stop-the-world

takuya-a のブログ

情報検索とその周辺

これは、情報検索・検索エンジン Advent Calendar 2019 の 1 日目の記事です。 情報検索・検索エンジン Advent Calendar を作った経緯 情報検索、検索エンジン周りのアドベントカレンダー誰か— すずどら (@sz_dr) November 6, 2019 情報検索はまだないんでし…

論文メモ: Fast Approximate Filtering of Search Results Sorted by Attribute (SIGIR 2019)

前回に引き続き、 SIGIR 2019 の efficiency に関する論文を読んだメモです。

論文メモ: Accelerated Query Processing Via Similarity Score Prediction (SIGIR 2019)

IR Reading 2019秋で標題の論文を紹介しました。 発表で使ったスライドは以下です: speakerdeck.com 以下は、この論文を読んだときのメモです。 概要 検索エンジンで top-k のクエリ処理を高速化するのが目的 クエリ処理中の動的な文書の pruning(枝刈り)…

EdgeRouter設定メモ: IPv6/IPoE + DS-Liteでインターネット高速化

家庭用の LAN を IPv6 に移行したら、下り 400 - 500 Mbps、上り 500 - 600 Mbps 出るようになったので、環境や設定などを共有します。 参考: blog.amedama.jp techlog.iij.ad.jp 環境 CLI による操作 EdgeOS のコマンド 基本コマンド 操作モードのコマンド…

ISUCON8 で予選を突破したのでまとめる

ディメンジョナルハイソサイエティぬれねずみというチーム名で ISUCON8 に出場しました。言語は Perl を選択しました。 結果は 40,867点で、13位 / 528組。 技術的なことについては、すでにチームメンバーの2人が書いてくれているので、自分からは主にそれ以…

論文 "BitFunnel: Revisiting Signatures for Search" を読んだメモ

まとめると 気になりポイント 1. Introduction 2. Background and prior work 2.1 Inverted Indexes 2.2 Bit-String Signatures 2.3 Bit-Sliced Signatures 2.4 Bit-Sliced Blocked Signatures 3. THE BITFUNNEL SYSTEM 3.1 Architectural Overview 3.2 The …

「Elasticsearch での類似文書検索と More Like This Query API 詳解」というタイトルで発表しました

Elasticsearch 勉強会 in 大阪・京都で発表しました。 最近、興味をもって調べていた More Like This Query API について、改めてソースコードリーディングしながら整理した内容になっています。 Elasticsearch 勉強会 in 大阪(7/13 Yahoo! JAPAN 大阪) El…

株式会社はてなに入社しました

4月1日付で株式会社はてなに入社しました。 京都オフィス勤務です。 そして kuromoji.js を大規模サービスに投入するチャンスを虎視眈々と狙っていきます。 みなさま、どうぞよろしくお願いいたします。