情報検索アルゴリズム

著者:北 研二

発売日:2002/01/01

出版社:共立出版

ISBN:4320120361

高速な文字列マッチング - 気ままなブログ

最近は、簡潔データ構造を中心に調べたりしていたけど、文字列マッチングを考えた場合、別のアプローチもあります。そう、grepのような逐次文字列検索ですね。以下の解説がおもしろいです。 http://www.i.kyushu-u.ac.jp/~takeda/papers/IPSJMagazineCPM.pdf CSAとかFM-Indexに隠れてしまっていますが、実はかなり強力で...

Latent Semantic Indexing - naoyaのはてなダイアリー

情報検索におけるベクトル空間モデルでは、文書をベクトルとみなして線形空間でそれを扱います。この文書ベクトルは、文書に含まれる単語の出現頻度などを成分に取ります。結果、以下のような単語文書行列 (term document matrix) が得られます。 d1d2d3d4 Apple3000 Linux0101 MacOSX2000 Perl0100 Ruby0103 この単語文...

GitHub - mocobeta/building-search-system-book: 「仕事ではじめる検索システム」という本があったなら,という想像の産物です

[PoC][書籍] 仕事ではじめる検索システム UPDATE 2021/08/06 1年(以上)が経過してしまいましたが,心強い共著者,編集者を得ることができ,少しずつ原稿が形になってきました。具体的なアウトプットはまだしばらく先になりますが,ラムダノート社の技術情報誌 「n月刊ラムダノート」Vol.3 No.1 で「検索エンジンのしく...

情報検索ことはじめ〜教科書編〜 - 睡眠不足?!

2011-01-18追記 教科書編その2 にて2011年版のIR教科書を紹介しています 情報検索(IR)の勉強を本格的に始めて8ヶ月.大体どんな分野があって,どんなことを勉強すればいいのかわかってきた(と思う).この気持ちを忘れないうちにメモしておこう.以下,若輩があーだこーだ言ってるだけなので,間違いや他に情報があれば...

データサイエンティスト生活でお世話になった本|くに | 武田邦敬|note

みなさんこんにちは。くにです。 データ分析の世界に足を踏み入れてから9年が過ぎました。 分析実務未経験でキャリアチェンジできたのは幸運としか言えませんが、ある意味無知だったからこそ無謀な挑戦ができたのかもしれません。この挑戦の泥臭い記録は、この記事に書きました。 ポジションは変われど、データを扱う仕...