検索エンジンはなぜ見つけるのか 知っておきたいウェブ情報検索の基礎知識

検索エンジンはなぜ見つけるのか 知っておきたいウェブ情報検索の基礎知識

-Amazon.co.jp: 検索エンジンはなぜ見つけるのか ―知っておきたいウェブ情報検索の基礎知識: 森大二郎: 本
--http://www.amazon.co.jp/exec/obidos/ASIN/4822284611/nilabwiki-22/ref=nosim/
--->内容紹介
--->「第一線の開発者が書いた、深くて易しくて面白い検索エンジンの解説書」
--->―――― 岡野原大輔氏(株式会社 プリファードインフラストラクチャー)
---> 
--->◆地球上のウェブページから「本当に欲しかった情報」と人を結びつけるしくみを解説
--->情報社会の恩恵を受けるうえで今や欠かせない存在となった検索エンジンですが、
--->そのシステムを支える基本的なしくみや原理についてはそれほどよく知られていません。
---> 
--->どうしたら世界中のウェブページの中から、もれなく一瞬で検索できるのか?
--->なぜわずか一言か二言の言葉を打ち込むだけで的確なページを見つけ出せるのか?
---> 
--->日頃から検索エンジンを使っているエンドユーザーにこそ知ってほしいとの願いを込めて、
--->数式やコンピュータ用語の代わりに身近なものへの比喩を駆使し、徹底して平易な文章で、
--->しかし妥協なく基本原理から先端技術までを解説しています。
---> 
---><本書の特徴>
--->●「もれなく、すばやく、的確に」検索するためのさまざまな工夫がわかる
--->●「図書館」「本」「ライト」など身近な例で、本来複雑な検索エンジンのしくみがすらすらわかる
--->●「圧縮サフィックスアレイ」「協調フィルタリング」など先端技術の本質がわかる
--->内容(「BOOK」データベースより)
--->世界中のウェブページから一瞬にして検索するしくみがわかる。「もれなく、すばやく、的確に」検索するためのさまざまな工夫がわかる。検索エンジンを第一線で開発する著書が本物のエンジンの姿を説き明かす。「図書館」「本」「ライト」身近な例で先端技術がすらすら理解できる。コンピュータや数学の専門知識がなくても面白く読める。「ページランク」や「協調フィルタリング」など先端技術の本質がわかる。

----
読書メモ

-メルヴィル・デューイ
--近代の図書館
--最善の図書を最低のコストで最大多数の人に
--十進分類法

-公立図書館: トップダウン
-検索エンジン: ボトムアップ

-文書の内容からスコアを決める
--単語の空間に文書を配置する
--タイトル、妙録、キーワードの重要度
---タイトルに含まれる単語等は重要度が高い

-キーワードを概念に置き換えてから検索

-多義語なら概念を選択してから検索する

-一言では表せない質問に答える
--図書館においては対話と通して質問を具体化する
---質問の主題
---動機や目的
---利用者の個人特性
---期待されている回答の形

-nilog: クロール先のサーバの処理能力を考慮。
--http://www.nilab.info/nilog/?type=twitter&id=190639302659678209
--