テキストから特徴語を抽出して結果をXMLで返すAPIをずいぶん昔に作ってそのままにしてたけど、せっかくなので使ってみた結果。スコアリングがめちゃくちゃだし。。。


[解析対象のテキスト]
複数のキーワードをまとめて緯度経度に変換したいんだけど、Google とか Yahoo! のジオコーダはそういうのを許してくれるんだろうか。API的にまとめて送れないから連発投入という形になるけど。
[解析結果]
複数のキーワード: 235
API的: 235
緯度経度: 235
Yahoo!のジオコーダ: 235
連発投入: 235
Google: 213
形: 131
変換: 131
まとめる: 2
する: 1
 
[解析対象のテキスト]
ページ作って10分もたたないうちに1番上なんておかしいだろJK.
[解析結果]
ろJK.: 235
10分: 235
1番上: 235
ページ: 131
おかしい: 2
たつ: 1
作る: 1
に: 0
うち: 0
ない: 0
 
[解析対象のテキスト]
住所: 愛知県稲沢市稲沢中島都市計画事業尾張西部都市拠点地区 土地区画整理事業13街区2-2, 3画地 リーフウォーク稲沢 1F ( ゜Д゜) なんだこの住所・・・
[解析結果]
住所:愛知県稲沢市稲沢中島都市計画事業尾張西部都市拠点地区土地区画整理事業13街区2-2,3画地リーフウォーク稲沢1F(: 235
Д: 213
住所: 131
なる: 1
): 0
この: 0
゜: 0
だ: 0
・: 0
 
[解析対象のテキスト]
おそらく中央相互銀行が配布していた「日本語の常識辞典」という小冊子。小冊子といってもけっこう分厚かったりする。青い鳥症候群。20年前に専門家が「言ってみただけ」かもしれないけど。20年前の現代語「パーペキ」
[解析結果]
小冊子: 262
20年前: 235
鳥症候群: 235
20年前の現代語: 235
専門家: 235
日本語の常識辞典: 235
中央相互銀行: 235
パーペキ: 213
配布: 131
する: 2
 
[解析対象のテキスト]
こんな感じの分量でシェイクして完成。
・マスタード(粒じゃないやつ) 大さじ3
・オリーブオイル 大さじ3
・白ワインビネガー 大さじ3
・塩 適量
・コショウ 適量
・レモン(ポッカレモン) 適量
[解析結果]
感じの分量: 235
白ワインビネガー大さじ3: 235
やつ)大さじ3: 235
塩適量: 235
コショウ適量: 235
オリーブオイル大さじ3: 235
レモン(ポッカレモン)適量: 235
マスタード(粒: 235
シェイク: 233
完成: 131
 
[解析対象のテキスト]
「高架下が見えるぐらい立体的」といううわさを聞いてさいしょに見たときは、ゲートタワービルの道路部分はぜんぜん空中に浮いてなくて、地表0mにくっついてて「立体的に見えるけどこれは地表部分に貼ってある航空写真の目の錯覚。高さデータないから0m地点に表示してるのかなー」みたいに言ってたけど、じつはちがうPCに変えたらちゃんと立体的な高架が見れたという。あのPC環境はもしかして Google Earth 4 だったんだろうか。たしかに、高架は地表を這っていたのに。。。
[解析結果]
立体的: 705
高架: 262
地表部分: 235
高架下: 235
さデータ: 235
PC環境: 235
さいしょ: 235
GoogleEarth4: 235
ゲートタワービルの道路部分: 235
0m地点: 235

まぁ、素直に Yahoo!デベロッパーネットワークのキーフレーズ抽出Web API を使ったほうが無難かな。。。

Ref. 特徴語抽出API

tags: zlashdot WebServices WebServices

Posted by NI-Lab. (@nilab)