DataSift は Twitter のツイートを Stream で取得できる Web API 。
a one of our lucky golden ticket alpha invite winners...
というわけで
ようやく "DataSift Alpha Registration Key" というメールが12/9に送られてきたのでちょっとだけ試してみた。
Dashboard
My Streams
DataSift では Filtered Stream Definition Language (FSDL) という言語でツイートをフィルタして絞り込んで取ってこれる。
これは「名古屋」というキーワードを含むツイートを Twitter stream から取ってくる設定。
interaction.content contains "名古屋"
このへんが参考 ⇒ Stream Examples / Getting Started / FAQs - DataSift Support
実際にこんな感じのツイートがひっかかる。
一定時間のあいだにどれぐらいの数のツイートがひっかかったかもわかる。
キーワードだけじゃなく位置で絞り込むことも可能。
この辺が参考 ⇒ Geo Operations / Filtered Stream Definition Language (FSDL) / FAQs - DataSift Support
Geo_Box (2点を指定した矩形の範囲)
interaction.geo geo_box "51.4911,-1.0617:51.4194,-0.8921"
Geo_Radius (1点と半径距離を指定した円形の範囲)
interaction.geo geo_radius "51.4553,-0.9689:5"
Geo_Polygon (複数点による図形の範囲)
interaction.geo geo_polygon "51.4615,-0.9864:51.4586,-0.9472:51.4466,-0.9412:51.4443,-0.9651:51.4445,-0.9831"
作成した Stream には ID が振られるので、その ID を DataSift の Streams API に指定して絞り込んだツイートを取得できる。
Ref.
-DataSift: Realtime Social Data Mining Platform
-Welcome - DataSift Support
tags: Twitter WebAPI zurazure
Posted by NI-Lab. (@nilab)