DataSift は Twitter のツイートを Stream で取得できる Web API 。

a one of our lucky golden ticket alpha invite winners...
というわけで
ようやく "DataSift Alpha Registration Key" というメールが12/9に送られてきたのでちょっとだけ試してみた。

Dashboard

DataSift

My Streams

DataSift

DataSift では Filtered Stream Definition Language (FSDL) という言語でツイートをフィルタして絞り込んで取ってこれる。

これは「名古屋」というキーワードを含むツイートを Twitter stream から取ってくる設定。

DataSift

interaction.content contains "名古屋"

このへんが参考 ⇒ Stream Examples / Getting Started / FAQs - DataSift Support

実際にこんな感じのツイートがひっかかる。

DataSift

一定時間のあいだにどれぐらいの数のツイートがひっかかったかもわかる。

DataSift

キーワードだけじゃなく位置で絞り込むことも可能。

DataSift

この辺が参考 ⇒ Geo Operations / Filtered Stream Definition Language (FSDL) / FAQs - DataSift Support

Geo_Box (2点を指定した矩形の範囲)

interaction.geo geo_box "51.4911,-1.0617:51.4194,-0.8921"

Geo_Radius (1点と半径距離を指定した円形の範囲)

interaction.geo geo_radius "51.4553,-0.9689:5"

Geo_Polygon (複数点による図形の範囲)

interaction.geo geo_polygon "51.4615,-0.9864:51.4586,-0.9472:51.4466,-0.9412:51.4443,-0.9651:51.4445,-0.9831"

作成した Stream には ID が振られるので、その ID を DataSift の Streams API に指定して絞り込んだツイートを取得できる。

Ref.
-DataSift: Realtime Social Data Mining Platform
-Welcome - DataSift Support

tags: Twitter WebAPI zurazure

Posted by NI-Lab. (@nilab)