- konisimple
- 実験室
- Twitter路線運行状況監視所の説明
Twitter路線運行状況監視所の説明
アイディア
- 一定時間おきにtwitterから電車遅延とかに関するポストを抽出
- 単位時間あたりである基準に達したら平常運転じゃない認定
- 登録者に鉄道運行状況メール配信
- ウマー
- 電車運行情報系のメール配信って有料のが多い
- 無料のもあるのかな
- 路線と駅に関する情報はたしかAPIがいくつか出てるよね
- これはな公式ウェブサイトのページスクレイピングしないから著作権関係は比較的安心?
- twitterの方が公式発表より速い情報?←イメージ
- 公式発表より路線単位や駅単位とかきめ細かい情報が得られそう
結果
公式発表に出ないような5分とかわずかな遅れもわかる!と思ったのですが・・・
実際にやってみた
実際にしばらく電車遅延関連のtwitterのポストをしばらく抽出して保存してみました。その結果をまとめたのが以下のページです。
これはGoogle App Engineの練習とPythonの習作をかねています。
- twitterのapiは古い投稿は検索できないので、定期的にログをとってくる必要がある
- 本当に電車運行に関する情報を抽出するには形態素解析とかしないと!
- →めんどう!そこで「遅れ」「遅延」「運転見合わせ」などのキーワードをまずとってきて、その中から路線名が入ってるものを抜き出すという方法で実装
- 路線のリストは都道府県の路線一覧 XML / JSON | おもちゃ箱 | 駅データ 無料ダウンロード 『駅データ.jp』を利用。json本当にらくちん。すぐ書けた。
- 路線名が同じ場合は区別できない。東京メトロの東西線と関西のJR東西線など。
- まぁ実験なのでそれは気にしない。
結果・わかったこと
- 出てくるデータは公式サイトの情報からとってくるbotばかり。
- ほとんどの人は5分とか軽微な遅れはtwitterに投稿しない。
- twitter中毒みたいな人たちはそういうのも逐一書くんだと思ってましたw
- 間違った結果もかなり出てきました。
- 実用レベルにするにはY!JapanのApi 日本語係り受け解析みたいなのを使うか自前で文章の解析やるような仕組みが必要?
ということでこの企画は断念します。
上のGAEアプリはこのまま放置することにしますw
仕組み
Python on GAEでTwitterのAPIをCronで叩く。
関連情報
twitterの電車遅延関連のポストから遅延情報のメール配信 - konisimple log
twitter列車運行状況速報は困難。 - konisimple log
- 更新履歴
- 10/01/18:初出
- このページについて
- Twitter路線運行状況監視所の説明
- konisimple
- 実験室
- Twitter路線運行状況監視所の説明