機械学習で人々の感情を分析 : リオ オリンピックの事例から
2016年9月23日金曜日
オリンピックはいつも人々を驚くほど熱くさせます。そんなふうに世界が同じ出来事に注目することは滅多にありません。オリンピックは見る者すべてにとって、感嘆する瞬間や心を揺さぶられる瞬間の連続です。2 週間にわたってさまざまなドラマが連日繰り広げられ、すべてを追いかける簡単な方法はありません。
優れた技術のおかげで、世界が盛り上がる瞬間にこれまでにない多様なコミュニケーションが行われるようになりました。たとえばハッシュタグは、特定のアスリートや瞬間、あるいは大会全体などについて人々が考えたことや感じたことを素早くまとめ、一覧するのに役立ちます。
ですが、視聴者やファンがリオ オリンピックについてどう感じていたかを定量的に理解できれば、クールではないでしょうか。何百万件ものツイートを読まなくても、私たち Google の機械学習 API を使えば、それが可能です。この投稿では、そうした定量的な理解に向けて、私たちがどのような分析を行ったかをかいつまんで紹介します。
私たちはまず、Twitter Streaming API を使って、#olympics、#Rio2016、#RioOlympics2016 というハッシュタグを使っているツイート(ラベル付けされたリツイートを除く)を集めました。
次に、Cloud Natural Language API をそれらに適用しました。この API はテキストの構造と意味を理解し、ツイートを分析しました。
そのデータが集まったら、私たちはそれらに対して分析サービスの BigQuery を実行し、Natural Language API が特定したすべての形容詞(感情を知るための大きな手がかりです)を抽出して、それらが使われた回数をカウントしました。さらに、データを細分化し、特定のアスリートに対する形容詞を抽出して、それらのアスリートへの直接的な感情を探りました。

Usain Bolt(ウサイン・ボルト)

Simone Biles(シモーネ・バイルズ)
もちろん、絵文字(emoji)入りのツイートもたくさんありました。私たちは、どの絵文字が一番使われているかがわかれば面白いと考えました。Natural Language API は絵文字に対応していますので、私たちがやるべきことは絵文字の画像と Unicode 値を対応づけて、各絵文字が使われた回数をカウントすることだけでした。
私たちの機械学習 API を組み合わせて興味深いインサイトを得る方法には、無限の可能性があります。私たちは自身の実験を通じて、そして世界中の開発者および企業の素晴らしいプロジェクトから学ぶことにより、新しいユースケースを日々楽しく発見しています。
* この投稿は米国時間 9 月 8 日、Google Cloud Platform の Developer Advocate である Sara Robinson によって投稿されたもの(投稿はこちら)を要約し、抄訳したものです。
- Posted by Sara Robinson, Developer Advocate, Google Cloud Platform
0 件のコメント :
コメントを投稿