テキストからフライトシーケンスを抽出する
Wolfram言語を使うと,EntityStoreに保存されている複雑なデータから興味深い情報が簡単に抽出できる. 例として,ソーシャルネットワーキングのサイトからのデータをWolfram Knowledgebaseで使用可能な空港の詳細データと揃え,それを組込みの地理可視化関数で分析することで,フライトシーケンスを見付けることにする.
まず,使用可能なすべての空港の空港コードを取得する.
空港コードと単一の空港実体のAssociationを作る.
travel.stackexchange.comのアーカイブから作られたEntityStoreをインポートして登録する.
投稿の本文からリストされた空港のシーケンス(例:"LAX to STL to ORD")を抽出する特性を構築してEntityStoreに加える.
完全なWolfram言語入力を表示する
すべての投稿で,言及された空港のシーケンスを見付けて数える.
言及された空港シーケンスのトップ5を求める.
最頻の10の空港シーケンスを地図上に可視化する.
すべての空港シーケンスを,言及頻度で色付けして表示する.
完全なWolfram言語入力を表示する
SortedEntityClassとExtendedEntityClassを使って冗長コードを除外して,最も長い空港シーケンスのトップ3を求める.
投稿,最長フライトシーケンス,距離を表示する.
完全なWolfram言語入力を表示する
最長のフライトシーケンスを地図上に表示する.最長のフライトシーケンスは回遊旅行であった.
完全なWolfram言語入力を表示する