Wolfram言語

テキストからフライトシーケンスを抽出する

Wolfram言語を使うと,EntityStoreに保存されている複雑なデータから興味深い情報が簡単に抽出できる. 例として,ソーシャルネットワーキングのサイトからのデータをWolfram Knowledgebaseで使用可能な空港の詳細データと揃え,それを組込みの地理可視化関数で分析することで,フライトシーケンスを見付けることにする.

まず,使用可能なすべての空港の空港コードを取得する.

空港コードと単一の空港実体のAssociationを作る.

travel.stackexchange.comのアーカイブから作られたEntityStoreをインポートして登録する.

投稿の本文からリストされた空港のシーケンス(例:"LAX to STL to ORD")を抽出する特性を構築してEntityStoreに加える.

完全なWolfram言語入力を表示する

すべての投稿で,言及された空港のシーケンスを見付けて数える.

言及された空港シーケンスのトップ5を求める.

最頻の10の空港シーケンスを地図上に可視化する.

すべての空港シーケンスを,言及頻度で色付けして表示する.

完全なWolfram言語入力を表示する

SortedEntityClassExtendedEntityClassを使って冗長コードを除外して,最も長い空港シーケンスのトップ3を求める.

投稿,最長フライトシーケンス,距離を表示する.

完全なWolfram言語入力を表示する

最長のフライトシーケンスを地図上に表示する.最長のフライトシーケンスは回遊旅行であった.

完全なWolfram言語入力を表示する

関連する例

en