Wolfram言語

電子メールのスレッドの分析

メールボックスの会話グラフは,単一の電子メールを表す頂点と各頂点(電子メール)からその直接の返信への有向辺の2つからなる.このように表現することで,メールボックス内の異なる会話スレッドを見付けて分析することができる.この例ではここから取ったメーリングリストのアーカイブを使用している.

ダウンロードしたMBOXがfileに保存されているとして,全電子メールのメッセージから特定のメッセージ要素をインポートする.

メッセージのIDをキーとして,さまざまなファイルを含む連想を値として持つ連想を作る.

メッセージIDだけを抽出する.

別のメッセージに対する返信であるメッセージをすべて選択する.

各メッセージから各返信への辺を作る.

新たな本文のコンテンツを各頂点のツールチップとして使って,頂点と辺からグラフを作る.

グラフの各連結成分は1つの会話のスレッドである.個々のメッセージスレッドを分割して分析する.

例として,MinMaxを使って会話の開始日が最も早いものと最も遅いものを求めることで,各会話スレッドのタイムラインを計算する.

TimelinePlotを使って簡単なタイムラインを作る.

件名,開始時,終了時で各スレッド用のカスタムラベルを作る.

作ったラベルをTimelinePlotに渡して改良したラベルでタイムラインを作る.

スレッドは個別に分析することもできる.次では厳密に3つのメッセージあるいは2つの返信を含む最初のスレッドを選択する.

新たな本文のコンテンツをラベルとして,このスレッド中のメッセージのタイムラインを可視化する.

関連する例

de en es fr ko pt-br zh