E-Mail-Threads analysieren
Das Gesprächsdiagramm einer Mailbox besteht aus Knoten, die eine einzelne E-Mail darstellen, und einer gerichteten Kante von jedem Knoten (E-Mail) zu seinen direkten Antworten. Eine solche Darstellung ermöglicht das Finden und Analysieren der verschiedenen Diskussionsfäden im Postfach. Das Beispiel verwendet ein von hier übernommenes Mailinglistenarchiv.
Angenommen, die heruntergeladene MBOX ist in einer Datei gespeichert. Importieren Sie bestimmte Nachrichtenelemente für alle E-Mail-Nachrichten.
Erstellen Sie eine Zuordnung zu Nachrichten-IDs als Schlüssel und Zuordnungen, die die verschiedenen Dateien als Werte enthalten.
Extrahieren Sie nur die Nachrichten-IDs.
Wählen Sie alle Nachrichten aus, die Antworten auf eine andere Nachricht sind.
Erstellen Sie Kanten von jeder Nachricht zu jeder ihrer Antworten.
Erstellen Sie ein Diagramm aus den Knoten und Kanten und verwenden Sie den neuen Inhalt als Tooltip für jeden Knoten.
Jede verbundene Komponente des Graphen ist ein Konversationsfaden. Trennen Sie einzelne Nachrichten-Threads und analysieren Sie sie.
Berechnen Sie beispielsweise die Timeline jedes Conversation-Threads, indem Sie MinMax verwenden, um die frühesten und spätesten Ursprungsdaten zu finden.
Erstellen Sie eine einfache Zeitleiste mit TimelinePlot.
Erstellen Sie benutzerdefinierte Labels für jeden Thread mit dem Betreff, der Startzeit und der Endzeit.
Übergeben Sie diese Beschriftungen an TimelinePlot, um eine Timeline mit dem erweiterten Label zu erstellen.
Die Threads können auch einzeln analysiert werden. Im Folgenden wird der erste Thread ausgewählt, der genau drei Nachrichten enthält, ansonsten zwei Antworten.
Visualisieren Sie eine Zeitachse der Nachrichten in diesem Thread mit neuem Inhalt als Label.