Nach ziemlich langem Suchen habe ich heute eine gute Möglichkeit gefunden, Tweets eines bestimmten Zeitraums runterzuladen. Auch ein Download aller Tweets ist möglich, erfordert aber das wiederholte Ausführen der gleichen Schritte.

Ich bin mir bewusst, dass es Dienste gibt, die das anbieten. Aber die meisten Dienste bieten entweder nur das Downloaden einiger Daten an, sind fehlerhaft oder ermöglichen das Archivieren der Tweets erst ab dem Registrationsdatum. Nachfolgend möchte ich “meinen” Weg beschreiben. Ich setze “meinen” bewusst in Anführungs- und Schlusszeichen, weil ichs selbst über eine Suche gefunden habe. Den Dank verdient eigentlich Akmal Wardak mit diesem Eintrag und Matthew Wilcoxson mit einem Kommentar zum selben Eintrag. Weil ich den Kommentar aber erst sehr spät entdeckt habe und sich andere vielleicht mit dem selben Problem rumschlagen, fasse ich das hier zusammen. Die Erklärungen enthalten möglichst nur die konkrete Vorgehensweise, ohne ausschmückende Erklärungen. Wer etwas mehr Text will, sei auf den verlinkten Eintrag verwiesen.

  1. Im Browser  http://twitter.com/statuses/user_timeline/account.xml?count=n  eingeben. Dabei steht “account” für den Twitter-Username und “n” für die Anzahl Tweets, die runtergeladen werden (vom aktuellsten an). So können aber nur die knapp 200 neuesten Tweets heruntergeladen werden. Mehr lässt Twitter nicht zu.
  2. Für mehr Tweets oder für die 200 letzten Tweets vor einem bestimmten Datum, gibt man im Browser http://twitter.com/statuses/user_timeline/account.xml?max_id=ID&count=n ein. Dabei steht “account” wieder für den Twitter-Username und “n” für die Anzahl Tweets, die man runterladen will. Zusätzlich muss man “ID” mit der ID-Nummer des aktuellsten Tweets ersetzen, der noch runtergeladen werden soll. Wenn also die 100 letzten Tweets vor dem Tweet vom 11. März runtergeladen werden sollen, dann ersetzt man “n” mit 100 und ID mit der Nummer des Tweets vom 11. März. Die ID findet man in der URL des jeweiligen Tweets (die lange Nummer am Schluss). Die IDs der bereits heruntegeladenen Tweets sind auch im Excel enthalten, das man mit den gewonnen Daten erstellen kann (dazu unten).

Ob ich 1. oder 2. ausführe, angezeigt wird mir im Browser eine Art Code, der alleine noch nicht viel hilft. Diesen kann man aber als .xml-Datei speichern. Im Excel importiert man diese wieder und schon hat man eine schöne Liste. Diese enthält sehr viele Daten zu den einzelnen Tweets. Einige sind nachfolgend aufgeführt:

  • Datum
  • ID
  • Text
  • Falls mit dem Tweet auf einen anderen geantwortet wurde: Die ID des Ursprungstweets und die ID sowie den Username des Ursprungsusers
  • Wieviel mal der Tweet retweetet wurde
  • und viele mehr

Bei Fragen könnt ihr gerne einen Kommentar hinterlassen.