“Ob dieses Rauschen nun durch Bots oder Menschen gemacht wird, ist egal.”

Tim Freys Firma Iunera aus Walldorf ist auf Big-Data-Analysen spezialisiert. Seit kurzem stellt sie auch einen Index von Kryptowährungen bereit, der nach der Beliebtheit auf Twitter sortiert ist. Wir haben gefragt, wie die Analyse funktioniert und welchen Aussagewert solche Rankings haben können.
Hallo Herr Frey! Ihre Spezialität ist die Big-Data-Analyse. Können Sie für den Anfang des Interviews erklären, was Big Data meint? Ab welcher Größe spricht man davon?
Haha, das ist eine gute Frage. Für uns ist das Minimum ein Datenstrom von einem Gigabyte am Tag. Wir verstehen Daten nicht als feste Einträge in einer Datenbank, sondern als Strom, also als etwas volatiles, das fließt. Blockchains selbst sind nicht Big Data, auch wenn die Bitcoin-Blockchain mittlerweile bald 200 Gigabyte groß ist. Aber das, was darum herum passiert, das Ökosystem und die Börsen, das produziert Datenströme, die man Big Data nennen könnte. Ein gutes Beispiel sind die Daten, die in das Ranking von Coinmarketcap einfließen.
Ihr habt nun auf Basis von Tweets ein alternatives Ranking von Kryptowährungen gebildet. Darin gibt es einige überraschende Positionen, so ist etwa Tron auf dem dritten Platz gelandet. Welche Methode steckt hinter dem Ranking?
Wir haben die Tweets, in denen es auch um Kryptowährungen ging, nach Währung sortiert. Zum Beispiel gab es in den letzten 24 Stunden 89.000 Tweets und Retweets, in denen #Bitcoin, #BTC oder $BTC vorgekommen sind. Normale Wörter ohne Hashtag-Raute oder Dollarzeichen werten wir nicht. Das würde bei Währungen wie Bitcoin oder Ethereum zwar einigermaßen gehen, wird aber bei Währungen wie Tron oder Waves zum Problem, da diese Wörter auch anders verwendet werden, was das Ergebnis verfälschen würde.
Wir haben nun mehrere Werte aus der Big Data Analyse gezogen, etwa die Anzahl von Tweets, die Anzahl von twitternden Personen und die Anzahl von Tweets im Verhältnis zur Marktkapitalisierung.
Wie funktioniert das Ranking technisch?
Wir bekommen in Echtzeit von Twitter die Tweets, in denen bestimmte Wörter und Zeichenfolgen auftauchen, wie Bitcoin, Ethereum und so weiter. Insgesamt sind das mehrere Gigabyte am Tag, die einlaufen. Diese Daten verarbeiten wir auf unserem Cluster. Die Menge ist weniger problematisch, als ich befürchtet habe, und wir könnten noch wesentlich mehr Daten verarbeiten, als wir derzeit bekommen.
Was sagt die Anzahl von Tweets über Phänomene aus? Kann man überhaupt gültige Schlussfolgerungen daraus ziehen?
Das ist eine spannende und interessante Frage. Es könnte helfen, es mit einem anderen Thema zu vergleichen. Wir haben für die Bundestagswahl auch Tweets ausgewertet. Dabei war die AFD interessant, weil sie in den Umfragen bei neun Prozent lag, aber auf Twitter die größte Reichweite aller Parteien hatte, ungefähr 40 Prozent Lufthoheit. Das Stimmungsbild war auf Twitter also schon früh sehr gut für die Partei, und in der Wahl hat die AFD dann auch auf 12 bis 13 Prozent aufgeholt. Das ist natürlich weniger als die 40 Prozent, die wir bei Twitter festgestellt haben, aber es war ein Trend.
Sind die Tweets also eher Indikatoren für Veränderungen?
Ja, das würde ich schon sagen. Man kann in den Tweets sehen, wenn sich etwas auf Dauer verschiebt. Wenn Sie jetzt bei einer Wahl antreten, und in Umfragen bei drei Prozent stehen, aber es schaffen, einen Tweet-Anteil von 30 Prozent zu erreichen, weil Sie einen Hype auslösen, bedeutet das nicht, dass sie bei der Wahl auch 30 Prozent bekommen. Aber es gibt eine Richtung vor.
Wenn wir Kryptowährungen anschauen, ist Ripple ein interessantes Beispiel. Es gibt relativ wenig Tweets je Marktkapitalisierung, aber weil viele professionelle Institutionen mit Ripple arbeiten, hat der Coin dennoch seinen Wert. Ich glaube, man kann positive Effekte viel besser ausmachen als negative.
Oder schauen Sie Tron an. Der Coin hat im Allgemeinen eine begeisterte Community. An einem bestimmten Tag, dem des Mainnet-Launches, ging die Anzahl der Tweets extrem stark hoch. Mit 350.000 hatte Tron viel mehr Tweets als alle anderen Coins. Aber das bedeutet nun natürlich nicht, dass Tron bald Bitcoin überholt. Sondern nur, dass es ein vorübergehendes Ereignis gab.
Kann man die Tweet-Indikatoren für das Trading nutzen?
Das ist schwierig, denke ich. Man kann zwar feststellen, wie viele Tweets es gibt, aber es ist kaum möglich, diese konkret mit dem Kurs zu verbinden. Es gibt ja keine deterministische Wechselwirkung zwischen beidem. Manchmal gibt es kausale Zusammenhänge, dann versuchen wir, Vorhersagen zu bilden oder Muster zu erkennen.
Als es den Mainnet-Launch von Tron gab, gab es auch viele Tweets. Das zieht eine große Aufmerksamkeit an, und vielleicht ist es gar nicht so wichtig, ob sie positiv oder negativ ist. Hauptsache die Leute reden darüber. Das bedeutet nicht von selbst, dass der Kurs steigen wird, aber es ist Bewegung da und es gibt ein Potential. Polarisierung ist immer besser als Totschweigen.

Der Launch des Mainnets ist in der Twitter-Analyse von Tron sehr gut sichtbar.
Nehmen wir einen zweiten Indikator, die Tweets per Marktkapitalisierung. Da ist derzeit Sumokoin am besten, danach kommt Bytom. Aber das sind kleine Coins, und es ist schwer zu sagen, was dahintersteckt. Spannender finde ich Zclassic. Hier sieht man hohe Werte der Tweets je Marktkapitalisierung, und relativ viele Tweets von relativ wenig Leuten. Man könnte sagen, dass ist eine kleine, aber hochmotivierte Truppe. Anders ist SmartCash. Da gibt es ein wenig mehr als 1.000 Leute, aber nur 1.500 Tweets, was auch interessant sein könnte.
Insgesamt aber glaube ich, dass das nur einzelne Indikatoren sind, die nur im Gesamtbild Sinn ergeben. Für sich selbst sagen sie relativ wenig aus, aber sie können wertvoll als Teil der Analyse sein.
Was meinen Sie, wie viel Manipulation ist in den Tweets?
Sie meinen, Manipulation durch Bots? Das ist ein recht spannndes Thema. Es gibt auf jeden Fall Bots, das haben wir schon bei der Bundestagswahl erlebt. In unserer Statistik listen wir nicht nur die Anzahl der Tweets, sondern auch die Anzahl der tweetenden Personen. Grundsätzlich gilt, dass man leichter Tweets je Account heraussschießt, als neue Accounts oder Bots bildet.
Wenn wir diese beiden Werte vergleichen, können wir mögliche Bots oder andere Unregelmäßigkeiten identifizieren. Bei Bitcoin und Ethereum gibt es je Person etwa drei Tweets, bei Tron nur zwei, Rippple steht irgendwo dazwischen. Das scheint im großen und ganzen die Norm zu sein. Eine Abweichung davon, wie bei Zclassic, muss nicht zwingend bedeuten, dass manipuliert wird. Es kann auch sein, dass es ein Ereignis gibt, über das viel getweetet wird, etwa eine Konferenz.
Insgesamt ist es für uns auch gar nicht so wichtig, ob ein Mensch oder ein Bot hinter einem Tweet steckt. Wenn ein Mensch am Tag 100 zufällige Tweets rausschießt, oder ein Bot das macht, hat es denselben Effekt. Auf Twitter haben wir ein Grundrauschen, das oft nichts mit dem Kurs zu tun hat, weil nicht nur Trader auf Twitter sind. Ob dieses Rauschen nun durch Bots oder Menschen gemacht wird, ist eigentlich egal.
Wieder ein sehr interessanter Beitrag. Danke