DebateExplorer: Die Mühen der Ebene

Ich sollte glücklich sein! Ich trainiere eine Software, die den Journalisten der Zukunft die Arbeit erleichtern soll. Die investigative Recherche am Leben erhält. Ich arbeite voll am Puls der Zeit – wer würde sich nicht wünschen, auch mal eine künstliche Intelligenz mit eigenem Hirnschmalz anzureichern?

Aber manchmal holen mich die Mühen der Ebene ein: Das Bürokratendeutsch der Politiker beispielsweise. Wird eine Maschine je verstehen können, was diese vor lauter Rhetorik wirklich meinen? Sie wiederholen die Argumente der Gegenseite, bevor sie verklausuliert zu ihren eigenen Standpunkten kommen, sie verwenden ohne Ende doppelte Verneinungen, Schachtelsätze – werden meine Annotationen dem Algorithmus wirklich helfen? Weiterlesen

DebateExplorer: Wie alles anfing

Im April 2015 bin ich auf einem Vortrag von Jonas Kuhn, Professor für Computerlinguistik an der Uni Stuttgart, über die automatische Analyse großer Textmengen. Er zeigt an beeindruckenden und einleuchtenden Beispielen, dass jene Algorithmen erfolgreich sind, die teilweise regelbasiert und teilweise selbst lernend nach Mustern suchen. Wenn Maschinen Sprache rein nach statistischen Verfahren lernen, kommen sie zwar recht weit, aber irgendwann stoßen sie an ihre Grenzen: So wird der englische Satz „Producing fluent German tends to be quite hard.“ (Es scheint schwierig zu sein, fließendes Deutsch zu erzeugen)  bei Googletranslate zu dieser Zeit beispielsweise übersetzt mit „Herstellung fließend Deutsch neigt dazu, ziemlich hart.“ Also ziemlicher Buchstabenmüll.

Wenn Menschen hingegen ein paar Regeln hinzugeben, sind die Maschinen erfolgreicher, erklärt Jonas Kuhn auf seinem Vortrag. Die Herausforderung ist, die richtige Mischung herauszufinden: Die Maschine nicht zu sehr einzuschränken, aber ihr auch nicht zu große Freiheiten zu lassen, die sie auf die falsche Spur führt. Nach dem Vortrag frage ich Jonas Kuhn, ob wir nicht ein gemeinsames Projekt starten könnten: schon lange frage ich mich, inwiefern Lobbyisten Politiker beeinflussen. Weiterlesen

Datenjournalismus-Projekt DebateExplorer startet

Unser Projekt DebateExplorer hat die Förderzusage der Volkswagenstiftung bekommen! Die Stuttgarter Computerlinguisten Jonas Kuhn, Andre Blessing und ich werden im Rahmen der Ausschreibung „Wissenschaft und Datenjournalismus“ in den nächsten Monaten Tools entwickeln, die via Textmining die Beeinflussung von Debatten untersuchen. Einige dieser Tools sollen nach Pro­jek­ten­de allen in­ter­es­sier­ten Jour­na­lis­ten zur Ver­fü­gung stehen. Weiterlesen

Wie wird aus Datenjournalismus mehr als Teenager-Sex?

Der Stand des deutschen Datenjournalismus nach der Konferenz Datenlabor 2015 und was wir tun müssen, wenn wir unsere Möglichkeiten nicht länger verschenken wollen.

Datenjournalismus ist wie Teenager-Sex: alle reden davon. Keiner weiß so richtig, wie es geht. Jeder denkt, alle anderen tun es. Und deshalb behaupten alle, dass sie es tun. Diese Sätze  habe ich von dem US-Psychologen Dan Ariely geklaut – und auch leicht abgewandelt. Es ist mir kürzlich bei einem wissenschaftlichen Vortrag über Bigdata über den Weg gelaufen. Und das, was im wissenschaftlichen Zusammenhang Bigdata ist, erscheint mir im Journalismus derzeit der Datenjournalismus. Der Begriff wird inflationär verwendet, und jede Redaktion, die etwas auf sich hält, unterhält wenigstens ein Datenjournalismus-Team.

Was vor einigen Jahren mit einer Debatte über neue „Storytelling“-Formate im Netz begann, einer Debatte, der man auf keiner Journalistenkonferenz entkam (und die im übrigen den Begriff Storytelling – eine eigene, fabelhafte, viel zu seltene journalistische Stilform – verhunzt), heißt heute Datenjournalismus. Und hej, wenn die ganze Welt von Bigdata redet, wenn Daten wahlweise das Gold oder das Öl der Zukunft sind – dann nichts wie mitgemischt. Irgendwie wollen wir Journalisten ja auch nichts verpassen. Weiterlesen

Wie intelligent können Maschinen sein?

Stuttgarter Zeitung, Tagesthema, 17. Juli 2015

Intelligente Maschinen beschäftigen die Menschen derzeit stark.  Das Wissenschaftsmagazin „Science“ veröffentlicht einen Themenschwerpunkt über die aktuellen Herausforderungen der künstlichen Intelligenz – und ihre Begrenzungen

Sei es das soziale Netzwerk Facebook, das seine User mittels Künstlicher Intelligenz besser kennen lernen und Werbung noch gezielter platzieren will oder Googles Vision, den Menschen künftig Fragen zu beantworten, bevor sich diese ihnen stellen: Künstliche Intelligenz ist derzeit in viel gefragtes Themenfeld. Ein Grund für das Wissenschaftsjournal „Science“, Künstliche Intelligenz in der aktuellen Ausgabe als Themenschwerpunkt zu behandeln. Schließlich wächst das Thema auch in der Wissenschaft, hohe Fördersummen fließen in entsprechende Projekte. Ein mutmaßlich weiterer Grund: Die Sichtweise der Öffentlichkeit – seien es Befürchtungen vor superintelligenten Robotern bis hin zu übergroßen Hoffnungen, was Maschinen alles leisten könnten – weicht bisweilen von der Realität der Forschung ab. In verschiedenen Artikel beschreiben die Forscher die aktuellen Herausforderungen für die Künstliche Intelligenz – und ihre Begrenzungen. Weiterlesen

So klingt Sympathie

Kurzmitteilung

Im Dialog gleichen wir uns sprachlich einander an. So verändert sich langfristig sogar unsere Sprache. Aber wieso passen sich manche Menschen mehr und manche weniger an? Computerlinguisten haben einen neuen Faktor entdeckt.

Mehr dazu in meinem aktuellen Artikel auf spektrum.de oder hier auf dieser Seite.

Der Klang der Sympathie

Stuttgarter Zeitung, 19.10.2012
spektrum.de, 21.12.2012
  –  online

An der Uni Stuttgart wird erforscht, wie man sich seinen Gesprächspartnern anpasst.

Wenn der Bürokollege mit seiner Mutter telefoniert, schwäbelt er. Ruft er hingegen die Berliner Zentrale an, spricht er astreines Hochdeutsch. Viele Menschen beobachten diesen Effekt verblüfft an ihren Mitmenschen – und merken nicht, dass er sie selbst ebenso betrifft: Wir passen uns sprachlich unwillkürlich an unsere Mitmenschen an. Während manche den Wechsel zwischen Dialekt und Hochdeutsch bewusst steuern können – zumindest teilweise –, geschehen viele andere Anpassungen unbewusst: Wenn sich zwei Menschen unterhalten, benutzen sie zunehmend die gleichen Wörter, ihre Aussprache und ihre Betonung im Verlauf des Gesprächs werden sich ähnlicher.

Weiterlesen