DebateExplorer: Unser Workshop auf der Wissenswerte

Blog über unser Datenjournalismus-Projekt DebateExplorer, November 2016

Auf der Wissenswerte, der Konferenz für Wissenschaftsjournalismus, präsentieren wir in einem Werkstattgespräch am Dienstag, 29.11., erste Ergebnisse unseres DebateExplorers: Können Maschinen Semantik verstehen, können sie sogar angesichts der verklausulierten Sprache der Politiker Muster in Bundestagsdebatten finden und uns Journalisten auf Auffälligkeiten stoßen, die wir ohne maschinelle Unterstützung nicht gefunden hätten? Unser Projekt auf der Basis der Förderung der Volkswagenstiftung im Projekt „Wissenschaft und Datenjournalismus“ erkundet seit Januar 2016 die Grenzen der Wissenschaft und versucht, sie zu verschieben. Wir wollen mit euch unsere Erfolge und die künftigen Herausforderungen diskutieren.

Unser Tool soll gerade in Zeiten knapper Mittel im Journalismus dafür sorgen, dass investigative Recherche nicht nur den großen Verlagen vorbehalten bleibt oder angesichts des Aufwands ganz ausstirbt. Wir nutzen öffentlich zugängliche Texte wie Bundestagsdebatten, Interviews und Artikel, um mittels automatischer Texterkennung aufzudecken, wie Debatten beeinflusst werden. Die Herausforderung dabei: die Algorithmen sollen nicht nur wortgleiche Passagen finden, sondern auch inhaltliche Gemeinsamkeiten, die verschieden formuliert sind. Dafür trainieren wir sie gemeinsam: JournalistInnen und ComputerlinguistInnen.

Es ist nicht einfach, den Maschinen ein Verständnis menschlicher Sprache nahe zu bringen. Aber wir sind überzeugt, dass das Team Hirn und Algorithmus unschlagbar ist und den investigativen Journalismus vorantreibt. Das wollen wir im Rahmen des Werkstattgesprächs auf der Grundlage unserer Erfahrungen mit euch diskutieren und gemeinsam in die Zukunft blicken. Unser Ziel ist ein Tool, das JournalistInnen in Zukunft nutzen können, um die Beeinflussung von Debatten zu untersuchen. Wir sind überzeugt davon, dass diese Art der Datenauswertung und des Textmining die Zukunft des (Daten)Journalismus ist und dass wir diese erreichen können, wenn wir untereinander und mit Wissenschaftlern kooperieren und unsere Ergebnisse sowie den zugehörigen Code zum Nutzen aller veröffentlichen.

Ähnliche Artikel

  • DebateExplorer: Unsere Datenbasis wächst – und mit ihr die HerausforderungenDebateExplorer: Unsere Datenbasis wächst – und mit ihr die Herausforderungen Blog über unser Datenjournalismus-Projekt Debate Explorer, August 2016 So gruselig der aktuelle Stuttgart-Tatort ist, in dem eine Künstliche Intelligenz unkontrollierbar wird, so sehr […]
  • DebateExplorer: Die Mühen der EbeneDebateExplorer: Die Mühen der Ebene Ich sollte glücklich sein! Ich trainiere eine Software, die den Journalisten der Zukunft die Arbeit erleichtern soll. Die investigative Recherche am Leben erhält. Ich arbeite voll am Puls […]
  • DebateExplorer: Jetzt will ich es wissen!DebateExplorer: Jetzt will ich es wissen! Jetzt will ich es wissen! Wir sitzen im Besprechungsraum am Institut für Maschinelle Sprachverarbeitung und schauen gebannt auf die Leinwand, auf der Textwolken auftauchen. Wir: […]
  • DebateExplorer: Unser Baby wächstDebateExplorer: Unser Baby wächst Blog über unser Datenjournalismusprojekt DebateExplorer, Oktober 2016 Unser Baby spricht die ersten eigenen Worte! Genau genommen findet es die ersten eigenen Worte, nämlich Debatten […]
  • DebateExplorer: Wie sag ichs der Maschine?DebateExplorer: Wie sag ichs der Maschine? Blog über unser Datenjournalismusprojekt DebateExlorer, Mai 2016 Und schwupp! Schon ist es noch schwieriger, die passenden Beiträge zu finden. Ich widme mich nach der Hotelsteuer dem […]
  • DebateExplorer: Wie alles anfingDebateExplorer: Wie alles anfing Im April 2015 bin ich auf einem Vortrag von Jonas Kuhn, Professor für Computerlinguistik an der Uni Stuttgart, über die automatische Analyse großer Textmengen. Er zeigt an beeindruckenden […]