Markt News

iStock.com/Mihajlo Maricic

Projekt: KI hilft Journalisten bei der Datenauswertung

Datenjournalisten sammeln und analysieren öffentlich zugängliche Daten und bereiten die darin verborgenen Informationen für ihre Medien auf. Dafür müssen sie häufig mit Daten arbeiten, die nur in unstrukturierter Form vorliegen. Dies macht eine automatisierte Auswertung schwierig. Im Rahmen eines Forschungsprojekts möchten die TH Köln und das Science Media Center Germany (SMC) daher ein Tool entwickeln, das mit solchen Datenquellen umgehen und diese journalistisch nutzbar machen kann. Das teilte die TH Köln mit. 

„Die Daten, in denen Journalisten nach Informationen suchen, können ungemein vielfältig sein: Es handelt sich um Texte, Tabellen oder Grafiken, Dokumente unterschiedlichen Typs wie Word, PDF oder E-Mail oder um Webseiten, die zudem noch höchst unterschiedlich formatiert sein können. All das macht es sehr schwierig, zuverlässige und konsistente Regeln zu definieren, nach denen eine automatisierte Auswertung erfolgen könnte“, erläutert Prof. Dr. Philipp Schaer vom Institut für Informationswissenschaft die Problemstellung. 


Künstliche Intelligenz lernt Extraktionsmuster
Auf Grundlage der beiden Open-Source-Werkzeuge Workbench und Fonduer soll demnach eine Lösung entstehen, die unstrukturierte Daten in eine strukturierte und damit auswertbare Form bringt, erklärte die Hochschule. Workbench erlaube unter anderem die Extraktion von Webdaten. Fonduer verwende Künstliche Intelligenz, um automatisch Extraktionsmuster zum Beispiel zur Erkennung von Tabellen zu lernen. 

Um die spezifischen Anforderungen von Redaktionen und Datenjournalisten zu erfahren, seien Experteninterviews und gegebenenfalls Umfragen geplant. „Mit unserem Tool möchten wir den State of the Art der Datenverarbeitung für Redakteurinnen und Redakteure verfügbar machen, damit sie Informationen aus der Wildnis des Internets schnell und zuverlässig beschaffen können. Da diese oftmals mit begrenzten Ressourcen arbeiten müssen, wird unsere Lösung kostenlos und als Open-Source-Software verfügbar sein“, sagte Dr. Meik Bittkowski, Leiter Forschung und Entwicklung beim SMC Germany. (ud)
 

Stichworte

Verwandte Artikel

Anzeige

Lexikoneinträge