Piwik

Künstliche Intelligenz zur Erschließung alter Drucke und Analyse von Figurenkonstellationen

28. Mai 2020 : 15:30 - 15:55

Frank Puppe (Universität Würzburg)

Veranstaltungsraum: Raum 2

Der Vortrag berichtet über Werkzeuge und Evaluationsergebnisse für zwei Pipelines: Die OCR-Pipeline zur Transkription alter Drucke (Scans) mit Vorverarbeitung, Segmentierung, eigentlicher OCR und Nachbearbeitung, die als Ergebnis einen maschinenlesbaren Text liefert. Daraus können in der zweiten NLP-Pipeline mittels Named Entity Recognition, Co-Reference-Resolution und Relation Extraction Figuren-Konstellationen eines Romans ermittelt werden.
#OCR (Optical Character Recognition)  #Neuronale Netze  #Information Extraction

zurück zur Liste