28. Mai 2020 : 15:30 - 15:55
Frank Puppe (Universität Würzburg)
Veranstaltungsraum: Raum 2
Der Vortrag berichtet über Werkzeuge und Evaluationsergebnisse für zwei Pipelines: Die OCR-Pipeline zur Transkription alter Drucke (Scans) mit Vorverarbeitung, Segmentierung, eigentlicher OCR und Nachbearbeitung, die als Ergebnis einen maschinenlesbaren Text liefert. Daraus können in der zweiten NLP-Pipeline mittels Named Entity Recognition, Co-Reference-Resolution und Relation Extraction Figuren-Konstellationen eines Romans ermittelt werden.
#OCR (Optical Character Recognition) #Neuronale Netze #Information Extraction