Chancen & Herausforderungen der KI-basierten Spracherkennung: Wie Whisper die Servicequalität des AV-Portals steigert
7. Dezember 2023 : 10:35 - 10:55
Sven Strobel (TIB – Leibniz-Informationszentrum Technik und Naturwissenschaften, Deutschland)
Veranstaltungsraum: RAUM A
Die Open-Source KI 'Whisper' von OpenAI steigert Effizienz und Servicequalität in Bibliotheken. Anhand des Videoportals der Technischen Informationsbibliothek werden die Vorteile und Herausforderungen dieser KI aufgezeigt.
KI-basierte Open-Source-Software bietet Bibliotheken die Chance, sowohl die betriebliche Effizienz als auch die Qualität der Services für die Kunden zu verbessern. Im Bereich der automatischen Spracherkennung haben maschinelle Lernverfahren, insbesondere Deep Learning, zu erheblichen Fortschritten bei der Genauigkeit, Effizienz und Vielseitigkeit der Systeme geführt. Ein Beispiel dafür ist Whisper von OpenAI - ein Spracherkennungsmodell, das 97 Sprachen transkribiert, mehrere Sprachen ins Englische übersetzt und gut mit Dialekten und Akzenten zurecht kommt. Anhand des Videoportals der Technischen Informationsbibliothek wird gezeigt, wie Whisper in das Portal integriert wurde und welche Vorteile es für die Nutzer bringt. Außerdem werden die Probleme und Herausforderungen dieser KI-Software beleuchtet.