{"id":10967,"date":"2015-06-08T17:11:00","date_gmt":"2015-06-08T15:11:00","guid":{"rendered":"http:\/\/theark.ch\/mieux-interpreter-la-ponctuation-dans-les-systemes-de-reconnaissance-vocale-8169\/"},"modified":"2024-09-17T18:23:00","modified_gmt":"2024-09-17T16:23:00","slug":"bessere-interpretation-der-zeichensetzung-in-spracherkennungssystemen-8169","status":"publish","type":"post","link":"https:\/\/theark.ch\/de\/news\/bessere-interpretation-der-zeichensetzung-in-spracherkennungssystemen-8169\/","title":{"rendered":"Bessere Interpretation der Zeichensetzung in Spracherkennungssystemen"},"content":{"rendered":"<p><strong>Herk\u00f6mmliche automatische Spracherkennungssysteme sind mit der Problematik der Zeichensetzung konfrontiert. Selbst wenn eine Transkription keinen Fehler enth\u00e4lt, erschwert die fehlende Zeichensetzung und Formatierung des Textes seine Verwendung und erfordert eine beachtliche Arbeit des Nutzers. Dieser sieht sich mit einer\u00a0 wilden Aufeinanderfolge von W\u00f6rtern ohne Grossbuchstaben, Punkten, Kommas und Segmenten unterschiedlicher L\u00e4ngen konfrontiert und er muss die fehlenden Informationen im Text manuell erg\u00e4nzen.<\/strong><\/p>\n<p>\nDas Projekt PUNK, an dem das <a href=\"http:\/\/www.idiap.ch\" target=\"_blank\" rel=\"noopener\">Idiap<\/a> und die Firma <a href=\"http:\/\/www.recapp.ch\/fr\/\" target=\"_blank\" rel=\"noopener\">recapp IT<\/a> SA beteiligt sind, verfolgt das Ziel, Formatierungsmodule zu entwickeln, um dem Endnutzer eine intuitivere Interpretation des Textes und ein m\u00f6glichst vollst\u00e4ndiges Ergebnis der Transkription zu pr\u00e4sentieren, ist in der Reifephase. In einer ersten Phase behandelt das Projekt die Formatierung von Datumsangaben, Zahlen und Akronymen. In einem zweiten Schritt wird die Problematik der Zeichensetzung behandelt: Indem sich die entwickelten Algorithmen auf eine grosse Sammlung an bereits verf\u00fcgbaren Texten st\u00fctzen und deren Merkmale \u201eerlernen\u201c, k\u00f6nnen sie die Zeichensetzung f\u00fcr einen Text, bei dem diese nicht vorhanden ist, automatisch ermitteln. Um das System noch weiter zu verbessern, wird ebenfalls eine letzte Phase untersucht, in der die Sprechpausen und die Sprachmerkmale der Sprecher ausgewertet werden.<\/p>\n<p>\nDas Walliser Parlament wird als erstes von dieser Technologieprofitien, in Form seines Mediaparl-Systems, das von recapp und Idiap bereitgestellt wird.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Herk\u00f6mmliche automatische Spracherkennungssysteme sind mit der Problematik der Zeichensetzung konfrontiert. Selbst wenn eine Transkription keinen Fehler enth\u00e4lt, erschwert die fehlende Zeichensetzung und Formatierung des Textes seine Verwendung und erfordert eine beachtliche Arbeit des Nutzers. Dieser sieht sich mit einer\u00a0 wilden Aufeinanderfolge von W\u00f6rtern ohne Grossbuchstaben, Punkten, Kommas und Segmenten unterschiedlicher L\u00e4ngen konfrontiert und er muss [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[204],"tags":[],"class_list":["post-10967","post","type-post","status-publish","format-standard","hentry","category-digitalisierung"],"acf":[],"_links":{"self":[{"href":"https:\/\/theark.ch\/de\/wp-json\/wp\/v2\/posts\/10967","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/theark.ch\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/theark.ch\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/theark.ch\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/theark.ch\/de\/wp-json\/wp\/v2\/comments?post=10967"}],"version-history":[{"count":12,"href":"https:\/\/theark.ch\/de\/wp-json\/wp\/v2\/posts\/10967\/revisions"}],"predecessor-version":[{"id":38380,"href":"https:\/\/theark.ch\/de\/wp-json\/wp\/v2\/posts\/10967\/revisions\/38380"}],"wp:attachment":[{"href":"https:\/\/theark.ch\/de\/wp-json\/wp\/v2\/media?parent=10967"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/theark.ch\/de\/wp-json\/wp\/v2\/categories?post=10967"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/theark.ch\/de\/wp-json\/wp\/v2\/tags?post=10967"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}