{"id":10961,"date":"2015-06-08T17:11:00","date_gmt":"2015-06-08T15:11:00","guid":{"rendered":"http:\/\/theark.ch\/mieux-interpreter-la-ponctuation-dans-les-systemes-de-reconnaissance-vocale-8169\/"},"modified":"2015-06-08T17:11:00","modified_gmt":"2015-06-08T15:11:00","slug":"mieux-interpreter-la-ponctuation-dans-les-systemes-de-reconnaissance-vocale-8169","status":"publish","type":"post","link":"https:\/\/theark.ch\/fr\/news\/mieux-interpreter-la-ponctuation-dans-les-systemes-de-reconnaissance-vocale-8169\/","title":{"rendered":"Mieux interpr\u00e9ter la ponctuation dans les syst\u00e8mes de reconnaissance vocale"},"content":{"rendered":"<p><strong>Les syst\u00e8mes traditionnels de reconnaissance automatique de la parole se heurtent \u00e0 la probl\u00e9matique de la ponctuation. M\u00eame quand une retranscription ne comporte aucune erreur, le manque de ponctuation et de formatage du texte rend son utilisation difficile et n\u00e9cessite un travail cons\u00e9quent par l\u2019utilisateur. Celui-ci se voit pr\u00e9senter une suite de mots exempt\u00e9e de majuscule, point, virgule, d\u00e9coup\u00e9e en segments de diff\u00e9rentes longueurs et doit donc compl\u00e9ter manuellement le texte avec les informations manquantes.<\/strong><\/p>\n<p>\u00a0<\/p>\n<p>Le projet de m\u00fbrissement PUNK impliquant l\u2019<a href=\"http:\/\/www.idiap.ch\" target=\"_blank\" rel=\"noopener\">Idiap<\/a> et la soci\u00e9t\u00e9 <a href=\"http:\/\/www.recapp.ch\/fr\/\" target=\"_blank\" rel=\"noopener\">recapp IT<\/a> SA vise \u00e0 d\u00e9velopper des modules de formatage pour que l\u2019interpr\u00e9tation du texte propos\u00e9 \u00e0 l\u2019utilisateur final soit plus intuitive et que le r\u00e9sultat de la retranscription soit le plus complet possible. Dans un premier temps, le projet traite donc la mise en forme des dates, des nombres et des acronymes. Une seconde \u00e9tape va s\u2019occuper de la probl\u00e9matique de la ponctuation: en se basant sur un grand ensemble de textes d\u00e9j\u00e0 disponibles et en \u00abapprenant\u00bb leurs caract\u00e9ristiques, les algorithmes d\u00e9velopp\u00e9s pourront trouver automatiquement la ponctuation d\u2019un texte qui n\u2019en comporte pas. Pour am\u00e9liorer encore plus le syst\u00e8me, une derni\u00e8re \u00e9tape utilisant les silences et les caract\u00e9ristiques vocales des locuteurs sera aussi investigu\u00e9e.<\/p>\n<p>\u00a0<\/p>\n<p>Le parlement valaisan sera le premier b\u00e9n\u00e9ficiaire de cette technologie via son syst\u00e8me Mediaparl, fourni par Recapp et l\u2019Idiap.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Les syst\u00e8mes traditionnels de reconnaissance automatique de la parole se heurtent \u00e0 la probl\u00e9matique de la ponctuation. M\u00eame quand une retranscription ne comporte aucune erreur, le manque de ponctuation et de formatage du texte rend son utilisation difficile et n\u00e9cessite un travail cons\u00e9quent par l\u2019utilisateur. Celui-ci se voit pr\u00e9senter une suite de mots exempt\u00e9e de [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[186],"tags":[],"class_list":["post-10961","post","type-post","status-publish","format-standard","hentry","category-digital"],"acf":[],"_links":{"self":[{"href":"https:\/\/theark.ch\/fr\/wp-json\/wp\/v2\/posts\/10961","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/theark.ch\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/theark.ch\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/theark.ch\/fr\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/theark.ch\/fr\/wp-json\/wp\/v2\/comments?post=10961"}],"version-history":[{"count":0,"href":"https:\/\/theark.ch\/fr\/wp-json\/wp\/v2\/posts\/10961\/revisions"}],"wp:attachment":[{"href":"https:\/\/theark.ch\/fr\/wp-json\/wp\/v2\/media?parent=10961"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/theark.ch\/fr\/wp-json\/wp\/v2\/categories?post=10961"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/theark.ch\/fr\/wp-json\/wp\/v2\/tags?post=10961"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}