{"id":18457,"date":"2020-04-14T09:00:56","date_gmt":"2020-04-14T09:00:56","guid":{"rendered":"https:\/\/voice-interaction.com\/tmp-web\/?p=18457"},"modified":"2020-04-14T16:32:35","modified_gmt":"2020-04-14T16:32:35","slug":"sabe-como-funciona-um-sistema-de-legendagem-automatica","status":"publish","type":"post","link":"https:\/\/voice-interaction.com\/tmp-web\/br\/sabe-como-funciona-um-sistema-de-legendagem-automatica\/","title":{"rendered":"Sabe como funciona um sistema de legendagem autom\u00e1tica?"},"content":{"rendered":"<p>Desenvolver uma nova l\u00edngua de trabalho pressup\u00f5e a reuni\u00e3o de fatores fundamentais para que o reconhecimento autom\u00e1tico de fala alcance medidas de sucesso e \u00eaxito. \u00c9, portanto, mandat\u00f3rio <strong>construir modelos de l\u00edngua e modelos ac\u00fasticos a partir de dados ac\u00fasticos e textuais de qualidade como fala limpa<\/strong> e adequados ao objetivo final de utiliza\u00e7\u00e3o, a fim de obter equil\u00edbrio entre l\u00edngua comum e l\u00edngua do dom\u00ednio ou \u00e1rea de intera\u00e7\u00e3o (Tribunais, C\u00e2maras, Media, etc). Contudo, todas estas \u00e1reas com que trabalhamos t\u00eam muita fala espont\u00e2nea e coloquial, fala sobreposta, ru\u00eddo, muita variedade regional, e tamb\u00e9m pessoas a falar uma segunda l\u00edngua, o que constitui um enorme desafio, para n\u00e3o dizer dificuldade, para o reconhecimento.<\/p>\n<p>Nos trabalhos de <strong>reconhecimento de fala<\/strong>, tudo come\u00e7a na palavra dita e nos sons da l\u00edngua dispon\u00edveis\u00a0\u00a0 para ela, para que possa ter correspond\u00eancia entre sons\/fonemas e a palavra escrita. Esta correspond\u00eancia \u00e9 o <strong>nosso modelo ac\u00fastico, que, em conjuga\u00e7\u00e3o com o modelo de l\u00edngua, torna poss\u00edvel o reconhecimento.<\/strong><\/p>\n<p>Todas as palavras t\u00eam a sua identidade e, assim, caracter\u00edsticas pr\u00f3prias que obrigam a que, na sua periferia, estejam outras para que uma frase esteja gramaticalmente correta.<\/p>\n<p>Existem palavras que se alocam a outras em detrimento de tantas outras por causa da informa\u00e7\u00e3o veiculada e da forma como se quer passar essa informa\u00e7\u00e3o, que por tend\u00eancia est\u00e1 muito relacionada com o tipo de texto (liter\u00e1rio, jornal\u00edstico, formal, etc), com o dom\u00ednio textual (Esportivo, Economia, Pol\u00edtica, Culin\u00e1ria) e subdom\u00ednio (futebol, r\u00e2guebi) ou tema (Coronav\u00edrus, Presidenciais e elei\u00e7\u00e3o de Trump, situa\u00e7\u00e3o dos refugiados na Europa).<\/p>\n<p>H\u00e1 palavras que se alocam a outras em detrimento de tantas outras por causa da informa\u00e7\u00e3o veiculada e da forma como se quer passar essa informa\u00e7\u00e3o, pelo que tal tend\u00eancia est\u00e1 grandemente relacionada com o tipo de texto (liter\u00e1rio, jornal\u00edstico, formal, etc), com o dom\u00ednio textual (Desporto, Economia, Pol\u00edtica, Culin\u00e1ria) e subdom\u00ednio (futebol, r\u00e2guebi) ou tema (Coronav\u00edrus, Presidenciais e elei\u00e7\u00e3o de Trump, Ataque Terrorista das Torres G\u00e9meas em Nova Iorque).<\/p>\n<p>Chamamos a isto <strong>mapeamento de palavras (<span style=\"text-decoration: underline;\">word sketch<\/span>)<\/strong>, e atrav\u00e9s dele conseguimos entender quais as que est\u00e3o pr\u00f3ximas da palavra em an\u00e1lise, e estas s\u00e3o as que mais frequentemente surgem com ela nos textos (junto da palavra <em>problema<\/em> \u00e9 muito prov\u00e1vel que esteja um adjetivo de conota\u00e7\u00e3o negativa, como <em>s\u00e9rio<\/em>, <em>grave<\/em>, <em>grande<\/em>, <em>doloroso,<\/em> ou outro do mesmo \u00e2mbito sem\u00e2ntico).<\/p>\n<p>\u00c9 poss\u00edvel encontrar palavras compostas pela sua concentra\u00e7\u00e3o e pela elevada ocorr\u00eancia de determinado conjunto de palavras. A sua elevada concorr\u00eancia e concentra\u00e7\u00e3o podem determinar a sua unidade,\u00a0 em um determinado dom\u00ednio textual e n\u00e3o em outro (para a palavra <em>equipe<\/em>, h\u00e1 uma elevada aloca\u00e7\u00e3o das palavras <em>futebol<\/em>, <em>desenvolvimento<\/em>, <em>pesquisa)<\/em>. <strong>\u00c9 desta an\u00e1lise do comportamento das palavras e das probabilidades da sua distribui\u00e7\u00e3o, e da aplica\u00e7\u00e3o de diferentes metodologias, que sai o modelo de l\u00edngua.<\/strong><\/p>\n<p><strong>S\u00e3o estes os fatores poss\u00edveis na tarefa de reconhecimento da fala<\/strong>. Internamente, existem subtilezas importantes, como vari\u00e1veis f\u00edsicas (condi\u00e7\u00f5es de grava\u00e7\u00e3o), geogr\u00e1ficas (variantes fon\u00e9ticas para uma mesma palavra),\u00a0 discursivas (tom, novas palavras); humanas (emo\u00e7\u00f5es), fision\u00f3micas (idade do locutor e condi\u00e7\u00f5es do aparelho voc\u00e1lico) e outras, e s\u00e3o elas que fazem a diferen\u00e7a entre um reconhecimento bem ou mal-sucedido.<\/p>\n<p><strong>A equipe de P&amp;D da <span style=\"color: #ff9900;\">VoiceInteraction <\/span>trabalha para que todos os dias novos desenvolvimentos nesta \u00e1rea sejam feitos, mantendo-nos assim na vanguarda tecnol\u00f3gica!<\/strong><\/p>\n<p>Para mais informa\u00e7\u00e3o, contacte-nos para: <a href=\"mailto:info@voiceinteraction.com.br\">info@voiceinteraction.com.br<\/a><\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Desenvolver uma nova l\u00edngua de trabalho pressup\u00f5e a reuni\u00e3o de fatores fundamentais para que o reconhecimento&#8230;<\/p>\n","protected":false},"author":9,"featured_media":18560,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_links_to":"","_links_to_target":"","footnotes":""},"categories":[664,667],"tags":[1076,1073,1072,1074,1075,1077],"class_list":["post-18457","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-empresa","category-noticias-empresa","tag-audio","tag-engine","tag-modelos","tag-reconhecimento","tag-som","tag-tecnologia-br"],"_links":{"self":[{"href":"https:\/\/voice-interaction.com\/tmp-web\/br\/wp-json\/wp\/v2\/posts\/18457","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/voice-interaction.com\/tmp-web\/br\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/voice-interaction.com\/tmp-web\/br\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/voice-interaction.com\/tmp-web\/br\/wp-json\/wp\/v2\/users\/9"}],"replies":[{"embeddable":true,"href":"https:\/\/voice-interaction.com\/tmp-web\/br\/wp-json\/wp\/v2\/comments?post=18457"}],"version-history":[{"count":6,"href":"https:\/\/voice-interaction.com\/tmp-web\/br\/wp-json\/wp\/v2\/posts\/18457\/revisions"}],"predecessor-version":[{"id":18564,"href":"https:\/\/voice-interaction.com\/tmp-web\/br\/wp-json\/wp\/v2\/posts\/18457\/revisions\/18564"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/voice-interaction.com\/tmp-web\/br\/wp-json\/wp\/v2\/media\/18560"}],"wp:attachment":[{"href":"https:\/\/voice-interaction.com\/tmp-web\/br\/wp-json\/wp\/v2\/media?parent=18457"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/voice-interaction.com\/tmp-web\/br\/wp-json\/wp\/v2\/categories?post=18457"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/voice-interaction.com\/tmp-web\/br\/wp-json\/wp\/v2\/tags?post=18457"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}