A dar voz ao Processamento Computacional de Português no PROPOR2020
A cada dois anos, a Conferência Internacional de PROcessamento Computacional da Língua PORtuguesa – PROPOR – ocorre em Portugal ou no Brasil. Évora foi a cidade que a acolheu durante os dias 2 e 4 de março de 2020, e a VoiceInteraction esteve lá, não apenas como entidade de referência que procura ativamente soluções inovadoras para geração de produto e de tecnologia na área de Processamento de Fala, mas também como patrocinador principal, apoiando e motivando a pesquisa de qualidade desenvolvida dentro das universidades ao mercado e, em um trabalho conjunto com as empresas, dando respostas imediatas às necessidades do mercado e consumo como é exigido no setor das Tecnologias de Informação.
A última década foi de grande expansão e expressão para o Processamento de Linguagem Natural e Machine Learning, instrumentos essenciais no desenvolvimento da Inteligência Artificial.
Ainda que o Português esteja no grupo das cinco línguas mais faladas do mundo, muito está por fazer na recolha e construção de bases de dados de texto e de voz e no seu reconhecimento e tratamento, de modo que novas metodologias, técnicas e sistemas em interação, possam fornecer conhecimento (estatístico e de regra) para apoiar em tarefas do dia a dia que lidem com grandes quantidades desta matéria-prima que é a língua.
Da organização de dicionários, glossários e terminologias de língua à tradução automática. Do reconhecimento da língua padrão às suas variantes e dialetos. Da descrição de exames e diagnósticos médicos a sistemas de tratamento de patologias que envolvem a linguagem. Da língua escrita à falada; da falada à escrita, no auxílio a dificuldades de processamento de língua por afasias, na análise de sentimento, na extração e sumarização de informação. Da língua que se faz de segmentos menores a um conjunto de informação composta qual puzzle sempre em mudança, é imperativo seguir a desenvolver técnicas, metodologias, aplicações, modelos, ferramentas que da teoria à prática levem a língua na sua forma mais completa aos demais lugares em que ela é o ingrediente-chave na vida dos utilizadores.
Um futuro de possibilidades que os oradores convidados, João Graça (UnBabel), Fernando Pereira (Google), Cícero dos Santos (Amazon) e Isabel Trancoso (INESC-ID/IST, Univ. Lisboa), lançaram, juntando criatividade e conhecimento científico e tecnológico, numa ponte efetiva desenhada entre academia e indústria.
Também a VoiceInteraction levou um pouco do seu futuro que já se faz presente, com uma demonstração da ferramenta MMS, Sistema de Monitorização de Media, cujas funcionalidades estão na transcrição automática, segmentação e indexação de programas de televisão e rádio com possibilidade de análise do conteúdo transmitido, pesquisa de informação relevante, edição e partilha de conteúdos noutras plataformas.
Fecha-se este texto como se abriu a conferência. Aumentar as possibilidades para o reconhecimento e tratamento do Português aproximando os percursos/caminhos entre o que de conhecimento se constrói nos grupos de investigação dentro da Academia e os recursos e produtos desenvolvidos pela Indústria. Dois caminhos que devem confluir para um mesmo ponto.