PROJETO VOISCRIPTUM
Transcrição Automática de Fala para Apoio à Atividade Judicial e do Ministério Público
PARCEIRO
Um projeto em execução que conta com a participação da Procuradoria-Geral da República, em concreto com a DCIAP*, como utilizadora e recetora dos resultados do mesmo. Toda a operação é gerida, internamente, pela equipa da DCIAP, garantindo-se, sempre, toda a conficidencialidade exigida neste processo.
VOISCRIPTUM, uma solução baseada nas mais recentes tecnologias de processamento de áudio, segmentação e identificação do orador, bem como de transcrição de conteúdos falados, que servirá para apoiar os procedimentos judiciais. O principal objetivo será a transcrição automática das sessões de interrogatório e depoimentos para efeitos de maximização de recursos e diminuição da carga e tempo gastos, atualmente, em procedimentos de transcrição manual de raíz. Além disto, pretende-se equipar toda a magistratura com sistema de ditado individualmente customizados, minimizando tarefas datilográficas repetitivas.
Este projeto vai ao encontro de uma área em que os procedimentos inerentes à fase de inquérito dos processos jurídicos são, temporalmente, muito extensos e incluem vários oradores e pessoas de interesse, onde não será possível seguir uma abordagem personalizada, levando-nos a recorrer a modelos independentes do orador.
Após a captação e gravação dos áudios, estes são descarregados para um servidor de processamento através de uma interface web. Esta é responsável por importar, gerir e monitorizar todo o processo de transcrição automática, disponibilizando o resultado para fins de edição.
Neste seguimento de fluxo de trabalho, existirá uma interface complementar agregada com o objectivo de fornecer uma plataforma gráfica para editar/corrigir a transcrição. Este editor possui um player de áudio incorporado, possibilitando um processo de correção sem necessidade de ferramentas externas, já que existe uma sincronização entre aquilo que se ouve e aquilo que se está a corrigir.
Numa prespectiva de evolução e melhoramento constante dos resultados das transcrições automáticas, será garantido a realimentação deste “software” com base nas correções realizadas, onde o próprio sistema vai adaptando os seus modelos acústicos e linguísticos ao domínio da Justiça.
Adicionalmente, e no mesmo universo, iremos demonstrar, com este projeto inovador, as capacidades de maximização de pessoas e meios oferecidos pela tecnologia de transcrição automática da fala na área particular da justiça. Pretende-se que esta tecnologia sirva de base à construção de um sistema de ditado pessoal e personalizado, permitindo aos magistrados a criação de despachos e outros ofícios judiciais, de forma mais célere e recorrendo à própria voz. Será um sistema adaptável à voz e ao vocabulário do utilizador, retornando o que foi dito em forma de texto imediatamente após ter sido falado. Serão recolhidos dados reais para a criação de modelos directamente adaptados ao domínio da magistratura.
APOIOS
Este projeto, financiado no âmbito do Portugal 2020, conta com a participação da Procuradoria-Geral da República, através do seu orgão DCIAP, como utilizadora e recetora dos resultados do projeto. Toda a operação é gerida, internamente, pela equipa da DCIAP, garantindo-se, sempre, toda a conficidencialidade exigida neste processo.
Código do projecto: LISBOA-01-0247-FEDER-027496
Região de intervenção | Lisboa
Entidade beneficiária | Voiceinteraction – Tecnologias de Processamento de Fala, S.A
Data de Aprovação | 13-03-2018
Data de Início | 01-11-2017
Data de Conclusão | 02-05-2019
Custo total elegível | 281,960.42€
Apoio financeiro da União Europeia|FEDER | 112,784.17€