Conheça a tecnologia da VoiceInteraction
A VoiceInteraction tem a certeza que a fala será no futuro a principal interface no acesso às tecnologias de informação e pretendemos ser a empresa de referência nesta área, baseando a nossa ação em uma busca contínua por soluções inovadoras, de forma a potencializar e agregar valores às empresas através da integração de tecnologias de processamento da fala, nomeadamente reconhecimento e síntese de fala.
Nossas tecnologias movem-se em duas áreas que se complementam: o reconhecimento permite transcrever a fala do orador e a síntese transforma texto em fala. Aplicamos os conhecimentos desenvolvidos no contexto da atividade de I&D intensiva.
Os motores de reconhecimento e síntese podem ser integrados nas aplicações através de interfaces proprietárias (acessíveis em C++, Java), de interfaces standard (MRCP v2) ou acessadas remotamente via WebServices. Os motores são independentes da língua, e atualmente são suportados o Português Europeu, o Português do Brasil, o Espanhol (Castelhano), o Espanhol (América Latina), o Inglês (Americano e Britânico), o Italiano, o Alemão e o Francês.
Na área de reconhecimento de fala, a VoiceInteraction desenvolveu um sistema com capacidade de transformar o som produzido pelo orador numa sequência de palavras – o AUDIMUS.MEDIA. Destacamos aqui as potencialidades da nossa tecnologia aplicadas a este sistema:
- Processa áudio proveniente de fontes pré- existentes (arquivos) ou produzidas em tempo real (streaming).
- É capaz de combinar dinamicamente gramáticas livres de contexto (SRGS) com gramáticas estatísticas.
- Suporta adaptação ao orador.
- Tem módulos de pré-processamento acústico que conferem maior robustez ao reconhecimento em condições adversas.
- O sistema de reconhecimento é capaz de suportar dicionários >100.000 palavras, mantendo o processamento em tempo real.
- Existem versões adaptadas para áreas especificas: medicina (várias especialidades), justiça, media (televisão, internet e rádio).
- Os resultados têm medidas de confiança associadas para permitir a recuperação de erros.
- É possível ajustar as transcrições fonéticas das palavras do dicionário e adicionar palavras não existentes no modelo