Não estaremos com você na NAB Show, mas estamos sempre aqui para si.
Broadcast & Mídia, Empresa, Indústrias, Legendagem, Notícias Empresa
Para maior divulgação na NAB Las Vegas 2020, tínhamos preparado um conjunto de desenvolvimentos associados ao nosso sistema de legendagem automática dos quais destacamos:
- Otimização do motor de Automatic Speech Recognition (ASR) com melhor gestão de memória e utilização eficiente de novas threads em paralelo que permitem melhorar a velocidade e diminuir a latência;
- Com a coleta diária de mais dados, acústicos e textuais, o treino dos modelos tem produzido melhorias constantes e consistentes. Com a utilização de mais GPUs em paralelo, conseguimos diminuir o tempo de treino desses modelos. Isso permite que atualmente estejamos a gerar modelos diários para várias línguas, garantindo que os nossos clientes tenham acesso a modelos atualizados todos os dias;
- Realizamos vários treinos nos modelos de Speaker Turn, Speaker ID e Punctuation que nos permite uma melhor apresentação de resultados;
- Melhoria substancial em várias línguas, nomeadamente, no inglês americano, espanhol americano, português do Brasil, espanhol dos países LATAM (Argentina, Chile, Peru, Colômbia, Caribe genérico) – com modelos específicos para cada país; México, línguas europeias (Itália, França, Espanha, Alemanha, Holanda, Portugal, Suíça). Iniciámos também o desenvolvimento de modelos para a Ásia (inglês da Ásia, inglês da Índia, hindu, malaio e coreano);
- Possibilidade de trabalhar com 2 ou mais línguas em simultâneo (por exemplo, Inglês e Espanhol no mesmo programa);
- Utilização de sistemas de tradução 3rd party para tradução em tempo real, Inglês -> Espanhol e Espanhol -> Inglês, e possibilidade de enviar simultaneamente como CC1 e CC3 em 2 línguas;
- Integração com AWS e Google (cloud) e possibilidade de outras integrações para On-premises;
- Integração com sistemas Text-to-Speech, como seja Acapela, AWS cloud e Google cloud, entre outros;
- Novas funcionalidades na interface nos agendamentos com adição de novas palavras no vocabulário, integração com MOS/ENPS, iNews e Dalet. Estas integrações permitem acesso a mais dados e uma atualização mais efetiva dos modelos diários;
- Controlo da aplicação por GPIO, que é uma alternativa à interface e aos mute/unmute ou utilização da API REST;
- Integração com várias placas, como Decklink, Avermedia (com transcode) e AJA;
- Suporte a diferentes formatos de streams adicionando o WebVTT, Unified Streaming, YouTube, Facebook, Zoom;
- Exportação do vídeo e CC, seja em formatos comprimidos ou não, para utilização em plataformas VOD.
A VoiceInteraction continua focada no futuro e está a trabalhar diariamente para que um produto mais sólido seja entregue aos seus clientes.
Se ficou interessado ou tem alguma questão sobre o nosso produto, não hesite em contactar-nos: info@voiceinteraction.com.br
Tags In
Tweets VoiceInteraction
Notícias por categoria:
Tags Cloud
analise audiencias
anatel
audimus.media
audimus.server
Big Data
Broadcast Asia
broadcast monitoring
camaras municipais
Closed Captioning
compliance recording
CONFERÊNCIA
Data
Data Science
DSPA
ebu
EiTV
Espanhol
eventos
Events
EXPOTEC Perú
fab
fcc
i-Data Meeting
ibc
IFE
imsc
Insights
legendagem ao vivo
legendas ao vivo
live streaming
machine learning
MMS
mms be
mms broadcast
nab
noticias
Opinion Article
Parceiros
set expo
Singapura
speech recognition
subtitling regulation
TVB Europe
VoiceInteraction Brasil
vox control