Não estaremos com você na NAB Show, mas estamos sempre aqui para si.
Broadcast & Mídia, Empresa, Indústrias, Legendagem, Notícias Empresa
Para maior divulgação na NAB Las Vegas 2020, tínhamos preparado um conjunto de desenvolvimentos associados ao nosso sistema de legendagem automática dos quais destacamos:
- Otimização do motor de Automatic Speech Recognition (ASR) com melhor gestão de memória e utilização eficiente de novas threads em paralelo que permitem melhorar a velocidade e diminuir a latência;
- Com a coleta diária de mais dados, acústicos e textuais, o treino dos modelos tem produzido melhorias constantes e consistentes. Com a utilização de mais GPUs em paralelo, conseguimos diminuir o tempo de treino desses modelos. Isso permite que atualmente estejamos a gerar modelos diários para várias línguas, garantindo que os nossos clientes tenham acesso a modelos atualizados todos os dias;
- Realizamos vários treinos nos modelos de Speaker Turn, Speaker ID e Punctuation que nos permite uma melhor apresentação de resultados;
- Melhoria substancial em várias línguas, nomeadamente, no inglês americano, espanhol americano, português do Brasil, espanhol dos países LATAM (Argentina, Chile, Peru, Colômbia, Caribe genérico) – com modelos específicos para cada país; México, línguas europeias (Itália, França, Espanha, Alemanha, Holanda, Portugal, Suíça). Iniciámos também o desenvolvimento de modelos para a Ásia (inglês da Ásia, inglês da Índia, hindu, malaio e coreano);
- Possibilidade de trabalhar com 2 ou mais línguas em simultâneo (por exemplo, Inglês e Espanhol no mesmo programa);
- Utilização de sistemas de tradução 3rd party para tradução em tempo real, Inglês -> Espanhol e Espanhol -> Inglês, e possibilidade de enviar simultaneamente como CC1 e CC3 em 2 línguas;
- Integração com AWS e Google (cloud) e possibilidade de outras integrações para On-premises;
- Integração com sistemas Text-to-Speech, como seja Acapela, AWS cloud e Google cloud, entre outros;
- Novas funcionalidades na interface nos agendamentos com adição de novas palavras no vocabulário, integração com MOS/ENPS, iNews e Dalet. Estas integrações permitem acesso a mais dados e uma atualização mais efetiva dos modelos diários;
- Controlo da aplicação por GPIO, que é uma alternativa à interface e aos mute/unmute ou utilização da API REST;
- Integração com várias placas, como Decklink, Avermedia (com transcode) e AJA;
- Suporte a diferentes formatos de streams adicionando o WebVTT, Unified Streaming, YouTube, Facebook, Zoom;
- Exportação do vídeo e CC, seja em formatos comprimidos ou não, para utilização em plataformas VOD.
A VoiceInteraction continua focada no futuro e está a trabalhar diariamente para que um produto mais sólido seja entregue aos seus clientes.
Se ficou interessado ou tem alguma questão sobre o nosso produto, não hesite em contactar-nos: info@voiceinteraction.com.br
Tags In
Related Posts
Tweets VoiceInteraction
Notícias por categoria:
Tags Cloud
analise audiencias
anatel
audimus.media
audimus.server
Aúdio
broadcast monitoring
Call Center Magazine
callscriber
camaras municipais
Closed Captioning
compliance recording
ebu
Engine
Espanhol
eventos
fab
fcc
Global Contact Center
ibc
imsc
IVR
legendagem ao vivo
legendas ao vivo
live streaming
machine learning
MMS
mms be
mms broadcast
Modelos
nab
news
noticias
Opinion Article
Quality Monitoring
Reconhecimento
set expo
Som
speech analytics
speech recognition
subtitling regulation
Technology
Tecnologia
TVB Europe
VoiceInteraction Brasil
vox control