A voz da tradutora do Google já se tornou um clássico da internet, contudo, a empresa começa a dar indícios que deve criar novas soluções para essa aplicação. Após anunciar um assistente virtual com a voz do cantor John Legend, a empresa anunciou nesta quarta-feira (15), a criação da tecnologia Translatotron, que traduz o enunciado de voz para voz guardando as características originais da voz do usuário.
LEIA TAMBÉM: Google lança assistente de voz com perfil do cantor John Legend
Esse é o primeiro modelo de ponta a realizar tradução diretamente da fala de um idioma para o outro, de modo que o dispositivo é capaz de reter a voz do locutor no anunciado que foi traduzido.
Para desenvolver a eficiência da ferramenta, os pesquisadores utilizaram um formato de sequência à sequência, além de espectogramas como dados iniciais de treinamento de entrada. Deste modo, uma rede de codificador eficiente para alto-falantes é utilizada para captar com fidelidade a voz do locutor.
De acordo com o Google, o sistema pretende “dividir a tarefa em estágios separados, fornecendo algumas vantagens sobre sistemas em cascata, incluindo velocidade de inferência mais rápida, evitando naturalmente erros de composição entre reconhecimento e tradução, facilitando a retenção da voz do falante original após a tradução e lidando melhor com palavras que não precisam ser traduzidas”.
Por enquanto, a ferramenta está em fase de experimento, contudo, é provável que não demore muito para que seja incorporada a outros produtos de voz da companhia, como o Tradutor.