Como seres humanos, estamos muito familiarizados com o uso de nossas vozes – nosso principal meio de comunicação. O tempo, porém, fez com que passássemos a usar também o texto: SMS, WhatsApp, Telegram, Skype… são muitos os recursos que nos permitem digitar e que, com o tempo, também passaram a permitir o envio de mensagens de voz e a compreender palavras ditadas pelo consumidor.
Chegamos, então, a um ponto em que o interlocutor já não é necessariamente um humano, mas um robô. Ele começa a entender a voz de um indivíduo, a conhecer expressões e até mesmo gírias, evoluindo a cada dia. Fernando Lemos, CTO da Microsoft, explica que houve etapas nessa evolução:
- 2016 – Visão
- 2017 – Reconhecimento de fala
- 2018 – Leitura, tradução e síntese de discurso
- 2019 – Compreensão de linguagem
Com isso, o chamado aprendizado de máquina (ou Machine Learning, em inglês), tornou-se uma realidade.
Qual foi o impacto desse processo na experiência do cliente?
Lemos responde a essa pergunta a partir de um exemplo: a transformações de texto em voz que, hoje, é feita a partir de sistemas neurais – ou seja, ela se torna muito mais natural e confiável. A partir disso, ele apresenta o que a Microsoft possui para trabalhar com sistemas de cognição e voz. “Dentro de uma das nossas nuvens, a Azure, temos uma gama enorme de serviços de IA”, diz.
1. Aplicativos de IA e agentes
“São dois grandes blocos: serviços cognitivos e comunicação por chatbots apoiados em sistemas cognitivos e IA”, diz. Em sistemas cognitivos, a empresa busca aplicar capacidade humana na tecnologia e, depois, tomadas de decisão via redes neurais. Como exemplo, ele cita sistemas de apoio à decisão, ou seja, personalização. No atendimento ao cliente, por exemplo, ele cita que é possível determinar as respostas a partir da compreensão do humor do cliente. “Em sistemas de linguagem, muitas vezes é difícil determinar se a conversa é com um robô ou com um agente”, diz.
Caso não seja possível manter o uso de uma nuvem pública, ele explica que os serviços de cognição podem ser aplicados no sistema interno da empresa.
2. Gestão do conhecimento
Na prática, esse serviço se aplica a qualquer tipo de informação – seja documento, seja imagem, ou até mesmo vídeos. Depois, esses dados são catalogados e transformados em outras interações. Portanto, é a transformação da informação em conhecimento em prol da experiência.
3. Machine Learning
No caso de máquinas de aprendizado, Lemos destaca que essa tecnologia passa a estar disponível também para pessoas que não são especialistas – cientistas de dados, por exemplo. “Estamos empoderando qualquer pessoas para que possam fazer sistemas cognitivos com máquinas de aprendizado”, diz.
Ele opera de duas formas: quem não é técnico, que atua na área de negócios, pode usar a alternativa automática, que já é pré-treinada e pode simplesmente ser abastecida com dados do negócio. De forma visual e gráfica, o uso é simples. Por outro lado, há o processo de operar voz, IA e nuvem – como um método de treinamento da Machine Learning.
O trabalho com voz
De acordo com Lemos, o trabalho principal com voz acontece em empresas de relacionamento com clientes, telecomunicações, mídia, hotéis, restaurantes e carros inteligentes. “Aplicamos as técnicas de voz para criar dados insights e um assistente digital”, diz. A ideia é que as empresas possam ter suas próprias assistentes virtuais de voz. “A Microsoft lançou recentemente um estúdio de voz em que cada um pode experimentar e criar a voz que vai falar com você”, afirma.
No Teams, ele conta que é possível ter uma tradução em tempo real da fala em outra língua. O Skype, por sua vez, foi o primeiro a ter tradução em tempo real. Ambas (e muitos outros recursos) usam a tecnologia da Microsoft.
Confira o vídeo completo:
+CVX
5 exemplos de como IA e os bots combatem a Covid-19
5 perguntas e respostas sobre bots e dados pessoais
Humana ou não, a voz é sempre uma alternativa no atendimento