Cada vez mais IAs generativas baseadas em Large Language Models (LLM) estão impulsionando uma nova experiência para os consumidores com marcas, produtos e serviços. Uma IA que acaba de ganhar novos “poderes” com uso de LLM é a Alexa, da Amazon. Algumas novidades foram anunciadas para os EUA ainda sem data para o Brasil.
Daniel Rausch, vice-presidente, Alexa e Fire TV da Amazon, está otimista com este novo conjunto de soluções: “Estamos apenas começando. Com a IA generativa podemos aprimorar vários componentes principais da experiência Alexa”.
Este novo modelo traz um grande conjunto de recursos de conversação que ajudarão a fornecer uma Alexa ainda mais intuitiva, inteligente e útil. “Nos últimos anos, falamos frequentemente sobre como vivemos a era de ouro da inteligência artificial (IA). Ideias que pareciam ficção científica há pouco tempo agora são realidade – e não há melhor exemplo disso do que Alexa”, comenta Raush.
Tendo ultrapassado meio bilhão de dispositivos vendidos e com dezenas de milhões de interações a cada hora, Alexa tornou-se parte da família em milhões de lares. “Sempre pensamos na Alexa como um serviço em evolução e temos melhorado continuamente desde o dia em que a introduzimos no mercado em 2014. Uma missão de longa data, tem sido tornar uma conversa com Alexa tão natural quanto falar com outro ser humano, e com o rápido desenvolvimento da IA generativa o que apenas imaginávamos está agora ao nosso alcance”, destaca Daniel Rausch, no comunicado do lançamento do LLM.
Uma Alexa mais inteligente
Conceber uma Alexa mais inteligente e conversacional só foi possível com uso intenso de LLM. “Estudamos muito sobre conversação nos últimos anos e sabemos que nas nossas interações vamos muito além das palavras. Em qualquer conversa processamos muitas informações adicionais, como linguagem corporal, conhecimento da pessoa com quem você está conversando e contato visual”, comenta Rausch, dando indícios de todo o potencial explorado para a nova Alexa.
Veja cinco capacidades aprimoradas com IA para a Alexa:
Conversa
A entrada dos novos sensores à câmera e entrada de voz, aumentaram a capacidade da Alexa em detectar a presença humana e fundir mais informações para uma conversa mais fluída. Com esses APIs e modelos de LLMs, ela agora pode compreender dicas não-verbais. A redução de latência do dispositivo para que as conversas fluam naturalmente, sem pausa, e as respostas tenham a duração certa para a voz também foram outros avanços. Por exemplo, quando você pergunta as últimas notícias sobre uma determinada tendência, você obtém uma resposta sucinta apenas com as informações mais relevantes. Caso queira aprofundar o tema, basta seguir perguntando.
Utilidade no mundo real
Para ser verdadeiramente útil, a Alexa precisa ser capaz de agir no mundo real. Isso tem sido um dos desafios em termos de LLM: como integrar APIs em escala e de maneira confiável para tomar as ações corretas? Este novo modelo agora vem conectado a centenas de milhares de dispositivos do mundo real por meio de APIs de LLM. Isso aprimora a capacidade da Alexa de processar nuances e ambiguidades, além de programar rotinas mais complexas inteiramente por voz.
Personalização e contexto
Um LLM para o lar deve ser personalizado para toda a família. Essa nova geração da Alexa é capaz de oferecer experiências únicas com base nas preferências que você e sua família compartilham, nos serviços com os quais interage e sobre diversas informações. Com isso, Alexa agora também pode transportar mais contexto ao longo das conversas, da mesma forma que os humanos fazem o tempo todo.
Personalidade
Com este novo modelo de LLM, Alexa tem agora um ponto de vista único também – mais “pessoal” – tornando as conversas mais envolventes. Alexa pode dizer quais filmes deveriam ter ganhado um Oscar, por exemplo, ou comemorar quando você responde corretamente a uma pergunta, ou até criar um bilhete entusiasmado para você para parabenizar um amigo numa data especial.
Confiança
Embora a integração de LLM e IA generativa traga infinitas possibilidades, os avanços da Alexa trazem um compromisso com a transparência e a confiança de seus clientes. Conceber experiências com maior proteção à privacidade é uma delas.
Explorar as capacidades de envolvimento entre máquinas e humanos certamente será um dos grandes objetivos e avanços em IAs generativas e modelos de linguagem natural para a experiência do cliente nos próximos anos. Com uma capacidade cada vez maior de reunir informações sobre nossos hábitos e preferências, muito em breve a tecnologia nos aproximará ainda mais daquilo que antes era apenas conhecido em filmes de ficção científica. Você duvida? Pergunte a Alexa.