/
/
O ChatGPT pode acabar com as pesquisas de mercado com humanos?

O ChatGPT pode acabar com as pesquisas de mercado com humanos?

Apesar de tentadores, LLMs ainda não conseguem gerar respostas completamente confiáveis. Mas combinação entre amostras sintéticas e humanos começam a se tornar viáveis

Na era da Inteligência Artificial generativa, será que as amostras sintéticas irão tomar conta do mercado de pesquisas? Será que elas irão substituir os entrevistados humanos? Ou atuar como um complemento às respostas dos painéis? Ou, ainda mais importante, os dados gerados são de qualidade suficientemente alta?

Antes, é preciso entender o que é amostra sintética. Ela é produzida por meio de IA generativa ou, mais comumente, modelagem preditiva, e são respostas parecidas com as humanas, com base nos conjuntos de dados disponíveis. Em vez de fazermos perguntas para um participante humano real, a IA generativa (grandes modelos de linguagem, como o GPT-4) ou modelos preditivos são usados como substitutos.

Juliana Cavallari, diretora de Contas da Kantar Brasil.

Essas amostras são compostas por esses dados sintéticos, que por sua vez podem ser gerados de diferentes formas: para aumentar dados existentes, criar dados e simular cenários futuros.

Cientistas de dados têm inserido dados preditivos há décadas para muitos propósitos, inclusive no campo da pesquisa de mercado. Mas, dados sintéticos levam isso ao próximo nível, pretendendo representar as atitudes ou comportamentos de um indivíduo ou grupo.

Os dados sintéticos podem oferecer muitos benefícios para a pesquisa de mercado, incluindo aumentar o tamanho da amostra e a diversidade ao imitar populações difíceis de alcançar a baixo custo, criar ideias e soluções através de modelagem preditiva, e acelerar o processo de pesquisa.

No entanto, os dados e amostras sintéticos também apresentam grandes riscos. Na pesquisa de mercado, conjuntos de dados sintéticos podem introduzir vieses ou distorções que não refletem com precisão as características e preferências de uma população-alvo. Portanto, é crucial entender os casos de uso, as metodologias de solução e os frameworks de avaliação antes de confiar em dados sintéticos para informar decisões comerciais importantes.

Um elemento essencial para alimentar um algoritmo gerador de dados sintéticos é uma abundância de “dados reais”. Confiar exclusivamente em um Large Language Model (LLM) disponível no mercado é, muitas vezes, uma estratégia ruim. É vital começar com uma fonte de dados de alta qualidade que seja muito específica para o problema em questão e usar isso para treinar um algoritmo gerador de dados sintéticos.

ChatGPT pode responder pesquisas?

Para confirmarmos isso, recentemente fizemos testes comparando os resultados gerados pelo GPT-4. Comparamos dados de uma pesquisa de cerca de 5 mil respondentes a perguntas sobre um produto de luxo e suas atitudes em relação à tecnologia com respostas dadas pela ferramenta de IA.

Usamos marcadores demográficos de nossa amostra humana, como localização geográfica, idade, etnia, renda, educação etc., como parte de nosso “condicionamento de prompt”. Para, assim, o GPT-4 garantir que suas respostas fossem comparáveis às respostas da pesquisa daquele perfil de respondente. Em efeito, portanto, criamos uma “amostra sintética” com características demográficas idênticas à nossa amostra humana.

Nossa conclusão é que, no momento, a amostra sintética, conforme gerada por esses LLM pré-treinados, tem viés, falta variação e nuance tanto na análise qualitativa quanto quantitativa. Por si só, como está, ainda não está pronta para ser usada como um complemento para amostras humanas.

Combinando amostras humanas e sintéticas

Amostras sintéticas criadas exclusivamente por LLMs prontos estão longe de atender à qualidade dos dados exigidos para pesquisa de mercado. É possível, porém, encontrar o equilíbrio certo entre colaboração entre máquina e humano para fornecer uma fonte de dados confiável.

Existem três principais casos de uso que vemos neste campo:

  • Impulsionamento de Amostra: é possível pegar um conjunto de dados de pesquisa em uma categoria específica e aumentar o conjunto de dados com mais respondentes em um ou mais subgrupos (que, por exemplo, podem estar sub-representados ou serem caros para recrutar). As respostas sintéticas podem ser aumentadas via agrupamento de respondentes ou via respondentes individuais. Se pensarmos em um conjunto de dados de pesquisa como uma tabela onde as linhas são respondentes e as colunas são perguntas da pesquisa, estamos tentando criar sinteticamente “novas linhas”, correspondentes aos respondentes de pequenos subgrupos.
  • Aumento Preditivo: considerações sobre o comprimento da pesquisa muitas vezes significam que precisamos tomar decisões difíceis sobre quais perguntas podemos acomodar. Podemos preencher algumas lacunas em nossos dados com base em outros respondentes históricos da pesquisa ou, de fato, com dados de perfil que já temos em nosso painel, para fornecer campos adicionais (modelados) junto com os dados base da pesquisa coletada.
  • Gêmeos Digitais: ao longo do tempo, acumulamos um grande número de dados para respondentes individuais. Muitas vezes temos anos de dados atitudinais e comportamentais de alta qualidade sobre nossos painelistas mais leais. Podemos aproveitar essas informações históricas para ajustar modelos de IA que então nos permitam “estender” além das perguntas anteriores da pesquisa para novas categorias, comportamentos e tópicos.

No caso da Kantar, por exemplo, complementamos nossa rede programática de mais de 170 milhões de painelistas humanos em mais de 100 mercados com o Qubed, nossa tecnologia contra fraude construída a partir de 3 redes neurais profundas, e design empático de pesquisas, para garantir que estamos criando comunidades de painelistas reais e engajados que fornecem os dados de maior qualidade e mais significativos.

Os dados sintéticos têm muito potencial, mas a indústria tem muito mais trabalho a fazer para construir soluções tecnicamente e metodologicamente sólidas. Embora pretendamos aproveitar ao máximo o potencial de alguns dos algoritmos e tecnologias mais recentes, como líderes responsáveis na indústria, também precisamos abordar as principais questões e desafios que os dados sintéticos apresentam, como sua precisão e viés, sua viabilidade em situações particulares e sua robustez. Essas são as questões que estamos ativamente explorando e testando com nossos clientes e emitiremos mais orientações à medida que estiverem disponíveis.

*Juliana Cavallari é diretora de Contas da Kantar Brasil.

Compartilhe essa notícia:

WhatsApp
X
LinkedIn
Facebook
Email

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Recomendadas

MAIS MATÉRIAS

SUMÁRIO – Edição 292

A evolução do consumidor traz uma série de desafios inéditos, inclusive para os modelos de gestão corporativa. A Consumidor Moderno tornou-se especialista em entender essas mutações e identificar tendências. Como um ecossistema de conteúdo multiplataforma, temos o inabalável compromisso de traduzir essa expertise para o mundo empresarial assimilar a importância da inserção do consumidor no centro de suas decisões e estratégias.

A busca incansável da excelência e a inovação como essência fomentam nosso espírito questionador, movido pela adrenalina de desafiar e superar limites – sempre com integridade.

Esses são os valores que nos impulsionam a explorar continuamente as melhores práticas para o desenho de uma experiência do cliente fluida e memorável, no Brasil e no mundo.

A IA chega para acelerar e exponencializar os negócios e seus processos. Mas o CX é para sempre, e fará a diferença nas relações com os clientes.

CAPA: Camila Nascimento
IMAGEM: Midjourney


Publisher
Roberto Meir

Diretor-Executivo de Conhecimento
Jacques Meir
[email protected]

Diretora-Executiva
Lucimara Fiorin
[email protected]

COMERCIAL E PUBLICIDADE
Gerentes

Daniela Calvo
[email protected]

Elisabete Almeida
[email protected]

Érica Issa
[email protected]

Natalia Gouveia
[email protected]

NÚCLEO DE CONTEÚDO
Head de Conteúdo
Larissa Sant’Ana
[email protected]

Editor-assistente
Thiago Calil
[email protected]

Editora do Portal 
Júlia Fregonese
[email protected]

Produtores de Conteúdo
Bianca Alvarenga
Danielle Ruas 
Jéssica Chalegra
Marcelo Brandão
Nayara de Deus

Head de Arte
Camila Nascimento
[email protected]

Designer
Isabella Pisaneski

Revisão
Elani Cardoso

COMUNICAÇÃO E MARKETING
Gerente
Simone Gurgel

TECNOLOGIA
Gerente

Ricardo Domingues


CONSUMIDOR MODERNO
é uma publicação da Padrão Editorial Ltda.
www.gpadrao.com.br
Rua Ceará, 62 – Higienópolis
Brasil – São Paulo – SP – 01234-010
Telefone: +55 (11) 3125-2244
A editora não se responsabiliza pelos conceitos emitidos nos artigos ou nas matérias assinadas. A reprodução do conteúdo editorial desta revista só será permitida com autorização da Editora ou com citação da fonte.
Todos os direitos reservados e protegidos pelas leis do copyright,
sendo vedada a reprodução no todo ou em parte dos textos
publicados nesta revista, salvo expresso
consentimento dos seus editores.
Padrão Editorial Ltda.
Consumidor Moderno ISSN 1413-1226

NA INTERNET
Acesse diariamente o portal
www.consumidormoderno.com.br
e tenha acesso a um conteúdo multiformato
sempre original, instigante e provocador
sobre todos os assuntos relativos ao
comportamento do consumidor e à inteligência
relacional, incluindo tendências, experiência,
jornada do cliente, tecnologias, defesa do
consumidor, nova consciência, gestão e inovação.

PUBLICIDADE
Anuncie na Consumidor Moderno e tenha
o melhor retorno de leitores qualificados
e informados do Brasil.

PARA INFORMAÇÕES SOBRE ORÇAMENTOS:
[email protected]