Quando as empresas utilizam dados públicos, elas podem identificar tendências de mercado, compreender o comportamento dos clientes e otimizar suas operações internas. Isso acontece porque os profissionais podem usar tais dados como fontes de insights, aplicando-os em estratégias de marketing, desenvolvimento de novos produtos e melhoria de processos .
Por consequência, a análise de dados públicos permite que as empresas se tornem mais eficientes, reduzindo custos desnecessários e focando em áreas que realmente agregam valor. Outro aspecto significativo é a transparência que o uso de dados públicos agrega ao negócio. E, ao ser mais transparente em suas operações e decisões fundamentadas por dados confiáveis, a empresa aumenta sua credibilidade, o que pode resultar em uma relação mais forte e confiável com os consumidores. Isso, óbvio, se traduz em lealdade à marca e em uma reputação positiva no mercado.
Dados públicos = mina de ouro
Fato é que os dados públicos representam uma verdadeira mina de ouro para as empresas, revelando um potencial extraordinário que vai muito além do que se vê à primeira vista. “Ao aproveitar as informações, as organizações têm a oportunidade de inovar e aprimorar seus produtos e serviços de maneira surpreendente. Isso não só eleva a qualidade do que é oferecido, mas também transforma a experiência do consumidor em algo memorável”. Quem melhor explica essa realidade é Thoran Rodrigues, CEO da BigData Corp, especialista no mercado de análise de dados.
Confira abaixo, na íntegra, à entrevista à Consumidor Moderno.
Os benefícios dos dados públicos
Consumidor Moderno: Quais são os principais benefícios dos dados públicos para as empresas? E como os consumidores podem se beneficiar do acesso a dados públicos?
Throran Rodrigues: É interessante definirmos o conceito de dado público. Existem, basicamente, duas categorias de informações públicas. O governo disponibiliza a primeira informação, como as estatísticas do Instituto Brasileiro de Geografia e Estatística (IBGE) e as pesquisas realizadas por ministérios, por exemplo. Isso inclui também dados que os governos estaduais e municipais divulgam, além de informações que obtemos em prefeituras ou sites do Governo Federal para validar ou emitir documentos. A segunda categoria que merece atenção é a informação em domínio público. Antigamente, jornais e revistas publicavam essa informação, mas hoje, com a internet, podemos encontrá-la ao alcance de um clique.
CM: Quais os benefícios dessas duas categorias, juntas – informações do governo mais as dos mais variados sites da internet?
Os benefícios dessa democratização do conhecimento são inúmeros, mas, se eu tivesse que destacar um, certamente seria a maneira como simplifica as nossas vidas. Imagine só: antes, para acessar informações tributárias de uma empresa, era preciso lidar com pilhas de papel, e se fosse necessário regularizar uma situação, a pessoa tinha que ter o cartão CNPJ da empresa, impresso e em mãos. Agora, é possível acessar tudo isso digitalmente, diretamente no site do governo. Isso desburocratiza processos e eliminar a papelada que antes parecia interminável.
Vantagens para o mercado
CM: A disponibilidade da informação pública, além de desburocratizar a vida das pessoas, auxilia o mercado de que forma?
As empresas podem validar informações digitalmente, otimizando seus processos. Esse é, sem dúvida, o benefício mais impactante. O benefício para o consumidor reside na maior transparência e segurança nas transações. Quando as informações são validadas digitalmente, o consumidor pode ter a certeza de que os dados apresentados são autênticos e confiáveis. Isso diminui o risco de fraudes e aumenta a confiança nas empresas que adotam esses sistemas.
Os índices de inflação, por exemplo, impactam diretamente nossa vida financeira, as escolhas de investimento etc. Embora não proporcionem benefícios imediatos, essas informações são fundamentais para a economia, guiando decisões financeiras e sustentando a dinâmica do sistema econômico, muitas vezes de forma subestimada. Fato é que nossa vida financeira é moldada por diversos indicadores que estão ao alcance de todos. As informações públicas, muitas vezes subestimadas, são verdadeiros pilares que sustentam a dinâmica financeira.
Dados e labirinto legislativo
CM: Em um país onde leis, decretos, instruções normativas e atos declaratórios mudam quase que diariamente, é fácil entender a confusão que permeia o cotidiano dos consumidores, empresários e investidor. No labirinto legislativo, os dados públicos podem servir como uma luz no fim do túnel?
Ao mergulharmos nesse tema, encontramos um fascinante jogo. Um jogo com dois lados. De um lado, temos as informações públicas, que, embora não necessariamente veiculadas pelo governo, estão disponíveis para todos. Essas informações brotam do vasto campo do domínio público, oferecendo um panorama valioso da economia, das realidades urbanas e de outras questões, independentemente da coleta feita por autoridades oficiais.
Imagine um cenário onde os dados não estão à mercê de decretos ou mudanças legislativas. Um exemplo claro disso é o índice da Fundação Instituto de Pesquisas Econômicas (Fipe), que nos traz insights sobre a inflação e as oscilações de preços no mercado. Este índice é gerado por organizações do setor privado, o que o torna um farol independente da coleta oficial de preços. Isso significa que intervenções normativas ou regulamentares não conseguem impactar sua integridade. Contudo, é crucial ressaltar que a continuidade desse índice depende da vontade do setor privado em mantê-lo vivo.
Indicadores
CM: Assim, a informação do domínio público se transforma em um poderoso aliado na construção de indicadores?
Isso. E, aqui, nesse ponto, entramos na seara do que chamamos de “dados alternativos”, que possibilitam a análise e o estudo de realidades, além de criar métricas, séries históricas e pesquisas que são menos suscetíveis a variações provocadas por mudanças legislativas.
Do outro lado do jogo, ao analisarmos as informações veiculadas pelos órgãos oficiais, temos a complexidade da situação legislativa no Brasil – e em muitos outros países. E é importante ressaltar que esse labirinto legislativo não é uma característica apenas do Brasil. Mas, aqui, nós assistimos a momentos em que informações consideradas públicas, de repente, desaparecem, dificultando o acesso e obscurecendo a visibilidade que outrora tinham.
Incertezas econômicas
CM: Quais são as consequências do “desaparecimento” dos dados públicos?
Temos incertezas e instabilidades que podem ter consequências negativas significativas. É vital lembrar que a transparência e a abundância de informações são aliadas indispensáveis para um cenário mais saudável. A proposta é que a informação de domínio público complemente os dados oficiais, formando um mosaico informativo mais robusto, e não que um substitua o outro. Afinal, quanto mais iluminado for o caminho, mais fácil será a jornada em busca de conhecimento e compreensão.
CM: Você acredita que existam lacunas nas leis de acesso à informação e de transparência que afetam os dados públicos e, consequentemente, pessoas físicas e jurídicas?
As leis de transparência e de acesso à informação são, de fato, positivas, mas têm um foco muito específico; especialmente a Lei de Acesso à Informação, que parece ter um caráter transacional. Em outras palavras, quando há uma informação ausente, é necessário fazer um pedido para obtê-la. O cidadão a recebe, mas não há na legislação a obrigatoriedade de que certas informações sejam disponíveis continuamente. Também existem questões relacionadas ao formato e à frequência da informação. Outra coisa é a forma como os dados são apresentados nem sempre é a ideal para que sejam úteis. Isso revela lacunas, especialmente quando analisamos a forma como os dados são disponibilizados. Só para exemplificar, imagine fazer um pedido de acesso à informação e receber 5 mil páginas impressas em casa. Você não leria tudo isso. A informação foi disponibilizada, a lei foi cumprida, mas isso não traz valor; você não consegue utilizá-la.
Dados úteis
CM: Como assegurar então que as informações sejam apresentadas de maneira útil?
Esse é o “ponto x” da discussão. Ademais, em se tratando de dados públicos, é fundamental garantir a continuidade na disponibilização desses dados, pois muitas informações se tornam relevantes quando observamos sua evolução ao longo do tempo. Essas lacunas precisam ser abordadas, especialmente no que se refere à forma, frequência e continuidade na disponibilização das informações, para que possamos apoiar estudos e análises ao longo do tempo, e não apenas de forma pontual.
CM: Quais tipos de dados públicos estão disponíveis na Big Data Corp, e como as pessoas podem acessá-los?
Sempre brinco que, em um mundo perfeito, a nossa empresa não existiria. O trabalho que realizamos, que consiste em capturar e estruturar informações para que outras pessoas possam utilizá-las, seria desnecessário se as informações fossem disponibilizadas de maneira adequada e contínua. Atualmente, trabalhamos com diversos tipos de informação, tanto de pessoas quanto de empresas, além de dados sobre produtos e outras entidades.
Em suma, disponibilizamos essas informações para apoiar os processos de tomada de decisão dos nossos clientes. Quando um cliente precisa tomar uma decisão, ajudamos a preencher as informações cadastrais essenciais para atender às regulamentações exigidas pelas casas autônomas. No mercado financeiro, por exemplo, auxiliamos as empresas a obterem os dados cadastrais necessários para cumprir os requisitos regulatórios estabelecidos pelo Banco Central, Comissão de Valores Mobiliários, entre outros. A informação é acessível apenas a empresas; não vendemos dados para pessoas físicas, e todas as nossas informações estão em conformidade com a Lei Geral de Proteção de Dados (LGPD).
Brasil: dados públicos fragmentados
CM: Além da grande fragmentação das informações públicas no Brasil, há outros desafios para operar com dados públicos?
O Brasil é um caso interessante, pois possui uma infraestrutura de informação bastante robusta. Estamos muito à frente, inclusive, de muitos países que consideramos em desenvolvimento. A quantidade de informação que está disponível publicamente atualmente no Brasil é enorme. E ela é resultado do processo de digitalização da sociedade. No entanto, essas informações estão fragmentadas. Elas estão distribuídas em centenas, às vezes milhares, de sites diferentes, e você precisa navegar por esses locais e fazer o processo manualmente, lidando com centenas de fontes. Portanto, parte do desafio que enfrentamos é a compilação das informações de todas essas fontes. O segundo desafio, decorrente da fragmentação e do ambiente digital, como mencionei anteriormente, é a forma como as informações são disponibilizadas.
Há uma grande incoerência na forma como as informações são apresentadas, tanto no Brasil quanto no domínio público em geral. O desafio reside em como estruturamos essas informações que estamos coletando para que uma empresa possa tomar decisões embasadas. Tomando como exemplo o contexto de terrorismo: quando falamos sobre a verificação, frequentemente referida como know your client (conhecer o seu cliente), uma prática comum no setor financeiro, essas verificações de know your client geralmente incluem mais de 100 listas distintas ao redor do mundo, cada uma com formatos próprios. Transformar esses dados em insights que alimentem decisões é, sem dúvida, um dos maiores desafios que enfrentamos.
Inteligência Artificial e dados públicos
CM: Quais são as principais vantagens da utilização de Inteligência Artificial na análise de dados públicos?
Nos últimos um ano e meio a dois anos, temos incorporado cada vez mais Inteligência Artificial para aumentar a eficiência no trabalho de minerar dados públicos. E, dentre as vantagens observadas, posso citar três exemplos práticos.
Primeiramente, uma área que analisamos no domínio público são as notícias em sites e blogs. Isso é importante porque, ao realizar verificações regulatórias, uma das etapas é a análise da chamada “mídia negativa”. Em suma, ela identifica se há notícias desfavoráveis sobre a empresa. Portanto, é necessário compilar informações de diversas mídias, estruturá-las e apresentá-las para que nossa equipe possa tomar decisões informadas. Cerca de dois anos atrás, coletávamos dados de aproximadamente 100 fontes de notícias no Brasil, utilizando uma equipe de quatro desenvolvedores dedicada a esse processo. Comparamos isso ao uso de modelos de IA para extrair e estruturar informações das matérias coletadas. Conseguimos expandir para mais de 300 fontes e reduzir a equipe de quatro pessoas para apenas uma. Isso resultou em um ganho de eficiência de 12 vezes com a integração da IA nesse processo.
Mudanças na prática
CM: A BigDataCorp tem outros cases de sucesso, que refletem os benefícios práticos para o consumidor final?
Outro projeto interessante que realizamos foi relacionado às informações de produtos, onde coletamos dados para construir um histórico de preços e categorizar produtos. Um dos desafios nesse processo é identificar que a TV Samsung 39 polegadas LED disponível em um site é a mesma que aparece em outro site. Realizando testes, descobrimos que os modelos de Large Language Model (LLM) podem resolver esses problemas de padronização e identificação de informações de forma muito eficaz. Assim, conseguimos aumentar em mais de 50% a qualidade da nossa base de dados de produtos, refletindo na melhoria da informação que entregamos aos nossos clientes.
Os benefícios disso para o consumidor são evidentes e multifacetados. Primeiramente, com uma base de dados mais precisa e confiável, os consumidores podem tomar decisões de compra mais informadas. A consistência nas informações dos produtos significa que, ao procurar uma televisão específica, por exemplo, o cliente pode ter certeza de que as características e o preço apresentados são os mesmos em diferentes plataformas.
E o terceiro exemplo, que foi bastante interessante e que representa um desafio enfrentado por muitas pessoas, diz respeito à padronização da informação de endereço. Em regiões mais afastadas do Brasil, especialmente no Centro-Oeste, como em Brasília, Goiânia e Tocantins, por exemplo, os endereços costumam ser complicados. Eles têm expressões como “quadra”, “lote”, “prédio”, entre outros, tornando a compreensão desses endereços muito difícil, já que existem inúmeras variações. Para que a informação seja realmente útil, é necessário que ela esteja padronizada. Essa uniformização reduz erros nos cadastros por parte das empresas, melhorando a experiência do consumidor e otimizando processos operacionais.