media-blend
text-black

Um técnico de TI segura um laptop e conversa sobre trabalho com um técnico de servidores. Eles estão em um data center.

Data-Washing na América Latina: Quando os dados são o discurso, não a prática

A ascensão de narrativas "data-driven" muitas vezes supera as capacidades reais de dados, dando origem a uma lacuna crescente entre intenção e execução, conhecida como data-washing.

default

{}

default

{}

primary

default

{}

secondary

Da conversa data-driven à realidade da data-washing

No que você pensa quando escuta “ser data-driven”, “usar inteligência artificial” ou “tomar decisões baseadas em dados”? Isso soa familiar? Provavelmente sim. Na América Latina, essas expressões se tornaram parte habitual do discurso empresarial. Aparecem em planos estratégicos, apresentações para diretorias e conversas sobre transformação digital.

De acordo com uma pesquisa sobre o estado da qualidade de dados na América Latina realizada pela Merlin Data Quality, nos últimos anos cresceu de forma contínua a importância atribuída aos dados dentro das organizações. Há um maior conhecimento sobre as possibilidades que os sistemas de informação podem trazer. Mas isso não necessariamente se traduz em implementação real. O mesmo relatório mostra que ainda há muito a ser feito em termos de políticas formais, definição de papéis, qualidade dos dados e práticas consolidadas.

Essa distância entre a aspiração declarada e a maturidade real das práticas, cria um cenário que pode levar a um crescimento gradual, mas também a um fenômeno cada vez mais visível: o "data-washing".

Não se trata exatamente de um “engano”, mas sim de uma forma mais interessante de entender o termo como uma lacuna: entre o discurso e a capacidade real da gestão dos dados. Assim como o AI-Washing Report 2025, da Signal IA, descreve o uso retórico da inteligência artificial sem estruturas técnicas ou organizacionais que a sustentem, o data-washing pode ser entendido como a adoção do discurso da linguagem de “ser data-driven” sem contar ainda com práticas sólidas de qualidade, interoperabilidade e governança de dados. Isso porque o data-washing surge quando os dados ocupam um lugar central na narrativa estratégica, mas continuam frágeis como ativo operacional.

Dessa forma, a conversa sobre dados começa a revelar uma tensão. Não basta declarar uma orientação “data-driven” nem investir em novas ferramentas analíticas. Esse fenômeno surge quando “trabalhar com dados” é associado principalmente a resultados visíveis — dashboards, indicadores em tempo real ou relatórios automatizados — sem uma revisão profunda de como esses dados são produzidos, integrados e validados.

A magnitude dessa lacuna não é pequena. Em nível global, cerca de 70% das organizações afirmam que a gestão de dados é uma prioridade para sua transformação digital; no entanto, apenas cerca de 20% relatam ter uma estratégia integral efetivamente implementada. Na região, o fenômeno é ainda mais acentuado: aproximadamente 66% das organizações na América Latina indicam que uma gestão deficiente de dados as expõe a sanções regulatórias, e cerca de 70% citam a falta de profissionais qualificados como uma barreira principal. Essa tensão entre discurso e prática é, essencialmente, a definição quantitativa de data-washing.

Data-first ou dados em primeiro lugar: um sistema inteligente que gera dados confiáveis

A premissa de data-first responde a uma diretriz estratégica, uma definição de prioridades. Quando a base de dados é fraca, incompleta ou carece de governança, os sistemas inteligentes são construídos de outra forma. Inconsistências são reproduzidas, erros são amplificados e os processos se tornam opacos.

A inteligência artificial, em particular, não “corrige” problemas de dados: ela os amplifica. Modelos treinados com informações inconsistentes, incompletas ou mal integradas reproduzem essas falhas em maior escala. Um levantamento da PwC indica que 79% das organizações já estão adotando agentes de IA de alguma forma; nesse contexto, problemas de qualidade de dados podem gerar comportamentos imprevisíveis nos modelos, incluindo outputs alucinados ou deriva progressiva nos resultados. E, considerando que o investimento em IA já supera os 2 bilhões de dólares em 2026, a tolerância ao erro diminui drasticamente: quando o investimento cresce, o custo de dados deficientes cresce junto.

Mas o que realmente implica uma estratégia baseada em dados? Não se trata de simplesmente acumular informações, nem apenas centralizá-las em um repositório. Trata-se de definir como os dados percorrem todo o ciclo da informação: desde a coleta até o uso na tomada de decisão.

Um plano desse tipo exige, no mínimo: regras claras sobre qualidade e consistência, mecanismos de integração entre sistemas, responsabilidades definidas sobre os dados e uma arquitetura estruturada.

Há também uma dimensão interna que poucas organizações admitem abertamente: quando as próprias equipes não confiam nos dados da empresa, as decisões passam a ser tomadas por intuição ou política, e não por evidência. A Accenture constatou que apenas um em cada três executivos confia suficientemente em seus dados para extrair valor real deles. Essa desconfiança silenciosa é talvez a forma mais cara de data-washing, pois não aparece em nenhum dashboard ou relatório de transformação digital.

Sinais concretos de data-washing nas organizações

Do ponto de vista técnico, o data-washing se manifesta menos no que as organizações dizem e mais nas decisões que adiam. Por exemplo, quando existem dashboards sem linhagem de dados, ou seja, informações sem rastreabilidade ou com pouca clareza sobre sua origem e transformação.

Outro indicador comum é a centralização passiva da informação. Isso decorre da presença de repositórios centralizados onde os dados simplesmente se acumulam, sem processos consistentes de normalização ou critérios claros de reutilização. Longe de permitir escalabilidade, essa abordagem muitas vezes transforma os "dados centralizados" em um gargalo difícil de auditar, manter ou evoluir.

Somam-se a isso as chamadas “soluções rápidas”, que resolvem um caso pontual dentro da empresa, mas que, ao invés de se integrarem, aumentam a fragmentação da arquitetura.

No entanto, o indicador mais evidente aparece no uso da inteligência artificial. Isso acontece quando projetos operam sobre datasets preparados manualmente, desconectados dos sistemas principais, ou quando, diante de um erro, ninguém consegue explicar claramente quem é responsável por aquele dado ou sob quais regras ele foi gerado.

Mas o data-washing também tem raízes culturais e organizacionais que vão além do aspecto técnico. Em muitas organizações latino-americanas, os dados representam poder político: compartilhar informações entre áreas pode ser visto como ameaça, e ninguém quer ser “dono” de um dado porque isso implica responsabilidade. Isso cria silos que não são apenas tecnológicos, mas também relacionais. O resultado é uma arquitetura de dados fragmentada que, na verdade, reflete uma estrutura organizacional que não foi projetada para colaborar.

Além disso, há uma crescente pressão regulatória. A América Latina avança em marcos de proteção de dados, com o Brasil e a LGPD como referência regional mais consolidada, e a região está progressivamente adotando padrões semelhantes ao GDPR europeu. Isso adiciona uma dimensão de risco legal que torna o data-washing potencialmente muito caro: não se trata apenas de decisões frágeis, mas de exposição regulatória concreta. O IBM Institute for Business Value estimou, em 2025, que mais de um quarto das organizações perde mais de 5 milhões de dólares por ano devido a problemas de qualidade de dados, sendo que 7% relatam perdas superiores a US$25 milhões.

Casos que mostram o caminho inverso

Diante desses sinais de data-washing, também é possível observar organizações na região que seguiram o caminho oposto: não começaram pela promessa da inteligência artificial nem pela visualização de resultados, mas pela construção de uma base de dados sólida como infraestrutura.

O objetivo? Integrar dados de negócio, padronizar processos e definir padrões de interoperabilidade. Em setores de consumo, como a Hypera Pharma, o foco está em consolidar dados operacionais, financeiros e logísticos antes de incorporar qualquer tecnologia inteligente. No setor financeiro, o Santander priorizou a rastreabilidade e consistência dos dados devido às exigências regulatórias e à atuação multicanal. Já na Arauco, a integração de dados de operações florestais, plantas industriais e finanças em uma arquitetura integrada antecedeu qualquer iniciativa analítica, com foco em padronização e rastreabilidade.

Trabalhar com dados significa assumir a necessidade de construir uma infraestrutura que permita seu fluxo, retroalimentação e potencialização. E, como toda infraestrutura, se não for bem projetada e mantida, não gera valor — pelo contrário: cria atrito, ruído e decisões frágeis. O desafio para as organizações na América Latina é se tornarem data-driven sem cair no data-washing. E esse desafio é técnico, regulatório e, sobretudo, cultural.

Product demo

SAP Business Data Cloud

Amplie o valor da IA ​​com seus dados mais valiosos.

Solicite uma demonstração