Data-Washing en América Latina: Cuando los datos son el discurso, no la práctica
El auge de las narrativas "data-driven" a menudo supera las capacidades reales de los datos, lo que da lugar a una brecha cada vez mayor entre la intención y la ejecución, conocida como data-washing.
default
{}
default
{}
primary
default
{}
secondary
Del discurso data-driven a la realidad data-washing
¿En qué piensan cuando escuchan “ser data-driven”, “usar inteligencia artificial” o “tomar decisiones basadas en datos”? ¿Les suena? Probablemente sí. En América Latina, estas expresiones se volvieron parte habitual del discurso empresarial. Aparecen en planes estratégicos, presentaciones a directorios y conversaciones sobre transformación digital.
De acuerdo con una encuesta sobre el estado de la calidad de datos en Latinoamérica realizada por Merlin Data Quality, en los últimos años en América Latina, creció de manera sostenida la importancia que se le da a los datos dentro de las organizaciones. Hay un mayor conocimiento sobre las posibilidades que pueden traer los sistemas de información. Pero esto no necesariamente se traduce en incorporación real. El mismo informe evidencia que todavía falta mucho en cuestiones de políticas formales, roles definidos, calidad de datos y prácticas consolidadas.
Esta distancia entre la aspiración declarada y la madurez real de las prácticas plantea un terreno que puede dar lugar a un crecimiento escalonado, pero también a un fenómeno cada vez más visible: el "data-washing".
No se trata tanto de un “engaño”, pero es más interesante plantear el término como una brecha: entre el discurso y la capacidad real de la gestión de los datos. Así como el AI-Washing Report 2025 de Signal IA describe el uso retórico de la inteligencia artificial sin estructuras técnicas u organizacionales que la sostengan, el data-washing puede entenderse como la adopción del lenguaje de “ser data-driven” sin contar aún con prácticas sólidas de calidad, interoperabilidad y gobernanza de datos. Porque el data-washing aparece cuando los datos ocupan un lugar central en la narrativa estratégica, pero siguen siendo frágiles como activo operativo.
De esta manera, la conversación sobre datos empieza a mostrar una tensión. No alcanza con declarar una orientación “data-driven” ni con invertir en nuevas herramientas analíticas. Este fenómeno puede emerger cuando se asocia al “trabajar con datos” principalmente a resultados visibles, dashboards, indicadores en tiempo real o reportes automatizados, sin una revisión profunda de cómo se producen, integran y validan los mismos.
La magnitud de esta brecha no es menor. A nivel global, cerca del 70% de las organizaciones declaran que la gestión de datos es una prioridad para su transformación digital; sin embargo, solo alrededor del 20% reporta tener una estrategia integral efectivamente implementada. En la región, el fenómeno se agudiza: aproximadamente el 66% de las organizaciones en América Latina señalan que una gestión deficiente de sus datos las expone a sanciones regulatorias, y cerca del 70% citan la escasez de personal capacitado como una barrera principal. Esta tensión entre declaración y práctica es, en esencia, la definición cuantitativa del data-washing.
Data-first o los datos primero: un sistema inteligente que genere datos confiables
La premisa de data-first responde a una consigna estratégica. Una definición de prioridades. Cuando una base de datos es débil, incompleta o carece de gobernabilidad, los sistemas inteligentes se construyen de otra manera. Se reproducen inconsistencias, se amplifican errores y los procesos de error se vuelven opacos.
La inteligencia artificial, en particular, no “corrige” problemas de datos: los amplifica. Entonces los modelos entrenados sobre información inconsistente, incompleta o mal integrada reproducen esas fallas a mayor escala. Un relevamiento de PwC indica que el 79% de las organizaciones están adoptando agentes de IA en alguna forma; en ese contexto, los problemas de calidad de datos pueden generar comportamientos impredecibles en los modelos, incluyendo outputs alucinados o deriva progresiva en los resultados. Y dado que el gasto en IA supera ya los USD 2 billones en 2026, la tolerancia al error se reduce drásticamente: cuando la inversión en IA escala, el costo de los datos deficientes escala con ella
Pero, ¿qué implica realmente una estrategia basada en datos? No equivale a acumular información. Tampoco a centralizar la misma en un repositorio. Se trata de definir la manera en que los datos atraviesan la información: desde su captura hasta su uso en la toma de decisiones.
Un plan de este tipo requiere, al menos: reglas claras sobre calidad y consistencia en la información, mecanismos de integración entre sistemas, responsabilidades explícitas sobre los datos y una arquitectura.
Hay, además, una dimensión interna que pocas organizaciones reconocen abiertamente: cuando los propios equipos no confían en los datos de su empresa, las decisiones se toman por intuición o por política, no por evidencia. Accenture encontró que solo uno de cada tres ejecutivos confía suficientemente en sus datos como para derivar valor real de ellos. Esta desconfianza silenciosa es quizás la forma más costosa del data-washing, porque no aparece en ningún dashboard ni en ningún reporte de transformación digital.
Señales concretas de data-washing en las organizaciones
Desde una perspectiva técnica, el data-washing no se expresa tanto en lo que las organizaciones dicen, sino en las decisiones que postergan. Por ejemplo, cuando hay dashboards sin linaje de datos, es decir, información sin trazabilidad o con escasa precisión respecto de su origen y transformación.
Otro indicio habitual es la centralización pasiva de la información. A partir de la presencia de repositorios centralizados donde los datos simplemente se acumulan, sin procesos consistentes de normalización ni criterios claros de reutilización. Lejos de habilitar escala, este enfoque suele convertir al “dato centralizado” en un cuello de botella difícil de auditar, mantener o evolucionar.
A esto se suman las llamadas “soluciones rápidas”, que resuelven un caso puntual dentro de la organización pero que, en lugar de integrarse, profundizan la fragmentación de la arquitectura general.
Sin embargo, el indicador más evidente aparece en el uso de la inteligencia artificial. Esto ocurre cuando los proyectos operan sobre datasets preparados manualmente, desconectados de los sistemas core, o cuando, ante un error, nadie puede responder con claridad quién es responsable de ese dato ni bajo qué reglas fue generado.
Pero el data-washing también tiene raíces culturales y organizacionales que van más allá de lo técnico. En muchas organizaciones latinoamericanas, los datos son poder político: compartir información entre áreas se percibe como una amenaza, y nadie quiere ser "dueño" de un dato porque eso implica responsabilidad sobre él. Esta dinámica genera silos que no son solo tecnológicos, sino relacionales. El resultado es una arquitectura de datos fragmentada que refleja, en realidad, una estructura organizacional que no fue diseñada para colaborar.
A esto se suma una presión creciente desde el entorno regulatorio. América Latina avanza en marcos de protección de datos, con Brasil y la LGPD como referencia regional más consolidada, y la región está adoptando progresivamente estándares similares al GDPR europeo. Esto introduce una dimensión de riesgo legal que hace al data-washing potencialmente muy costoso: ya no se trata solo de decisiones frágiles, sino de exposición regulatoria concreta. IBM Institute for Business Value estimó en 2025 que más de un cuarto de las organizaciones pierde más de USD 5 millones anuales por problemas de calidad de datos, con un 7% que reporta pérdidas superiores a USD 25 millones.
Casos que muestran el camino inverso
Frente a estas señales de data-washing, también es posible observar en la región organizaciones que recorrieron el camino opuesto: no empezaron por la promesa de la inteligencia artificial ni por la visualización de resultados, sino por resolver primero la base de datos como infraestructura
¿El objetivo? Integrar datos de negocio, estandarizar procesos y definir estándares de interoperabilidad. En industrias de consumo como Hypera Pharma, el énfasis aparece en consolidar los datos operativos, financieros y logísticos antes de añadir cualquier instancia de tecnología inteligente. A su vez, en el sector financiero, Santander priorizó trabajar sobre la trazabilidad y consistencia de datos por la especificidad regulatoria y multicanal del sector. En Arauco, la consolidación de datos de operaciones forestales, plantas industriales y finanzas en una arquitectura integrada antecedió a cualquier iniciativa analítica, con foco en estandarización y trazabilidad.
Porque trabajar con datos es asumir la necesidad de trabajar en armar una infraestructura en la que se puedan mover, retroalimentar y potenciar. Y, como toda infraestructura, si no se diseña y mantiene, no genera valor sino todo lo contrario: fricción, ruido y decisiones frágiles. El desafío para las organizaciones en Latinoamérica es volverse data-driven sin caer en data-washing. Y ese desafío es técnico, regulatorio y, sobre todo, cultural.