flex-height
text-black

Imagen de una mujer analizando datos en su escritorio

¿Qué es el data mesh?

El data mesh es un enfoque de la gestión de datos que utiliza un marco arquitectónico distribuido.

default

{}

default

{}

primary

default

{}

secondary

Resumen sobre data mesh

El data mesh representa una nueva forma de buscar información. Nace del creciente concepto de que los datos son un producto en sí mismos, una herramienta, un medio para alcanzar un fin —no simplemente algo que las empresas recopilan y luego analizan en un intento retrospectivo por comprender cosas que ya han ocurrido—.

Definición de data mesh

El data mesh es un enfoque de la gestión de datos que utiliza un marco arquitectónico distribuido. En otras palabras, extiende en todo el negocio la propiedad y responsabilidad sobre data sets específicos hasta aquellos usuarios que tienen expertise de especialista para comprender qué significan esos datos y cómo hacer el mejor uso de ellos.

La arquitectura de data mesh conecta y extrae datos provenientes de distintas fuentes, tales como data lakes y almacenes de datos. Luego distribuye los data sets relevantes hacia los expertos humanos y equipos de dominio adecuados en toda la empresa. Básicamente, en un data lake central una voluminosa mezcla de datos se clasifica y distribuye en partes manejables entre quienes pueden comprenderlos y aprovecharlos mejor.

Orígenes del data mesh

El data mesh se originó alrededor de 2009 en respuesta a los desafíos de escalar arquitecturas de datos en organizaciones grandes y complejas. La idea principal detrás del data mesh es descentralizar la propiedad y arquitectura de los datos, tratándolos como un producto y asignando la responsabilidad a equipos orientados por dominio. El data mesh combina principios de diseño orientado al dominio, pensamiento de producto e infraestructura de autoservicio, lo cual habilita a las organizaciones para escalar los sistemas de datos sin crear cuellos de botella monolíticos.

Los modelos de gestión de datos centralizados suelen fallar en las grandes organizaciones debido a:

Beneficios del data mesh

Las bases de datos heredadas e infraestructuras limitadas para gestión de datos han contribuido a la percepción de que los datos son algo que debe mantenerse en una única bóveda y ser medidos a discreción de unos pocos administradores de datos. Ahora, los datos son el combustible que impulsa su negocio y se deben brindar libremente a aquellos especialistas en la materia que mejor saben cómo hacer que funcionen e impulsen ganancias en tiempos competitivos.

Las principales ventajas de la arquitectura de data mesh se pueden resumir en tres categorías:

Escalabilidad y agilidad

Mayor accesibilidad a los datos: el data mesh garantiza que todo el personal adecuado de toda su organización pueda acceder a los datos que necesita —para alcanzar el mejor desempeño en su trabajo—.

Pipelines y procesos de datos personalizables: muchos de los mejores y potencialmente más rentables proyectos se archivan debido a la enorme molestia que implica seleccionar los data sets específicos y personalizados que se necesitan para lograr el éxito. Con un data mesh, los equipos pueden acceder y probar rápidamente nuevos modelos de proyecto sin la tradicional pérdida de tiempo y recursos.

Cuellos de botella reducidos: este es un beneficio obvio tanto para los equipos de TI como para los propietarios de datos. Además, reduciendo una fuente de frustración e irritación, las empresas pueden ayudar a eliminar los silos que obstaculizan el desarrollo saludable del negocio.

Calidad y confianza

Capacidades analíticas mejoradas: cuando las organizaciones consideran los datos como un producto que se debe utilizar todos los días, los equipos comienzan a adoptar un enfoque data-first para planificación y estrategia. Esto conduce a una reducción de los errores y a un enfoque más objetivo y menos orientado a la opinión sobre el desarrollo del negocio.

Colaboración y reutilización entre dominios

Menor tensión sobre los equipos centrales de gestión de datos: esto significa no solo reducir retrasos y frustración, sino también liberar innumerables horas para que sus talentosos equipos de TI se dediquen a actividades más especializadas, interesantes y rentables

Descentralizando la propiedad y tratando los datos como un producto, el data mesh empodera a las organizaciones para moverse más rápido, generar confianza en la información estratégica y escalar de manera fluida abarcando distintos dominios.

Principios fundamentales del data mesh

Cuando hablamos de data lakes y data mesh, básicamente hablamos de Big Data. Lo que hace que los datos sean Big Data no es simplemente su gran volumen. Entre otros criterios, Big Data también se define por ser complejo, variable, rápidamente generado y no estructurado.

Una base de datos lineal es como una hoja de cálculo: tiene columnas y filas y categorías inmutables donde deben encajar todos los componentes de datos. Algunos de los datos generados a partir de maquinaria, sensores y fuentes industriales están estructurados y encajan perfectamente en una base de datos lineal. Sin importar el volumen de datos con el que deba lidiar, si están 100% estructurados no cumplen con los criterios de Big Data y se los puede alojar en una base de datos lineal, lo cual hace que sea relativamente sencillo filtrarlos y extraerlos.

Pero cada vez más, el Big Data moderno no está estructurados y consiste en componentes visuales, texto libre, e incluso video y medios enriquecidos. Estos datos cruciales pueden comprender miles de terabytes de información para muchas empresas, y es imposible almacenarlos en una base de datos lineal estándar.

Ingrese al data lake. A medida que los volúmenes de Big Data comenzaron a aumentar, los data lakes se desarrollaron como un lugar donde los datos complejos podían almacenarse y usarse desde un repositorio central en su formato sin procesar. Si bien los data lakes representan una solución excelente al problema de Big Data, también tienen debilidades. Carecen de ciertas características analíticas, así que dependen de otros servicios para las funcionalidades de recuperación, indexación, transformación, consulta y analíticas.

Hay cuatro principios de data mesh que abordan los desafíos presentados por los data lakes:

1. Propiedad del dominio

Es complejo definir la propiedad de un data lake cuando muchos operadores generan y acceden a los datos. Ante la falta de roles y responsabilidades claramente definidos, el mismo data set puede ser gestionado de forma diferente por distintas áreas, creando inconsistencias que dificultan su uso. Del mismo modo, otros datos terminan siendo descuidados cuando no los gestionan activamente quienes en última instancia los van a utilizar.

La arquitectura del data mesh soluciona esto descentralizando la propiedad. Garantiza que la gobernanza de datos se distribuya claramente por dominio, para que cada equipo o experto controle los datos que produce y utiliza. Para respaldar esto, los data mesh también usan una estructura de gobernanza federada a fin de habilitar el control central del modelado de datos, las políticas de seguridad y el compliance. La propiedad del data mesh crea responsabilidad y mejora la usabilidad de los datos.

2. Datos como un producto

Los data lakes pueden fallar en garantizar la calidad de los datos cuando su volumen se torna demasiado grande o los administradores centrales no los entienden. La arquitectura de data mesh trata a los datos fundamentalmente como un producto valioso, lo cual pone su calidad e integridad a la vanguardia de la gestión de datos. Es de suponer que cada equipo conoce los criterios y cuestiones más importantes que desea extrapolar a partir de los datos que recopila. Integrando estos criterios y prioridades dentro de la arquitectura, el data mesh puede ayudar a garantizar la entrega continua y priorizada de datos depurados, actualizados y completos, incluso si hay involucrados data sets más grandes. Y, por supuesto, cuando se aplican algoritmos de machine learning, estos criterios y data sets resultantes se vuelven cada vez más precisos y útiles con el tiempo.

3. Plataforma de datos de autoservicio

Los data lakes pueden crear cuellos de botella debido a su arquitectura centralizada y a los tradicionalmente difíciles protocolos y procesos de recuperación. Esto normalmente significa que el control de una gran cantidad de datos consolidados se reduce a un único equipo de TI o de gestión de datos. Y a medida que los volúmenes de datos (y la demanda de recuperación) aumentan, estos equipos de TI se ven sobrecargados.

Además, los datos deben ser revisados y estructurados correctamente para garantizar el compliance y la adhesión a los principios de gobernanza de datos. Cuando se enfrenta demasiada presión, puede haber una tendencia a apurar estas etapas de compliance, lo cual genera potenciales riesgos y pérdidas para la empresa. Los principios de data mesh abordan esto habilitando una plataforma de datos de autoservicio. Brindan acceso y control a usuarios especializados autorizados que tienen un mayor interés en los datos —todo a la vez que se emplean protocolos de seguridad estrictos e integrados—. Esto reduce los cuellos de botella y acelera la entrega de datos.

4. Gobernanza federada

Si bien la descentralización es fundamental, las organizaciones no pueden abandonar la gobernanza. El data mesh utiliza un modelo de gobernanza federada para equilibrar la autonomía con la consistencia. Esto significa que los dominios gestionan sus propios productos de datos, pero deben cumplir con estándares compartidos de seguridad, compliance e interoperabilidad en toda la organización. Este enfoque híbrido de gobernanza de data mesh garantiza agilidad sin sacrificar la confianza ni el compliance normativo.

Si bien existen desafíos asociados al data mesh, la arquitectura de gestión de datos descentralizada y democratizada ha hecho que las empresas sean más inteligentes, ágiles y precisas. ¿Cómo? Garantizando que los datos correctos estén disponibles inmediatamente para las personas adecuadas, donde y cuando los necesiten. El data mesh hace que los datos como producto sean una realidad concreta, reduciendo barreras y priorizando el valor de la información para que los equipos puedan obtener un acceso más rápido y sin obstáculos a los datos esenciales.

Arquitectura y marcos de trabajo de data mesh

Hemos analizado por qué el data mesh es una forma descentralizada de arquitectura de datos que los trata como una herramienta esencial para la gestión del negocio. Y, lo que es más importante, equipos independientes son responsables de gestionar los datos dentro de sus ámbitos de trabajo y expertise, garantizando a la vez el compliance de las prácticas de gestión determinadas centralmente. Este cambio de mentalidad está en el centro del data mesh.

Una vista panorámica de una arquitectura de data mesh

En un data mesh, los dominios son los principales productores y consumidores de datos, cada uno posee sus datos como un producto para garantizar su calidad y relevancia. La plataforma de autoservicio brinda la infraestructura para publicar, descubrir y consumir estos productos de datos, junto con características automatizadas de seguridad y compliance. La gobernanza opera en un modelo federado, que equilibra los estándares globales de interoperabilidad y seguridad con la autonomía local, para que los dominios puedan innovar mientras mantienen confianza y consistencia en toda la organización.

Para comprender mejor cómo se integra la arquitectura de data mesh, profundicemos en sus tres componentes principales.

Fuentes de datos

Estas representan el repositorio —como un data lake— en el que se ingresan los datos primarios sin procesar. Ya sea que se recopilen de redes IIoT en la nube, formularios de feedback del cliente o datos extraídos de la web, estos son los datos de entrada sin procesar que los usuarios consultarán y procesarán en toda la red según sea necesario. Mientras que un enfoque de data lake canalizaría todos estos datos dentro de una sola ubicación central, la metodología del data mesh, en cambio, distribuye entre una serie de dominios la responsabilidad por la admisión, almacenamiento, procesamiento y extracción de esos datos sin procesar.

Infraestructura de data mesh

La información no solo se aísla dentro de dominios departamentales individuales, sino que también se puede compartir a voluntad dentro de la red operativa de la organización, manteniendo el compliance con los lineamientos establecidos para gobernanza de datos. Esto es resultado directo de dos de los pilares clave del data mesh: una plataforma de datos por autoservicio y gobernanza federada. La plataforma de datos por autoservicio brinda las herramientas e infraestructura necesarias para que cada dominio ingiera, transforme, procese y presente universalmente sus datos. Por su parte, los principios de gobernanza federada garantizan la estandarización en toda la organización, lo cual habilita una interoperabilidad de los datos sin esfuerzo entre todos los equipos de dominios.

Propietarios de datos

Los propietarios de los datos son el componente final de un data mesh y tienen la responsabilidad de aplicar los protocolos de compliance, gobernanza y categorización para los datos de sus departamentos. Por ejemplo, los archivos de RR. HH. deben almacenarse bajo determinados protocolos de seguridad, no deben utilizarse para ciertos fines y solo deben liberarse para personas específicas. Por supuesto, cada departamento tendrá categorías y tipos de datos específicos para su función o propósitos. En un sistema de data lake, los equipos de TI deben lidiar con todos esos diferentes protocolos y categorías para todos los diferentes propietarios de datos que han volcado cosas en el data lake. Por otra parte, la arquitectura del data mesh otorga a los propietarios de dominio plena autoridad y control sobre estos asuntos porque no hay nadie mejor que los expertos del área para gestionar sus propios datos y garantizar que cumplan con los estándares de calidad.

El modelo operativo del data mesh

El modelo operativo del data mesh reúne personas, procesos y tecnología para habilitar la gestión descentralizada de datos a gran escala. Esta colaboración garantiza que los datos circulen de manera fluida en toda la organización, lo cual fomenta confianza, agilidad y reutilización sin depender de un único equipo centralizado. Un data mesh habilita interoperabilidad y capacidad de descubrimiento aplicando estándares compartidos y brindando una plataforma común, formatos consistentes y términos de búsqueda, así como reglas de gobernanza para la publicación y consumo de productos de datos. Las herramientas de data mesh, tales como los catálogos y registros de datos, permiten encontrar, acceder de manera segura y utilizar productos de datos en toda la organización.

Piense en un data mesh como en una ciudad moderna: cada barrio (dominio) gestiona sus propios servicios y utilidades —tales como agua, electricidad y residuos— porque conocen mejor sus necesidades locales. La ciudad brinda infraestructura compartida, tales como carreteras y transporte público (plataforma de autoservicio) y normas de seguridad (gobernanza), para que los barrios puedan conectarse, acceder a los recursos de la ciudad y colaborar sin generar caos. De este modo, los recursos fluyen libremente por toda la ciudad, se siguen reglas comunes y la innovación prospera localmente mientras toda la ciudad funciona de manera fluida.

Data mesh en la práctica: ejemplos y casos de uso

Para que las soluciones de gestión de datos evolucionen y sean más exitosas, deben ser utilizables y relevantes para una amplia gama de aplicaciones y operaciones. A medida que la arquitectura de data mesh y la facilidad de uso mejoran, vemos un aumento en la variedad de funciones de negocio que las organizaciones pueden optimizar con un enfoque seguro y distribuido de datos como producto y como herramienta.

Exploremos algunos casos de uso de negocio comunes de data mesh.

Ventas

Para los equipos de ventas, todo se reduce a adquirir, nutrir y cerrar leads. Cuanto más tiempo estén los miembros de su equipo de ventas en el escritorio realizando tareas administrativas, menos tiempo tendrán para construir relaciones con nuevos clientes. Con la arquitectura de data mesh, estos usuarios no necesitan ser expertos en gestión ni en recuperación de datos para tener al alcance de su mano los data sets y combinaciones más potentes y relevantes. Cuando los departamentos de ventas tienen todos los datos correctos para analizar, ello se traduce en información y estrategias más accionables.

Ejemplo de data mesh de ventas: los equipos de venta regionales o específicos de productos pueden ser responsables de sus propios dominios de datos de CRM y su pipeline, lo cual habilita proyecciones precisas y dashboards en tiempo real sin tener que esperar al equipo central de TI.

Cadena de suministro y logística

Las cadenas de suministro modernas son vulnerables a una enorme variedad de disrupciones. Surge una ventaja competitiva cuando las empresas pueden pivotar rápido y responder tanto a amenazas como a oportunidades con la misma agilidad. Los datos de la cadena de suministro global de hoy llegan en gran cantidad y muy rápido —provenientes del feedback del cliente, redes de IIoT y gemelos digitales, entre otros—. Cuando gerentes de la cadena de suministro experimentados y expertos son capaces de seleccionar y ahondar en cualquiera de esos data sets en tiempo real, las empresas obtienen una poderosa fuente de información estratégica y conocimiento.

Ejemplo de data mesh en la cadena de suministro: la optimización de la cadena de suministro requiere visibilidad en tiempo real de los niveles de inventario, el desempeño de los proveedores y los datos logísticos. Un data mesh otorga a cada dominio —compras corporativas, almacenamiento, transporte— la propiedad de sus productos de datos, lo cual habilita una toma de decisiones más rápida y operaciones más rentables.

Fabricación

Siendo parte de la cadena de suministro, las operaciones de fabricación de una empresa son igualmente vulnerables a los rápidos cambios en el mercado y a las volátiles demandas de los clientes. En el pasado, los equipos de diseño y de I+D debían confiar en los datos históricos de los clientes, alimentados por otros departamentos. Hoy, el data mesh brinda acceso a datos en vivo a los usuarios que están detrás del tablero de diseño, a los equipos de I+D y de prueba, y a lo largo de todo el camino hasta la planta de fabricación. El feedback del cliente en tiempo real puede fundamentar el desarrollo de productos al instante y la inteligencia actualizada al minuto desde redes de IIoT, así como las simulaciones digitales, ayuda a las fábricas a operar de manera más segura, rápida y eficiente.

Ejemplo de data mesh en fabricación: los equipos a nivel de planta pueden ser responsables de los datos de sensores y del rendimiento de las máquinas, lo cual posibilita el mantenimiento predictivo y reduce el downtime mediante analíticas descentralizadas.

Marketing

Hoy en día, las demandas y expectativas de los clientes están dando forma al futuro, y cambian y crecen a un ritmo sin precedentes. Una sola marca generalmente tiene innumerables puntos de contacto con el consumidor en redes sociales, anuncios digitales dirigidos, y portales de compras on-line y omnicanal. El mercado actual ve un creciente deseo de una personalización rápida, ciclos de vida de producto más cortos, y altos niveles de elección y competencia. Para comprender y anticiparse a estas tendencias, los profesionales de marketing modernos necesitan acceso simultáneo y en tiempo real a una amplia variedad de data sets. En el pasado, esto implicaba solicitarlos (y esperarlos) de otros departamentos. Sin embargo, con una configuración de data mesh, los profesionales de marketing pueden seleccionar y acceder a estos datos en el momento, bajo sus propios términos.

Ejemplo de data mesh de marketing: construir una vista 360 del cliente requiere integrar datos de múltiples canales tales como correo electrónico, redes sociales y anuncios pagados. Un data mesh habilita que cada canal sea dueño de su producto de datos, garantizando así información estratégica en tiempo real para campañas personalizadas y mejores experiencias para los clientes.

Recursos humanos

Los equipos de RR. HH. deben gestionar grandes cantidades de datos extremadamente complejos y sensibles. Y dada la tendencia creciente hacia los lugares de trabajo remotos e híbridos, esos datos se complejizan y diversifican geográficamente todos los días. Por no mencionar el siempre cambiante conjunto de cuestiones legales y de compliance sobre las cuales los equipos de RR. HH. deben estar al tanto con mucha urgencia. Desde la contratación hasta la jubilación, los líderes de RR. HH. deben ser capaces de validar, evaluar y analizar algunos de los data sets más dispares de cualquier organización. La arquitectura de data mesh permite implementar los protocolos de seguridad adecuados y un acceso estrictamente restringido. Al mismo tiempo, habilita que los usuarios autorizados de RR. HH. accedan a datos e información de manera rápida y sin depender de complejos protocolos internos ni de la burocracia multidepartamental.

Ejemplo de data mesh de RR. HH.: los equipos de reclutamiento, nómina y gestión del desempeño pueden gobernar sus propios dominios de datos, mejorando el compliance y posibilitando analíticas en tiempo real de la fuerza laboral para la toma de decisiones estratégicas.

Finanzas

Al igual que el área de RR. HH., los equipos de finanzas y contabilidad también son responsables de datos sumamente cruciales y sensibles. Los sistemas de ERP modernos están revolucionando las finanzas, utilizando tecnología de bases de datos in-memory para personalizar informes, análisis y proyecciones en tiempo real. Sin embargo, incluso cuando los equipos financieros utilizan las mejores bases de datos y sistemas de ERP, aún suelen enfrentar obstáculos debido a culturas arraigadas y rígidas, silos pesados y procesos burocráticos y anticuados. La arquitectura de data mesh supone un cambio fundamental en la forma de analizar y gestionar los datos financieros Incluso puede remover ideas estancadas cuando las organizaciones empoderan a los equipos para poseer y revisar sus propios procesos de datos obsoletos.

Ejemplo de data mesh de finanzas: los equipos de planificación financiera pueden ser responsables de los dominios de datos de ingresos, gastos e inversiones, garantizando una proyección precisa y una modelación ágil de escenarios sin depender de un único equipo central.

Está claro que el data mesh no es solo otra palabra de moda sino una tendencia de la estrategia de datos que debe tomarse en serio. Empresas de todos los tamaños e industrias están usando el data mesh en su búsqueda de formas de usar los datos para crear información estratégica y valor.

Alternativas al data mesh

Si bien el data mesh ofrece un enfoque descentralizado para la gestión de datos, no es la única opción. Las arquitecturas tradicionales tales como los data lakes y almacenes de datos siguen siendo ampliamente utilizadas para centralizar y almacenar grandes volúmenes de datos, a menudo combinadas con data lakehouses que integran capacidades para datos estructurados y no estructurados. Otros modelos, como el data fabric, se enfocan en crear una capa unificada para la integración y orquestación de datos abarcando sistemas diversos. Cada alternativa aborda la escalabilidad, gobernanza y accesibilidad de manera diferente, por lo que la elección depende de las necesidades y el nivel de madurez de la organización.

Veamos las alternativas al data mesh y cómo se comparan.

Data mesh vs. data lake/lakehouse de datos

Data mesh
Data lake/lakehouse de datos
Concepto central
Arquitectura descentralizada con gobernanza federada
Repositorio centralizado para datos sin procesar o semiestructurados
Foco
Propiedad, gobernanza y capacidad de descubrimiento
Almacenamiento y procesamiento de datos a gran escala
Es mejor para
Organizaciones que enfrentan cuellos de botella y problemas de escalabilidad
Empresas que necesitan una única fuente para analíticas y cargas de trabajo de machine learning
Cuándo elegirlo
Cuando la calidad de los datos, la autonomía y la colaboración entre dominios son lo más importante
Cuando el almacenamiento rentable y las analíticas por lotes son una prioridad

Data mesh vs. almacén de datos

Data mesh
Almacén de datos
Concepto central
Productos de datos distribuidos gestionados por dominio
Repositorio centralizado y estructurado para analíticas
Foco
Escalabilidad, agilidad y gobernanza descentralizada
Consultas de alto rendimiento e informes de BI
Es mejor para
Organizaciones complejas con necesidades de datos diversas y en rápida evolución
Empresas con datos principalmente estructurados e informes estandarizados
Cuándo elegirlo
Cuando la flexibilidad, la propiedad del dominio y la interoperabilidad son fundamentales
Cuando la presentación de informes históricos consistentes y el compliance son las principales prioridades

Data mesh vs. data fabric

Data mesh
Data fabric
Concepto central
Propiedad de datos descentralizada y orientada a dominios
Capa de integración centralizada para el acceso a datos
Foco
Modelo organizacional para la escalabilidad y autonomía
Conectividad y automatización impulsadas por tecnología
Es mejor para
Grandes organizaciones con estructuras de dominio complejas
Empresas que necesitan acceso unificado abarcando silos
Cuándo elegirlo
Cuando la agilidad, la responsabilidad por dominio y los datos como producto son prioridades
Cuando la integración y automatización fluida en entornos híbridos es el objetivo principal

Implementar un data mesh

Implementar un data mesh requiere un enfoque estratégico que equilibre la descentralización con estándares compartidos. Esto son los pasos clave de un data mesh:

  1. Identifique los dominios piloto: comience de a poco seleccionando dos o tres dominios con un valor comercial claro y una sólida madurez de datos. Estos equipos serán los primeros en adoptar el modelo, demostrando el modelo de data mesh antes de escalarlo en toda la organización.
  2. Establezca la plataforma: construya una plataforma de datos de autoservicio que brinde herramientas comunes para publicar, descubrir y consumir productos de datos. Esto incluye catálogos de datos, API y características de seguridad automatizadas para reducir la fricción para los equipos de dominio.
  3. Defina la gobernanza federada: cree políticas de gobernanza que hagan cumplir estándares globales de seguridad, compliance e interoperabilidad, permitiendo al mismo tiempo la autonomía de los dominios. La gobernanza debe incluir roles claros, definiciones de productos de datos y expectativas de calidad.

Antipatrones que se deben evitar

Cuando el data mesh se implementa incorrectamente al no seguir los patrones organizacionales naturales, puede generar confusión y discordia. Un antipatrón en el data mesh es un enfoque o práctica recurrente que parece útil, pero que en última instancia socava los principios fundamentales de la arquitectura. Los antipatrones que se deben evitar incluyen:

Cinco mejores prácticas para un data mesh

  1. Comience de a poco e itere: use dominios piloto para perfeccionar los procesos antes de escalar.
  2. Trate los datos como un producto: defina la propiedad, los acuerdos de nivel de servicio (SLA) y los estándares de usabilidad para cada data set.
  3. Invierta en herramientas compartidas: facilite la publicación y el descubrimiento para los equipos de dominio.
  4. Incorpore la gobernanza desde el principio: equilibre la autonomía con el compliance desde el inicio.
  5. Enfóquese en los resultados de negocio: alinee los productos de datos con un valor medible, no solo con objetivos técnicos.

Combinando la propiedad de dominios, una plataforma robusta y una gobernanza federada, las organizaciones pueden mejorar la agilidad, confianza y colaboración entre dominios —sin los cuellos de botella de los modelos centralizados tradicionales—.

Medición y métricas

Evaluar el éxito requiere métricas de data mesh que equilibren el rendimiento técnico con los resultados de negocio. Estas métricas pueden incluir:

En conjunto, estas métricas brindan información estratégica orientativa sobre si el data mesh está brindando agilidad, confianza y escalabilidad, sin asumir benchmarks universales.

Preguntas frecuentes sobre el data mesh

¿Qué es la democratización de datos?
En esencia, la democratización de datos consiste en resolver los desafíos relacionados que enfrenta el personal en su trabajo diario. El data mesh brinda soporte descentralizando la propiedad hacia los dominios de negocio —de modo que los datos sean gestionados por quienes están más cerca de su contexto— y brindando una plataforma de autoservicio que facilita la publicación, descubrimiento y uso de productos de datos. En este blog se enumeran más detalles sobre la definición, los principios, y cómo ayudar a que los empleados se sientan cómodos al hacer preguntas y obtener respuestas relacionadas con datos.
¿Qué es la interoperabilidad?

La interoperabilidad se define como la capacidad de un sistema o producto para funcionar con otros sistemas o productos sin esfuerzo especial por parte del usuario. Techtarget agrega que ayuda a las organizaciones a lograr una mayor eficiencia y una visión más holística sobre información y datos. Para obtener más detalles, esta clase de Open MOOC brinda los aspectos básicos de la interoperabilidad de datos, así como sus diferentes tipos y capas.

En el contexto de los datos, la interoperabilidad va más allá de la simple conectividad e incluye la capacidad de descubrimiento (hacer que los productos de datos sean fácilmente encontrados en diferentes dominios mediante catálogos o registros); contratos (acuerdos claros y legibles por máquinas sobre esquemas de datos, API y SLA para ayudar a garantizar un consumo consistente); y estándares compartidos (gobernanza común, metadatos y prácticas de seguridad para un intercambio de datos sin fricciones entre dominios).

Un ejemplo de interoperabilidad es cuando el dominio de clientes publica un producto de datos con perfiles de clientes y, luego, el dominio de ventas consume estos datos para enriquecer las analíticas su pipeline. La interoperabilidad garantiza que el equipo de ventas pueda descubrir el producto de datos del cliente en un catálogo, confiar en su contrato para los esquemas y garantías de calidad, e integrarlo todo utilizando estándares compartidos sin trabajo manual.

¿Cuál es la diferencia entre data mesh y data fabric?

Data mesh y data fabric son enfoques arquitectónicos diferentes dentro de la estrategia de gestión de datos de una empresa.

El data fabric es un enfoque tecnocéntrico que busca formas cada vez más fluidas de gestionar metadatos complejos e información no estructurada fusionando IA, machine learning y analíticas avanzadas. El data mesh, por su parte, si bien depende de todos los desarrollos tecnológicos del data fabric, se enfoca más en integrar los procesos de gestión de datos con los usuarios humanos que dependen de ellos —y en encontrar formas de optimizar y simplificar el acceso y la utilidad desde la perspectiva del personal—.

Hay una relación como del huevo y la gallina entre el data mesh y el data fabric: se necesitan tecnologías de data fabric cada vez más avanzadas para que la gestión de datos evolucione a la velocidad que necesita. Sin embargo, sin una evolución que acompañe los procesos humanos y las estrategias organizativas, el personal no podrá aprovechar adecuadamente los avances de tecnologías de data fabric. Así como el DOS y las interfaces complejas dieron paso a los sistemas operativos informáticos más fluidos que disfrutamos hoy, las arquitecturas de data mesh y data fabric están destinadas a hacerse cada vez más fluidas a medida que avanzan estos procesos y tecnologías.

¿Qué problema resuelve el data mesh?
El data mesh resuelve el problema de los cuellos de botella creados por equipos de datos centralizados, acelera el time-to-insight y habilita la escalabilidad. Los modelos tradicionales concentran la propiedad y el procesamiento de los datos en un único equipo, lo cual causa retrasos y reduce la agilidad. El data mesh aborda esto aplicando cuatro principios: propiedad de dominio, datos como producto, una plataforma de datos de autoservicio y gobernanza federada. En conjunto, los principios del data mesh descentralizan la responsabilidad, mejoran la accesibilidad y aceleran la toma de decisiones.
¿Es un data mesh una tecnología o un modelo operativo?
El data mesh es un modelo operativo, no una sola tecnología o herramienta. Es una forma de organizar la manera en que los equipos trabajan con los datos, descentralizando la propiedad hacia los dominios de negocio y tratando los datos como un producto. El modelo de data mesh cuenta con el soporte de capacidades de plataforma compartidas —tales como infraestructuras de autoservicio, catálogos de datos y herramientas de gobernanza— que ayudan a los equipos a publicar, compartir y gobernar los datos de manera efectiva. En lugar de reemplazar las tecnologías existentes, el data mesh brinda un marco para escalar los datos en toda una organización sin crear cuellos de botella en los equipos centralizados.