¿Qué es la gestión de datos?
La gestión de datos es la práctica de recopilar, organizar, gestionar y acceder a los datos para dar soporte a la productividad, eficiencia y toma de decisiones.
Resumen sobre la gestión de datos
Los datos son esenciales para las operaciones y el funcionamiento de un negocio. Las empresas deben dar sentido a los datos y encontrar los que son relevantes entre el ruido creado por los diversos sistemas y tecnologías que dan soporte a las economías globales altamente conectadas de hoy. En este sentido, los datos ocupan un lugar central. Por sí solos, los datos son inútiles. Las empresas necesitan una estrategia, gobernanza y modelo de gestión eficaces para aprovechar todas las formas de datos para su uso práctico y eficiente en cadenas de suministro, redes de empleados, ecosistemas de clientes y socios… y mucho más.
Definición y proceso de data management
La gestión de datos es la práctica de recopilar, organizar, gestionar y acceder a los datos para dar soporte a la productividad, eficiencia y toma de decisiones. Dado el rol fundamental que juegan los datos en los negocios de hoy, una estrategia eficaz por parte de la empresa y una plataforma moderna para la gestión de datos son esenciales en todas las empresas –independientemente del tamaño o industria–. La gestión de datos es importante para una variedad de casos de uso basados en datos, incluyendo ejecución de procesos de negocio de punta a punta, cumplimiento regulatorio, analíticas e IA precisas, migración de datos, y transformación digital.
El proceso de data management incluye una amplia gama de tareas y procedimientos, tales como:
Recopilar, procesar y validar datos
Integrar diferentes tipos de datos de fuentes dispares, incluyendo datos estructurados y no estructurados
Gestionar la calidad de los datos para cumplir con los estándares del negocio
Brindar autoservicio, colaboración y acceso a los datos
Proteger y asegurar los datos y garantizar su privacidad
Gestionar el ciclo de vida de los datos, desde la creación hasta la eliminación
Garantizar una alta disponibilidad de datos y su recuperación ante desastres
Los elementos clave de data management
¿Por qué es importante la data management?
Cada aplicación, solución analítica y algoritmo utilizado en un negocio (las reglas y los procesos asociados que permiten que la tecnología resuelva problemas y complete tareas) depende del acceso fluido a datos de alta calidad. En esencia, un sistema para gestión de datos ayuda a garantizar que estos sean seguros, accesibles y precisos. Pero los beneficios de la gestión de datos no terminan ahí.
Convertir los datos en un activo de negocios de alto valor
Demasiados datos pueden resultar abrumadores –e inútiles– si no se gestionan correctamente. A ello súmele crecientes niveles de diversidad, distribución y demanda sobre los datos, y es fácil ver cómo las organizaciones pueden tener dificultades para aprovecharlos como un activo para cubrir las necesidades de su negocio digital. Pero con las herramientas correctas, los datos se pueden aprovechar para empoderar a las empresas con información estratégica más profunda que nunca, proyecciones más precisas y procesos de negocio innovadores. Puede aportar a las empresas una mejor comprensión de lo que quieren los clientes, y ayudarlas a brindar experiencias excepcionales basadas en las lecciones que dan los datos. También puede ayudar a impulsar nuevos modelos de negocio basados en datos –tales como ofertas de servicio basadas en IA generativa–, los cuales no serían precisos si no hubiera una base de datos de alta calidad sobre la cual basar los modelos de entrenamiento.
"Estar impulsado por datos significa usar datos para todo lo que tenga que ver con manejar la complejidad de su estado, almacenamiento, acceso, calidad y contexto para permitir que las organizaciones materialicen sus aspiraciones basadas en datos, centrales para el éxito del negocio digital".
Gartner "Data Management Solutions Primer for 2023". Adam Ronthal, Ehtisham Zaidi, 14 de febrero de 2023
No es ningún secreto que las organizaciones impulsadas por datos tienen una ventaja competitiva importante. Con herramientas avanzadas, las empresas pueden gestionar y acceder a más datos provenientes de más fuentes que nunca. También pueden aprovechar muchos tipos diferentes de datos en tiempo real, estructurados y no estructurados –incluyendo información de dispositivos de internet de las cosas (IoT), archivos de video y audio, datos sobre secuencias de clics en internet, y comentarios en redes sociales–, lo cual abre más oportunidades para monetizarlos y utilizarlos como un activo.
Sentar el cimiento de los datos para la transformación digital
A menudo se dice que los datos son el alma de la transformación digital –y es cierto–. Los líderes de datos y analíticas (D&A) deben ser capaces de cubrir las demandas del negocio digital y la creciente complejidad del entorno de datos (incluyendo el impacto de la nube). La IA, machine learning, Industria 4.0, analíticas avanzadas, IoT y automatización inteligente requieren de grandes volúmenes de datos oportunos, precisos y seguros para hacer lo que hacen.
El achine learning y la IA generativa, por ejemplo, necesitan data sets muy grandes y diversos para "aprender", identificar patrones complejos, resolver problemas, y mantener una actualización y funcionamiento eficaces de modelos y algoritmos. Las analíticas avanzadas (que a menudo aprovechan machine learning e IA) también dependen de vastas cantidades de datos de alta calidad para producir información estratégica relevante y accionable a partir de la cual se pueda actuar con confianza. Y los escenarios de IoT e IoT industrial dependen de recibir un flujo constante de datos de máquinas y sensores entregados a velocidades extremadamente altas.
El denominador común en cualquier proyecto de transformación digital son los datos. Antes de que las organizaciones puedan transformar procesos, aprovechar nuevas tecnologías y convertirse en empresas inteligentes, necesitan un cimiento de datos sólido. En resumen, necesitan un sistema para gestión de datos moderno.
"La supervivencia continua de cualquier negocio dependerá de una arquitectura ágil y centrada en los datos que responda a la tasa de cambio constante.
Donald Feinberg, Vice President de Gartner
Garantizar el cumplimiento de las leyes de privacidad de datos
Una buena gestión de datos también es esencial para garantizar el cumplimiento de las leyes nacionales e internacionales sobre privacidad de datos –tales como el Reglamento General de Protección de Datos (GDPR) en Europa o la ley de privacidad del consumidor de California en Estados Unidos–, así como los requisitos de privacidad y seguridad específicos de la industria. Y cuando esas protecciones deben probarse o auditarse, es esencial tener en funcionamiento políticas y procedimientos sólidos para la gestión de datos.
Enfoques sobre la gestión de datos
Tanto el data fabric como el data mesh se han convertido en los últimos años en términos populares dentro de la gestión de datos, dado que muchas organizaciones los adoptan. El estilo de la arquitectura del data fabric está pensado para crear una capa de conexión entre distintas fuentes de datos, facilitando el autoservicio y el acceso y entrega de en toda la empresa. Una arquitectura de data fabric está pensada para abstraer las diferentes ubicaciones donde usted almacena sus datos desde la perspectiva de un usuario final, presentando una sola vista unificada que se puede utilizar como tal incluso cuando la arquitectura subyacente sea altamente distribuida.
Data mesh
El data mesh es un enfoque de la gestión de datos que utiliza un marco arquitectónico distribuido. En otras palabras: extiende en todo el negocio la propiedad y responsabilidad sobre data sets específicos hasta aquellos usuarios que tienen expertise de especialista para comprender qué significan esos datos y cómo hacer el mejor uso de ellos. La arquitectura de data mesh conecta y extrae datos desde distintas fuentes, tales como data lakes y almacenes de datos, y distribuye los relevantes entre los expertos humanos y equipos de dominio adecuados de todo el negocio. Básicamente, en un data lake central una voluminosa mezcla de datos se clasifica y distribuye en partes manejables entre quienes pueden comprenderlos y aprovecharlos mejor.
Data fabric
El data fabric es una combinación de arquitectura de datos y soluciones de software dedicadas que centralizan, conectan, gestionan y gobiernan datos entre diferentes sistemas y aplicaciones. Las soluciones de data fabric le permiten conectar y gestionar datos en tiempo real, entre diferentes sistemas y aplicaciones. Esto hace posible crear una única fuente de verdad, y usar y acceder a esos datos cuando y donde usted lo necesite –democratizando y automatizando los procesos de gestión–. Un data fabric también optimiza todos los datos, especialmente en arquitecturas distribuidas complejas, ya que los prepara para su uso en aplicaciones de analíticas, IA y machine learning unificándolos, depurándolos, enriqueciéndolos y protegiéndolos. La arquitectura y soluciones de data fabric les permiten a las empresas aprovechar sus datos y escalar sus sistemas mientras se adaptan a mercados rápidamente cambiantes.
Gestión de datos maestros (MDM)
La gestión de datos maestros es la disciplina de crear una sola referencia confiable (una única versión de la verdad) para todos los que son importantes para el negocio, tales como los de productos, clientes, activos, finanzas, y más. La MDM ayuda a garantizar que las empresas no utilicen múltiples versiones de datos potencialmente inconsistentes en diferentes áreas del negocio, incluyendo procesos, operaciones, analíticas, IA e informes. Los tres pilares clave para una MDM eficaz incluyen: consolidación, gobernanza y gestión de calidad de los datos.
"Una disciplina habilitada por la tecnología, donde la organización de negocios y la de TI trabajan juntas para garantizar la uniformidad, precisión, administración, consistencia semántica y responsabilidad sobre los activos de datos maestros oficiales compartidos en la empresa".
Definición de MDM según Gartner
Integración de datos
Integración de datos es la práctica de ingerir, transformar, combinar y brindar datos, donde y cuando se necesiten. Esta integración se lleva a cabo en la empresa y más allá –tanto entre socios como con fuentes de datos y casos de uso de terceros– para cubrir los requisitos de todas las aplicaciones y procesos de negocio. Las técnicas aplicadas a los datos incluyen, por ejemplo, movimiento en masa/por lotes; extracción, transformación y carga (ETL); captura de cambios; réplica; virtualización; organización; e integración.
Descubrimiento y catalogación de datos
El descubrimiento y catalogación le permiten encontrar qué datos tiene y determinar cómo se relacionan. El descubrimiento a menudo se brinda como parte de los perfiles de datos (los cuales a su vez existen para generar una visión general de su estructura, contenido, etc.), e indica el paradero y las relaciones entre diferentes data sets dentro y entre múltiples fuentes de datos (heterogéneos). En términos más generales, es una herramienta fundamental para comprender su entorno de datos. El descubrimiento de datos sensibles es una subcategoría notable que se ocupa especialmente de localizar y clasificar los datos personales o de algún otro modo sensibles que hay dentro de su organización para poder protegerlos adecuadamente en pos de la privacidad, seguridad y cumplimiento regulatorio de los datos.
El descubrimiento de datos también se utiliza para crear catálogos de datos, junto con otras técnicas de automatización más avanzadas, tales como IA y machine learning. Los catálogos de datos brindan un repositorio de información (conocido como metadatos) sobre estos activos: cuáles son, dónde se encuentran, en qué formato, y dentro de qué dominios son relevantes. Se debe recopilar automáticamente la mayor parte posible de esta información, y se la puede clasificar por zona geográfica, tiempo, control de acceso, etc. Los catálogos se pueden indexar y buscar, y brindan soporte para autoservicio y colaboración. Los catálogos más completos ingerirán metadatos desde distintas fuentes de datos derivadas, tales como informes y dashboards analíticos, además de las físicas. Los catálogos se utilizan habitualmente junto con las herramientas de preparación de datos y son importantes para dar soporte a la gobernanza y el acceso colaborativo basado en autoservicio.
Gobernanza, seguridad y cumplimiento de datos
La gobernanza de datos es una recopilación de reglas y responsabilidades para garantizar su disponibilidad, calidad, compliance y seguridad en toda la organización. La gobernanza de datos establece la infraestructura y nombra a las personas (o cargos) que dentro de una organización tendrán la autoridad y responsabilidad de gestionar y salvaguardar clases y tipos de datos específicos. La gobernanza de datos es una parte clave del compliance. Los sistemas se ocuparán de las mecánicas de seguridad, almacenamiento y acceso, así como de la adecuada eliminación y retención. La gobernanza de datos también ayuda a garantizar que estos sean precisos para comenzar, y que cumplan con los estándares del negocio antes de ser ingresados al sistema, mientras se los utiliza, y cuando se los recupera desde el sistema para su uso o almacenamiento en otro lugar. La gobernanza organizativa especifica cómo los individuos responsables utilizan procesos y tecnologías para gestionar y proteger los datos.
La seguridad de los datos es una preocupación importante en el mundo actual de hackers, virus, ciberataques y filtraciones de datos. Si bien la seguridad está incorporada dentro de los sistemas y aplicaciones, la gobernanza de datos se aplica para garantizar que estos sean configurados y administrados correctamente, y que se apliquen procedimientos y responsabilidades para proteger a los que están fuera del sistema o la base de datos.
¿Qué es una estrategia empresarial de datos, y por qué debería tener una?
Hoy, las estrategias de negocios dependen de los datos para innovar, automatizar procesos, personalizar experiencias de cliente y de empleado, e impulsar el crecimiento a través de nuevos mercados o adquisiciones. Por lo tanto, el éxito depende cada vez más de alinear su estrategia de datos con su estrategia de negocios. Una estrategia de datos debe tener resonancia en todos los niveles de la organización. Debe aportar significado y contexto al negocio.
Una empresa necesita una estrategia de datos para priorizar su trabajo. Todos sabemos que la cantidad de datos que genera y utiliza una organización está creciendo significativamente. En la información siempre habrá más problemas y requisitos que recursos. A lo largo de la estrategia, las empresas necesitan una forma de priorizar las actividades relacionadas con los datos en base al valor que generarán. La estrategia debe estar "vivita y coleando", totalmente alineada con las prioridades del negocio, pero siendo lo suficientemente flexible como para cambiar a medida que este se transforma y madura. No pueden ser solo palabras en un documento, sino que debe tomar vida dentro de la organización.
Una estrategia de datos describe todas las capacidades que deben crearse para lograr un resultado de negocios. Esto incluye no solo capacidades y herramientas para gestión de datos, sino también de negocios, tales como estructura organizativa, estrategia de adquisición y red de datos, compliance, y ética. Elabora un plan de acción a varios años para el desarrollo de capacidades, definiendo expectativas sobre cuáles se pueden alcanzar, en qué plazo, a qué costo, y qué soporte ejecutivo requieren.
La evolución de la data management
Una gestión de datos eficaz es crítica para el éxito del negocio desde hace más de 50 años –desde ayudar a las empresas a mejorar la precisión de los informes, hasta detectar tendencias y tomar mejores decisiones para impulsar la transformación digital y potenciar hoy nuevas tecnologías y modelos de negocio–. Los datos se han convertido en un nuevo tipo de capital, y las organizaciones con visión de futuro siempre están buscando nuevas y mejores formas de usarlos en su beneficio. Estas son las últimas tendencias en data management moderna que se deben vigilar y explorar por su relevancia para su negocio e industria:
Data fabric: la mayoría de las organizaciones hoy tienen una variedad de tipos de datos implementados en la nube y on-premise —y usan múltiples sistemas de gestión de bases de datos, tecnologías de procesamiento y herramientas—. El data fabric, que es una combinación personalizada entre arquitectura y tecnología, usa integración y orquestación de datos dinámicas para habilitar el acceso e intercambio de datos sin fricciones en un entorno distribuido.
Gestión de datos en la nube: muchas empresas están llevando a la nube algunas o todas sus plataformas para gestión de datos. La gestión de datos en la nube aprovecha todos los beneficios que ella brinda –escalabilidad, seguridad avanzada, acceso mejorado, backups automatizados, recuperación ante desastres, ahorro de costos, y más–. Las soluciones en la nube para base de datos y base de datos como servicio (DBaaS), los almacenes de datos en la nube y los data lakes en la nube están creciendo en popularidad.
Los datos como producto: es la práctica de tratar a su información interna como un artículo de primer orden, donde el trabajo de su equipo de datos –y por extensión, su Chief Data Officer o ejecutivo equivalente– es brindarle al resto de su organización exactamente aquellos que necesita, en el momento que los necesita, y con el nivel de calidad que los necesita. El objetivo es habilitar una mayor utilización de sus datos en general para obtener, por ejemplo, información analítica más puntual y precisa.
Gestión de datos aumentada: esta es una de las tendencias más recientes. La gestión de datos aumentada utiliza IA y machine learning para hacer que estos procesos se configuren y ajusten automáticamente. La gestión de datos aumentada automatiza todo, desde la calidad y los datos maestros hasta la integración –liberando al personal técnico calificado para que se enfoque en actividades de mayor valor–.
Analíticas aumentadas: las analíticas aumentadas usan tecnologías de inteligencia artificial (IA), machine learning y procesamiento de lenguaje natural (NLP) no solo para encontrar automáticamente la información estratégica más importante, sino para democratizar el acceso a analíticas avanzadas para que todos, no solo los científicos de datos, puedan hacer preguntas y obtener respuestas de una manera natural y conversacional.
Explore términos y tendencias adicionales en data management.
Resumen
Sabemos que la información se deriva de los datos. Y si la información es poder, gestionar y capitalizar sus datos de manera eficaz bien podría ser el superpoder de su empresa. Como tal, las responsabilidades de la gerencia de datos y el rol del director de Datos (y Analíticas) están evolucionando hacia convertirse en agentes del cambio claves para la organización –impulsando la adopción de la nube, aprovechando nuevas tendencias y tecnologías, y brindando valor estratégico al negocio–.
Soluciones para gestión de datos y de bases de datos
SAP puede ayudar a gestionar, controlar e integrar sus datos empresariales.
Ideas que no encontrará en ningún otro lugar
Regístrese para recibir una dosis de business intelligence directamente en su bandeja de entrada.