
¿Qué es la minería de datos?
Esta página web se ha traducido automáticamente para su comodidad. SAP no proporciona ninguna garantía con respecto a la exactitud o integridad de la traducción automática. La página web original en inglés se puede encontrar utilizando el mapa mundial en la esquina superior derecha de esta página.
La minería de datos es el proceso de extraer información útil de una acumulación de datos, a menudo de un almacén de datos o de la recopilación de conjuntos de datos vinculados. Las herramientas de minería de datos incluyen potentes capacidades estadísticas, matemáticas y analíticas cuyo objetivo principal es examinar grandes conjuntos de datos para identificar tendencias, patrones y relaciones para dar soporte a la toma de decisiones fundamentada y a la planificación.
A menudo, asociados con las consultas del departamento de marketing, muchos ejecutivos ven la minería de datos como una forma de ayudarlos a comprender mejor la demanda y a ver el efecto que los cambios en los productos, los precios o las promociones tienen en las ventas. Pero la minería de datos también tiene beneficios considerables para otras áreas de negocio. Los ingenieros y diseñadores pueden analizar la eficacia de los cambios de producto y buscar posibles causas de éxito o fracaso del producto en relación con cómo, cuándo y dónde se utilizan los productos. Las operaciones de servicio y reparación pueden planificar mejor el inventario de piezas y la asignación de personal. Las organizaciones de servicios profesionales pueden utilizar la minería de datos para identificar nuevas oportunidades a partir de tendencias económicas cambiantes y cambios demográficos.
La minería de datos se vuelve más útil y valiosa con conjuntos de datos más grandes y con más experiencia de usuario. Lógicamente, cuantos más datos, más información estratégica e inteligencia se entierren allí. Además, a medida que los usuarios se familiarizan más con las herramientas y comprenden mejor la base de datos, más creativos pueden ser con sus exploraciones y análisis.
¿Por qué utilizar la minería de datos?
El principal beneficio de la minería de datos es su poder para identificar patrones y relaciones en grandes volúmenes de datos de múltiples fuentes. Con cada vez más datos disponibles –de fuentes tan variadas como las redes sociales, sensores remotos e informes cada vez más detallados sobre el movimiento del producto y la actividad del mercado–, la minería de datos ofrece las herramientas para explotar al máximo Big Data y convertirlos en inteligencia accionable. Es más, puede actuar como un mecanismo para “pensar fuera de la caja”.
El proceso de minería de datos puede detectar relaciones y patrones sorprendentes e intrigantes en fragmentos de información aparentemente no relacionados. Debido a que la información tiende a compartimentarse, históricamente ha sido difícil o imposible de analizar en su conjunto. Sin embargo, puede haber una relación entre factores externos (quizás factores demográficos o económicos) y el rendimiento de los productos de una empresa. Y si bien los ejecutivos observan regularmente los números de ventas por territorio, línea de productos, canal de distribución y región, a menudo carecen de contexto externo para esta información. Su análisis señala “qué pasó” pero hace poco por descubrir el “por qué ocurrió de esta manera”. La minería de datos puede llenar esta brecha.
La minería de datos puede buscar correlaciones con factores externos; mientras que la correlación no siempre indica causalidad, estas tendencias pueden ser indicadores valiosos para guiar las decisiones de producto, canal y producción. El mismo análisis beneficia a otras partes del negocio desde el diseño del producto hasta la eficiencia operativa y la prestación de servicios.
Historial de minería de datos
Las personas han estado recopilando y analizando datos durante miles de años y, de muchas maneras, el proceso ha permanecido igual: identificar la información necesaria, encontrar fuentes de datos de calidad, recopilar y combinar los datos, utilizar las herramientas más eficaces disponibles para analizar los datos y capitalizar lo que ha aprendido. A medida que la computación y los sistemas basados en datos han crecido y avanzado, también lo han hecho las herramientas para gestionar y analizar los datos. El verdadero punto de inflexión llegó en la década de 1960 con el desarrollo de la tecnología de bases de datos relacionales y herramientas de consulta de lenguaje natural orientadas al usuario como Structured Query Language (SQL). Ya no había datos disponibles solo a través de programas codificados personalizados. Con este avance, los usuarios de negocio podrían explorar interactivamente sus datos y eliminar las gemas ocultas de inteligencia enterradas dentro.
La minería de datos ha sido tradicionalmente un conjunto de habilidades de especialidad dentro de la ciencia de datos. Sin embargo, cada nueva generación de herramientas analíticas empieza a requerir capacidades técnicas avanzadas, pero evoluciona rápidamente para que los usuarios puedan acceder a ellas. La interactividad –la capacidad de dejar que los datos hablen con usted– es el avance clave. Haz una pregunta; ve la respuesta. En función de lo que aprenda, haga otra pregunta. Este tipo de roaming no estructurado a través de los datos lleva al usuario más allá de los límites del diseño de la base de datos específica de la aplicación y permite el descubrimiento de relaciones que cruzan los límites funcionales y organizativos.
La minería de datos es un componente clave de Business Intelligence. Las herramientas de minería de datos están integradas en tableros ejecutivos, recolectando información estratégica de Big Data, incluidos datos de redes sociales, feeds de sensores de internet de las cosas (IoT), dispositivos con conocimiento de la ubicación, texto no estructurado, video y más. La minería de datos moderna se basa en la nube y la computación virtual, así como en bases de datos in-memory, para gestionar datos de muchas fuentes de manera rentable y escalar según la demanda.
¿Cómo funciona Data Mining?
- Comprenda el problema, o al menos el área de investigación. El responsable de la toma de decisiones empresarial, que debería estar en el asiento del conductor de esta aventura off-road de minería de datos, necesita una comprensión general del dominio en el que trabajarán: los tipos de datos internos y externos que formarán parte de esta exploración. Se supone que tienen un conocimiento íntimo del negocio y de las áreas funcionales involucradas.
- Recopilación de datos. Comience con sus sistemas y bases de datos internos. Vincularlos a través de sus modelos de datos y varias herramientas relacionales o reunir los datos en un almacén de datos. Esto incluye cualquier dato de fuentes externas que formen parte de sus operaciones, como datos de ventas de campo y/o datos de servicio, IoT o datos de redes sociales. Busque y adquiera los derechos de datos externos, incluidos datos demográficos, económicos e inteligencia de mercado, como las tendencias de la industria y los índices de referencia financieros de asociaciones comerciales y gobiernos. Abráquelos al alcance del conjunto de herramientas (incorpórelos a su almacén de datos o vincúlelos al entorno de minería de datos).
- Preparación y comprensión de los datos. Utilice los expertos en la materia de su empresa para ayudar a definir, categorizar y organizar los datos. Esta parte del proceso a veces se llama disputa de datos o munging. Algunos de los datos pueden necesitar limpieza o “limpieza” para eliminar duplicados, inconsistencias, registros incompletos o formatos obsoletos. La preparación y depuración de datos puede ser una tarea continua a medida que los nuevos proyectos o los datos de nuevos campos de consulta se vuelven de interés.
- Formación de usuarios. Usted no le daría a su adolescente las llaves de la familia Ferrari sin tener que pasar por la educación del conductor, la capacitación en la carretera y alguna práctica supervisada con un conductor con licencia –así que asegúrese de brindar capacitación formal a sus futuros mineros de datos, así como alguna práctica supervisada a medida que comienzan a familiarizarse con estas poderosas herramientas–. La educación continua también es una buena idea una vez que han dominado lo básico y pueden pasar a técnicas más avanzadas.
Técnicas de minería de datos
Tenga en cuenta que la minería de datos se basa en un kit de herramientas en lugar de en un proceso o rutina fijos. Las técnicas específicas de minería de datos citadas aquí son simplemente ejemplos de cómo las organizaciones están usando las herramientas para explorar sus datos en busca de tendencias, correlaciones, inteligencia y visión del negocio.
En términos generales, los enfoques de minería de datos pueden categorizarse como dirigidos –enfocados en un resultado específico deseado– o no dirigidos como un proceso de descubrimiento. Otras exploraciones pueden tener como objetivo clasificar o clasificar datos, como agrupar clientes potenciales según atributos empresariales como sector, productos, tamaño y ubicación. Un objetivo similar, la detección de anomalías o valores atípicos, es un método automatizado para reconocer anomalías reales (en lugar de una simple variabilidad) dentro de un conjunto de datos que muestra patrones identificables.
Asociación
Otro objetivo interesante es la asociación, que une dos eventos o actividades aparentemente no relacionados. Una historia clásica de los primeros días de analíticas y minería de datos, tal vez ficticia, tiene una cadena de tiendas de conveniencia que descubren una correlación entre las ventas de cerveza y los pañales. Especular que acosaba a los nuevos padres que se agotan a última hora de la noche para conseguir pañales pueden agarrar un par de seis paquetes mientras están allí. Las tiendas posicionan la cerveza y los pañales cerca y aumentan las ventas de cerveza como resultado.
Agrupación en clústeres
Este enfoque tiene como objetivo agrupar los datos por similitudes en lugar de supuestos predefinidos. Por ejemplo, cuando extrae la información de ventas de sus clientes combinada con el crédito al consumidor externo y los datos demográficos, puede descubrir que sus clientes más rentables provienen de ciudades medianas.
Gran parte del tiempo, la minería de datos se persigue en apoyo de la predicción o la previsión. Cuanto mejor comprenda los patrones y los comportamientos, mejor trabajo podrá hacer para pronosticar acciones futuras relacionadas con causas o correlaciones.
Regresión
Una de las técnicas matemáticas ofrecidas en kits de herramientas de minería de datos, el análisis de regresión predice un número basado en patrones históricos proyectados en el futuro. Varios otros algoritmos de detección y seguimiento de patrones proporcionan herramientas flexibles para ayudar a los usuarios a comprender mejor los datos y el comportamiento que representan.
Estas son solo algunas de las técnicas y herramientas disponibles en los kits de herramientas de minería de datos. La elección de la herramienta o técnica es algo automatizada en el sentido de que las técnicas se aplicarán de acuerdo a cómo se plantea la pregunta. En tiempos anteriores, la minería de datos se denominaba "corte y división" de la base de datos, pero la práctica es ahora más sofisticada y términos como asociación, agrupación y regresión son habituales.
Casos de uso y ejemplos
La minería de datos es clave para el análisis de opiniones, la optimización de precios, el marketing de bases de datos, la gestión del riesgo crediticio, la capacitación y el soporte, la detección de fraudes, los diagnósticos médicos y de salud, la evaluación de riesgos, los sistemas de recomendación ("clientes que compraron esto también le gustó...") y mucho más. Puede ser una herramienta eficaz en casi cualquier industria, incluyendo comercio minorista, distribución mayorista, industrias de servicios, fabricación, telecomunicaciones, comunicaciones, seguros, educación, fabricación, cuidado de la salud, banca, ciencia, ingeniería y marketing en línea o redes sociales.
- Desarrollo de productos: las empresas que diseñan, fabrican o distribuyen productos físicos pueden identificar oportunidades para orientar mejor sus productos analizando patrones de compra junto con datos económicos y demográficos. Sus diseñadores e ingenieros también pueden hacer referencia cruzada entre el feedback de clientes y usuarios, los registros de reparaciones y otros datos para identificar oportunidades de mejora de productos.
- Fabricación: Los fabricantes pueden realizar un seguimiento de las tendencias de calidad, los datos de reparación, las tasas de producción y los datos de rendimiento de los productos desde el campo para identificar problemas de producción. También pueden reconocer posibles actualizaciones de procesos que mejorarían la calidad, ahorrarían tiempo y costos, mejorarían el rendimiento del producto y/o apuntarían a la necesidad de equipos de fábrica nuevos o mejores.
- Industrias de servicios: en las industrias de servicios, los usuarios pueden encontrar oportunidades similares de mejora de productos haciendo referencia cruzada a las opiniones de los clientes (directas o de redes sociales u otras fuentes) con servicios específicos, canales, datos de desempeño de pares, región, precios, demografía, datos económicos y más.
Por último, todos estos hallazgos deben devolverse a los pronósticos y la planificación para que toda la organización esté en sintonía con los cambios anticipados en la demanda basados en un conocimiento más íntimo del cliente –y estar mejor posicionada para explotar las oportunidades recientemente identificadas–.
Desafíos de la minería de datos
- Big Data: los datos se generan a un ritmo acelerado, ofreciendo cada vez más oportunidades para la minería de datos. Sin embargo, se necesitan herramientas modernas de minería de datos para extraer significado de Big Data, dado el gran volumen, alta velocidad y gran variedad de estructuras de datos, así como el creciente volumen de datos no estructurados. Muchos sistemas existentes luchan por manejar, almacenar y hacer uso de esta inundación de entradas.
- Competencia del usuario: Las herramientas de minería y análisis de datos están diseñadas para ayudar a los usuarios y a los responsables de la toma de decisiones a tener sentido y engañar el significado y la información estratégica de masas de datos. Si bien son muy técnicas, estas potentes herramientas ahora están empaquetadas con un excelente diseño de experiencia de usuario, por lo que prácticamente cualquiera puede utilizar estas herramientas con una formación mínima. Sin embargo, para obtener todos los beneficios, el usuario debe comprender los datos disponibles y el contexto empresarial de la información que está buscando. También deben saber, al menos en general, cómo funcionan las herramientas y qué pueden hacer. Esto no está fuera del alcance del gerente promedio o ejecutivo, pero es un proceso de aprendizaje y los usuarios deben poner un poco de esfuerzo en desarrollar este nuevo conjunto de habilidades.
- Calidad y disponibilidad de datos: con masas de datos nuevos, también hay masas de datos incompletos, incorrectos, engañosos, fraudulentos, dañados o simplemente inútiles. Las herramientas pueden ayudar a resolver todo esto, pero los usuarios deben ser continuamente conscientes de la fuente de los datos y de su credibilidad y fiabilidad. Las preocupaciones por la privacidad también son importantes, tanto en lo que se refiere a la adquisición de los datos como al cuidado y manejo una vez que estén en su poder.
Amplíe su expertise en
gestión de datos
Comprenda el proceso de gestión de datos y sus beneficios.
Más en esta serie
Preguntas frecuentes sobre minería de datos
Data Mining es el proceso de utilizar herramientas analíticas avanzadas para extraer información útil de una acumulación de datos. Machine learning es un tipo de inteligencia artificial (IA) que permite a los sistemas aprender de la experiencia. La minería de datos puede hacer uso del aprendizaje automático, cuando los programas analíticos tienen la capacidad de adaptar su funcionalidad en respuesta al análisis de datos que realizan.
El análisis o análisis de datos son términos generales para el amplio conjunto de prácticas centradas en identificar información útil, evaluarla y proporcionar respuestas específicas. La minería de datos es un tipo de análisis de datos que se centra en explorar grandes conjuntos de datos combinados para descubrir patrones, tendencias y relaciones que pueden conducir a información estratégica y proyecciones.
La ciencia de datos es un término que incluye muchas tecnologías de la información incluyendo estadísticas, matemáticas y técnicas computacionales sofisticadas aplicadas a los datos. La minería de datos es un caso de uso para la ciencia de datos centrado en el análisis de grandes conjuntos de datos de una amplia gama de fuentes.
Un almacén de datos es una colección de datos, generalmente de múltiples fuentes (ERP, CRM, etc.) que una empresa combinará en el almacén para el almacenamiento de archivo y análisis amplios como la minería de datos.
SAP Insights Newsletter
Suscríbase hoy
Obtenga información estratégica clave suscribiéndose a nuestro newsletter.