Saltar al contenido
Machine learning identificando autos

¿Qué es machine learning?

Machine learning es un subconjunto de inteligencia artificial (IA). Se centra en enseñar a las computadoras a aprender de los datos y mejorar con la experiencia –en lugar de ser explícitamente programadas para hacerlo–. En machine learning, los algoritmos se capacitan para encontrar patrones y correlaciones en grandes data sets y para tomar las mejores decisiones y previsiones basadas en ese análisis. Las aplicaciones de machine learning mejoran con el uso y se vuelven más precisas a medida que tienen acceso a más datos. Las aplicaciones de machine learning están a nuestro alrededor –en nuestras casas, nuestros carritos de compra, nuestros medios de entretenimiento y nuestro cuidado de la salud–.

Explicación de machine learning

¿Cómo se relaciona el machine learning con la IA?

El machine learning y sus componentes de deep learning y redes neuronales, todos encajan como subconjuntos concéntricos de IA. La IA procesa datos para tomar decisiones y hacer proyecciones. Los algoritmos de machine learning permiten que la IA no solo procese esos datos, sino que los use para aprender y ser más inteligente, sin necesidad de programación adicional. La inteligencia artificial es la madre de todos los subconjuntos de machine learning subyacentes. Dentro del primer subconjunto está machine learning; dentro de eso está el deep learning, y luego las redes neuronales dentro de eso.

Diagrama de la relación entre IA y machine learning

Diagrama de IA versus machine learning

¿Qué es una red neural?

 

Una red neuronal artificial (ANN) sigue el modelo de las neuronas de un cerebro biológico. Las neuronas artificiales se llaman nodos y se agrupan en múltiples capas, que operan en paralelo. Cuando una neurona artificial recibe una señal numérica, la procesa y envía una señal a las otras neuronas conectadas a ella. Al igual que en un cerebro humano, el refuerzo neuronal resulta en un mejor reconocimiento de patrones, experiencia y aprendizaje general.

 

¿Qué es deep learning?

 

Este tipo de machine learning se denomina "deep learning" porque incluye muchas capas de redes neuronales y volúmenes masivos de datos complejos y dispares. Para lograr un deep learning, el sistema se involucra con múltiples capas en la red, extrayendo cada vez más resultados de nivel superior. Por ejemplo, un sistema de deep learning que está procesando imágenes de la naturaleza y buscando "margaritas Gloriosa" reconocerá, en la primera capa, una planta. A medida que avanza por las capas neuronales, entonces identificará una flor, luego una margarita, y finalmente una "margarita Gloriosa". Ejemplos de aplicaciones de deep learning incluyen el reconocimiento de voz, la clasificación de imágenes y el análisis farmacéutico.

¿Cómo funciona el machine learning?

El machine learning se compone de diferentes tipos de modelos de machine learning, y utiliza varias técnicas algorítmicas. Dependiendo de la naturaleza de los datos y el resultado deseado, se puede utilizar uno de los cuatro modelos de aprendizaje: supervisado, no supervisado, semisupervisado o de refuerzo. Dentro de cada uno de esos modelos, se pueden aplicar una o más técnicas algorítmicas, en relación con los data sets en uso y los resultados que se buscan. Los algoritmos de machine learning básicamente están diseñados para clasificar cosas, encontrar patrones, proyectar resultados, y tomar decisiones fundamentadas. Los algoritmos pueden utilizarse uno a la vez o combinarse para lograr la mayor precisión posible cuando se trata de datos complejos y más impredecibles. 

Cómo funciona el proceso de machine learning

Diagrama de cómo funciona el machine learning

¿Qué es el aprendizaje supervisado?

 

El aprendizaje supervisado es el primero de los cuatro modelos de machine learning. En los algoritmos de aprendizaje supervisado, a la máquina se le enseña mediante ejemplos. Los modelos de aprendizaje supervisados consisten en pares de datos de "entrada" y "salida", donde la salida se etiqueta con el valor deseado. Por ejemplo, supongamos que el objetivo es que la máquina diga la diferencia entre las flores de las margaritas y las de los pensamientos. Un par de datos binarios de entrada incluyen tanto una imagen de una margarita como de un pensamiento. El resultado deseado para ese par en particular es escoger la margarita, con lo cual se la identificará previamente como el resultado correcto.

 

Mediante un algoritmo, el sistema compila todos estos datos de entrenamiento a lo largo del tiempo y comienza a determinar similitudes correlativas, diferencias y otros puntos de lógica –hasta que puede anticipar las respuestas para la pregunta "margarita o pensamiento" por sí mismo–. Es el equivalente de dar a un niño un conjunto de problemas con una clave de respuesta, luego pedirles que muestren su trabajo y expliquen su lógica. Los modelos de aprendizaje supervisado se utilizan en muchas de las aplicaciones con las que interactuamos todos los días, como motores de recomendación para productos y aplicaciones de análisis de tráfico como Waze, que prevén la ruta más rápida en diferentes horas del día.

 

¿Qué es el aprendizaje no supervisado?

 

El aprendizaje no supervisado es el segundo de los cuatro modelos de machine learning. En los modelos de aprendizaje no supervisado, no existe una clave de respuesta. La máquina estudia los datos de entrada –muchos de los cuales no están etiquetados ni estructurados– y comienza a identificar patrones y correlaciones, utilizando todos los datos relevantes y accesibles. En muchos sentidos, el aprendizaje no supervisado sigue el modelo de cómo los humanos observan el mundo. Utilizamos la intuición y la experiencia para agrupar cosas. A medida que experimentamos cada vez más ejemplos de algo, nuestra capacidad de categorizarla e identificarla se vuelve cada vez más precisa. Para las máquinas, la "experiencia" se define por la cantidad de datos que se introducen y se ponen a disposición. Ejemplos comunes de aplicaciones de aprendizaje no supervisado incluyen el reconocimiento facial, el análisis de secuencias genéticas, la investigación de mercado y la ciberseguridad.

 

¿Qué es el aprendizaje semisupervisado?

 

El aprendizaje semisupervisado es el tercero de los cuatro modelos de machine learning. En un mundo perfecto, todos los datos se estructurarían y etiquetarían antes de ser introducidos en un sistema. Pero como es obvio que esto no es factible, el aprendizaje semisupervisado se convierte en una solución viable cuando hay grandes cantidades de datos crudos y no estructurados. Este modelo consiste en introducir pequeñas cantidades de datos etiquetados para aumentar los data sets sin etiquetar. Esencialmente, los datos etiquetados actúan para dar un inicio de funcionamiento al sistema y pueden mejorar considerablemente la velocidad y precisión del aprendizaje. Un algoritmo de aprendizaje semisupervisado instruye a la máquina para que analice los datos etiquetados según propiedades correlativas que podrían aplicarse a los datos no etiquetados.

 

Tal como se exploró en profundidad en este documento de investigación del MIT Press existen, sin embargo, riesgos asociados con este modelo, donde los defectos en los datos etiquetados son aprendidos y replicados por el sistema. Las empresas que utilizan con mayor éxito el aprendizaje semisupervisado se aseguran de aplicar los protocolos de mejores prácticas. El aprendizaje semisupervisado se utiliza en el análisis del habla y del lenguaje, las investigaciones médicas complejas como la categorización de proteínas, y la detección de fraude de alto nivel.

 

¿Qué es el aprendizaje por refuerzo?

 

El aprendizaje por refuerzo es el cuarto modelo de machine learning. En el aprendizaje supervisado, la máquina recibe la respuesta de referencia y aprende encontrando correlaciones entre todos los resultados correctos. El modelo de aprendizaje por refuerzo no incluye una respuesta de referencia, sino que más bien introduce un conjunto de acciones permitidas, reglas y estados finales potenciales. Cuando el objetivo deseado del algoritmo es fijo o binario, las máquinas pueden aprender mediante el ejemplo. Pero en los casos en los que el resultado deseado es mutable, el sistema debe aprender por experiencia y recompensa. En los modelos de aprendizaje por refuerzo, la "recompensa" es numérica y se programa dentro del algoritmo como algo que el sistema busca recopilar.

 

En muchos sentidos, este modelo es análogo a enseñarle a alguien a jugar ajedrez. Sin duda, sería imposible intentar mostrarle cada movimiento potencial. En cambio, se le explican las reglas, y la persona aumenta su habilidad a través de la práctica. Las recompensas provienen no solo de ganar el juego, sino también de adquirir las piezas del oponente. Las aplicaciones de aprendizaje por refuerzo incluyen la puja de precios automatizada para los compradores de publicidad on-line, el desarrollo de juegos de computadora, y la negociación bursátil de alto riesgo.

Machine learning empresarial en pocas palabras

Los algoritmos de machine learning reconocen patrones y correlaciones, lo cual significa que son muy buenos a la hora de analizar su propio ROI. Para las empresas que invierten en tecnologías de machine learning, esta función permite realizar una evaluación casi inmediata del impacto operativo. A continuación se incluye una pequeña muestra de algunas de las áreas de crecimiento en aplicaciones de machine learning empresarial.

placeholder

Comience hoy mismo

Vea las tecnologías inteligentes de SAP, incluyendo IA y machine learning en acción

  • Motores de recomendación: del 2009 al 2017, el número de hogares de EE. UU. suscritos a servicios de streaming de video aumentó un 450%. Y un artículo de 2020 de la revista Forbes reporta un nuevo pico en las cifras de uso de streaming de video de hasta el 70%. Los motores de recomendación tienen aplicaciones en muchas plataformas de venta minorista y de compras, pero sin duda están teniendo mucho éxito en servicios de streaming de música y­ video.
  • Marketing dinámico: la generación de leads y su canalización a través del embudo de ventas requiere la capacidad de recopilar y analizar tantos datos del cliente como sea posible. Los consumidores modernos generan una enorme cantidad de datos variados y no estructurados –desde transcripciones de chat hasta carga de imágenes–. El uso de aplicaciones de machine learning ayuda a los profesionales de marketing a comprender estos datos –y usarlos para brindar contenido de marketing personalizado e interacción en tiempo real con clientes y leads–.
  • ERP y automatización de procesos: las bases de datos de ERP contienen data sets amplios y dispares, que pueden incluir estadísticas de rendimiento de ventas, revisiones de consumidores, informes de tendencias del mercado y registros de gestión de la cadena de suministro. Los algoritmos de machine learning pueden ser utilizados para encontrar correlaciones y patrones en dichos datos. Esa información se puede utilizar para informar virtualmente a todas las áreas del negocio, incluyendo optimizar los flujos de trabajo de los dispositivos de internet de las cosas (IoT) que hay dentro de la red, o las mejores formas de automatizar tareas repetitivas o propensas a errores.
  • Mantenimiento predictivo: las cadenas de suministro modernas y las fábricas inteligentes utilizan cada vez más dispositivos y máquinas de IoT, así como conectividad en la nube en todas sus flotas y operaciones. Las fallas e ineficiencias pueden dar lugar a enormes costos y disrupciones. Cuando los datos de mantenimiento y reparación se recopilan manualmente, es casi imposible prever problemas potenciales –menos aun, automatizar procesos para preverlos y prevenirlos–. Los sensores de enlace de IoT pueden ser instalados incluso en máquinas analógicas con décadas de antigüedad, lo cual brinda visibilidad y eficiencia en todo el negocio.

Desafíos del machine learning

En su libro "Spurious Correlations", el científico de datos y graduado de Harvard, Tyler Vigan, señala que "no todas las correlaciones son indicativas de una conexión causal subyacente". Para ilustrar eso, incluye un gráfico que muestra una correlación aparentemente fuerte entre el consumo de margarina y la tasa de divorcio en el estado de Maine de EE. UU. Por supuesto, dicho gráfico pretende ser una alusión humorística. Sin embargo, como reflexión más seria, las aplicaciones de machine learning son vulnerables al sesgo y al error humano y algorítmico. Y debido a su propensión a aprender y adaptarse, los errores y las correlaciones falsas pueden propagarse rápidamente y contaminar los resultados a través de la red neuronal.

 

Un desafío adicional proviene de los modelos de machine learning, donde el algoritmo y su resultado son tan complejos que no pueden ser explicados ni entendidos por los humanos. Esto se llama un modelo de "caja negra" y supone un riesgo para las empresas cuando son incapaces de determinar cómo y por qué un algoritmo llegó a una conclusión o decisión en particular.

 

Afortunadamente, a medida que aumenta la complejidad de los data sets y los algoritmos de machine learning, también lo hacen las herramientas y los recursos disponibles para gestionar el riesgo. Las mejores empresas están trabajando para eliminar errores y sesgos estableciendo directrices de control de IA sólidas y actualizadas y protocolos de mejores prácticas.

placeholder

Sacar el mayor provecho del machine learning

Siga los pasos de los “fast learners” con estas cinco lecciones aprendidas.

Preguntas frecuentes sobre machine learning

El machine learning es un subconjunto de la IA y no puede existir sin ella. La IA utiliza y procesa datos para tomar decisiones y hacer proyecciones: es el cerebro de un sistema informático y es la "inteligencia" exhibida por las máquinas. Los algoritmos de machine learning que hay dentro de la IA, así como otras apps potenciadas por IA, permiten que el sistema no solo procese esos datos, sino que los utilice para ejecutar tareas, hacer proyecciones, aprender y ser más inteligente, sin necesidad de programación adicional. Le brindan a la IA tareas orientadas a objetivos en base a toda esa inteligencia y datos.

Sí, pero debe abordarse como una iniciativa en toda la empresa, no solo como una actualización de TI. Las empresas que tienen los mejores resultados con los proyectos de transformación digital realizan una evaluación inexorable de sus recursos y habilidades existentes y se aseguran de contar con los sistemas fundacionales adecuados antes de comenzar.

En relación con machine learning, la ciencia de datos es un subconjunto; se enfoca en estadísticas y algoritmos, utiliza técnicas de regresión y clasificación, e interpreta y comunica resultados.  El machine learning se enfoca en la programación, automatización, escala, y en incorporar y almacenar los resultados.

El machine learning analiza patrones y correlaciones; aprende de ellos y se optimiza a medida que avanza. La minería de datos se utiliza como una fuente de información para el machine learning. Las técnicas de minería de datos emplean algoritmos complejos y pueden ayudar a brindar data sets mejor organizados para el uso de la aplicación de machine learning.

Las neuronas conectadas con una red neuronal artificial se denominan nodos, que están conectados y agrupados en capas. Cuando un nodo recibe una señal numérica, envía una señal a otras neuronas relevantes, que operan en paralelo. El deep learning utiliza la red neuronal y es "profundo" porque utiliza grandes volúmenes de datos y se relaciona simultáneamente con múltiples capas de la red neuronal. 

El machine learning es la amalgama de varios modelos de aprendizaje, técnicas y tecnologías, que pueden incluir estadísticas. Las estadísticas se enfocan en el uso de datos para realizar proyecciones y crear modelos para el análisis.

SAP Insights Newsletter

placeholder
Suscríbase hoy

Obtenga información estratégica clave suscribiéndose a nuestro newsletter.

Lectura adicional

Volver al inicio