¿Qué es machine learning?

El machine learning es un subconjunto de la inteligencia artificial (IA) donde las computadoras aprenden de los datos y mejoran con la experiencia sin ser programadas explícitamente.

Definición de machine learning en detalle

El machine learning es un subconjunto de la inteligencia artificial (IA). Se enfoca en enseñar a las computadoras para que aprendan de los datos y mejoren con la experiencia –en lugar de ser explícitamente programadas para hacerlo–. En el machine learning, los algoritmos están entrenados para encontrar patrones y correlaciones en grandes data sets, y para lograr las mejores decisiones y proyecciones en base a ese análisis. Las aplicaciones de machine learning mejoran con el uso y se vuelven más precisas a medida que tienen acceso a más datos.

 

Las aplicaciones de machine learning están a nuestro alrededor –en nuestras casas, carritos de compra, medios de entretenimiento, y cuidado de la salud–.

¿Cómo se relaciona machine learning con la IA?

El machine learning y sus componentes de deep learning y redes neuronales, todos encajan como subconjuntos concéntricos de la IA. La IA procesa datos para llegar a decisiones y proyecciones. Los algoritmos de machine learning permiten que la IA no solo procese esos datos, sino que los use para aprender y ser más inteligente, sin necesidad de programación adicional. La inteligencia artificial es la madre de todos los subconjuntos de machine learning subyacentes. Dentro del primer subconjunto está el machine learning; dentro de él está el deep learning, dentro del cual están las redes neuronales.

¿Qué es una red neural?

 

Una red neuronal artificial (ANN) sigue el modelo de un cerebro biológico. Las neuronas artificiales se llaman nodos, y se agrupan en múltiples capas que operan en paralelo. Cuando una neurona artificial recibe una señal numérica, la procesa y envía una señal a las otras que están conectadas a ella. Al igual que en un cerebro humano, el refuerzo neuronal da como resultado mejor reconocimiento de patrones, expertise y aprendizaje general.

 

¿Qué es el deep learning?

 

Este tipo de machine learning se llama así porque incluye muchas capas de redes neuronales y volúmenes masivos de datos complejos y dispares. Para lograr el deep learning, el sistema interactúa con múltiples capas de la red, extrayendo resultados con un nivel cada vez más alto. Por ejemplo, un sistema de deep learning que está procesando imágenes de la naturaleza y buscando "margaritas gloriosa" reconocerá, en la primera capa, una planta. A medida que avance por las capas neuronales, entonces identificará una flor, luego una margarita, y finalmente una "margarita gloriosa". Los ejemplos para aplicar deep learning incluyen reconocimiento de voz, clasificación de imágenes, y análisis farmacéutico.

¿Cómo funciona el machine learning?

El machine learning se compone de diferentes tipos de modelos de aprendizaje automático, y usa varias técnicas algorítmicas. Dependiendo de la naturaleza de los datos y el resultado deseado, se puede usar uno de los cuatro modelos de aprendizaje: supervisado, no supervisado, semisupervisado, o de refuerzo. Dentro de cada uno de esos modelos, se pueden aplicar una o más técnicas algorítmicas –relacionadas con los data sets en uso y los resultados buscados–. Los algoritmos de machine learning están diseñados básicamente para clasificar cosas, encontrar patrones, proyectar resultados, y tomar decisiones fundamentadas. Los algoritmos pueden usarse uno a la vez o combinarse para lograr la mayor precisión posible cuando se trata de datos complejos y más impredecibles.

Cómo funciona el proceso de machine learning

¿Qué es el supervised learning?

 

El supervised learning es el primero de los cuatro modelos de machine learning. En sus algoritmos, a la máquina se la entrena mediante ejemplos. Los modelos de supervised learning consisten en pares de datos de "entrada" y "salida", donde el de salida se etiqueta con el valor deseado. Por ejemplo, supongamos que el objetivo es que la máquina diga la diferencia entre margaritas y pensamientos. Uno de los pares de datos de entrada binarios incluye las imágenes de una margarita y de un pensamiento. El resultado deseado para ese par en particular es escoger la margarita, así que se la identificará previamente como el resultado correcto.

 

Mediante un algoritmo, el sistema compila todos esos datos del entrenamiento a lo largo del tiempo, y comienza a determinar similitudes correlativas, diferencias, y otros puntos de lógica –hasta que puede prever por sí mismo las respuestas a la pregunta "margarita o pensamiento"–. Es el equivalente de darle a un niño un conjunto de problemas con una clave de respuestas, y luego pedirle que muestre su trabajo y explique su lógica. Los modelos de supervised learning se usan en muchas de las herramientas con las que interactuamos todos los días, como los motores de recomendación de productos y las aplicaciones de análisis de tránsito como Waze, que prevén la ruta más rápida en diferentes horarios.

 

¿Qué es el unsupervised learning?

 

El unsupervised learning es el segundo de los cuatro modelos de machine learning. En este, no existe una clave de respuestas. La máquina estudia los datos de entrada –muchos de los cuales no están etiquetados ni estructurados– y comienza a identificar patrones y correlaciones, usando todos los datos relevantes y accesibles. En muchos sentidos, el unsupervised learning sigue el modelo humano de observación del mundo. Usamos la intuición y experiencia para agrupar las cosas juntas. A medida que experimentamos más ejemplos de algo, nuestra capacidad para categorizarlo e identificarlo se vuelve cada vez más precisa. Para las máquinas, la "experiencia" se define por la cantidad de datos que se introducen y ponen a disposición. Ejemplos comunes para aplicar unsupervised learning incluyen reconocimiento facial, análisis de secuencias genéticas, investigación de mercado, y ciberseguridad.

 

¿Qué es el semi-supervised learning?

 

El semi-supervised learning es el tercero de los cuatro modelos de machine learning. En un mundo perfecto, todos los datos se estructurarían y etiquetarían antes de ser ingresados a un sistema. Pero como obviamente esto no es factible, el semi-supervised learning se convierte en una solución viable cuando hay grandes cantidades de datos crudos y no estructurados. Este modelo consiste en ingresar pequeñas cantidades de datos etiquetados para aumentar los data sets no etiquetados. Esencialmente, los primeros actúan para dar un inicio de funcionamiento al sistema, y pueden mejorar considerablemente la velocidad y precisión del aprendizaje. Un algoritmo de semi-supervised learning instruye a la máquina para que analice los datos etiquetados según propiedades correlativas que podrían aplicarse a los no etiquetados.

 

Tal como se exploró en profundidad en este documento de investigación del MIT Press, sin embargo hay riesgos asociados a este modelo, porque los defectos de los datos etiquetados son aprendidos y replicados por el sistema. Las empresas más exitosas en el uso de aprendizaje semisupervisado se aseguran de aplicar protocolos de mejores prácticas. El aprendizaje semisupervisado se usa en análisis de habla y lenguaje, detección de fraudes de alto nivel, e investigaciones médicas complejas tales como la categorización de proteínas.

 

¿Qué es el reinforcement learning?

 

El reinforcement learning es el cuarto modelo de machine learning. En el supervised learning, la máquina recibe la respuesta de referencia y aprende encontrando correlaciones entre todos los resultados correctos. El modelo de reinforcement learning no incluye una respuesta de referencia, sino que más bien ingresa un conjunto de acciones permitidas, reglas, y potenciales estados finales. Cuando el objetivo deseado del algoritmo es fijo o binario, las máquinas pueden aprender mediante el ejemplo. Pero en los casos donde el resultado deseado es mutable, el sistema debe aprender por experiencia y recompensa. En los modelos de reinforcement learning, la "recompensa" es numérica, y se programa dentro del algoritmo como algo que el sistema busca recopilar.

 

En muchos sentidos, este modelo es análogo a enseñarle a alguien a jugar al ajedrez. Sin duda, sería imposible intentar mostrarle cada movimiento potencial. En cambio, usted explica las reglas y la persona aumenta su habilidad a través de la práctica. Las recompensas provienen no solo de ganar el juego, sino también de adquirir las piezas del oponente. Los ejemplos para aplicar el reinforcement learning incluyen la puja de precios automatizada para compradores de publicidad on-line, el desarrollo de juegos de computadora, y la negociación bursátil de alto riesgo.

Machine learning empresarial en acción

Los algoritmos de machine learning reconocen patrones y correlaciones, lo cual significa que son muy buenos a la hora de analizar su propio ROI. A las empresas que invierten en tecnologías de machine learning, esta función les permite realizar una evaluación casi inmediata del impacto operativo. Abajo hay una pequeña muestra de algunas de las áreas en crecimiento para aplicar machine learning empresarial.

  • Motores de recomendación: entre el 2009 y el 2017, el número de hogares de EE. UU. suscritos a servicios de streaming de video aumentó un 450%. Y un artículo de 2020 de la revista Forbes reporta un nuevo pico de hasta el 70% en las cifras de uso de streaming de video. Los motores de recomendación se aplican en muchas plataformas de venta minorista y de compras, pero sin duda están teniendo mucho éxito en los servicios de streaming de música y­ video.

  • Marketing dinámico: la generación de leads y su canalización a través del embudo de ventas requiere la capacidad de recopilar y analizar tantos datos del cliente como sea posible. Los consumidores modernos generan una enorme cantidad de datos variados y no estructurados –desde transcripciones de chat hasta carga de imágenes–. El uso de aplicaciones de machine learning ayuda a los profesionales de marketing a comprender estos datos –y usarlos para brindar contenido personalizado e interacción en tiempo real con clientes y leads–.

  • ERP y automatización de procesos: las bases de datos de ERP contienen data sets amplios y dispares, que pueden incluir estadísticas de rendimiento de ventas, reseñas de consumidores, informes sobre tendencias del mercado, y registros de gestión de la cadena de suministro. Los algoritmos de machine learning pueden ser usados para encontrar correlaciones y patrones en dichos datos. Esa información se puede aprovechar para fundamentar prácticamente todas las actividades del negocio, incluyendo optimizar los flujos de trabajo de los dispositivos de internet de las cosas (IoT) que hay dentro de la red, o recurrir a las mejores formas de automatizar tareas repetitivas o propensas a errores.

  • Mantenimiento predictivo: las cadenas de suministro modernas y las fábricas inteligentes usan cada vez más dispositivos y máquinas de IoT, así como conectividad en la nube entre todas sus flotas y operaciones. Las fallas e ineficiencias pueden dar lugar a enormes costos y disrupciones. Cuando los datos de mantenimiento y reparación se recopilan manualmente, es casi imposible prever los problemas potenciales –menos aún, automatizar procesos para preverlos y prevenirlos–. Los sensores de enlace de IoT pueden ser instalados incluso en máquinas analógicas con décadas de antigüedad, brindando visibilidad y eficiencia en todo el negocio.

Desafíos del machine learning

En su libro "Spurious Correlations", el científico de datos y graduado de Harvard, Tyler Vigan, señala que "no todas las correlaciones son indicativas de una conexión causal subyacente". Para ilustrar eso, incluye un gráfico que muestra una correlación aparentemente fuerte entre el consumo de margarina y la tasa de divorcios en el estado de Maine, EE. UU. Por supuesto, dicho gráfico pretende hacer una alusión humorística. Sin embargo, como reflexión más seria, las aplicaciones de machine learning son vulnerables al sesgo y al error tanto humanos como algorítmicos. Y debido a su propensión a aprender y adaptarse, los errores y correlaciones falsas pueden propagarse rápido y contaminar los resultados en toda la red neuronal.

 

Un desafío adicional proviene de los modelos de machine learning donde el algoritmo y su resultado son tan complejos que no pueden ser explicados ni entendidos por los humanos. Esto modelo se llama "caja negra" y pone en riesgo a las empresas cuando se encuentran incapaces de determinar cómo y por qué un algoritmo llegó a una conclusión o decisión en particular.

 

Afortunadamente, a medida que aumenta la complejidad de los data sets y los algoritmos de machine learning, también lo hacen las herramientas y recursos disponibles para gestionar el riesgo. Las mejores empresas están trabajando para eliminar errores y sesgos estableciendo directrices de control de IA sólidas y actualizadas, y protocolos de mejores prácticas.

Preguntas frecuentes sobre machine learning

El machine learning es un subconjunto de la IA y no puede existir sin ella. La IA usa y procesa datos para llegar a decisiones y proyecciones: es el cerebro de un sistema basado en computadoras, y es la "inteligencia" exhibida por las máquinas. Los algoritmos de machine learning que hay dentro de la IA, así como otras apps potenciadas por IA, permiten que el sistema no solo procese esos datos, sino que los use para ejecutar tareas, hacer proyecciones, aprender, y ser más inteligente, sin necesidad de programación adicional. Ellos le brindan a la IA tareas orientadas a objetivos en base a toda esa inteligencia y esos datos.

Sí, pero debe abordarse como una iniciativa en toda la empresa, no solo como una actualización de TI. Las empresas que tienen los mejores resultados con los proyectos de transformación digital realizan una estricta evaluación de sus recursos y habilidades existentes, y se aseguran de tener los sistemas fundamentales correctos antes de comenzar.

En relación con el machine learning, la ciencia de datos es un subconjunto; se enfoca en estadísticas y algoritmos, usa técnicas de regresión y clasificación, e interpreta y comunica resultados. El machine learning se enfoca en la programación, automatización, escala, y en la incorporación y almacenamiento de resultados.

El machine learning analiza patrones y correlaciones; aprende de ellos y se optimiza a medida que avanza. La minería de datos se usa como fuente de información para machine learning. Las técnicas de minería de datos emplean algoritmos complejos,y pueden ayudar a brindar data sets mejor organizados para que los use la aplicación de machine learning.

Las neuronas conectadas con una red neuronal artificial se llaman "nodos", los cuales están conectados y agrupados en capas. Cuando un nodo recibe una señal numérica, les avisa a otras neuronas relevantes que operan en paralelo. El deep learning usa la red neuronal, y es profundo porque usa grandes volúmenes de datos y se relaciona simultáneamente con múltiples capas de la red neuronal.

El machine learning es la amalgama de varios modelos de aprendizaje, técnicas y tecnologías, que pueden incluir estadísticas. Las estadísticas se centran en el uso de datos para realizar proyecciones y crear modelos para análisis.

twitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixel