¿Qué es el aprendizaje supervisado?
El aprendizaje supervisado es el primero de los cuatro modelos de machine learning. En los algoritmos de aprendizaje supervisado, a la máquina se le enseña mediante ejemplos. Los modelos de aprendizaje supervisados consisten en pares de datos de "entrada" y "salida", donde la salida se etiqueta con el valor deseado. Por ejemplo, supongamos que el objetivo es que la máquina diga la diferencia entre las flores de las margaritas y las de los pensamientos. Un par de datos binarios de entrada incluyen tanto una imagen de una margarita como de un pensamiento. El resultado deseado para ese par en particular es escoger la margarita, con lo cual se la identificará previamente como el resultado correcto.
Mediante un algoritmo, el sistema compila todos estos datos de entrenamiento a lo largo del tiempo y comienza a determinar similitudes correlativas, diferencias y otros puntos de lógica –hasta que puede anticipar las respuestas para la pregunta "margarita o pensamiento" por sí mismo–. Es el equivalente de dar a un niño un conjunto de problemas con una clave de respuesta, luego pedirles que muestren su trabajo y expliquen su lógica. Los modelos de aprendizaje supervisado se utilizan en muchas de las aplicaciones con las que interactuamos todos los días, como motores de recomendación para productos y aplicaciones de análisis de tráfico como Waze, que prevén la ruta más rápida en diferentes horas del día.
¿Qué es el aprendizaje no supervisado?
El aprendizaje no supervisado es el segundo de los cuatro modelos de machine learning. En los modelos de aprendizaje no supervisado, no existe una clave de respuesta. La máquina estudia los datos de entrada –muchos de los cuales no están etiquetados ni estructurados– y comienza a identificar patrones y correlaciones, utilizando todos los datos relevantes y accesibles. En muchos sentidos, el aprendizaje no supervisado sigue el modelo de cómo los humanos observan el mundo. Utilizamos la intuición y la experiencia para agrupar cosas. A medida que experimentamos cada vez más ejemplos de algo, nuestra capacidad de categorizarla e identificarla se vuelve cada vez más precisa. Para las máquinas, la "experiencia" se define por la cantidad de datos que se introducen y se ponen a disposición. Ejemplos comunes de aplicaciones de aprendizaje no supervisado incluyen el reconocimiento facial, el análisis de secuencias genéticas, la investigación de mercado y la ciberseguridad.
¿Qué es el aprendizaje semisupervisado?
El aprendizaje semisupervisado es el tercero de los cuatro modelos de machine learning. En un mundo perfecto, todos los datos se estructurarían y etiquetarían antes de ser introducidos en un sistema. Pero como es obvio que esto no es factible, el aprendizaje semisupervisado se convierte en una solución viable cuando hay grandes cantidades de datos crudos y no estructurados. Este modelo consiste en introducir pequeñas cantidades de datos etiquetados para aumentar los data sets sin etiquetar. Esencialmente, los datos etiquetados actúan para dar un inicio de funcionamiento al sistema y pueden mejorar considerablemente la velocidad y precisión del aprendizaje. Un algoritmo de aprendizaje semisupervisado instruye a la máquina para que analice los datos etiquetados según propiedades correlativas que podrían aplicarse a los datos no etiquetados.
Tal como se exploró en profundidad en este documento de investigación del MIT Press existen, sin embargo, riesgos asociados con este modelo, donde los defectos en los datos etiquetados son aprendidos y replicados por el sistema. Las empresas que utilizan con mayor éxito el aprendizaje semisupervisado se aseguran de aplicar los protocolos de mejores prácticas. El aprendizaje semisupervisado se utiliza en el análisis del habla y del lenguaje, las investigaciones médicas complejas como la categorización de proteínas, y la detección de fraude de alto nivel.
¿Qué es el aprendizaje por refuerzo?
El aprendizaje por refuerzo es el cuarto modelo de machine learning. En el aprendizaje supervisado, la máquina recibe la respuesta de referencia y aprende encontrando correlaciones entre todos los resultados correctos. El modelo de aprendizaje por refuerzo no incluye una respuesta de referencia, sino que más bien introduce un conjunto de acciones permitidas, reglas y estados finales potenciales. Cuando el objetivo deseado del algoritmo es fijo o binario, las máquinas pueden aprender mediante el ejemplo. Pero en los casos en los que el resultado deseado es mutable, el sistema debe aprender por experiencia y recompensa. En los modelos de aprendizaje por refuerzo, la "recompensa" es numérica y se programa dentro del algoritmo como algo que el sistema busca recopilar.
En muchos sentidos, este modelo es análogo a enseñarle a alguien a jugar ajedrez. Sin duda, sería imposible intentar mostrarle cada movimiento potencial. En cambio, se le explican las reglas, y la persona aumenta su habilidad a través de la práctica. Las recompensas provienen no solo de ganar el juego, sino también de adquirir las piezas del oponente. Las aplicaciones de aprendizaje por refuerzo incluyen la puja de precios automatizada para los compradores de publicidad on-line, el desarrollo de juegos de computadora, y la negociación bursátil de alto riesgo.