flex-height

text-black

Imagen de una investigadora sentada, con una bata de laboratorio blanca, trabajando en un escritorio con varios monitores de computadora, junto a un pequeño robot.

¿Qué es el deep learning?

El deep learning es un subconjunto de la inteligencia artificial (IA) que imita las redes neuronales de un cerebro para aprender de grandes cantidades de datos, lo cual permite a las máquinas resolver problemas complejos.

default

{}

default

{}

primary

default

{}

secondary

Definición de deep learning

El deep learning es un tipo de machine learning que permite a las computadoras procesar información de maneras similares al cerebro humano. Se llama "deep" (profundo) porque implica múltiples capas de redes neuronales que ayudan al sistema a comprender e interpretar los datos. Esta técnica permite a las computadoras reconocer patrones y gestionar tareas complejas, tales como traducir idiomas y conducir automóviles de forma autónoma. De forma similar a cómo los humanos aprenden de la experiencia, estos sistemas mejoran sus habilidades y precisión a lo largo del tiempo analizando grandes cantidades de datos, sin necesidad de actualizaciones manuales por parte de los humanos.

Comprender las redes neuronales

De la teoría al Perceptron

En la década de 1940, Warren McCulloch, un neurocientífico, y Walter Pitts, un matemático, colaboraron para crear el primer concepto de red neuronal artificial. Su objetivo era entender cómo el cerebro podía producir complejos patrones de pensamiento a partir de las respuestas binarias simples de las neuronas. Introdujeron un modelo de la neurona, que creían que podría imitar la capacidad del cerebro para realizar cálculos complejos utilizando lógica binaria.

En el modelo de red neuronal desarrollado por McCulloch y Pitts, las entradas actúan como los impulsos eléctricos que recibe una neurona. Si algunas entradas son más cruciales para un resultado específico, el modelo las enfatiza dándoles mayor peso. Cuando estas entradas ponderadas exceden un cierto nivel, la neurona se activa; si no, permanece apagada. Este mecanismo básico de activación permitió a su modelo imitar procesos simples de toma de decisiones cerebrales, sentando las bases para la evolución del deep learning.

En 1957, la introducción del Mark I Perceptron, una máquina del tamaño de una habitación construida por el científico informático y psicólogo Frank Rosenblatt, mostró el primer uso práctico de las neuronas artificiales. Este dispositivo usaba fotocélulas y redes neuronales artificiales para reconocer y categorizar imágenes, demostrando la eficacia de las ideas de McCulloch y Pitts. El Perceptron de Rosenblatt no solo confirmó que el machine learning podría funcionar, sino que también allanó el camino para el desarrollo de las tecnologías de deep learning más sofisticadas de hoy en día.

¿Cómo funciona el deep learning?

El deep learning funciona usando el proceso de previsión para determinar qué algoritmos en sus redes neuronales son los más exitosos en producir resultados que cumplan con las expectativas humanas. Luego, las redes utilizan la retropropagación para refinar esos algoritmos, de modo que su tasa de éxito mejore. Aquí tiene un ejemplo:

Imagine que está enseñando a una computadora a reconocer diferentes géneros musicales. La red neuronal analiza miles de archivos de música, aprendiendo gradualmente a notar características como instrumentación, ritmos y progresiones de acordes. Cuando hace una previsión, como identificar una pieza como una canción de rock, y luego se le dice si es correcta, utiliza un método llamado retropropagación para ajustar su algoritmo.

Esto es como aprender de los errores. Por ejemplo, si la computadora confunde una sonata de piano clásica con una canción de rock, aprende de ese error, refinando su capacidad para distinguir entre las canciones clásicas y el rock en futuras proyecciones. Con el tiempo, este proceso permite a la red neuronal artificial hacer previsiones muy precisas, convirtiéndola en una poderosa herramienta para todo, desde recomendar películas según sus gustos hasta permitir que los vehículos autónomos interpreten señales e indicaciones de carretera.

Ahondar en las capas de red neuronal profundas

Esta lista explica los componentes esenciales de una red neuronal profunda y el orden general en el que funcionan. Sin embargo, las neuronas, funciones de activación y técnicas de regularización no son pasos aislados, sino características que operan a lo largo de la red y de su proceso de aprendizaje.

Capa de entrada

La capa de entrada es la puerta de enlace a la red, donde cada neurona representa una característica específica de los datos de entrada. La función principal de esta capa es recibir los datos brutos y pasarlos a las capas subsiguientes para su procesamiento posterior.

Neuronas (nodos)

Las neuronas, o nodos, son las unidades de procesamiento fundamentales de una red neuronal. Cada neurona recibe entradas, las procesa (usando una suma ponderada y luego aplicando una función de activación), y envía el resultado a la siguiente capa.

Funciones de activación

Estas son como los responsables de la toma de decisiones en una red neuronal, que ayudan a determinar qué aprender o ignorar. Añaden cierta flexibilidad a la red, lo cual le permite capturar patrones complejos y aprender de ellos. Las funciones de activación comunes incluyen sigmoide, ReLU (unidad lineal rectificada) y tanh.

Ponderaciones y sesgos

Las ponderaciones son parámetros dentro de la red que determinan la influencia de los datos de entrada en los resultados dentro de las capas de la red. Junto con las ponderaciones, los sesgos aseguran que las funciones de activación puedan producir resultados distintos de cero, mejorando la capacidad de la red para activarse y aprender eficazmente.

Capas ocultas

Situadas entre las capas de entrada y las de resultado, las capas ocultas realizan la mayor parte de los cálculos dentro de una red neuronal. Se llaman "ocultas" porque, a diferencia de las entrada y las de resultado, no interactúan con el entorno externo. La complejidad y capacidad de una red neuronal están determinadas en gran medida por el número y arquitectura de las capas ocultas.

Capa de resultado

Esta es la capa final en una red neuronal. Presenta los resultados, transformando la información de las capas ocultas en un formato que resuelve la tarea en cuestión, como la clasificación, regresión o cualquier otro tipo de previsión.

Función de pérdida

La función de pérdida, o función de costo, cuantifica la diferencia entre los resultados previstos y los reales. Minimizar esta función es el objetivo del entrenamiento, lo cual permite al modelo prever con mayor precisión.

Algoritmos de optimización

Estos algoritmos realizan ajustes al modelo para mejorar su precisión a lo largo del tiempo. Ajustan las ponderaciones y sesgos para reducir los errores cuando realiza las previsiones. Algunos métodos populares incluyen el descenso de gradiente estocástico, Adam y RMSprop.

Retropropagación

Este algoritmo de deep learning es crucial porque ayuda al modelo a mejorar y aprender de sus errores. Descifra cómo los cambios en las ponderaciones del modelo afectan a su precisión. Luego, realiza ajustes a esas configuraciones rastreando los errores hacia atrás a lo largo del modelo para mejorar en sus previsiones.

Técnicas de regularización

Los modelos suelen aprender los datos de entrenamiento de manera demasiado directa, lo cual hace que no se desempeñen tan bien con datos nuevos (conocido como overfitting). Para compensar esto, se utilizan técnicas como la regularización L1 y L2 y la normalización por lotes para ajustar el tamaño de las ponderaciones y acelerar el proceso de entrenamiento.

Normalización de lotes

Esta técnica normaliza las entradas de cada capa, con el objetivo de mejorar la estabilidad, rendimiento y velocidad de la red neuronal. También ayuda a reducir la sensibilidad a las ponderaciones iniciales.

Dropout

Otro método de regularización, el dropout, ignora aleatoriamente un conjunto de neuronas durante el entrenamiento. Esto ayuda a reducir el sobreajuste evitando que la red se vuelva demasiado dependiente de cualquier neurona individual.

Aplicaciones comunes de deep learning

El deep machine learning ha recorrido un largo camino desde el Perceptron. En lugar de tener que instalar máquinas del tamaño de una habitación, las organizaciones ahora pueden crear soluciones de deep learning en la nube. La capacidad de las redes neuronales profundas de hoy en día para manejar data sets complejos las convierten en herramientas valiosas en diversos sectores, pues abren nuevas vías para la innovación que antes se consideraban futuristas.

Sector automotriz

El deep learning permite a los vehículos interpretar los datos de sensores para la navegación. También mejora los sistemas de asistencia al conductor, con características como la detección de peligros y prevención de colisiones, y contribuye a un mejor diseño y fabricación del vehículo.

Operaciones de negocio

Los chatbots de IA conversacional y los copilotos asistentes virtuales son aplicaciones de deep learning de negocios populares. Reducen el error humano automatizando las tareas manuales, aceleran el análisis de datos y la toma de decisiones, y facilitan la búsqueda de información almacenada en diferentes sistemas.

Finanzas

El comercio algorítmico impulsado por el deep learning se utiliza para analizar datos de mercado para obtener información predictiva e identifica patrones complejos, a fin de mejorar la detección de fraudes. El deep learning también ayuda en la gestión de riesgos, evaluación del riesgo crediticio y condiciones de mercado para lograr una toma de decisiones más fundamentada.

Descubra más sobre la tecnología de IA en finanzas

Cuidado de la salud

Los algoritmos de deep learning pueden ayudar a mejorar la precisión de los diagnósticos y detectar anomalías, tales como tumores, en una etapa temprana a partir de imágenes médicas. También hay oportunidades para el descubrimiento de fármacos mediante la previsión del comportamiento molecular, lo cual facilita el desarrollo de nuevos tratamientos.

Fabricación

El mantenimiento predictivo utiliza Internet de las cosas y deep learning para anticiparse a las fallas de la maquinaria, minimizando el tiempo de inactividad. Los sistemas de inspección visual entrenados sobre la base de extensos data sets de imágenes pueden mejorar el control de calidad mediante la identificación de defectos.

Descubra más sobre la tecnología de IA en fabricación

Medios de comunicación y entretenimiento

La industria del entretenimiento utiliza aplicaciones de deep learning para potenciar las recomendaciones de contenido en plataformas de streaming y ayudar a los creadores a desarrollar CGI realista y componer música utilizando IA generativa. También analiza las preferencias del espectador, lo cual ayuda a los creadores a adaptar el contenido y prever tendencias futuras.

Comercio minorista

El deep learning ha revolucionado las experiencias de cliente minorista con recomendaciones de productos personalizadas. También mejora la gestión del inventario utilizando analíticas predictivas para pronosticar la demanda y optimizar los niveles de stock.

Descubra más sobre la tecnología de IA en el comercio minorista

Cadena de suministro

Las operaciones de logística utilizan deep machine learning para optimizar la programación de entregas identificando disrupciones de tránsito en tiempo real. El deep learning también mejora la precisión de las proyecciones de oferta y demanda, lo cual permite realizar ajustes proactivos en la estrategia.

Beneficios y desafíos del deep learning

Si bien los beneficios del deep learning son realmente impresionantes, la complejidad de esta tecnología también conlleva desafíos. Y dado que las soluciones de deep learning requieren planificación y recursos considerables, es fundamental que las organizaciones establezcan objetivos claramente definidos y prácticas de IA responsables antes de diseñar e implementar esta tecnología.

Beneficios

Desafíos

Alta precisión en tareas tales como reconocimiento de imágenes y voz
Capacidad para procesar y analizar grandes cantidades de datos
Mejora con el tiempo a medida que se expone a más datos
Automatiza la extracción de características, reduciendo la necesidad de intervención manual
Habilita experiencias personalizadas en servicios y productos

Requiere grandes data sets para entrenamiento
Es computacionalmente intensivo, necesita un significativo poder de procesamiento
Puede ser una "caja negra", haciendo difícil comprender los procesos de decisión de los modelos
Es proclive a perpetuar sesgos injustos cuando los datos de entrenamiento son defectuosos
Necesita datos y monitoreo continuos para mantener el rendimiento a lo largo del tiempo

Deep learning vs. machine learning vs. IA

Existen algunas diferencias clave entre el machine learning tradicional y el deep learning:

El machine learning depende de los humanos para identificar y seleccionar manualmente las funciones o características de los datos que son importantes para una tarea, tales como bordes en imágenes o palabras específicas en el texto. Este proceso de entrenamiento requiere mucho expertise y esfuerzo.

El deep learning permite a las máquinas determinar automáticamente qué características de los datos son más importantes para realizar tareas específicas. Esto se realiza procesando los datos en bruto, tales como píxeles en una imagen, a través de múltiples capas de una red neuronal. Cada capa transforma los datos en una forma más abstracta, basándose en el resultado de la capa anterior. A medida que el modelo se expone a más datos, refina continuamente estas transformaciones para mejorar la precisión y el rendimiento, volviéndose más efectivo con el tiempo.

Ejemplo de IA vs. deep learning vs. machine learning

Si tiene dudas sobre las diferencias entre IA, machine learning y deep learning, no es una excepción. Este es un ejemplo del mundo real de IA contrastado con deep learning y machine learning en relación con vehículos autónomos:

La IA es la tecnología global que se utiliza para ofrecer a los vehículos autónomos inteligencia y autonomía casi humanas. Eso incluye machine learning y deep learning.

El machine learning es el subtipo de IA que permite que los sistemas de conducción autónoma aprendan y mejoren a partir de los datos sin ser programados específicamente para cada escenario.

El deep learning es el subtipo especializado de machine learning que procesa e interpreta las entradas complejas, incluidos los datos visuales de las cámaras, dando sentido al entorno en tiempo real.

Deep learning vs. modelos de deep learning

Tampoco es raro ver los términos “deep learning” y “modelos de deep learning” utilizados de manera indistinta, pero hay una diferencia matizada entre ellos:

El deep learning se refiere a todo el campo de estudio. Abarca las teorías, técnicas, algoritmos y procesos utilizados para entrenar redes neuronales artificiales.

Los modelos de deep learning se refieren a las redes neuronales específicas que han sido diseñadas y entrenadas para resolver un problema en particular o realizar una tarea específica. Cada modelo es único, adaptado a sus datos específicos, entrenamiento y tarea. El rendimiento de un modelo depende de:

Cuán bien se ha entrenado, esto incluye la calidad y cantidad de los datos, y su tasa de aprendizaje.
El diseño y potencia computacional de la infraestructura informática en la que se ejecuta.

¿Qué son las redes neuronales profundas?

Las redes de deep learning, a menudo llamadas redes neuronales profundas, aprenden patrones complejos en grandes data sets realizando ajustes a las conexiones neuronales a través del entrenamiento. Existen varios tipos principales de redes neuronales: artificiales, convolucionales, recurrentes, generativas y los autocodificadores.

Tipos de redes neuronales profundas

Característica/Tipo

Red neuronal artificial

Red neuronal convolucional

Red neuronal recurrente

Red neuronal generativa

Autocodificadores

Uso principal

Propósito general, desde regresión hasta clasificación.

Reconocimiento de imagen y video, clasificación de imágenes.

Procesamiento de lenguaje natural, reconocimiento de voz.

Generación de imágenes, transferencia de estilo, aumento de datos.

Reducción de dimensionalidad, reducción de ruido, aprendizaje de características y detección de anomalías.

Características clave

Simplicidad y versatilidad.

Uso de capas convolucionales para aprender de manera adaptativa las jerarquías espaciales de las características.

Capacidad para procesar la información en secuencias, preservándola al ir de un paso al siguiente.

Capacidad para generar nuevos datos similares a los ingresados.

Utilizan un codificador para comprimir datos y un decodificador para reconstruirlos, aprendiendo representaciones de datos eficientes.

Concepto básico

Una red de neuronas/nodos que simulan el cerebro humano.

Especializada para procesar datos de topología en forma de cuadrícula.

Diseñada para datos secuenciales o de series temporales.

Consiste de dos redes (generadora y discriminadora) que compiten en un juego.

Diseñados para el aprendizaje no supervisado, típicamente compresión de datos y extracción de características.

Ventajas

Flexible. Se puede aplicar a un amplio espectro de tareas.

Alta eficiencia y rendimiento en tareas relacionadas con datos visuales.

Capaz de aprender dependencias a largo plazo con modificaciones como memoria a corto-largo plazo.

Potente para generar nuevas instancias de datos; mejora su realismo y diversidad.

Eficientes en la compresión de datos y aprendizaje de características relevantes sin etiquetas; útiles en preentrenamiento para otras tareas.

Desafíos

Puede tener dificultades con el reconocimiento de patrones complejos en datos brutos y de alta dimensión.

Requiere una cantidad significativa de datos de entrenamiento para lograr un rendimiento óptimo.

Dificultad en el entrenamiento durante secuencias largas debido al problema del gradiente evanescente.

La estabilidad del entrenamiento y el colapso del modo pueden ser difíciles de manejar.

Propensos a sobreadaptarse si no se regularizan o si los datos no son lo suficientemente diversos; puede ser complicado ajustar el espacio latente.

Características arquitectónicas

Capas de neuronas completamente conectadas.

Capas convolucionales, capas de agrupamiento, seguidas de capas completamente conectadas.

Cadenas de unidades repetitivas que procesan secuencias.

Dos redes: una generadora para crear datos, y una discriminadora para evaluarlos.

Utilizan un codificador y decodificador para reducir y luego reconstruir los datos ingresados.

Manejo de datos

Maneja una amplia gama de tipos de datos.

Maneja eficientemente los datos espaciales.

Se destaca en el manejo de datos secuenciales o dependientes del tiempo.

Aprende a generar datos que son indistinguibles de los datos reales.

Eficientes en aprender representaciones comprimidas para un data set dado.

Requisitos de infraestructura para deep learning

El deep learning requiere infraestructura de computación y de red especializada para procesar sus modelos complejos y data sets masivos. No resulta práctico ejecutar modelos de deep learning en hardware o redes informáticas generales, por lo cual muchas organizaciones adoptan plataformas de IA empresarial para satisfacer los requisitos necesarios. Estas son las principales consideraciones de infraestructura:

GPU de alto rendimiento

La columna vertebral de la infraestructura de deep learning son las unidades de procesamiento de gráficos de alto rendimiento (GPU). Originalmente diseñadas para renderizar gráficos en videojuegos, las GPU tienen capacidades de procesamiento que las hacen muy adecuadas para el deep learning. Su capacidad para realizar múltiples cálculos simultáneamente reduce en gran medida el tiempo de entrenamiento para los modelos, haciéndolas indispensables para la investigación y las aplicaciones modernas de IA.

Soluciones de almacenamiento escalables

Cuantos más sean los datos de los que pueda aprender un modelo, mejor será su rendimiento. Esto crea la necesidad de soluciones de almacenamiento escalables y rápidas que puedan manejar petabytes de datos sin crear cuellos de botella en su recuperación. Las unidades de estado sólido y los sistemas de archivos distribuidos se utilizan comúnmente para satisfacer estas demandas, ofreciendo acceso a datos de alta velocidad que mantiene el ritmo de la velocidad computacional de las GPU.

Marcos de procesamiento de datos eficientes

Marcos y bibliotecas tales como TensorFlow, PyTorch y Keras simplifican el desarrollo de modelos de deep learning brindando funciones preconfiguradas, reduciendo la necesidad de codificación desde cero. Estas herramientas no solo aceleran el proceso de desarrollo, sino que también optimizan la eficiencia computacional del entrenamiento e inferencia, permitiendo una utilización efectiva del hardware subyacente.

Plataformas de computación en la nube

Las plataformas de computación en la nube desempeñan un rol fundamental a la hora de hacer que el deep learning sea ampliamente accesible. Brindan acceso a recursos informáticos de alto rendimiento on-demand, eliminando la necesidad de una inversión inicial significativa en hardware físico. Estas plataformas ofrecen diversos servicios, incluidas instancias de GPU, almacenamiento escalable y marcos de machine learning, lo cual facilita a las personas y organizaciones la creación e implementación de modelos de deep learning.

Infraestructura de red

Los modelos de deep learning a menudo se entrenan a través de múltiples GPU e incluso en diferentes ubicaciones geográficas, por lo cual una infraestructura de red robusta es crucial. La conectividad de alto ancho de banda garantiza que los datos y parámetros del modelo se puedan transferir eficientemente entre nodos en una configuración de entrenamiento distribuida, minimizando así los retrasos y optimizando el proceso de entrenamiento.

Preguntas frecuentes

¿Qué es el deep learning en palabras sencillas?

El deep learning, a veces también llamado machine learning profundo, es un tipo de inteligencia artificial que enseña a las computadoras a aprender mediante el ejemplo, al igual que los humanos. Utiliza una estructura en capas de algoritmos llamados redes neuronales para procesar datos, reconocer patrones y tomar decisiones.

¿Cuál es un ejemplo de deep learning?

Un ejemplo notable de deep learning es el de las imágenes médicas, donde los algoritmos analizan imágenes como rayos X, IRM o tomografías computarizadas para detectar enfermedades tales como el cáncer. Mediante el entrenamiento basado en vastos data sets de imágenes médicas, estos sistemas de deep learning pueden identificar patrones sutiles que podrían ser pasados por alto por los ojos humanos, ayudando así a los médicos en el diagnóstico temprano y planificación personalizada del tratamiento.

¿Cuáles son los tres tipos de deep learning?

Redes neuronales convolucionales: un ejemplo conocido es la función de desbloqueo facial en los teléfonos inteligentes. Las redes neuronales convolucionales analizan las características faciales de la entrada de la cámara para verificar la identidad del usuario, permitiendo un acceso seguro y rápido al dispositivo. Este proceso implica que la red aprenda de distintas imágenes para reconocer y confirmar con precisión la cara del usuario.
Redes neuronales recurrentes: son ideales para tareas que involucran secuencias, tales como prever la siguiente palabra en una oración. Esto las hace excelentes para aplicaciones como el texto predictivo en su smartphone, donde la red aprende de la secuencia de su escritura para sugerir la siguiente palabra que pueda querer escribir.
Autocodificadores: un ejemplo práctico es la compresión de imágenes, donde los autocodificadores reducen el tamaño estas para su almacenamiento o transmisión y luego las restauran a su calidad original cuando es necesario. Este proceso ayuda a reducir el espacio requerido para almacenar imágenes, manteniendo su calidad.

¿Cuál es la diferencia entre machine learning y deep learning?

Machine learning se refiere al concepto más amplio de computadoras que aprenden a partir de datos para tomar decisiones o realizar previsiones. El deep learning es un subconjunto de machine learning que utiliza redes neuronales con muchas, o "profundas", capas. La principal diferencia es la profundidad del aprendizaje; el deep learning descubre automáticamente los datos más relevantes que se utilizarán para el aprendizaje, mientras que el machine learning requiere que los datos se especifiquen manualmente. Además, el deep learning funciona mejor con data sets más grandes, mientras que el machine learning tradicional puede ser más efectivo con data sets más pequeños.

/content/sapcom/countries/es_co/fragments/insights/article-details

location

sidebar

/content/sapcom/countries/es_co/fragments/insights/article-read-more

location

document-footer

¿Qué es el deep learning?

Definición de deep learning

Comprender las redes neuronales

De la teoría al Perceptron

¿Cómo funciona el deep learning?

Ahondar en las capas de red neuronal profundas

Aplicaciones comunes de deep learning

Sector automotriz

Operaciones de negocio

Finanzas

Cuidado de la salud

Fabricación

Medios de comunicación y entretenimiento

Comercio minorista

Cadena de suministro

Beneficios y desafíos del deep learning

Deep learning vs. machine learning vs. IA

Ejemplo de IA vs. deep learning vs. machine learning

Deep learning vs. modelos de deep learning

¿Qué son las redes neuronales profundas?

Tipos de redes neuronales profundas

Requisitos de infraestructura para deep learning

GPU de alto rendimiento

Soluciones de almacenamiento escalables

Marcos de procesamiento de datos eficientes

Plataformas de computación en la nube

Infraestructura de red

Explore la IA creada para los negocios

Preguntas frecuentes

Explore la IA creada para los negocios