flex-height
text-black

Uma pesquisadora sentada, vestindo um jaleco branco, trabalha em uma mesa com vários monitores de computador, com um pequeno robô ao seu lado.

O que é deep learning?

O deep learning é um subconjunto de inteligência artificial que imita as redes neurais do cérebro para aprender com grandes volumes de dados, permitindo que as máquinas resolvam problemas complexos.

default

{}

default

{}

primary

default

{}

secondary

Definição de deep learning

Deep learning é um tipo de Machine Learning que possibilita que os computadores processem informações de maneira semelhante ao cérebro humano. É chamado de "deep" porque envolve várias camadas de redes neurais que ajudam o sistema a entender e interpretar dados. Esta técnica permite que os computadores reconheçam padrões e gerenciem tarefas complexas, como traduzir idiomas e dirigir carros de forma autônoma. Semelhante ao modo como os humanos aprendem com a experiência, esses sistemas melhoram suas próprias habilidades e precisão ao longo do tempo, analisando grandes quantidades de dados, sem precisar de atualizações manuais de humanos.

Entenda as redes neurais

Da teoria ao Perceptron

Na década de 1940, Warren McCulloch, um neurocientista, e Walter Pitts, um matemático, trabalharam juntos para desenvolver o primeiro conceito de rede neural artificial. O objetivo era entender como o cérebro poderia produzir padrões de pensamento complexos a partir de respostas binárias simples dos neurônios. Eles introduziram um modelo do neurônio que, segundo acreditavam, poderia imitar a capacidade do cérebro de realizar cálculos complexos usando lógica binária.

No modelo de rede neural desenvolvido por McCulloch e Pitts, as entradas atuam como os impulsos elétricos que um neurônio recebe. Se algumas entradas são mais cruciais para um resultado específico, o modelo as enfatiza com um peso maior. Quando essas entradas ponderadas excedem um determinado nível, o neurônio é ativado, caso contrário, permanece desativado. Esse mecanismo básico de ativação e desativação permitiu que o modelo imitasse processos simples de tomada de decisões semelhantes aos do cérebro, preparando o terreno para a evolução do deep learning.

Em 1957, a introdução do Mark I Perceptron, uma máquina do tamanho de uma sala construída pelo cientista da computação e psicólogo Frank Rosenblatt, apresentou o primeiro uso prático de neurônios artificiais. Esse dispositivo usava fotocélulas e redes neurais artificiais para reconhecer e categorizar imagens, demonstrando a eficácia das ideias de McCulloch e Pitts. O Perceptron de Rosenblatt não só confirmou a viabilidade do Machine Learning, como também abriu caminho para o desenvolvimento das tecnologias de deep learning mais sofisticadas da atualidade.

Como funciona o deep learning?

O deep learning usa o processo de previsão para determinar quais algoritmos em suas redes neurais são os mais bem-sucedidos em produzir resultados que atendam às expectativas humanas. Em seguida, as redes usam a retropropagação para refinar esses algoritmos, de modo que sua taxa de sucesso aumente. Veja um exemplo:

Imagine que você está ensinando um computador a reconhecer diferentes gêneros musicais. A rede neural analisa milhares de arquivos de música, aprendendo gradualmente a identificar características como instrumentação, batidas e progressões de acordes. Quando faz uma previsão – por exemplo, identificar uma música como rock – e é informada se está correta, ela usa um método chamado retropropagação para ajustar seu algoritmo.

É como aprender com os erros. Por exemplo, se o computador confunde uma sonata clássica para piano com uma música de rock, ele aprende com esse erro, aprimorando sua capacidade de distinguir entre músicas clássicas e de rock nas previsões futuras. Com o tempo, esse processo permite que a rede neural artificial faça previsões altamente precisas, transformando-a em uma ferramenta poderosa para tudo, desde recomendar filmes com base no que você gosta até permitir que carros autônomos interpretem placas e sinais de trânsito.

Uma análise das camadas profundas da rede neural

Esta lista explica os componentes essenciais de uma rede neural profunda e a ordem geral em que eles funcionam. No entanto, neurônios, funções de ativação e técnicas de regularização não são etapas isoladas, mas sim características que operam em toda a rede e em seu processo de aprendizado.

  1. Camada de entrada

A camada de entrada é o gateway da rede, em que cada neurônio representa uma característica única dos dados de entrada. A função principal desta camada é receber os dados brutos e passá-los para as camadas subsequentes e continuar o processamento.

  1. Neurônios (nós)

Os neurônios, ou nós, são as unidades fundamentais de processamento de uma rede neural. Cada neurônio recebe uma entrada, depois a processa (usando uma soma ponderada e aplicando uma função de ativação) e, por fim, envia a saída para a camada seguinte.

  1. Funções de ativação

São como os tomadores de decisão em uma rede neural que a ajudam a determinar o que aprender e o que ignorar. Elas adicionam uma espécie de flexibilidade à rede, permitindo a captação e o aprendizado de padrões complexos. As funções de ativação comuns incluem sigmoide, ReLU (unidade linear retificada) e tanh.

  1. Pesos e vieses

Os pesos são parâmetros dentro da rede que determinam a influência dos dados de entrada nas saídas dentro das camadas da rede. Juntamente com os pesos, os vieses garantem que as funções de ativação possam produzir saídas diferentes de zero, aumentando a capacidade da rede de ativar e aprender de maneira eficaz.

  1. Camadas ocultas

Situadas entre as camadas de entrada e saída, as camadas ocultas executam a maior parte dos cálculos em uma rede neural. São chamadas de "ocultas" porque, ao contrário da entrada e saída, elas não interagem com o ambiente externo. A complexidade e a capacidade de uma rede neural são amplamente determinadas pelo número e pela arquitetura das camadas ocultas.

  1. Camada de saída

Esta é a camada final de uma rede neural. Ela apresenta os resultados, transformando as informações das camadas ocultas em um formato que resolve a tarefa em questão, como classificação, regressão ou qualquer outro tipo de previsão.

  1. Função de perda

A função de perda, ou função de custo, quantifica a diferença entre os resultados previstos e os reais. O objetivo do treinamento é minimizar esta função, permitindo que o modelo faça previsões mais precisas.

  1. Algoritmos de otimização

Esses algoritmos ajustam o modelo para melhorar sua precisão ao longo do tempo. Eles ajustam os pesos e vieses para reduzir erros durante as previsões. Alguns métodos populares incluem SGD (Stochastic Gradient Descent), Adam e RMSprop.

  1. Retropropagação

Este algoritmo de deep learning é fundamental porque ajuda o modelo a aprender e melhorar com seus erros. Ele descobre como as mudanças nos pesos do modelo afetam sua precisão. Em seguida, ajusta essas configurações rastreando os erros no modelo para torná-lo mais eficiente nas previsões.

  1. Técnicas de regularização

Os modelos muitas vezes se ajustam excessivamente aos dados de treinamento, fazendo com que eles não tenham um desempenho tão bom com dados novos (conhecido como overfitting). Neste caso, técnicas como regularização L1 e L2 e normalização de lote são usadas para ajustar o tamanho dos pesos e acelerar o processo de treinamento.

  1. Normalização em lote

Esta técnica normaliza as entradas de cada camada, visando melhorar a estabilidade, o desempenho e a velocidade da rede neural. Ela também ajuda a reduzir a sensibilidade aos pesos iniciais.

  1. Dropout

Outro método de regularização, o dropout, ignora aleatoriamente um conjunto de neurônios durante o treinamento. Ele ajuda a reduzir o overfitting, impedindo que a rede se torne muito dependente de um único neurônio.

Aplicações comuns de deep learning

O Machine Learning profundo percorreu um longo caminho desde o Perceptron. Em vez de instalar máquinas do tamanho de uma sala, as organizações agora podem desenvolver soluções de deep learning na nuvem. A capacidade atual das redes neurais profundas de lidar com conjuntos de dados complexos as torna ferramentas valiosas em diversos setores, abrindo novos caminhos para a inovação que antes eram considerados futuristas.

Automotivo

O deep learning permite que os veículos interpretem dados de sensores para navegação. Ele também melhora os sistemas de assistência ao motorista, com recursos como detecção de perigos e prevenção de colisões, e contribui para o aprimoramento do design e a fabricação de veículos.

Operações de negócios

Os chatbots de IA conversacional e os copilotos assistentes virtuais são os exemplos de aplicativos de deep learning de negócios mais conhecidos. Eles reduzem erros humanos por meio da automação de tarefas manuais, aceleração da análise de dados e tomada de decisões, além da simplificação da localização de informações armazenadas em diferentes sistemas.

Finanças

A negociação algorítmica baseada em deep learning é usada para analisar dados de mercado em busca de insights preditivos e identificar padrões complexos para aprimorar a detecção de fraudes. O deep learning também auxilia na gestão de riscos, avaliando os riscos de crédito e as condições do mercado para uma tomada de decisão mais fundamentada.

Saiba mais sobre a tecnologia de IA em finanças

Saúde

Os algoritmos de deep learning ajudam a melhorar a precisão do diagnóstico e detectar anomalias como tumores em estágios iniciais a partir de imagens médicas. Há também oportunidades para a descoberta de medicamentos por meio da previsão do comportamento molecular, facilitando o desenvolvimento de novos tratamentos.

Produção

A manutenção preditiva usa a Internet das Coisas e o deep learning para prever falhas de máquinas, minimizando o tempo de inatividade. Sistemas de inspeção visual, treinados em grandes conjuntos de dados de imagens, podem melhorar o controle da qualidade com a identificação de defeitos.

Saiba mais sobre a tecnologia de IA na produção

Mídia e entretenimento

O setor de entretenimento usa aplicativos de deep learning para impulsionar recomendações de conteúdo em plataformas de streaming e para ajudar os criadores a desenvolver CGIs realistas e compor músicas usando IA generativa. A tecnologia também analisa as preferências dos visualizadores, ajudando os criadores a personalizar o conteúdo e a prever tendências futuras.

Varejo

O deep learning revolucionou as experiências do cliente do varejo com recomendações personalizadas de produtos. Além disso, ele melhora a gestão de estoques usando funções analíticas preditivas para prever a demanda e otimizar os níveis de estoque.

Saiba mais sobre a tecnologia de IA no varejo

Cadeia de suprimentos

As operações de logística estão usando o Machine Learning profundo para otimizar a programação de entregas com a identificação de disrupções no trânsito em tempo real. O deep learning também aumenta a exatidão das previsões de oferta e demanda, permitindo ajustes estratégicos proativos.

Benefícios e desafios do deep learning

Embora os benefícios do deep learning sejam realmente impressionantes, a complexidade dessa tecnologia também traz desafios. E como as soluções de deep learning exigem planejamento e recursos consideráveis, é crucial que as empresas estabeleçam metas claramente definidas e práticas de IA responsável antes de projetar e implementar essa tecnologia.

Benefícios
Desafios
  • Alta precisão em tarefas como reconhecimento de imagens e de fala.
  • Capacidade de processar e analisar grandes quantidades de dados.
  • Aprimoramento ao longo do tempo, à medida que é exposto a mais dados.
  • Automação da extração de recursos, reduzindo a necessidade de intervenções manuais.
  • Viabilização de experiências personalizadas em serviços e produtos.
  • Necessidade de grandes conjuntos de dados para treinamento.
  • Grande utilização de capacidade computacional, necessitando de poder de processamento significativo.
  • Possibilidade de ser uma "caixa preta", dificultando o entendimento dos processos de decisão do modelo.
  • Probabilidade de perpetuar vieses injustos se os dados de treinamento tiverem falhas.
  • Necessidade de monitoramento e dados contínuos para manter o desempenho ao longo do tempo.

Deep learning vs. Machine Learning vs. IA

Existem algumas diferenças importantes entre o Machine Learning tradicional e o deep learning:

O Machine Learning depende de humanos para identificar e selecionar manualmente os recursos ou características dos dados que são importantes para uma tarefa, como bordas em imagens ou palavras específicas em um texto. Esse processo de treinamento requer muita expertise e esforço.

O deep learning permite que as máquinas determinem automaticamente quais características dos dados são mais importantes para a execução de tarefas específicas. Isso é feito pelo processamento dos dados brutos, como pixels em uma imagem, por meio de várias camadas da rede neural. Cada camada transforma os dados em uma forma mais abstrata, com base na saída da camada anterior. À medida que o modelo é exposto a mais dados, ele refina continuamente essas transformações para melhorar a precisão e o desempenho, tornando-se mais eficaz ao longo do tempo.

Exemplo de IA, deep learning e Machine Learning

Se você não tem certeza das diferenças entre IA, Machine Learning e deep learning, saiba que não está sozinho. Confira um exemplo real dessas diferenças em veículos autônomos:

IA é a tecnologia abrangente usada para dar aos veículos autônomos inteligência e autonomia semelhantes às humanas. Ela inclui Machine Learning e deep learning.

Machine Learning é o subtipo de IA que permite que sistemas autônomos aprendam e melhorem com os dados sem serem programados especificamente para cada cenário.

Deep learning é o subtipo especializado de Machine Learning que processa e interpreta as entradas complexas, incluindo dados visuais de câmeras, dando sentido ao ambiente em tempo real.

Deep learning vs. modelos de deep learning

Também não é incomum ver os termos "deep learning" e "modelos de deep learning" usados de maneira intercambiável, mas há uma diferença sutil entre eles:

Deep learning refere-se a todo o campo de estudo. Ele abrange os algoritmos, teorias, técnicas e processos usados para treinar redes neurais artificiais.

Modelos de deep learning referem-se às redes neurais específicas que foram projetadas e treinadas para resolver um determinado problema ou executar uma tarefa específica. Cada modelo é único, adaptado aos seus dados, treinamento e tarefa específicos. O desempenho do modelo será de acordo com:

O que são redes neurais profundas?

Redes de deep learning, muitas vezes chamadas de redes neurais profundas, aprendem padrões complexos com grandes conjuntos de dados ajustando conexões neurais por meio de treinamento. Existem vários tipos importantes: redes neurais artificiais, redes neurais convolucionais, redes neurais recorrentes, redes neurais generativas e autoencoders.

Tipos de rede neural profunda

Recurso/tipo
Rede neural artificial
Rede neural convolucional
Rede neural recorrente
Rede neural generativa
Autoencoders
Uso principal
Propósito geral, variando da regressão à classificação.
Reconhecimento de imagens e vídeos, classificação de imagens.
Processamento de linguagem natural, reconhecimento da fala.
Geração de imagens, transferência de estilos, ampliação de dados.
Redução de dimensionalidade, diminuição de ruídos, identificação de recursos e detecção de anomalias.
Principais características
Simplicidade e versatilidade.
Uso de camadas convolucionais para reconhecer, de maneira adaptativa, as hierarquias espaciais dos recursos.
Capacidade de processar informações em sequências, preservando informações de uma etapa da sequência para a seguinte.
Recurso de geração de novos dados semelhantes aos dados de entrada.
Uso de um codificador (encoder) para comprimir os dados e um decodificador (decoder) para reconstruí-los, aprendendo representações eficientes de dados.
Conceito básico
Uma rede de neurônios/nós que simula o cérebro humano.
Especializada em processamento de dados topológicos em forma de grade.
Desenvolvida para dados sequenciais ou em séries cronológicas.
Consiste de duas redes (geradora e discriminadora) competindo em um jogo.
Desenvolvida para aprendizagem sem supervisão, normalmente para a compressão de dados e a extração de recursos.
Vantagens
Flexibilidade. Pode ser aplicada em um amplo espectro de tarefas.
Alto desempenho e eficiência em tarefas relacionadas a dados visuais.
Capacidade de aprender dependências de longo prazo com modificações como memória longa de curto prazo.
Poderosa para a geração de novas instâncias de dados; aprimora o realismo e a diversidade de dados.
Eficiente para a compressão de dados e a apreensão de recursos notáveis sem rótulos; útil no pré-treinamento para outras tarefas.
Desafios
Pode ter dificuldades no reconhecimento de padrões complexos em dados brutos de alta dimensionalidade.
Exige uma quantidade significativa de dados de treinamento para o desempenho ideal.
Apresenta dificuldades no treinamento em longas sequências devido ao problema de dissipação do gradiente.
A estabilidade do treinamento e o colapso de modelos podem ser difíceis de administrar.
Tem tendência ao excesso de ajustes se não regularizada ou se os dados não forem diversos o suficiente; ajustar o espaço latente pode ser difícil.
Características arquiteturais
Camadas de neurônios totalmente conectados.
Camadas convolucionais, camadas de agrupamento (pooling), seguidas por camadas totalmente conectadas.
Cadeias de unidades de repetição que processam sequências.
Duas redes: uma geradora para criar dados e uma discriminadora para avaliá-los.
Utiliza um codificador e um decodificador para reduzir e, em seguida, reconstruir as entradas.
Tratamento de dados
Trata uma ampla gama de tipos de dados.
Processa dados espaciais com eficiência.
É excelente para tratar dados sequenciais ou cronológicos.
Aprende a gerar dados que não podem ser distinguidos de dados reais.
Eficiente na aprendizagem de representações comprimidas de um conjunto de dados específico.

Requisitos da infraestrutura de deep learning

O deep learning requer computação especializada e infraestrutura de rede para processar seus modelos complexos e grandes conjuntos de dados. Não convém executar modelos de deep learning em redes ou hardware de computador em geral, por isso muitas empresas adotam plataformas de IA empresarial para atender aos requisitos necessários. Estas são as principais considerações de infraestrutura:

GPUs de alto desempenho

A espinha dorsal da infraestrutura de deep learning são as unidades de processamento gráfico (GPUs) de alto desempenho. Originalmente projetadas para renderizar gráficos em videogames, as GPUs têm capacidades de processamento que as tornam ideais para o deep learning. Sua capacidade de executar vários cálculos simultaneamente reduz muito o tempo de treinamento dos modelos, tornando-as indispensáveis para pesquisas e aplicativos modernos de IA.

Soluções de armazenamento escaláveis

Quanto mais dados um modelo puder aprender, melhor será seu desempenho. Isso cria a necessidade de soluções de armazenamento escaláveis e rápidas que possam lidar com petabytes de dados, sem criar gargalos na recuperação de dados. Unidades de estado sólido e sistemas de arquivos distribuídos são normalmente usados para atender a essas demandas, oferecendo acesso de alta velocidade a dados que acompanha a velocidade computacional das GPUs.

Estruturas eficientes de processamento de dados

Frameworks e bibliotecas como TensorFlow, PyTorch e Keras simplificam o desenvolvimento de modelos de deep learning com o fornecimento de funções predefinidas, o que reduz a necessidade de codificação do zero. Essas ferramentas não só aceleram o processo de desenvolvimento, como também otimizam a eficiência computacional do treinamento e inferência, permitindo o uso eficiente do hardware subjacente.

Plataformas de computação em nuvem

As plataformas de computação em nuvem têm um papel fundamental para tornar o deep learning amplamente acessível. Elas dão acesso a recursos de computação de alto desempenho on demand, eliminando a necessidade de investimentos iniciais significativos em hardware físico. Essas plataformas oferecem diversos serviços, incluindo instâncias de GPU, armazenamento escalável e estruturas de Machine Learning, facilitando o desenvolvimento e a implementação de modelos de deep learning por indivíduos e organizações.

Infraestrutura de rede

Os modelos de deep learning são geralmente treinados em várias GPUs e até mesmo em diferentes localizações geográficas, de modo que é essencial ter uma infraestrutura de rede robusta. A conectividade de alta largura de banda garante que os parâmetros de modelos e dados possam ser transferidos entre nós de maneira eficiente em uma configuração de treinamento distribuída, minimizando atrasos e otimizando o processo de treinamento.

Conheça a IA desenvolvida para os negócios

Descubra como aprimorar e conectar melhor seus processos, dados e pessoal.

Saiba mais

Perguntas frequentes

Em outras palavras, o que é deep learning?
O deep learning, às vezes também chamado de Machine Learning profundo, é um tipo de inteligência artificial que ensina computadores a aprender por exemplos, assim como os humanos. Ele usa uma estrutura em camadas de algoritmos chamados redes neurais para processar dados, reconhecer padrões e tomar decisões.
Qual seria um exemplo de deep learning?
Um exemplo relevante de deep learning está nas imagens médicas, em que os algoritmos analisam imagens como raio-X, ressonância magnética (MRI) e tomografia computadorizada (CT) para detectar doenças como o câncer. Esses sistemas de deep learning são treinados com vastos conjuntos de dados de imagens médicas e conseguem identificar padrões sutis que podem passar despercebidos pelos olhos humanos, auxiliando os médicos no diagnóstico precoce e no planejamento de tratamento personalizado.
Quais são os três tipos de deep learning?
  1. Redes neurais convolucionais: um exemplo conhecido é o recurso de desbloqueio facial em smartphones. As redes neurais convolucionais analisam as características faciais da entrada da câmera para verificar a identidade do usuário, permitindo acesso seguro e rápido ao dispositivo. Esse processo envolve o aprendizado da rede a partir de várias imagens para reconhecer e confirmar com precisão o rosto do usuário.
  2. Redes neurais recorrentes: ideal para tarefas que envolvem sequências, como prever a próxima palavra em uma frase. Isso as torna ideais para aplicações como texto preditivo em smartphones, em que a rede aprende com a sequência de digitação para sugerir a próxima palavra que você pode digitar.
  3. Autoencoders: um exemplo prático é a compactação de imagens, em que os autoencoders reduzem o tamanho das imagens para armazenamento ou transmissão e depois as restauram à sua qualidade original quando necessário. Esse processo ajuda a reduzir o espaço necessário para armazenar imagens, mantendo sua qualidade.
Qual é a diferença entre Machine Learning e deep learning?
Machine Learning refere-se ao conceito mais amplo de computadores que aprendem com os dados para tomar decisões ou fazer previsões. Deep learning é um subconjunto do Machine Learning que usa redes neurais com várias, ou "profundas", camadas. A principal diferença é a profundidade do aprendizado; o deep learning descobre automaticamente os dados mais relevantes a serem usados no aprendizado e, no Machine Learning, os dados são especificados manualmente. Além disso, o deep learning tem melhor desempenho com conjuntos de dados maiores, enquanto o Machine Learning tradicional pode ser mais eficaz com conjuntos de dados menores.

Conheça a IA desenvolvida para os negócios

Descubra como aprimorar e conectar melhor seus processos, dados e pessoal.

Saiba mais