flex-height
text-black

Um investigador sentado, com uma bata branca de laboratório, trabalha numa secretária com vários monitores de computador, ao lado de um pequeno robô.

O que é aprendizagem profunda?

O deep learning é um subconjunto da inteligência artificial (IA) que imita as redes neurais do cérebro para aprender a partir de grandes quantidades de dados, permitindo que as máquinas resolvam problemas complexos.

default

{}

default

{}

primary

default

{}

secondary

Definição de aprendizagem profunda

O deep learning é um tipo de aprendizagem automática que permite aos computadores processar informações de forma semelhante ao cérebro humano. Chama-se "profundo" porque envolve múltiplas camadas de redes neuronais que ajudam o sistema a compreender e interpretar os dados. Esta técnica permite que os computadores reconheçam padrões e realizem tarefas complexas, como traduzir línguas e conduzir carros de forma autónoma. De forma semelhante à maneira como os seres humanos aprendem com a experiência, estes sistemas melhoram as suas competências e precisão ao longo do tempo, analisando grandes quantidades de dados, sem necessitarem de atualizações manuais por parte das pessoas.

Compreender redes neurais

Da teoria ao Perceptron

Na década de 1940, Warren McCulloch, um neurocientista, e Walter Pitts, um matemático, colaboraram para criar o primeiro conceito de rede neural artificial. O objetivo deles era compreender como o cérebro poderia produzir padrões de pensamento complexos a partir das simples respostas binárias dos neurónios. Eles apresentaram um modelo do neurónio, que acreditavam poder imitar a capacidade do cérebro de realizar cálculos complexos utilizando lógica binária.

No modelo de rede neural desenvolvido por McCulloch e Pitts, as entradas funcionam como os impulsos elétricos que um neurónio recebe. Se algumas entradas forem mais cruciais para um determinado resultado, o modelo dá-lhes mais ênfase através de um peso maior. Quando estes inputs ponderados excedem um determinado nível, o neurónio é ativado; caso contrário, permanece desligado. Este mecanismo básico de ligar e desligar permitiu que o seu modelo imitasse processos simples de tomada de decisão semelhantes aos do cérebro, preparando o terreno para a evolução do deep learning.

Em 1957, a introdução do Mark I Perceptron, uma máquina do tamanho de uma sala construída pelo cientista informático e psicólogo Frank Rosenblatt, demonstrou a primeira utilização prática de neurónios artificiais. Este dispositivo utilizava fotocélulas e redes neuronais artificiais para reconhecer e categorizar imagens, demonstrando a eficácia das ideias de McCulloch e Pitts. O Perceptron de Rosenblatt não só confirmou que o aprendizado de máquina poderia funcionar, como também abriu caminho para o desenvolvimento das tecnologias de aprendizagem profunda mais sofisticadas de hoje.

Como funciona o deep learning?

O deep learning funciona utilizando o processo de previsão para determinar quais algoritmos nas suas redes neurais são mais bem-sucedidos a produzir resultados que correspondem às expectativas humanas. Depois, as redes utilizam a retropropagação para aperfeiçoar esses algoritmos, de modo a melhorar a sua taxa de sucesso. Eis um exemplo:

Imagine que está a ensinar um computador a reconhecer diferentes géneros de música. A rede neural analisa milhares de ficheiros de música, aprendendo gradualmente a identificar características como instrumentação, batidas e progressões de acordes. Quando faz uma previsão, como identificar uma música como sendo rock, e depois é informado se está correta ou não, utiliza um método chamado retropropagação para ajustar o seu algoritmo.

Isto é como aprender com os erros. Por exemplo, se o computador confundir uma sonata clássica de piano com uma música rock, aprende com esse erro, aprimorando a sua capacidade de distinguir entre músicas clássicas e rock em previsões futuras. Com o tempo, este processo permite que a rede neural artificial faça previsões altamente precisas, tornando-se uma ferramenta poderosa para tudo, desde recomendar filmes com base nas suas preferências até permitir que carros autónomos interpretem sinais e sinais de trânsito.

Uma análise aprofundada das camadas de redes neuronais profundas

Esta lista explica os componentes essenciais de uma rede neural profunda e a ordem geral em que funcionam. No entanto, os neurónios, as funções de ativação e as técnicas de regularização não são etapas isoladas, mas sim características que operam em toda a rede e no seu processo de aprendizagem.

  1. Camada de entrada

A camada de entrada é a porta de entrada para a rede, onde cada neurónio representa uma característica única dos dados de entrada. A principal função desta camada é receber os dados brutos e passá-los para as camadas seguintes para processamento adicional.

  1. Neurónios (nodos)

Os neurónios, ou nós, são as unidades fundamentais de processamento de uma rede neural. Cada neurónio recebe uma entrada, processa-a (utilizando uma soma ponderada e depois aplicando uma função de ativação) e envia o resultado para a camada seguinte.

  1. Funções de ativação

Estes são como os decisores numa rede neural, ajudando-a a determinar o que deve aprender e o que deve ignorar. Elas acrescentam um tipo de flexibilidade à rede, permitindo-lhe captar e aprender padrões complexos. As funções de ativação mais comuns incluem sigmóide, ReLU (unidade linear retificada) e tanh.

  1. Pesos e enviesamentos

Os pesos são parâmetros dentro da rede que determinam a influência dos dados de entrada nos resultados das camadas da rede. Juntamente com os pesos, os vieses garantem que as funções de ativação possam produzir saídas diferentes de zero, aumentando a capacidade da rede de se ativar e aprender de forma eficaz.

  1. Camadas ocultas

Situadas entre as camadas de entrada e as camadas de saída, as camadas ocultas realizam a maior parte dos cálculos dentro de uma rede neural. Chamam-se "ocultas" porque, ao contrário da entrada e da saída, não interagem com o ambiente externo. A complexidade e a capacidade de uma rede neural são em grande parte determinadas pelo número e pela arquitetura das camadas ocultas.

  1. Camada de saída

Esta é a camada final numa rede neural. Apresenta os resultados, transformando a informação das camadas ocultas num formato que resolve a tarefa em questão, como classificação, regressão ou qualquer outro tipo de previsão.

  1. Função de perda

A função de perda, ou função de custo, quantifica a diferença entre os resultados previstos e os resultados reais. Minimizar esta função é o objetivo do treino, permitindo que o modelo faça previsões com maior precisão.

  1. Algoritmos de otimização

Estes algoritmos ajustam o modelo para melhorar a sua precisão ao longo do tempo. Ajustam os pesos e os vieses para reduzir os erros durante as previsões. Alguns métodos populares incluem o gradiente descendente estocástico, Adam e RMSprop.

  1. Retropropagação

Este algoritmo de aprendizagem profunda é crucial porque ajuda o modelo a aprender e a melhorar com os seus erros. Determina como as alterações nos pesos do modelo afetam a sua precisão. Depois, ajusta estas definições ao rastrear os erros para trás através do modelo, para o tornar melhor a fazer previsões.

  1. Técnicas de regularização

Os modelos muitas vezes aprendem os dados de treino demasiado ao pormenor, o que faz com que não tenham um desempenho tão bom em novos dados (conhecido como sobreajuste). Para ajustar isto, são utilizadas técnicas como regularização L1 e L2 e normalização por lotes para afinar o tamanho dos pesos e acelerar o processo de treino.

  1. Normalização em lote

Esta técnica normaliza as entradas de cada camada, com o objetivo de melhorar a estabilidade, o desempenho e a velocidade da rede neural. Também ajuda a reduzir a sensibilidade aos pesos iniciais.

  1. Desistência

Outro método de regularização, o dropout ignora aleatoriamente um conjunto de neurónios durante o treino. Isto ajuda a reduzir o sobreajuste, impedindo que a rede se torne demasiado dependente de qualquer neurónio individual.

Aplicações comuns de aprendizagem profunda

O deep learning evoluiu muito desde o Perceptron. Em vez de precisarem de instalar máquinas do tamanho de uma sala, as organizações podem agora criar soluções de aprendizagem profunda na cloud. A capacidade das redes neurais profundas atuais de lidar com conjuntos de dados complexos torna-as ferramentas valiosas em diversos setores, abrindo novas vias para a inovação que outrora eram consideradas futuristas.

Indústria automóvel

O deep learning permite que os veículos interpretem os dados dos sensores para navegação. Também melhora os sistemas de assistência ao condutor, com funcionalidades como deteção de perigos e prevenção de colisões, e contribui para um melhor design e fabrico de veículos.

Operações empresariais

Chatbots de IA conversacional e assistentes virtuais copilotos são aplicações populares de deep learning para empresas. Reduzem o erro humano ao automatizar tarefas manuais, aceleram a análise de dados e a tomada de decisões, e facilitam a localização de informações armazenadas em diferentes sistemas.

Finanças

A negociação algorítmica potenciada por deep learning é utilizada para analisar dados de mercado em busca de previsões e identificar padrões complexos, melhorando a deteção de fraude. O deep learning também auxilia na gestão de riscos, avaliando riscos de crédito e condições de mercado para uma tomada de decisão mais informada.

Descubra mais sobre a tecnologia de IA nas finanças

Saúde

Os algoritmos de aprendizagem profunda podem ajudar a melhorar a precisão do diagnóstico e a detetar anomalias como tumores em fases iniciais a partir de imagens médicas. Existem também oportunidades para a descoberta de medicamentos através da previsão do comportamento molecular, facilitando o desenvolvimento de novos tratamentos.

Fabrico

A manutenção preditiva utiliza a Internet das Coisas e aprendizagem profunda para antecipar falhas em máquinas, minimizando o tempo de inatividade. Os sistemas de inspeção visual treinados com extensos conjuntos de imagens podem melhorar o controlo de qualidade ao identificar defeitos.

Descubra mais sobre a tecnologia de IA na indústria transformadora

Comunicação e entretenimento

A indústria do entretenimento utiliza aplicações de deep learning para potenciar recomendações de conteúdos em plataformas de streaming e para ajudar criadores a desenvolver CGI realista e compor música utilizando IA generativa. Também analisa as preferências dos espectadores, ajudando os criadores a adaptar o conteúdo e a prever tendências futuras.

Retalho

O deep learning revolucionou as experiências dos clientes no retalho com recomendações personalizadas de produtos. Também melhora a gestão de inventário ao utilizar análises preditivas para prever a procura e otimizar os níveis de stock.

Descubra mais sobre a tecnologia de IA no retalho

Cadeia logística

As operações logísticas estão a utilizar aprendizagem profunda de máquina para otimizar o agendamento de entregas, identificando perturbações no trânsito em tempo real. O deep learning também melhora a precisão das previsões de procura e oferta, permitindo ajustes proativos de estratégia.

Vantagens e desafios do deep learning

Embora os benefícios do deep learning sejam realmente impressionantes, a complexidade desta tecnologia também traz desafios. E porque as soluções de aprendizagem profunda exigem um planeamento e recursos consideráveis, é fundamental que as organizações estabeleçam objetivos claramente definidos e práticas responsáveis de IA antes de conceberem e implementarem esta tecnologia.

Benefícios
Desafios
  • Alta precisão em tarefas como reconhecimento de imagem e de voz
  • Capacidade de processar e analisar grandes quantidades de dados
  • Melhora ao longo do tempo à medida que é exposto a mais dados
  • Automatiza a extração de características, reduzindo a necessidade de intervenção manual
  • Permite experiências personalizadas em serviços e produtos
  • Requer grandes conjuntos de dados para o treino
  • Computacionalmente intensivo, requerendo uma potência de processamento significativa
  • Pode ser uma “caixa negra”, tornando difícil compreender os processos de decisão dos modelos
  • Suscetível a perpetuar preconceitos injustos quando os dados de treino são defeituosos
  • Necessita de dados contínuos e monitorização para manter o desempenho ao longo do tempo

Aprendizagem profunda vs. aprendizagem automática vs. IA

Existem algumas diferenças fundamentais entre o machine learning tradicional e o deep learning:

O aprendizado automático depende de seres humanos para identificar e selecionar manualmente as características ou atributos dos dados que são importantes para uma tarefa, como contornos em imagens ou palavras específicas em textos. Este processo de formação requer muita experiência e esforço.

O deep learning permite que as máquinas determinem automaticamente quais características dos dados são mais importantes para realizar tarefas específicas. Isto é feito processando os dados brutos, como os píxeis de uma imagem, através de múltiplas camadas de uma rede neural. Cada camada transforma os dados numa forma mais abstrata, baseando-se na saída da camada anterior. À medida que o modelo é exposto a mais dados, refina continuamente estas transformações para melhorar a precisão e o desempenho, tornando-se mais eficaz ao longo do tempo.

Exemplo de IA vs. aprendizagem profunda vs. aprendizagem automática

Se não tem a certeza das diferenças entre IA, aprendizagem automática e aprendizagem profunda, não está sozinho. Aqui está um exemplo prático de IA vs. aprendizagem profunda vs. aprendizagem automática sobre veículos autónomos:

A IA é a tecnologia abrangente utilizada para dotar os veículos autónomos de inteligência e autonomia semelhantes às humanas. Inclui aprendizagem automática e aprendizagem profunda.

O machine learning é o subtipo de IA que permite aos sistemas autónomos aprender e melhorar a partir de dados sem serem especificamente programados para cada cenário.

O deep learning é o sub-tipo especializado de aprendizagem automática que processa e interpreta entradas complexas, incluindo dados visuais de câmaras, compreendendo o ambiente em tempo real.

Aprendizagem profunda vs. modelos de aprendizagem profunda

Também não é incomum ver os termos “aprendizagem profunda” e “modelos de aprendizagem profunda” usados de forma intercambiável, mas existe uma diferença subtil entre eles:

Aprendizagem profunda refere-se a todo o campo de estudo. Abrange as teorias, técnicas, algoritmos e processos utilizados para treinar redes neurais artificiais.

Modelos de aprendizagem profunda referem-se às redes neurais específicas que foram concebidas e treinadas para resolver um determinado problema ou realizar uma tarefa específica. Cada modelo é único, adaptado aos seus dados, treino e tarefa específicos. O desempenho de um modelo depende de:

O que são redes neuronais profundas?

As redes de aprendizagem profunda, frequentemente chamadas de redes neurais profundas, aprendem padrões complexos em grandes conjuntos de dados ajustando as conexões neurais através do treino. Existem vários tipos principais: redes neuronais artificiais, redes neuronais convolucionais, redes neuronais recorrentes, redes neuronais generativas, e autoencoders.

Tipos de redes neuronais profundas

Funcionalidade/Tipo
Rede Neural Artificial
Rede Neural Convolucional
Rede Neural Recorrente
Rede Neural Generativa
Autoencoders
Utilização principal
Propósito geral, abrangendo desde regressão até classificação.
Reconhecimento de imagens e vídeos, classificação de imagens.
Processamento de linguagem natural, reconhecimento de fala.
Geração de imagens, transferência de estilo, aumento de dados.
Redução de dimensionalidade, redução de ruído, aprendizagem de características e deteção de anomalias.
Características principais
Simplicidade e versatilidade.
Utilização de camadas convolucionais para aprender de forma adaptativa hierarquias espaciais de características.
Capacidade de processar informações em sequências, preservando a informação de um passo da sequência para o seguinte.
Capacidade de gerar novos dados semelhantes aos dados de entrada.
Utiliza um codificador para comprimir dados e um descodificador para os reconstruir, aprendendo representações de dados eficientes.
Conceito básico
Uma rede de neurónios/nós que simula o cérebro humano.
Especializado no processamento de dados com topologia em grelha.
Concebido para dados sequenciais ou séries temporais.
Consiste em duas redes (gerador e discriminador) que competem num jogo.
Concebido para aprendizagem não supervisionada, normalmente para compressão de dados e extração de características.
Vantagens
Flexível. Pode ser aplicado a uma vasta gama de tarefas.
Alta eficiência e desempenho em tarefas relacionadas com dados visuais.
Capaz de aprender dependências de longo prazo com modificações como memória de longo e curto prazo (LSTM).
Poderoso para gerar novas instâncias de dados; aumenta o realismo e a diversidade dos dados.
Eficiente na compressão de dados e na aprendizagem de características salientes sem rótulos; útil no pré-treinamento para outras tarefas.
Desafios
Pode ter dificuldades no reconhecimento de padrões complexos em dados brutos e de alta dimensão.
Requer uma quantidade significativa de dados de treino para um desempenho ideal.
Dificuldade em treinar sequências longas devido ao problema do gradiente que desaparece.
A estabilidade do treino e o colapso de modo podem ser difíceis de gerir.
Propenso a overfitting se não for regularizado ou se os dados não forem suficientemente diversificados; pode ser complicado ajustar o espaço latente.
Características arquitetónicas
Camadas de neurónios totalmente conectados.
Camadas convolucionais, camadas de pooling, seguidas por camadas totalmente conectadas.
Cadeias de unidades repetitivas que processam sequências.
Duas redes: um gerador para criar dados e um discriminador para os avaliar.
Utiliza um codificador e um descodificador para reduzir e depois reconstruir a entrada.
Gestão de dados
Lida com uma ampla variedade de tipos de dados.
Gere dados espaciais de forma eficiente.
Excecional no tratamento de dados sequenciais ou dependentes do tempo.
Aprende a gerar dados que são indistinguíveis dos dados reais.
Eficiente na aprendizagem de representações comprimidas para um determinado conjunto de dados.

Requisitos de infraestrutura para aprendizagem profunda

O deep learning requer infraestruturas especializadas de computação e redes para processar os seus modelos complexos e conjuntos de dados massivos. Não é prático executar modelos de aprendizagem profunda em hardware ou redes informáticas gerais, por isso muitas organizações adotam plataformas de IA empresarial para satisfazer os requisitos necessários. Aqui estão as principais considerações de infraestrutura:

GPUs de alto desempenho

A espinha dorsal da infraestrutura de deep learning são as unidades de processamento gráfico (GPUs) de alto desempenho. Originalmente concebidas para processar gráficos em videojogos, as GPUs possuem capacidades de processamento que as tornam muito adequadas para aprendizagem profunda. A sua capacidade de realizar múltiplos cálculos simultaneamente reduz significativamente o tempo de treino dos modelos, tornando-os indispensáveis para a investigação e aplicações modernas de IA.

Soluções de armazenamento escaláveis

Quanto mais dados um modelo puder aprender, melhor será o seu desempenho. Isto cria a necessidade de soluções de armazenamento escaláveis e rápidas que possam gerir petabytes de dados sem criar estrangulamentos na recuperação da informação. As unidades de estado sólido e os sistemas de ficheiros distribuídos são frequentemente utilizados para satisfazer estas exigências, oferecendo acesso a dados em alta velocidade que acompanha a velocidade de computação das GPUs.

Estruturas eficientes de processamento de dados

Frameworks e bibliotecas como TensorFlow, PyTorch e Keras simplificam o desenvolvimento de modelos de aprendizagem profunda ao fornecer funções pré-construídas, reduzindo a necessidade de programar do zero. Estas ferramentas não só aceleram o processo de desenvolvimento, como também otimizam a eficiência computacional do treino e da inferência, permitindo uma utilização eficaz do hardware subjacente.

Plataformas de computação em nuvem

As plataformas de computação em nuvem desempenham um papel fundamental em tornar o deep learning amplamente acessível. Eles fornecem acesso a recursos de computação de alto desempenho sob demanda, eliminando a necessidade de um investimento inicial significativo em hardware físico. Estas plataformas oferecem vários serviços, incluindo instâncias de GPU, armazenamento escalável e frameworks de aprendizagem automática, facilitando a criação e implementação de modelos de aprendizagem profunda por indivíduos e organizações.

Infraestrutura de rede

Os modelos de aprendizagem profunda são frequentemente treinados em várias GPUs e até mesmo em diferentes localizações geográficas, por isso uma infraestrutura de rede robusta é crucial. A conectividade de banda larga garante que os dados e os parâmetros do modelo possam ser transferidos de forma eficiente entre os nós numa configuração de treino distribuído, minimizando atrasos e otimizando o processo de treino.

Explore a IA criada para empresas

Veja como melhorar e ligar melhor as suas pessoas, dados e processos.

Saiba mais

Perguntas frequentes

O que é aprendizagem profunda em palavras simples?
Aprendizagem profunda, por vezes também chamada de aprendizagem automática profunda, é um tipo de inteligência artificial que ensina os computadores a aprender por exemplo, tal como os seres humanos fazem. Utiliza uma estrutura em camadas de algoritmos chamada redes neurais para processar dados, reconhecer padrões e tomar decisões.
Qual é um exemplo de aprendizagem profunda?
Um exemplo notável de aprendizagem profunda é na imagiologia médica, onde algoritmos analisam imagens como radiografias, ressonâncias magnéticas ou tomografias computorizadas para detetar doenças como o cancro. Ao serem treinados com vastos conjuntos de dados de imagens médicas, estes sistemas de aprendizagem profunda conseguem identificar padrões subtis que podem passar despercebidos ao olhar humano, auxiliando os médicos no diagnóstico precoce e no planeamento de tratamentos personalizados.
Quais são os três tipos de aprendizagem profunda?
  1. Redes neuronais convolucionais: Um exemplo familiar é a funcionalidade de desbloqueio facial em smartphones. As redes neuronais convolucionais analisam as características faciais a partir da entrada da câmara para verificar a identidade da pessoa utilizadora, permitindo um acesso seguro e rápido ao dispositivo. Este processo envolve a aprendizagem da rede a partir de várias imagens para reconhecer e confirmar com precisão o rosto do utilizador.
  2. Redes neuronais recorrentes: Ideais para tarefas que envolvem sequências, como prever a próxima palavra numa frase. Isto torna-os excelentes para aplicações como o texto preditivo no seu smartphone, onde a rede aprende com a sequência da sua digitação para sugerir a próxima palavra que poderá escrever.
  3. Autoencoders: Um exemplo prático é a compressão de imagens, onde os autoencoders reduzem o tamanho das imagens para armazenamento ou transmissão e depois restauram-nas à sua qualidade original quando necessário. Este processo ajuda a reduzir o espaço necessário para armazenar imagens, mantendo a sua qualidade.
Qual é a diferença entre aprendizagem automática e aprendizagem profunda?
Aprendizagem automática refere-se ao conceito mais amplo de computadores aprenderem a partir de dados para tomar decisões ou fazer previsões. O deep learning é um subconjunto do machine learning que utiliza redes neuronais com muitas camadas, ou camadas “profundas”. A principal diferença é a profundidade da aprendizagem; o deep learning descobre automaticamente os dados mais relevantes a serem utilizados para a aprendizagem, enquanto o machine learning requer que os dados sejam especificados manualmente. Além disso, o deep learning apresenta melhores resultados com conjuntos de dados maiores, enquanto o machine learning tradicional pode ser mais eficaz com conjuntos de dados mais pequenos.

Explore a IA criada para empresas

Veja como melhorar e ligar melhor as suas pessoas, dados e processos.

Saiba mais