Ir para o conteúdo
Machine learning a identificar automóveis

O que é machine learning?

Machine learning é uma parte da inteligência artificial (IA). Dedica-se a ensinar computadores a aprenderem com dados e a melhorarem com a experiência, em vez de serem explicitamente programados para esse efeito. No machine learning, são treinados algoritmos para encontrarem padrões e correlações em grandes conjuntos de dados e para tomarem as melhores decisões e fazerem as melhores previsões com base nessa análise. As aplicações de machine learning melhoram com a utilização e, a quantos mais dados tiverem acesso, mais exatas se tornam. As aplicações de machine learning estão por todo o lado – nas nossas casas, nos carrinhos de compras, no entretenimento e nos cuidados de saúde.

O machine learning explicado

Qual a relação entre machine learning e IA?

O machine learning – e os seus componentes de aprendizagem profunda (deep learning) e redes neuronais – são todos subconjuntos da inteligência artificial. A IA processa dados para a tomada de decisões e a realização de previsões. Os algoritmos de machine learning permitem à IA não só processar esses dados, como utilizá-los para aprender e tornar-se mais inteligente, sem precisar de qualquer programação adicional. A inteligência artificial é o elemento superior de todos os subconjuntos de machine learning abaixo dela. Dentro do primeiro subconjunto, está o machine learning, que contém a aprendizagem profunda que, por sua vez, contém as redes neuronais.

Diagrama de IA versus machine learning

Diagrama da relação entre IA e machine learning

O que é uma rede neuronal?

 

Uma rede neuronal artificial (ANN) é modelada com base nos neurónios de um cérebro biológico. Os neurónios artificiais chamam-se nós e estão agrupados em várias camadas de clusters, funcionando em paralelo. Quando um neurónio artificial recebe um sinal numérico, processa-o e envia um sinal aos outros neurónios ligados. Tal como num cérebro humano, os reforços neuronais resultam na melhoria do reconhecimento de padrões, da especialização e da aprendizagem global.

 

O que é aprendizagem profunda?

 

Este tipo de machine learning denomina-se "deep" (profunda) porque inclui muitas camadas da rede neuronal e volumes enormes de dados complexos e dispersos. Para atingir aprendizagem profunda, o sistema interage com várias camadas da rede, extraindo resultados de nível cada vez mais elevado. Por exemplo, um sistema de aprendizagem profunda que esteja a processar imagens da Natureza e à procura de margaridas Gloriosa, irá, na primeira camada, procurar uma planta. À medida que avança pelas camadas neuronais, vai identificar uma flor, depois uma margarida e, finalmente, uma margarida Gloriosa. Exemplos de aplicações de aprendizagem profunda incluem reconhecimento de fala, classificação de imagens e análise farmacêutica.

Como funciona o machine learning?

O machine learning é composto por diferentes tipos de modelos de machine learning, utilizando diversas técnicas algorítmicas. Dependendo da natureza dos dados e do resultado pretendido, pode ser utilizado um de quatro modelos de aprendizagem: supervisionado, não supervisionado, semi-supervisionado e ou por reforço. Dentro de cada um desses modelos, pode ser aplicada uma ou mais técnicas algorítmicas, relativamente aos conjuntos de dados utilizados e aos resultados pretendidos. Basicamente, os algoritmos de machine learning são concebidos para classificar coisas, encontrar padrões, prever resultados e tomar decisões informadas. Os algoritmos podem ser usados um de cada vez ou combinados, para se atingir a maior exatidão possível quando estão envolvidos dados complexos e mais imprevisíveis. 

Diagrama que ilustra o funcionamento do machine learning

Como funciona o processo de machine learning

O que é aprendizagem supervisionada?

 

Aprendizagem supervisionada é o primeiro dos quatro modelos de machine learning (aprendizagem automática). Nos algoritmos de aprendizagem supervisionada, a máquina é ensinada através de exemplos. Os modelos de aprendizagem supervisionada consistem em pares de dados de "entrada" e de "saída", em que a saída é rotulada com o valor pretendido. Digamos, por exemplo, que o objetivo é que a máquina consiga distinguir entre margaridas e amores-perfeitos. Um par binário de dados de entrada inclui uma imagem de uma margarida e uma imagem de um amor-perfeito. O resultado pretendido desse par específico consiste na escolha da margarida, pelo que será pré-identificada como o resultado correto.

 

Por via de um algoritmo, o sistema compila todos estes dados de treino ao longo do tempo e começa a determinar correlações de semelhança, diferença e outros pontos de lógica, até conseguir prever sozinho as respostas a perguntas sobre margarida-ou-amor-perfeito. Isto equivale a dar a uma criança um conjunto de problemas com uma chave de resposta e depois pedir-lhe que demonstre o trabalho e explique a sua lógica. Os modelos de aprendizagem supervisionada são utilizados em muitas das aplicações com que interagimos todos os dias, como mecanismos de recomendação de produtos e aplicações de análise de tráfego como a Waze, que prevê o itinerário mais rápido a diferentes horas do dia.

 

O que é aprendizagem não supervisionada?

 

Aprendizagem não supervisionada é o segundo dos quatro modelos de machine learning. Nos modelos de aprendizagem não supervisionada, não existe uma chave de resposta. A máquina estuda os dados de entrada – muitos dos quais não estão rotulados nem estruturados – e começa a identificar padrões e correlações utilizando todos os dados relevantes e acessíveis. De muitas formas, a aprendizagem não supervisionada é modelada de acordo com a forma como os seres humanos observam o mundo. Utilizamos intuição e experiência para agruparmos as coisas. À medida que somos mais expostos a mais exemplos de alguma coisa, a nossa capacidade de a categorizar e identificar torna-se cada vez mais exata. Para as máquinas, a "exposição" define-se pela quantidade de dados que é introduzida e disponibilizada. Exemplos comuns de aplicações de aprendizagem não supervisionada incluem o reconhecimento facial, a análise de sequências de genes, os estudos de mercado e a cibersegurança.

 

O que é aprendizagem semi-supervisionada?

 

Aprendizagem semi-supervisionada é o terceiro dos quatro modelos de machine learning. Num mundo perfeito, todos os dados seriam estruturados e rotulados antes de darem entrada num sistema. Mas como isso não é possível, a aprendizagem semi-supervisionada torna-se uma solução viável quando existem vastas quantidades de dados brutos e não estruturados. Este modelo consiste na entrada de pequenas quantidades de dados rotulados para aumentar conjuntos de dados não rotulados. Essencialmente, os dados rotulados proporcionam um arranque rápido do sistema e podem aumentar consideravelmente a velocidade e exatidão da aprendizagem. Um algoritmo de aprendizagem semi-supervisionada instrui a máquina para analisar os dados rotulados em busca de propriedades correlativas que possam ser aplicadas aos dados não rotulados.

 

Este documento de investigação do MIT Press explora de forma aprofundada os riscos associados a este modelo, em que falhas nos dados rotulados são aprendidas e replicadas pelo sistema. As empresas que utilizam a aprendizagem semi-supervisionada com mais sucesso garantem o cumprimento de protocolos de melhores práticas. A aprendizagem semi-supervisionada é utilizada em análise linguística e de fala, em investigação médica complexa como a categorização de proteínas e em deteção de fraude de alto nível.

 

O que é aprendizagem por reforço?

 

Aprendizagem por reforço é o quarto modelo de machine learning. Na aprendizagem supervisionada, a resposta correta é dada à máquina, que aprende ao encontrar correlações entre todos os resultados corretos. O modelo de aprendizagem por reforço não inclui uma chave de resposta mas, em vez disso, procede-se à entrada de um conjunto de ações permitidas, regras e estados finais potenciais. Quando o objetivo pretendido do algoritmo é fixo ou binário, as máquinas conseguem aprender através de exemplos. No entanto, nos casos em que o resultado pretendido é mutável, o sistema tem de aprender através de experiência e recompensa. Nos modelos de aprendizagem por reforço, a "recompensa" é numérica e é programada no algoritmo como algo que o sistema procura recolher.

 

De muitas formas, este modelo é parecido com ensinar alguém a jogar xadrez. Certamente, seria impossível tentar mostrar-lhe todas as jogadas possíveis. Em vez disso, explicam-se as regras e o aluno aumenta a sua competência através da prática. As recompensas são o facto de ganhar o jogo e também a aquisição das peças do oponente. As aplicações da aprendizagem por reforço incluem a licitação de preços automatizada para compradores de publicidade online, desenvolvimento de jogos de computador e negociações de alto risco na bolsa de valores.

Machine learning empresarial em ação

Os algoritmos de machine learning reconhecem padrões e correlações, o que significa que são muito bons a analisar o seu próprio ROI. Para as empresas que investem em tecnologias de machine learning, esta característica permite uma avaliação quase imediata do impacto operacional. Veja mais abaixo uma pequena amostra de algumas das áreas em crescimento das aplicações de machine learning empresarial.

  • Mecanismos de recomendação: Entre 2009 e 2017, o número de agregados familiares dos EUA com subscrições de serviços de streaming aumentou em 450%. E um artigo de 2020 na revista Forbes reportava um aumento súbito de até 70% na utilização de streaming de vídeo. Os mecanismos de recomendação podem ser aplicados a muitas plataformas de retalho e compras, mas estão definitivamente a assumir grande importância com os serviços de streaming de música e vídeo.
  • Marketing dinâmico: A geração de leads e a respetiva condução ao longo do ciclo de vendas, exige a capacidade de recolher e analisar a maior quantidade possível de dados de cliente. Os consumidores modernos geram uma enorme quantidade de dados variados e não estruturados – desde transcrições de chat até uploads de imagens. A utilização de aplicações de machine learning ajuda os profissionais de marketing a compreenderem estes dados e a utilizá-los para fornecerem conteúdo de marketing personalizado e envolvimento em tempo real com clientes e leads.
  • ERP e automatização de processos: As bases de dados de ERP contêm vastos conjuntos de dados diversificados, que podem incluir estatísticas de desempenho de vendas, opiniões de consumidores, relatórios de tendências de mercado e registos de gestão da cadeia logística. Os algoritmos de machine learning podem ser utilizados para encontrar correlações e padrões nesses dados. Essas informações podem então ser utilizadas para informar praticamente todas as áreas da empresa, incluindo a otimização dos fluxos de trabalho dos dispositivos com Internet of Things (IoT) dentro da rede, ou as melhores formas de automatizar tarefas repetitivas ou atreitas a erros.
  • Manutenção preditiva: As cadeias logísticas modernas e as fábricas inteligentes utilizam cada vez mais dispositivos e máquinas com IoT, bem como conetividade na Cloud em todas as suas frotas e operações. Avarias e ineficiências podem resultar em enormes custos e disrupções. Quando os dados de manutenção e reparação são recolhidos manualmente, é quase impossível prever problemas potenciais – quanto mais automatizar processos para os prever e evitar. É possível instalar sensores de gateway de IoT até em máquinas analógicas com décadas de idade, o que proporciona visibilidade e eficiência em toda a empresa.
placeholder

Comece já

Veja as tecnologias inteligentes da SAP em ação, incluindo IA e machine learning.

Desafios de machine learning

No seu livro intitulado Spurious Correlations (correlações ilegítimas), o cientista de dados formado em Harvard Tyler Vigan salienta que "Nem todas as correlações são indicadoras de uma ligação causal subjacente". Para ilustrar isso, ele inclui um gráfico que mostra uma correlação aparentemente entre o consumo de margarina e a taxa de divórcio no estado norte-americano do Maine. Obviamente, este gráfico serve apenas para marcar uma posição com algum humor. No entanto, agora mais a sério, as aplicações de machine learning estão vulneráveis ao enviesamento e erros humanos e algorítmicos. E devido à propensão dessas aplicações para aprenderem e adaptarem-se, erros e correlações ilegítimas podem propagar-se rapidamente e poluir resultados em toda a rede neuronal.

 

Um outro desafio provém dos modelos de machine learning, em que o algoritmo e os seus resultados são tão complexos que não podem ser explicados nem compreendidos pelos seres humanos. A isto chama-se o modelo "caixa negra", que coloca as empresas em risco quando são incapazes de determinar como e por que motivo um algoritmo chegou a uma determinada conclusão ou decisão.

 

Felizmente, à medida que aumenta a complexidade dos conjuntos de dados e algoritmos de machine learning, também aumentam as ferramentas e os recursos disponíveis para a gestão do risco. As melhores empresas estão a trabalhar para eliminarem erros e enviesamentos, estabelecendo diretrizes robustas e atualizadas de governance de IA e protocolos de melhores práticas.

placeholder

Aproveitar ao máximo o machine learning

Siga os passos dos "aprendizes rápidos" com estas cinco lições aprendidas.

Perguntas frequentes de machine learning

O machine learning é um subconjunto da IA e não pode existir sem ela. A inteligência artificial utiliza e processa dados para tomar decisões e fazer previsões; é o cérebro de um sistema baseado em computador e é a "inteligência" demonstrada pelas máquinas. Os algoritmos de machine learning dentro da IA, tal como qualquer outra aplicação potenciada por IA, permitem ao sistema não só processar esses dados, mas também utilizá-los para executar tarefas, fazer previsões, aprender e ficar mais inteligente, sem precisar de programação adicional. Eles dão à IA alguma coisa para fazer com toda essa inteligência e todos esses dados.

Sim, mas deve adotar uma abordagem que abrange toda a empresa, não apenas uma atualização de TI. As empresas que obtêm os melhores resultados com projetos de transformação digital fazem uma avaliação rigorosa dos seus recursos e conjuntos de competências existentes, e certificam-se de que têm os sistemas fundamentais certos a funcionar, antes de começarem.

Relativamente ao machine learning, a ciência de dados é um subconjunto; foca-se em estatísticas e algoritmos, utiliza técnicas de regressão e classificação e interpreta e comunica resultados.  O machine learning dedica-se à programação, automatização, escala e incorporação e armazenamento de resultados.

O machine learning observa padrões e correlações; aprende com eles e otimiza-se através dessa experiência. A extração de dados é utilizada como uma fonte de informação para machine learning. As próprias técnicas de extração de dados empregam algoritmos complexos e podem ajudar a fornecer conjuntos de dados mais bem organizados para serem usados pela aplicação de machine learning.

Os neurónios ligados com uma rede neuronal artificial são denominados nós, que estão ligados e agrupados em camadas de clusters. Quando um nó recebe um sinal numérico, envia sinais a outros nós relevantes, que funcionam em paralelo. A aprendizagem profunda utiliza a rede neuronal e é "profunda" porque utiliza grandes volumes de dados e interage em simultâneo com várias camadas da rede neuronal. 

O machine learning é uma amálgama de vários modelos, técnicas e tecnologias de aprendizagem, que podem incluir estatística. A estatística propriamente dita foca-se na utilização de dados para fazer previsões e criar modelos para análise.

Newsletter do SAP Insights

placeholder
Subscreva agora

Subscreva a nossa newsletter para obter informações chave.

Outras leituras

Voltar ao início