Ir para o conteúdo
Machine Learning identificando carros

O que é Machine Learning?

Machine Learning é um subconjunto de IA (inteligência artificial) cujo foco é ensinar os computadores a aprender com os dados e a melhorar com a experiência – em vez de programá-los explicitamente para esse fim. No Machine Learning, os algoritmos são treinados para identificar padrões e correlações em grandes conjuntos de dados, tomar melhores decisões e fazer previsões com base nessa análise. Os aplicativos de Machine Learning melhoram com o uso e se tornam mais precisos à medida que têm acesso a um maior volume de dados. Somos cercados por esse tipo de aplicativo – em nossos lares, carrinhos de compras, mídias de entretenimento e serviços de saúde.

Machine Learning – e seus componentes de aprendizagem profunda e redes neurais – se encaixam como subconjuntos concêntricos de IA. A IA processa dados para tomar decisões e fazer previsões. Os algoritmos de Machine Learning permitem que a IA não só processe esses dados, mas os utilize para aprender e ficar mais inteligente, sem precisar de programação adicional. A inteligência artificial é a matriz de todos os subconjuntos de Machine Learning subsequentes. No primeiro subconjunto está o Machine Learning, contendo a aprendizagem profunda que, por sua vez, contém as redes neurais.

O que é uma rede neural?

 

Uma rede neural artificial (ANN, na sigla em inglês) é modelada com base nos neurônios de um cérebro biológico. Chamados de nós, os neurônios artificiais são agrupados em várias camadas e funcionam em paralelo. Quando recebe um sinal numérico, o neurônio artificial o processa e sinaliza os demais neurônios a ele conectados. Como em um cérebro humano, o reforço neural promove melhor reconhecimento de padrões, expertise e aprendizado geral.

 

O que é aprendizagem profunda (deep learning)?

 

Esse tipo de Machine Learning é denominado “profundo” (deep) porque inclui muitas camadas da rede neural e grandes volumes de dados complexos e díspares. Para alcançar a aprendizagem profunda, o sistema envolve várias camadas na rede, extraindo resultados de níveis cada vez mais profundos. Por exemplo, um sistema de aprendizagem profunda que estiver processando imagens da natureza e procurando Rudbeckia Hirta, reconhecerá, na primeira camada, uma planta. À medida que se aprofundar nas camadas neurais, identificará uma flor, depois uma margarida e, por fim, uma margarida amarela. Exemplos de aplicações de aprendizagem profunda incluem reconhecimento de fala, classificação de imagens e análise farmacêutica.

O Machine Learning é composto por diferentes tipos de modelos que usam várias técnicas algorítmicas. Dependendo da natureza dos dados e do resultado desejado, um destes quatro modelos de Machine Learning pode ser usado: supervisionado, não supervisionado, semi-supervisionado ou por reforço. Em cada um desses modelos, uma ou mais técnicas algorítmicas podem ser aplicadas – em relação aos conjuntos de dados em uso e aos resultados desejados. Os algoritmos de Machine Learning são desenvolvidos basicamente para classificar coisas, encontrar padrões, prever resultados e tomar decisões fundamentadas. Os algoritmos podem ser usados um de cada vez ou combinados para alcançar a melhor precisão possível quando há dados complexos e mais imprevisíveis envolvidos. 

O que é aprendizado supervisionado (supervised learning)?

 

O aprendizado supervisionado é o primeiro dos quatro modelos de Machine Learning, cujos algoritmos ensinam a máquina por meio de exemplos. Os modelos de aprendizado supervisionado consistem em pares de dados de “entrada” e “saída”, em que a saída é rotulada com o valor desejado. Por exemplo, digamos que o objetivo seja que a máquina faça a distinção entre margarida e amor-perfeito. Um par binário de dados de entrada inclui uma imagem de margarida e outra de amor-perfeito. Como o resultado desejado para esse par específico é a margarida, esse dado será pré-identificado como o resultado correto.

 

Por meio de um algoritmo, o sistema compila todos esses dados de treinamento ao longo do tempo e começa a determinar semelhanças correlativas, diferenças e outros pontos de lógica, até conseguir prever sozinho as respostas para perguntas margarida ou amor-perfeito. É o equivalente a dar a uma criança um conjunto de problemas com uma folha de respostas e pedir para ela mostrar o trabalho e explicar sua lógica. Modelos de aprendizado supervisionado são usados em vários aplicativos com os quais interagimos todos os dias, como mecanismos de recomendação para produtos e aplicativos de análise de tráfego, como o Waze, que preveem a rota mais rápida em diferentes horários do dia.

 

O que é aprendizado não supervisionado?

 

A aprendizado não supervisionado é o segundo dos quatro modelos de Machine Learning. Nesse modelo de aprendizado, não há folhas de respostas. A máquina estuda os dados de entrada – muitos dos quais não são rotulados nem estruturados – e começa a identificar padrões e correlações, usando todos os dados relevantes e acessíveis. De muitas maneiras, o aprendizado não supervisionado é modelado com base no modo como os seres humanos observam o mundo. Usamos intuição e experiência para agrupar as coisas. À medida que experimentamos mais e mais exemplos de um determinado objeto, nossa capacidade de categorizá-lo e identificá-lo torna-se cada vez mais precisa. Para máquinas, a "experiência" é definida pela quantidade de dados inseridos e disponibilizados. Exemplos comuns de aplicações de aprendizado não supervisionado incluem reconhecimento facial, análise de sequências de genes, pesquisa de mercado e segurança cibernética.

 

O que é aprendizado semi-supervisionado?

 

O aprendizado semi-supervisionado é o terceiro dos quatro modelos de Machine Learning. Em um mundo perfeito, todos os dados seriam estruturados e rotulados antes de serem inseridos nos sistemas. Mas como isso é impraticável, o aprendizado semi-supervisionado torna-se uma solução viável quando há grandes volumes de dados brutos e não estruturados. Este modelo consiste na entrada de pequenas quantidades de dados rotulados para fortalecer os conjuntos de dados não rotulados. Basicamente, os dados rotulados agem para dar início à execução do sistema e podem melhorar consideravelmente a velocidade e a precisão do aprendizado. Um algoritmo de aprendizado semi-supervisionado instrui a máquina a analisar os dados rotulados quanto a propriedades correlativas que possam ser aplicadas aos dados não rotulados.

 

Contudo, como explorado em profundidade neste relatório de pesquisa do MIT Press, existem riscos associados a esse modelo, pois eventuais falhas nos dados rotulados são aprendidas e replicadas pelo sistema. As empresas que usam o aprendizado semi-supervisionado com maior eficácia garantem a aplicação de protocolos de melhores práticas. O aprendizado semi-supervisionado é usado na análise linguística e de discurso, pesquisa médica complexa, como categorização de proteínas e detecção geral de fraudes.

 

O que é aprendizado por reforço?

 

O aprendizado por reforço é o quarto modelo de Machine Learning, no qual a máquina recebe a folha de respostas e aprende por meio da identificação de correlações entre todos os resultados corretos. Este modelo não inclui uma folha de respostas, mas sim um conjunto de ações, regras e desfechos admissíveis. Quando o objetivo desejado do algoritmo é fixo ou binário, as máquinas podem aprender por exemplos. Mas quando o resultado desejado é mutável, o sistema deve aprender pela experiência e recompensa. Nos modelos de aprendizado por reforço, a “recompensa” é numérica e é programada no algoritmo como algo que o sistema busca coletar.

 

De muitas maneiras, podemos comparar este modelo a ensinar alguém a jogar xadrez. Com certeza, é inviável mostrar todos os movimentos possíveis desse jogo, mas você pode explicar as regras e a pessoa desenvolve habilidades próprias com a prática. As recompensas vêm não só com a vitória no jogo, mas também com a conquista das peças do adversário. As aplicações de aprendizado por reforço incluem licitação de preços automatizada para compradores de publicidade online, desenvolvimento de jogos de computador e negociações de alto risco no mercado de ações.

Como identificam padrões e correlações, os algoritmos de Machine Learning são muito bons em analisar o próprio ROI. Para empresas que investem em tecnologias de Machine Learning, esse recurso permite avaliação quase imediata do impacto operacional. Segue uma pequena amostra de algumas das áreas em crescimento dos aplicativos de Machine Learning corporativo.

  • Mecanismos de recomendação: de 2009 a 2017, o número de famílias americanas que assinavam serviços de streaming de vídeo aumentou 450%. E um artigo de 2020 publicado na revista Forbes, relata um aumento ainda maior no uso de streaming de vídeo em proporções que chegam a 70%. Os mecanismos de recomendação têm aplicativos em muitas plataformas de varejo e compras, mas definitivamente estão ganhando espaço com serviços de streaming de música e­ vídeo.
  • Marketing dinâmico: gerar leads e conduzi-los pelo funil de vendas requer a capacidade de reunir e analisar o máximo possível de dados do cliente. Os consumidores modernos geram um enorme volume de dados variados e não estruturados – desde transcrições de chat até uploads de imagens. O uso de aplicativos de Machine Learning ajuda os profissionais de marketing a entender esses dados e usá-los para fornecer conteúdo de marketing personalizado e engajamento em tempo real com clientes e leads.
  • ERP e automação de processos: os bancos de dados ERP contêm conjuntos de dados amplos e díspares, que podem incluir estatísticas de desempenho de vendas, reviews de consumidores, relatórios de tendências de mercado e registros de gestão da cadeia de suprimentos. Os algoritmos de Machine Learning podem ser usados para encontrar correlações e padrões nesses dados. Esses insights podem então ser usados para informar praticamente todas as áreas da empresa, incluindo a otimização de workflows de dispositivos da Internet das Coisas (IoT) na rede ou as melhores maneiras de automatizar tarefas repetitivas ou propensas a erros.
  • Manutenção preditiva: cadeias de suprimentos modernas e fábricas inteligentes estão, cada vez mais, usando máquinas e dispositivos de IoT, bem como conectividade na nuvem em todas as suas frotas e operações. Panes e ineficiências podem gerar enormes custos e disrupções. Quando os dados de manutenção e reparo são coletados manualmente, é quase impossível prever possíveis problemas – que dirá automatizar processos para prevê-los e evitá-los. Sensores de gateway de IoT podem ser instalados até mesmo em máquinas analógicas antigas, fornecendo visibilidade e eficiência em toda a empresa.

Em seu livro Spurious Correlations, Tyler Vigen, cientista de dados e doutorando em Harvard, ressalta que "nem todas as correlações são indicativas de uma conexão causal subjacente". Para ilustrar isso, o autor inclui um gráfico mostrando uma correlação aparentemente forte entre o consumo de margarina e o índice de divórcios no estado do Maine. É claro que o gráfico tem como objetivo mostrar a questão com bom humor. No entanto, em uma observação mais séria, vemos que os aplicativos de Machine Learning são vulneráveis a vieses e erros humanos e algorítmicos. E graças à propensão dessa tecnologia a aprender e adaptar-se, erros e correlações falsas podem propagar-se rapidamente e poluir os resultados em toda a rede neural.

 

Modelos de Machine Learning em que o algoritmo e a respectiva saída são tão complexos que não podem ser explicados nem compreendidos por humanos apresentam um desafio a mais. Esse modelo é chamado de "caixa preta" e coloca as empresas em risco quando se veem incapazes de determinar como e por que um algoritmo chegou a uma determinada conclusão ou decisão.

 

Felizmente, as ferramentas e os recursos disponíveis para administrar os riscos crescem à medida que a complexidade dos conjuntos de dados e algoritmos de Machine Learning aumenta. As empresas líderes têm trabalhado para eliminar erros e vieses, estabelecendo diretrizes de governança de IA robustas e atualizadas, além de protocolos de melhores práticas.

Perguntas frequentes sobre Machine Learning

Machine Learning é um subconjunto de IA e não pode existir sem ela. A IA usa e processa dados para tomar decisões e fazer previsões – é o cérebro de um sistema baseado em computador e é a "inteligência" exibida pelas máquinas. Os algoritmos de Machine Learning que residem na IA, bem como outros aplicativos baseados em IA, permitem que o sistema não só processe esses dados, mas também os use para executar tarefas, fazer previsões, aprender e ficar mais inteligente, sem precisar de programação adicional. Eles fornecem à IA um senso de objetivo ao qual toda essa inteligência e dados podem ser aplicados.

Sim, mas deve ser abordado como um esforço em toda a empresa e não apenas como upgrade de TI. As empresas que têm os melhores resultados com os projetos de transformação digital fazem uma avaliação rigorosa dos recursos e conjuntos de habilidades existentes e contam com os sistemas básicos certos antes de começar.

Em relação ao Machine Learning, a ciência de dados é um subconjunto, que se concentra em estatísticas e algoritmos, usa técnicas de regressão e classificação e interpreta e comunica resultados.  O Machine Learning é focado em programação, automação, escala, incorporação e resultados de armazenamento.

Machine Learning analisa padrões e correlações, aprende com eles e é otimizado ao longo do tempo. A mineração de dados é usada como fonte de informações para o Machine Learning. As técnicas de mineração de dados empregam algoritmos complexos e podem ajudar a fornecer conjuntos de dados mais bem organizados para serem usados no aplicativo de Machine Learning.

Os neurônios ligados a uma rede neural artificial, denominados nós, são conectados e agrupados em camadas. Quando recebe um sinal numérico, o nó sinaliza outros neurônios relevantes que operam em paralelo. A aprendizagem profunda usa a rede neural e é "profunda" porque usa grandes volumes de dados e envolve várias camadas da rede neural simultaneamente. 

Machine Learning é o amálgama de vários modelos, técnicas e tecnologias de aprendizagem que podem incluir estatística. A própria estatística se concentra no uso de dados para fazer previsões e criar modelos para análise.

Voltar ao início