O que é Machine Learning?
Machine Learning é um subconjunto de inteligência artificial (IA) em que computadores aprendem com os dados e melhoram com a experiência sem serem programados detalhadamente.
Definição de Machine Learning
Machine Learning é um subconjunto de inteligência artificial (IA). Seu objetivo é ensinar computadores a aprender com os dados e a melhorar com a experiência – em vez de serem detalhadamente programados para esse fim. No Machine Learning, os algoritmos são treinados para identificar padrões e correlações em grandes conjuntos de dados, para tomar as melhores decisões e fazer previsões com base nessa análise. Os aplicativos de Machine Learning melhoram com o uso e se tornam mais precisos à medida que têm acesso a um maior volume de dados.
Esse tipo de aplicativo está em todos os lugares – em nossos lares, carrinhos de compras, mídias de entretenimento e serviços de saúde.
Como o Machine Learning está relacionado à IA?
Machine Learning – e seus componentes de aprendizado profundo e redes neurais – se encaixam como subconjuntos concêntricos de IA. A Inteligência Artificial processa dados para tomar decisões e fazer previsões. Os algoritmos de Machine Learning permitem que a IA não só processe esses dados, mas também os utilize para aprender e ficar mais inteligente, sem precisar de programação adicional. A inteligência artificial é a matriz de todos os subconjuntos de Machine Learning subsequentes. No primeiro subconjunto está o Machine Learning, que contém o aprendizado profundo que, por sua vez, contém as redes neurais.
O que é uma rede neural?
Uma rede neural artificial (ANN, na sigla em inglês) é modelada com base nos neurônios de um cérebro biológico. Os neurônios artificiais, chamados de nós, são agrupados em várias camadas e funcionam em paralelo. Quando recebe um sinal numérico, o neurônio artificial o processa e sinaliza os demais neurônios a ele conectados. Como em um cérebro humano, o reforço neural resulta em melhor reconhecimento de padrões, expertise e aprendizado geral.
O que é aprendizado profundo (deep learning)?
Esse tipo de Machine Learning é denominado “profundo/deep” porque inclui muitas camadas da rede neural e grandes volumes de dados complexos e díspares. Para alcançar esse aprendizado, o sistema envolve várias camadas na rede, extraindo resultados de níveis cada vez mais profundos. Por exemplo, um sistema de aprendizado profundo que estiver processando imagens da natureza e procurando Rudbeckia Hirta, reconhecerá, na primeira camada, uma planta. À medida que se aprofunda nas camadas neurais, identificará uma flor, depois uma margarida e, por fim, uma margarida amarela. Exemplos de aplicações de aprendizado profundo incluem reconhecimento de fala, classificação de imagens e análise farmacêutica.
Como funciona o Machine Learning?
O Machine Learning é composto por diferentes modelos que usam várias técnicas algorítmicas. Dependendo da natureza dos dados e do resultado desejado, um dos quatro modelos de Machine Learning pode ser utilizado: supervisionado, não supervisionado, semi-supervisionado ou por reforço. Em cada um desses modelos, uma ou mais técnicas algorítmicas podem ser aplicadas em relação aos conjuntos de dados em uso e aos resultados desejados. Os algoritmos de Machine Learning são desenvolvidos basicamente para classificar coisas, encontrar padrões, prever resultados e tomar decisões fundamentadas. Os algoritmos podem ser usados um de cada vez ou combinados para alcançar a melhor precisão possível quando há dados complexos e mais imprevisíveis envolvidos.
Como o processo de Machine Learning funciona
O que é Machine Learning supervisionado?
O aprendizado supervisionado é o primeiro dos quatro modelos de Machine Learning, cujos algoritmos ensinam a máquina por meio de exemplos. Os tipos de aprendizado supervisionado consistem em pares de dados de “entrada” e “saída”, em que a saída é rotulada com o valor desejado. Por exemplo, digamos que o objetivo seja que a máquina faça a distinção entre margarida e amor-perfeito. Um par binário de dados de entrada inclui uma imagem de margarida e outra de amor-perfeito. Como o resultado desejado para esse par específico é a margarida, esse dado será pré-identificado como o resultado correto.
Por meio de um algoritmo, o sistema compila todos esses dados de treinamento ao longo do tempo e começa a determinar semelhanças correlativas, diferenças e outros pontos de lógica, até conseguir prever sozinho as respostas para perguntas sobre margarida ou amor-perfeito. É o equivalente a dar a uma criança um conjunto de problemas com uma folha de resposta e pedir para ela mostrar o trabalho e explicar sua lógica. Modelos de Machine Learning supervisionado são usados em vários aplicativos com os quais interagimos todos os dias, por exemplo, mecanismos de recomendação para produtos e aplicativos de análise de tráfego, como o Waze, que preveem a rota mais rápida em diferentes horários do dia.
O que é Machine Learning não supervisionado?
O aprendizado não supervisionado é o segundo dos quatro modelos de Machine Learning. Nesse modelo de aprendizado, não há folha de resposta. A máquina estuda os dados de entrada – muitos dos quais não são rotulados nem estruturados – e começa a identificar padrões e correlações, usando todos os dados relevantes e acessíveis. De muitas maneiras, o aprendizado não supervisionado é modelado com base na forma como os seres humanos observam o mundo. Usamos intuição e experiência para agrupar as coisas. À medida que experimentamos mais e mais exemplos de um determinado objeto, nossa capacidade de categorizá-lo e identificá-lo torna-se cada vez mais precisa. Para máquinas, a "experiência" é definida pela quantidade de dados que são inseridos e disponibilizados. Exemplos comuns de aplicações de Machine Learning não supervisionado incluem reconhecimento facial, análise de sequências de genes, pesquisa de mercado e segurança cibernética.
O que é Machine Learning semi-supervisionado?
O aprendizado semi-supervisionado é o terceiro dos quatro modelos de Machine Learning. Em um mundo perfeito, todos os dados seriam estruturados e rotulados antes de serem inseridos nos sistemas. Mas como isso é impraticável, o Machine Learning semi-supervisionado torna-se uma solução viável quando há grandes volumes de dados brutos e não estruturados. Este modelo consiste na entrada de pequenas quantidades de dados rotulados para fortalecer os conjuntos de dados não rotulados. Basicamente, os dados rotulados agem para dar início à execução do sistema e podem melhorar consideravelmente a velocidade e a precisão do aprendizado. Um algoritmo de Machine Learning semi-supervisionado instrui a máquina a analisar os dados rotulados em relação a propriedades correlativas que possam ser aplicadas aos dados não rotulados.
Contudo, como analisado detalhadamente neste relatório de pesquisa do MIT Press, existem riscos associados a esse modelo, pois eventuais falhas nos dados rotulados são aprendidas e replicadas pelo sistema. As empresas que usam Machine Learning semi-supervisionado com maior eficácia garantem a aplicação de protocolos de melhores práticas. O ML semi-supervisionado é usado em análise linguística e de discurso, pesquisas médicas complexas, como categorização de proteínas, e na detecção geral de fraudes.
O que é Machine Learning por reforço?
O aprendizado por reforço é o quarto modelo de Machine Learning, no qual a máquina recebe a folha de resposta e aprende por meio da identificação de correlações entre todos os resultados corretos. Este modelo não inclui uma folha de resposta, mas sim um conjunto de ações, regras e desfechos admissíveis. Quando o objetivo desejado do algoritmo é fixo ou binário, as máquinas podem aprender por exemplos. Mas quando o resultado desejado é mutável, o sistema deve aprender pela experiência e recompensa. Nos modelos de aprendizado por reforço, a “recompensa” é numérica e é programada no algoritmo como algo que o sistema busca coletar.
De muitas maneiras, podemos comparar este modelo a ensinar alguém a jogar xadrez. Com certeza, é inviável mostrar todos os movimentos possíveis desse jogo, mas você pode explicar as regras e então a pessoa desenvolve habilidades próprias com a prática. As recompensas vêm não só com a vitória no jogo, mas também com a conquista das peças do adversário. As aplicações de aprendizado por reforço incluem licitação de preços automatizada para compradores de publicidade online, desenvolvimento de jogos de computador e negociações de alto risco no mercado de ações.
Machine Learning empresarial em ação
Por identificarem padrões e correlações, os algoritmos de Machine Learning são muito bons em analisar o próprio ROI. Para empresas que investem em tecnologias de Machine Learning, esse recurso permite avaliação quase imediata do impacto operacional. Segue uma pequena amostra de algumas das áreas em crescimento dos aplicativos de Machine Learning empresarial.
Mecanismos de recomendação: de 2009 a 2017, o número de famílias americanas que assinavam serviços de streaming de vídeo aumentou 450%. E um artigo de 2020, publicado na revista Forbes, relata um aumento ainda maior no uso de streaming de vídeo em proporções que chegam a 70%. Os mecanismos de recomendação têm aplicativos em muitas plataformas de varejo e compras, mas definitivamente estão ganhando espaço com serviços de streaming de música e vídeo.
Marketing dinâmico: gerar leads e conduzi-los pelo funil de vendas requer a capacidade de reunir e analisar o máximo possível de dados do cliente. Os consumidores modernos geram um enorme volume de dados variados e não estruturados – desde transcrições de chat até uploads de imagens. O uso de aplicativos de Machine Learning ajuda os profissionais de marketing a entender esses dados e usá-los para fornecer conteúdo de marketing personalizado e engajamento em tempo real com clientes e leads.
ERP e automação de processos: os bancos de dados de ERP contêm conjuntos de dados amplos e díspares, que podem incluir estatísticas de desempenho de vendas, reviews de consumidores, relatórios de tendências de mercado e registros de gestão da cadeia de suprimentos. Os algoritmos de Machine Learning podem ser usados para encontrar correlações e padrões nesses dados. Esses insights podem então ser usados para informar praticamente todas as áreas da empresa, incluindo a otimização de workflows de dispositivos da Internet das Coisas (IoT) na rede ou as melhores maneiras de automatizar tarefas repetitivas ou propensas a erros.
Manutenção preditiva: cadeias de suprimentos modernas e fábricas inteligentes estão, cada vez mais, usando máquinas e dispositivos de IoT, bem como conectividade na nuvem em todas as suas frotas e operações. Panes e ineficiências podem resultar em enormes custos e disrupções. Quando os dados de manutenção e reparo são coletados manualmente, é quase impossível prever problemas, quanto mais automatizar processos para prevê-los e evitá-los. Sensores de gateway IoT podem ser instalados até mesmo em máquinas analógicas antigas, fornecendo visibilidade e eficiência em toda a empresa.
Desafios do Machine Learning
Em seu livro Spurious Correlations, Tyler Vigen, cientista de dados e doutorando em Harvard, ressalta que "nem todas as correlações são indicativas de uma conexão causal subjacente". Para ilustrar isso, o autor inclui um gráfico mostrando uma correlação aparentemente forte entre o consumo de margarina e o índice de divórcios no estado do Maine. É claro que o gráfico tem como objetivo mostrar a questão com bom humor. No entanto, em uma observação mais séria, vemos que os aplicativos de Machine Learning são vulneráveis a vieses e erros humanos e algorítmicos. E devido à propensão dessa tecnologia para aprender e adaptar-se, erros e correlações falsas podem propagar-se rapidamente e afetar os resultados em toda a rede neural.
Modelos de Machine Learning em que o algoritmo e a respectiva saída são tão complexos que não podem ser explicados nem compreendidos por humanos apresentam um desafio a mais. Esse modelo é chamado de "caixa preta" e coloca as empresas em risco quando se veem incapazes de determinar como e por que um algoritmo chegou a uma determinada conclusão ou decisão.
Felizmente, as ferramentas e os recursos disponíveis para administrar os riscos aumentam à medida que a complexidade dos conjuntos de dados e algoritmos de Machine Learning cresce. As empresas líderes têm trabalhado para eliminar erros e vieses, estabelecendo diretrizes de governança de IA robustas e atualizadas, além de protocolos de melhores práticas.