Machine Learning x Inteligência Artificial: eles não são sinônimos

Tratar os termos como intercambiáveis ou machine learning como parte da AI só complica as coisas. Para entender melhor é importante desmistificar suas histórias

Por Redação - 21/08/2017

Há muita excitação e até alguma confusão em todo o mercado digital no que diz respeito ao machine learning, e é por uma boa razão. A disponibilidade de armazenamento e processamento baratos tornou o "machine learning sofisticado" disponível para diversos outros mercados, um número muito maior do que o de, por exemplo, cinco anos atrás. O mercado de mídias viu soluções de machine learning serem aplicadas a diversos aplicativos, desde prever a probabilidade de um usuário clicar em um anúncio, até classificar os usuários em lookalikes para otimizar a entrega da campanha.

Este uso mais amplo aumentou a atenção para várias características do machine learning, e é aí que surge a confusão. Talvez nenhuma das ferramentas do machine learning tenha se tornado tão popular quanto a Inteligência Artificial (AI), que se tornou tão amplamente discutida que muitos usam os dois termos de forma intercambiável, como fica evidente em recentes pesquisas de fornecedores e pela cobertura da imprensa.

O uso do termo AI para encapsular uma ampla variedade de algoritmos cria ainda mais confusão. As equipes de marketing dos fornecedores lançaram a nomenclatura e tornaram o machine learning um subconjunto da AI porque a venda de inteligência artificial é uma narrativa mais convincente. Da maneira como a imprensa especializada define AI, eu poderia argumentar que qualquer planilha de Excel suficientemente complicada seria classificada como AI.

Tratar os dois termos como intercambiáveis ou tratar machine learning como parte da AI só complica as coisas. Para entender melhor machine learning e AI, é importante desmistificar suas histórias e como eles são usados na mídia atualmente.

Machine Learning
O machine learning é útil quando os seres humanos estão prevendo, classificando ou otimizando algo que é realmente complicado, com muitos fatores a serem considerados. As pessoas são limitadas por suas habilidades cognitivas e tempo disponível, mas as máquinas podem, com diferentes graus de inteligência, levar muitos outros fatores em consideração ao tentar resolver um problema.

No contexto do marketing direto, os profissionais de marketing compravam historicamente listas de editores de revistas e enviavam mensagens para aqueles nas listas com a esperança de que as assinaturas de revistas como Quatro Rodas coincidissem com os interesses das pessoas e possivelmente influenciassem seu comportamento de compra. Os planejadores de mídia tomavam essas decisões de compra de lista com base na compreensão do público da revista, do mercado-alvo e do produto do anunciante.

Na década de 1970, tornou-se prático processar dados para cada casa dos EUA e os algoritmos de machine learning tomaram as decisões sobre quais casas recebiam ofertas de correio. Os anunciantes de verticais como automotivos agora podiam usar dados sobre famílias para prever a probabilidade de alguém daquela residência estar interessado em um carro novo. As peças de correspondência agora eram direcionadas para casas que eram mais propensas a comprar, ao invés de quem só mostrava interesse, levando a custos reduzidos e mais vendas.

O mesmo tipo de coisa é feito na publicidade digital. As agências e as demand-side platforms coletam dados sobre os compradores do produto de um anunciante e criam modelos de machine learning que atribuem a cada usuário sua probabilidade de comprarem aquele produto. Uma vez que os profissionais de marketing conhecem a probabilidade de um usuário comprar, eles podem determinar de forma inteligente quanto estão dispostos a pagar para alcançar esse usuário com seus anúncios. Quanto mais prováveis os usuários forem comprar, mais um anunciante deve estar disposto a pagar. A publicidade de performance é realizada baseando-se nos modelos de predição e propensão à compra. E tudo isso é machine learning.

Então, por que os anunciantes só estão ouvindo sobre machine learning agora? No passado, machine learning tendia a ser aplicado em áreas onde o valor era muito alto, como pontuação de crédito ou negociação de ações. Os data scientists utilizaram ótimas técnicas e algoritmos por um longo tempo, e grande parte do que está sendo usado hoje já havia sido concebida antes da década de 1960. Até recentemente, o poder de processamento e, igualmente importante, de armazenamento, era caro e lento, tornando o machine learning impraticável em muitas situações.

Ao longo dos últimos 10 anos, três dinâmicas mudaram a equação custo-valor.

Primeiro, a comunidade open-source, grátis, criou plataformas, como Hadoop e Spark, que podem processar dados de forma muito eficiente. Em segundo lugar, os provedores de nuvem, incluindo Amazon Web Services e Microsoft, criaram uma infraestrutura que pode hospedar essas plataformas e deixá-las escalar de acordo com a demanda. Em terceiro lugar, softwares bons, completos e muitas vezes gratuitos de machine learning estão disponíveis em diversas fontes. Esses três fatores tornam a aprendizagem das máquinas uma abordagem mais prática para problemas que foram previamente resolvidos apenas pelos humanos ou por tentativa e erro.

Existem centenas de técnicas que podem ser vistas como machine learning. Pense nisso como um grupo de técnicas, como aritmética, com seus tipos de operações: adição, subtração, etc. O mesmo vale para o machine learning. Normalmente, ele é separado em técnicas, nas quais cada uma tem uma coisa específica que busca prever, o que é chamado de machine learning supervisionado, e classificando coisas, chamado machine learning sem supervisão.

Inteligência Artificial
Isso nos leva a inteligência artificial. Embora não espere que os profissionais de marketing mudem sua comunicação, sugiro que seja mais apropriado tratar a AI como um subconjunto do machine learning, ou como uma disciplina separada. Da mesma forma que as estatísticas são definidas por suas técnicas, a AI é um grupo de técnicas de computação e não um problema particular a ser resolvido, como processamento de linguagem natural ou reconhecimento de imagem.

AI refere-se a um subconjunto muito limitado de técnicas metodológicas, incluindo redes neurais ou sistemas experientes, que imitam sistemas cognitivos da inteligência humana. A técnica é o que a define como AI, e não o problema a ser resolvido. Se você olhar para a página na Wikipedia sobre machine learning, as técnicas usadas para aplicações típicas de AI são um subconjunto do machine learning.

Na mídia, existem muitas aplicações para os métodos de AI, principalmente aquelas focadas na compreensão de linguagem e imagens. O reconhecimento de voz por trás da Siri e da Alexa é baseado em AI. O Search Safe do Google, que identifica imagens e páginas da Web que podem não ser apropriadas para crianças, é baseado em modelos de deep-learning. As técnicas que alimentam todas essas aplicações são baseadas em machine learning.

A parte complicada do uso da AI é que exige que o cientista dos dados "treine" o modelo, e os modelos de deep-learning exigem uma grande quantidade de dados para poderem ser treinados.

Digamos que você deseja treinar um modelo de deep-learning para identificar rostos em imagens. Você precisa fornecer o modelo com centenas de milhares de imagens onde os rostos são identificados. Desta forma, o modelo aprende com o que um rosto "parece". Para construir o modelo, você precisa criar o "conjunto de treinamento". Criar o conjunto de treinamento significa que alguém precisa indicar nas imagens onde os rostos estão, o que pode levar centenas ou milhares de horas de trabalho. A falta de conjuntos de dados de treinamento "prontos" significava que era muito difícil criar aplicativos de AI, mas esses conjuntos de dados estão cada vez mais disponíveis.

À medida que o aprendizado automático da máquina se torna uma parte ainda maior do cenário da mídia digital, as marcas terão de continuar a educar-se sobre as nuances e as aplicações do machine learning. Aqueles que continuam a utilizar AI quando querem se referir ao machine learning dificilmente se comunicam com os profissionais e dificultam que o termo AI seja usado de maneira apropriada no mercado digital.

A proliferação do termo AI como um proxy para um conjunto complicado de algoritmos amplia o significado para torná-lo inútil. No futuro, a indústria de anúncios deve usar o termo AI para se referir a um conjunto de técnicas específicas que são usadas na construção de soluções, como redes neurais ou sistemas especializados, e manter o vocabulário de marketing de lado.