Mercado fechará em 39 mins

Amazon cria sistema de IA que usa contexto para melhores resultados de buscas

Claudio Yuge

Se você estiver precisando de um calçado à prova d’água para manter os pés secos durante o trajeto de metrô para o escritório e puser as palavras “sapatos à prova d’água” em uma plataforma de e-commerce, é bem possível que os resultados tragam várias outras opções relacionadas, geralmente a esportes — o que deixa essa busca mais demorada e, muitas vezes, frustrante. A Amazon quer usar o poder de sua inteligência artificial para compreender melhor os contextos e trazer opções mais precisas.

A maioria dos algoritmos de descoberta de produtos procura correlações entre consultas e produtos, mas as melhores correspondências podem mudar bastante, dependendo do uso — “deslocamento” e “caminhada”, por exemplo abordam soluções bem distintas. Para melhorar esse entendimento nos computadores, a Amazon vem utilizando aprendizado de máquina para prever o contexto de seus clientes. A gigante varejista deu mais detalhes em um artigo, que deve ser apresentado na conferência ACM SIGIR, sobre Interação e Recuperação de Informações Humanas, programada para ocorrer este mês.

Imagem: Reprodução/Amazon

Adrian Boteanu, cientista que participa das pesquisas sobre experiência dos consumidores na Amazon Search explica o processo. Para treinar o sistema, sua equipe avalia uma lista de 173 categorias, divididas em 112 atividades (como leitura, limpeza ou execução) e 61 diferentes tipos de público (a exemplo de criança, filha, homem ou profissional), com base em consultas comuns de produtos.

O grupo vem usando textos de referência padrão para criar pseudônimos em termos associados às categorias. Em seguida, há uma revisão sobre as sequências de caracteres, em um cruzamento de informações sobre as informações anteriores, diante dos milhões de itens da Amazon. Se os termos da categoria original ou do pseudônimo aparecerem em qualquer revisão de um determinado produto, então há uma correspondência.

Novo sistema possui pontuação por afinidade

Esse processo já correlacionou sequências de caracteres com produtos de acordo com uma pontuação de afinidade, que vai de 1 a 15 — a mais baixa indica a correlação fraca. Para treinar o preditor de contexto de uso, os pesquisadores produziram outro conjunto de dados, em que cada uma dessas entradas consiste em três itens de dados: uma consulta; a identidade do produto anotado com categorias de contexto de uso; e sua pontuação de afinidade.

Essas informações foram divididas em dois grupos menores, um de acordo com a atividade e outro referente ao público, e foram utilizadas para treinar seis modelos diferentes de aprendizado de máquina. Cada um deve prever o contexto de uso com base em cadeias de consulta e, em testes, o melhor desempenho conseguiu antecipar anotações de produtos com 97% de precisão nas categorias de atividades e 92% nas de público.

Imagem: Reprodução/Amazon

Quando os revisores humanos começaram a participar desse sistema, eles concordaram, em média, com 81% das previsões criadas pela IA. “Isso sugere que os contextos de uso identificados pelo nosso sistema podem ajudar os algoritmos de descoberta de produtos a fornecer resultados mais relevantes, melhorando a experiência do cliente. Além disso, a mínima supervisão humana necessária para produzir dados de treinamento significa que nosso método pode ser expandido para novas categorias com relativamente pouco esforço”, concluiu Boteanu.

Ainda não há uma previsão exata de quando isso deva funcionar, mas é bem possível que já possamos ver os resultados muito em breve nas plataformas da Amazon.

Fonte: Canaltech

Trending no Canaltech: