Mercado fechado

Microsoft desenvolve tecnologias que prometem mudar o mundo das deepfakes

Rafael Rodrigues da Silva

O uso de algoritmos de IA para vídeos promete ser um dos maiores desafios para o combate às fake news nos próximos anos, já que a existência de tecnologias como as deepfakes tornará cada vez mais difícil de identificar a olho nu se um vídeo a que estamos assistindo é mesmo real ou se foi algo criado por um programa de computador. Pensando exatamente nessas dificuldades, pesquisadores da Microsoft e da Universidade de Pequim (China) desenvolveram dois programas bem distintos para troca de rostos: um que torna ainda melhor a qualidade da inserção digital do rosto de alguém em um vídeo, e outro que ajuda a detectar se um vídeo é mesmo real ou se foi algo manipulado digitalmente.

O primeiro deles recebe o nome de FaceShifter, e tem mais ou menos o mesmo objetivo daquele famoso aplicativo FaceSwap, ou seja, substituir o rosto de uma pessoa em uma foto ou vídeo por o de outra pessoa qualquer. De acordo do estudo publicado pela Microsoft, a grande diferença do FaceShifter para outros aplicativos do tipo é que ele leva muita mais em conta a postura e as diferenças de perspectiva da pessoa alvo no vídeo, ajudando a criar assim uma imagem ainda mais realista.

O aplicativo utiliza basicamente uma rede contraditória geradora (GAN) que é responsável por extrair diversos atributos da imagem levando em conta diferentes resoluções espaciais. Assim, essa rede funciona como uma modelo de IA que “disputa” contra si mesmo, efetuando a colagem da imagem base sobre a original, e então rodando uma rotina de varredura no resultado para ver quais pontos são detectados como modificados, e com base nestes resultados a IA recalcula as modificações e o processo se repete até que tudo entre em um equilíbrio perfeito — ou seja, a rotina de varredura não consiga detectar mais nenhum ponto no vídeo que o identifique como modificado digitalmente.

Quadro de comparação do FaceShifter com os outros dois apps de troca de rostos mais famosos, o Target e o FaceSwap (Imagem: Microsoft)

De acordo com os pesquisadores, em todos os testes realizados, o FaceShifter preservou de forma fiel todos os diferentes ângulos de movimentação do vídeo alvo, respeitando também as diferenças na iluminação e da resolução na hora de inserir um novo rosto no vídeo base. Além disso, o algoritmo também se mostrou muito bom em conseguir levar em conta os pontos mais complexos de uma imagem — como imagens refletidas, sombras e o uso de óculos pela imagem base — sem que os técnicos precisassem inserir manualmente as informações para lidar com esses problemas, o que é um enorme avanço para este tipo de tecnologia, fazendo com que essa técnica da Microsoft seja facilmente a melhor de todos os aplicativos de troca de rostos existentes hoje.

Em contraste com esta tecnologia está o Face X-Ray, um aplicativo desenvolvido para detectar se uma foto é real ou se ela foi manipulada digitalmente — uma tecnologia que se revela cada vez mais necessária, já que é cada vez mais comum a criação de contas falsas nas redes sociais que utilizam nas fotos de perfil rostos sintetizados por uma IA.

A grande vantagem do Face X-Ray para outros mecanismos do tipo é que ele utiliza um método de detecção que transforma a imagem em nível de cinza, revelando assim se essa é uma imagem única ou se ela poderia ter sido formada a partir da junção de duas imagens de fontes diferentes. Isso quer dizer que o aplicativo não precisa ter qualquer tipo de conhecimento prévio de técnicas usadas para se manipular imagens, tornando-o possível de ser usado para identificar até mesmo técnicas desenvolvidas após o lançamento do produto.

Segundo os pesquisadores que desenvolveram esta técnica, este tipo de solução é possível porque a grande maioria dos métodos de manipulação digital de rostos, independente do quão diferentes sejam, compartilham uma etapa comum: fazer com que a imagem que está sendo manipulada se mescle com o plano de fundo da foto, de forma a “escondê-la” antes de se inserir digitalmente o que quer que se deseje modificar. Como cada imagem possui algumas marcas distintas aplicadas tanto por dispositivos físicos (como as lentes da câmera) quanto por software (como algoritmos de compressão), essas marcações costumam ser as mesmas ao longo de toda a imagem, então se algum pedaço dela apresentar uma “falha”, torna-se um grande indício de que ela foi alterada de alguma forma.

Quadro mostra como o Face X-Ray é ótimo em indentificar a área modificada em diversos tipos de algoritmos de deepfake (Imagem: Microsoft)

Assim, os desenvolvedores testaram esta tecnologia usando um enorme base de testes, contendo mais de mil clipes de vídeo originais (ou seja, criados especificamente para este fim) que foram manipulados utilizando quatro dos melhores softwares de deepfake, um banco de dados formado por milhares de imagens falsas construídas a partir da junção de fotos reais, uma coleção de milhares de vídeos deepfakes disponibilizados pela Google para que sejam usados no desenvolvimento de aplicativos que detectam manipulação por IA, imagens do Deepfake Detection Challenge (iniciativa do Facebook para o desenvolvimento de ferramentas capazes de detectar deepfakes) e um enorme banco de dados de deepfakes de celebridades, formado por 408 vídeos reais e 795 que foram manipulados digitalmente.

Os resultados mostraram que o Face X-Ray não apenas consegue detectar até mesmo imagens manipuladas que ainda não haviam sido identificadas como por tal por outros programas do tipo, como ainda conseguia indicar de forma bem precisa os lugares da imagem que foram manipulados. A equipe de pesquisadores alerta que, por se basear em um passo específico da criação de falsificações, o método ainda pode não ser aplicável para todos os casos (por exemplo, sistemas que usam rede contraditórias ou que utilizam somente imagens sintéticas na produção ainda não conseguem ser identificados), mas mesmo assim o Face X-Ray é um ótimo primeiro passo na criação de uma forma segura de se identificar quando uma imagem foi manipulada digitalmente.

Fonte: Canaltech

Trending no Canaltech: