Typos: a ferramenta anti-troll da Alphabet que ainda precisa de melhorar

Quem é que já não ouviu, ou leu até, “Não leia os comentários”? Pode parecer estranho, mas na Internet, esta frase é uma regra fundamental. Isto tem uma razão muito simples, porque normalmente, na maioria das vezes, o campo de comentários são focos de abuso, com uma linguagem considerada mesmo tóxica e, muitas vezes, sem sentido.

Tendo isto como mote, a Jigsaw, uma subsidiaria da Alphabet, está a trabalhar no combate a este problema, através de um projecto chamado Perspective. É uma API que utiliza a aprendizagem das máquinas para detectar o assédio online, mas, ao que parece, os pesquisadores têm vindo a descobrir que é fácil de dar a volta ao sistema.

A API atribui uma pontuação de toxicidade aos comentários com base no impacto que eles podem ter numa conversa. Por exemplo, se escrever “É estúpido e errado”, a Perspective pode classifica-la com 89 por cento como sendo tóxica. Mas os pesquisadores do Laboratório de Segurança de Redes da Universidade de Washington descobriram que conseguiam enganar a API, de modo a esta vir a diminuir consistentemente a pontuação de toxicidade, bastando para isso, modificar subtilmente as frases. Como por exemplo, adicionaram erros ortográficos de propósito (iidiota em vez de idiota), para além de inserirem pontuação nas palavras (“stu.pid” ou “s c r e w”).

Para além disto, também descobriram que uma frase benigna como “Não é estúpido e errado” teve uma pontuação quase tão alta como a abusiva.

A ideia é boa, o conceito está lá, só falta conseguirem fazer com que não seja enganada e faça realmente frente aos verdadeiros comentários abusivos que são um verdadeiro flagelo nos dias de hoje.

Fonte: Engadget

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui