22 março, 2008

O estilo é o sexo

Uma equipe de pesquisadores concebeu um algoritmo que tem a propriedade de predizer, com 80 por cento de acerto, qual é o sexo do autor de um texto. Para chegar a esse algoritmo, a equipe fez a análise computadorizada de cerca de 600 documentos publicados e encontrou que determinadas palavras, nesses documentos, eram empregadas com diferentes freqüências conforme os sexos de seus autores. Identificadas essas palavras-chave, foi a seguir construído o algoritmo, que é aplicável apenas na língua inglesa.
O "Gender Genie", que funciona com uma versão simplificada do sistema, permite que o leitor faça também seus testes. Como o que eu fiz ao inserir, no box disponibilizado pelo Bookblog, o abstract (resumo) de um documento publicado. Por sinal, o resumo do artigo que descreve a criação do algoritmo e que foi escrito por Shlomo Argamon do "Instituto de Tecnologia de Illinois", Estados Unidos, e colaboradores da "Universidade de Bar-Ilan", Israel.


Com o escore 266 x 40, deu que Shlomo Argamon escreve feito homem.

Nenhum comentário: