Pesquisadores da Universidade de Copenhague e dos Estados Unidos analisaram 3,5 milhões de livros em inglês utilizando Machine Learning (aprendizado de máquina) e descobriram que "Justo", "racional" e "corajoso" são alguns adjetivos usados para descrever os homens enquanto "adorável" e "bonita" são comumente usado para descrever mulheres.
"Podemos ver que as palavras usadas para as mulheres se referem muito mais às suas aparências do que as usadas para descrever os homens. Assim, conseguimos confirmar uma percepção generalizada ao nível estatístico", diz Isabelle Augenstein do Departamento de Ciência da Computação da Universidade de Copenhague.
Eles descobriram que verbos negativos relacionados ao corpo e aparência são usados cinco vezes mais para mulheres do que para homens. As análises também demonstraram que adjetivos positivos e neutros em relação ao corpo e à aparência ocorrem cerca de duas vezes mais nas descrições de mulheres, enquanto os homens são mais frequentemente descritos usando adjetivos que se referem a suas qualidades e comportamento pessoais.
Os linguistas costumavam examinar a prevalência da linguagem e do viés de gênero, usando pequenos conjuntos de dados. Hoje, porém, os cientistas são capazes de usar algoritmos para analisar vastos conjuntos de dados - 11 bilhões de palavras neste caso.
Velhos estereótipos de gênero
Os livros publicados a décadas atrás ainda desempenham um papel importante. Os dados na forma de texto alimentam os algoritmos usados para criar programas e aplicativos que podem entender a linguagem humana. Essa é a tecnologia que permite que os smartphones reconheçam nossas vozes, que o Google forneça sugestões de palavras-chave e muito mais.
"Se a linguagem que usamos para descrever homens e mulheres for diferente, nas recomendações dos candidatos, por exemplo, influenciará quem recebe uma proposta quando as empresas usam sistemas de TI para classificar os pedidos de emprego", diz Isabelle Augenstein.
É importante estar ciente da linguagem de gênero à medida que a inteligência artificial e a tecnologia da linguagem se tornam mais proeminentes.
Augenstein prossegue: "Podemos tentar levar isso em consideração ao desenvolver modelos de aprendizado de máquina usando texto menos tendencioso ou forçando os modelos a ignorar ou neutralizar o viés. Todos os três são possíveis. "
Lista dos 11 principais adjetivos que ocorrem com mais frequência, distribuídos em categorias.
University of Copenhagen
Fonte:
Comments