0

Assistentes de voz têm diferenças raciais, dizem pesquisadores

Segundo estudo publicado nesta semana, sistemas de reconhecimento de fala das gigantes de tecnologia entendem pior o que os negros dizem

26 mar 2020
05h11
  • separator
  • 0
  • comentários

Com um iPhone, você pode ditar uma mensagem de texto. Com a Alexa da Amazon na mesinha de centro, você pode pedir para ela tocar uma música do outro lado da sala. Mas esses dispositivos podem entender algumas vozes melhor do que outras. Os sistemas de reconhecimento de fala de cinco das maiores empresas de tecnologia do mundo - Amazon, Apple, Google, IBM e Microsoft - cometem muito menos erros com usuários brancos do que com negros, segundo um estudo publicado na segunda-feira, 23, na revista Proceedings da Academia Nacional de Ciências dos Estados Unidos.

Os sistemas se equivocaram na identificação de palavras em cerca de 19% das vezes com pessoas brancas. Com as negras, os erros saltaram para 35%. Cerca de 2% dos trechos de áudio de pessoas brancas foram considerados incompreensíveis por esses sistemas, de acordo com o estudo realizado por pesquisadores da Universidade Stanford. O número aumentou para 20% no caso dos negros.

O estudo, que adotou uma abordagem bastante abrangente para medir o viés nos sistemas de reconhecimento de fala, faz mais um sinal de alerta diante do rápido avanço das tecnologias de inteligência artificial (IA) para a vida cotidiana.

Outros estudos mostraram que, conforme os sistemas de reconhecimento facial entram nos departamentos de polícia e em outras agências governamentais, eles podem ser muito menos precisos na tentativa de identificação de mulheres e não-brancos. Testes revelaram comportamentos racistas e sexistas em chatbots, serviços de tradução e outros sistemas projetados para processar e imitar a linguagem escrita e a falada.

"Não entendo por que essas empresas não procedem com a devida diligência antes de lançar essas tecnologias", disse Ravi Shroff, professor de estatística da Universidade de Nova York que estuda preconceitos e discriminações nas novas tecnologias. "Não entendo por que continuamos vendo esses problemas".

Todos esses sistemas aprendem analisando grandes quantidades de dados. Os sistemas de reconhecimento facial, por exemplo, aprendem identificando padrões em milhares de imagens digitais de rostos.

Em muitos casos, os sistemas imitam os vieses encontrados dos dados, assim como as crianças adotam os maus hábitos dos pais. Os robôs de conversa, por exemplo, aprendem analisando diálogos humanos. Se esses diálogos associam mulheres a tarefas domésticas e homens a cargos de diretoria, os chatbots farão o mesmo.

Falta diversidade nas empresas, aponta estudo

O estudo de Stanford indicou que os principais sistemas de reconhecimento de fala podem ter falhas porque as empresas estão treinando a tecnologia com dados que não são tão diversos quanto deveriam - aprendendo principalmente com pessoas brancas e relativamente poucas pessoas negras.

"As cinco maiores empresas que fazem reconhecimento de fala estão cometendo o mesmo tipo de erro", disse John Rickford, um dos pesquisadores de Stanford por trás do estudo, especialista em fala afro-americana. "O pressuposto é que todos os grupos étnicos estão bem representados nessas empresas. Mas não estão".

O estudo testou cinco ferramentas disponíveis ao público - Apple, Amazon, Google, IBM e Microsoft - que qualquer pessoa pode usar para acessar serviços de reconhecimento de fala. Essas ferramentas não são necessariamente o que a Apple usa para criar a Siri ou que a Amazon usa para criar a Alexa. Mas podem compartilhar tecnologias e práticas subjacentes a serviços como a Siri e a Alexa.

Cada ferramenta foi testada no ano passado, entre o final de maio e o início de junho, e pode estar operando de maneira diferente agora. O estudo também aponta que, quando as ferramentas foram testadas, a ferramenta da Apple estava configurada de forma diferente das outras e exigiu uma engenharia adicional para ser testada.

Apple e Microsoft se recusaram a comentar o estudo. Uma porta-voz da Amazon apontou para uma página da web em que a empresa diz que está constantemente aprimorando seus serviços de reconhecimento de fala. A IBM não respondeu aos pedidos de comentário.

Justin Burr, porta-voz do Google, disse que a empresa estava comprometida em melhorar a ferramenta. "Há muitos anos estamos trabalhando no desafio de reconhecer com precisão as variações de fala - e continuaremos trabalhando", disse ele.

Os pesquisadores usaram esses sistemas para transcrever entrevistas com 42 pessoas brancas e 73 negras. Em seguida, compararam os resultados de cada grupo, revelando uma taxa de erro significativamente maior com as pessoas negras.

O sistema com melhor desempenho, o da Microsoft, errou na identificação de cerca de 15% das palavras dos brancos e de 27% das dos negros. O sistema da Apple, que apresentou o pior desempenho, falhou em 23% das vezes com as pessoas brancas e em 45% com as negras.

Moradores de uma comunidade rural majoritariamente afro-americana no leste da Carolina do Norte, de uma cidade de médio porte no oeste do estado de Nova York e da capital, Washington, os negros testados falaram aquilo que os linguistas chamam de inglês vernacular afro-americano - uma variedade do inglês falada por muitos afro-americanos em áreas urbanas e outras regiões dos Estados Unidos. Os brancos eram da Califórnia, alguns da capital do estado, Sacramento, e outros de uma área rural e majoritariamente branca, a cerca de 480 quilômetros de distância.

O estudo constatou que a "diferença de raça" era igualmente grande quando se comparavam frases idênticas proferidas por pessoas negras e brancas. Isso indica que o problema está na maneira como os sistemas são treinados para reconhecer o som. As empresas, ao que parece, não estão treinando as máquinas com dados suficientes que representam o inglês vernacular afro-americano, segundo os pesquisadores.

"Os resultados não são de apenas uma empresa específica", disse Sharad Goel, professor de engenharia em Stanford e pesquisador envolvido no estudo. "Vimos padrões qualitativamente semelhantes em todas as cinco empresas".

As empresas estão cientes do problema. Em 2014, por exemplo, os pesquisadores do Google publicaram um artigo descrevendo o viés em uma geração anterior de tecnologia de reconhecimento de fala.

Empresas como o Google podem ter problemas para coletar os dados corretos e podem não ter motivação o bastante para coletá-los. "É difícil consertar uma coisa dessas", disse Brendan O'Connor, professor da Universidade de Massachusetts Amherst, especialista em tecnologias de IA. "É difícil coletar esses dados. É uma batalha árdua". / TRADUÇÃO DE RENATO PRELORENTZOU

Veja também:

Estadão
  • separator
  • 0
  • comentários
publicidade