No Instituto de Computação da Unicamp, entre cursos de inteligência artificial e desenvolvimento de algoritmos, surgiu uma nova disciplina que poderia soar estranha para os engenheiros mais tradicionais: Feminismo de Dados.
O nome parece saído de um esquete de humor sobre a cultura woke. Mas a professora responsável pela matéria, que mistura tecnologia e teoria social, está longe de ser uma ativista de fachada. Doutora pela UFMG (Universidade Federal de Minas Gerais) e pela Sorbonne, a sergipana Sandra Ávila é uma referência em IA e chegou a receber um prêmio do Google por seus estudos.
O feminismo de dados parte da ideia de que algoritmos não são neutros. Eles sempre envolvem escolhas humanas — desde o jeito como a informação é reunida até como ela será usada depois. E, por isso, podem reproduzir preconceitos e outras distorções automaticamente.
Na prática, é um esforço para garantir que os computadores não reflitam apenas a visão de mundo de quem criou esses sistemas, principalmente dos homens. “Feminismo de dados é sobre poder, sobre quem o tem e quem não o tem. E, no mundo de hoje, dados são poder”, afirmou Sandra em uma entrevista recente ao portal G1.
O fato é que, em poucos anos, esse conceito saiu dos centros de pesquisa e passou a influenciar o vocabulário da indústria de tecnologia, o debate sobre inteligência artificial e até a legislação de países (incluindo o Brasil).
Sem questionamento
O feminismo de dados, obviamente, não nasceu na Unicamp. Seu surgimento, ou popularização, ocorreu nos EUA a partir de 2020, quando as pesquisadoras Catherine D’Ignazio, do MIT (o famoso Instituto de Tecnologia de Massachusetts), e Lauren Klein, da Universidade Emory, publicaram um livro a respeito do tema.
Segundo elas, toda a organização de dados passa por decisões: quem coleta, o que coleta e qual pergunta tem em mente quando coleta. E como as equipes de tecnologia são compostas majoritariamente por homens brancos de países ricos, essas decisões tendem a excluir mulheres, negros e pobres. Ou “invisibilizar” (tornar invisíveis), para usar um termo comum no beabá identitário.
A teoria rapidamente saiu dos departamentos universitários e foi abraçada por big techs como Google, Microsoft e Amazon — que passaram a adotar, talvez por estratégia de imagem, expressões como “IA responsável”, “equidade algorítmica” e “diversidade de dados” em seu dia a dia corporativo.
O conceito também chegou a Brasília. O projeto que pretende regular a inteligência artificial no país, aprovado pelo Senado em 2024, prevê regras para que as empresas expliquem como sistemas automatizados tomam decisões e avaliem possíveis discriminações associadas a fatores como raça e gênero. A responsabilidade, antes atribuída aos códigos, passa para quem gerencia o sistema.
Resumindo: em menos de cinco anos, uma teoria saiu de um livro e entrou nas salas de aula, nas regulações federais e na linguagem oficial das maiores corporações de tecnologia do mundo. Sem muito barulho nem debate público. Quase sem discordância ou questionamento.
Agenda política
Os entusiastas do feminismo de dados gostam de usar o termo privilege hazard, ou “risco de privilégio” — a ideia de que quem está no centro do poder não vê os problemas dos menos favorecidos. E realmente há casos documentados que sustentam, pelo menos em parte, essa tese.
Em 2018, a Amazon tirou do ar um sistema que ajudava a selecionar currículos porque ele tinha “aprendido”, sozinho, a dar notas mais baixas para candidatas mulheres. Isso aconteceu porque a IA foi treinada com registros de contratações antigas, quando o quadro da empresa era composto principalmente por homens.
Naquele mesmo ano, uma auditoria do MIT mostrou que programas de reconhecimento facial da IBM e da Microsoft erravam muito mais ao identificar mulheres de pele escura. Em alguns casos, a taxa de erro passava de 34%, enquanto para homens de pele clara ficava abaixo de 1%.
O caso que levou Sandra Ávila a se aprofundar nesse tema foi parecido com os anteriores: algoritmos usados para diagnosticar câncer de pele tinham desempenho pior em peles negras.
Segundo ela, isso não se resolve só com mais imagens e dados. As características das lesões podem mudar de acordo com o tipo de pele, o que exige olhar a questão de formas diferentes, e não apenas aumentar o volume de informação disponível.
A pesquisadora ainda destaca que muitas pesquisas acabam mostrando apenas um número geral de acerto, sem separar para quem o sistema funciona bem e para quem ele falha. Isso pode esconder diferenças importantes entre grupos distintos de pacientes.
Até aí são problemas reais, com causas identificáveis. O perigo está no que vem depois — quando a correção do sistema vira agenda política.
Guinada ideológica
Para os críticos, o feminismo de dados vai além de ajustar bases de informação. A proposta é mais ampla: incorporar a ideia de “justiça social” já na fase de construção dos sistemas, antes mesmo de qualquer análise técnica começar.
Isso abre espaço para que ativistas, grupos afetados e pesquisadores sociais participem das decisões sobre como os algoritmos devem ser desenhados. A própria Sandra Ávila resume esse raciocínio quando diz que é preciso “incluir as pessoas minorizadas para que elas tragam seus saberes e conhecimentos para desenvolver de outra forma”.
É aqui que o debate sai da programação e entra no terreno da política. Quem decide as regras que as máquinas devem seguir? O que é, afinal, um algoritmo justo?
Essa guinada ideológica preocupa parte da comunidade acadêmica e técnica. E levanta uma pergunta: quando a ciência de dados abraça uma causa, quem garante que ela ainda está descrevendo o mundo — e não tentando mudá-lo?
Faltam regras claras
Para os estudiosos mais cautelosos, o feminismo de dados corre o risco de ser uma teoria cheia de boas intenções, mas com dificuldade de sair do papel.
Um dos maiores problemas apontados é a falta de regras claras. Se a ideia é incluir todo mundo nas decisões, como isso funcionaria dentro de um sistema de computador?
Para Rafaela Weber Mallmann, pesquisadora do projeto Understanding Artificial Intelligence, vinculado à USP, essa visão pode acabar ficando apenas no mundo das ideias. “Há uma abstração que limita a aplicação prática. O que aparenta uma falta de dimensão normativa que seja possível de ser aplicada como modelos de avaliação, critérios de auditoria ou diretrizes para implementação em políticas públicas”, diz.
Traduzindo: é muito difícil transformar um discurso sobre “justiça” numa ferramenta real que um engenheiro possa usar para testar se um sistema está funcionando direito ou não.
Existe ainda o risco de a ciência virar militância disfarçada. Alberto Cairo, professor da Universidade de Miami e uma das maiores autoridades no uso de gráficos e informações visuais, questiona se o uso de emoção e causas políticas não pode manipular os dados para que eles digam apenas o que o autor quer ouvir.
Ao estudar um projeto que usava essa lógica, Cairo perguntou: “Fica claro para o público em geral que o que eles veem é o trabalho de profissionais que moldam ativamente os dados para apoiar uma causa, e não o produto de processos automatizados?”.
Máquina de classificar
Por fim, há quem lembre que classificar e separar as coisas em categorias não é necessariamente um exercício de poder, mas o modo como nossa mente funciona por natureza.
“O ser humano já tem esse problema do preconceito. A gente nasceu com uma máquina classificadora desde pequeno. E isso a IA também faz”, diz Fernando Osório, pesquisador de inteligência artificial no Instituto de Ciências Matemáticas e de Computação da USP.
No fundo, o debate sobre feminismo de dados trata menos dos algoritmos e mais de quem decide os valores que são levados para dentro das máquinas. Essa é uma decisão importante demais para ser tomada apenas em laboratórios, salas de aula, gabinetes de Brasília e escritórios de big techs.
A reportagem da Gazeta do Povo procurou a professora Sandra Ávila para uma entrevista. Ela retornou o contato inicial e manifestou interesse em colaborar por escrito, mas não respondeu às perguntas enviadas até a conclusão deste texto.
