Esta palavra multiplicou-se de forma exagerada em artigos científicos. E a culpa é da IA - Sem Enrolação

Esta palavra multiplicou-se de forma exagerada em artigos científicos. E a culpa é da IA

Esta palavra multiplicou-se de forma exagerada em artigos científicos. E a culpa é da IA

Continua após a publicidade


A presença de inteligência artificial (IA) na redação de trabalhos académicos é uma realidade crescente e que deixa marcas linguísticas que permitem identificar a sua intervenção. Recentemente, investigadores detetaram padrões de escrita específicos que revelam como os modelos de linguagem estão a moldar o vocabulário científico atual.

artigo cientifico

Continua após a publicidade


O estranho fenómeno da palavra "delve" na literatura académica

A evidência de que existem artigos científicos redigidos por IA já não é uma novidade, mas a escala desta prática continua a surpreender. Ao analisarem milhões de resumos de artigos publicados na base de dados PubMed, um grupo de investigadores descobriu uma tendência peculiar: o uso de determinados termos disparou de forma anómala.

O exemplo mais flagrante é a palavra "delve" (que se pode traduzir como "aprofundar"), cuja frequência de utilização multiplicou-se por 28 entre 2022 e 2024. Este período coincide precisamente com a explosão do ChatGPT e de outros Large Language Models (LLM).

Para além de "delve", outras palavras como "underscore" (sublinhar) ou "showcasing" (expondo) registaram aumentos de 13,8 e 10,7 vezes, respetivamente. É importante notar que estes termos não são substantivos técnicos relacionados com as descobertas científicas, mas sim elementos de estilo.

Trata-se de um vocabulário mais formal, que se tornou uma assinatura característica dos LLM. Embora encontrar uma destas palavras num artigo não signifique obrigatoriamente que este foi gerado por uma IA, o crescimento é tão desproporcional que não pode ser ignorado.

Em comparação, termos como "pandemia", que tiveram um pico natural em 2020, apresentam curvas de crescimento muito menos acentuadas do que o uso atual de "delve".

frequencia palavras artigos cientificos

A influência da Nigéria no treino de IA

Este fenómeno tem uma explicação que reside no processo de refinamento dos modelos de IA. Para que um chatbot responda de forma adequada, é submetido a uma fase de Reinforcement Learning from Humand Feedback (RLHF).

Curiosamente, uma grande parte dos trabalhadores responsáveis por este processo de filtragem e correção reside em países africanos, com especial destaque para a Nigéria. Nestas regiões, o inglês formal e de negócios utiliza frequentemente termos como "delve", "leverage" ou "tapestry".

Embora o volume de feedback humano seja reduzido face aos triliões de dados de treino, o seu impacto é decisivo na definição do tom e da personalidade do modelo.

O treino de modelos de linguagem exige uma mão-de-obra intensiva para o labeling de dados, uma tarefa muitas vezes delegada a trabalhadores em países com economias fragilizadas, como a Nigéria, o Quénia ou a Índia. Estes profissionais enfrentam frequentemente condições de trabalho precárias, com salários muito baixos e horários extensos.

Além disso, a natureza do trabalho obriga-os, por vezes, a analisar conteúdos violentos ou perturbadores para ensinar a IA a evitá-los, muitas vezes sem qualquer tipo de acompanhamento psicológico. Esta realidade invisível é, em última análise, o que molda a forma como as máquinas comunicam connosco hoje em dia.

 

Leia também:

Saiba mais sobre Inteligência Artificial

Publicidade


Sem Enrolação
Sem Enrolação

Conteúdo com dicas de tecnologia rápidas e diretas ao ponto!

Artigos: 1956

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *