Uma técnica batizada de mind-captioning (‘legendagem mental’) desenvolvida por pesquisadores no Japão e nos Estados Unidos permite gerar frases completas com base na atividade cerebral de indivíduos assistindo ou se lembrando de vídeos. A pesquisa foi publicada na revista Science Advances e destacada pelo site da revista Nature.
A ideia central é associar padrões de atividade cerebral a “assinaturas de significado”, representações numéricas derivadas de legendas de mais de 2 mil vídeos. Em seguida, um modelo de linguagem é usado para traduzir essas assinaturas em sentenças compreensíveis. O processo utiliza imagens obtidas por ressonância magnética funcional (fMRI), tecnologia não invasiva capaz de registrar em tempo real as mudanças no fluxo sanguíneo do cérebro, indicativo de atividade neural.
window._taboola = window._taboola || [];
_taboola.push({
mode: ‘organic-thumbs-feed-01-stream’,
container: ‘taboola-mid-article-saiba-mais’,
placement: ‘Mid Article Saiba Mais’,
target_type: ‘mix’
});
Avanço sobre modelos anteriores
Diferentemente de tentativas anteriores, que conseguiam apenas identificar palavras-chave isoladas, o novo sistema consegue reconstruir contextos mais complexos, incluindo ações e cenários. “O modelo prevê o que uma pessoa está vendo com muitos detalhes”, afirmou Alex Huth, neurocientista da Universidade da Califórnia, Berkeley.
O sistema passou por duas fases de treinamento. Primeiro, analisou vídeos e suas legendas para construir um banco de dados com os significados atribuídos a cada cena. Em seguida, associou esses significados à atividade cerebral de seis voluntários enquanto assistiam aos vídeos. Depois, ao receber um novo exame de ressonância, o sistema era capaz de identificar a assinatura semântica correspondente e, com a ajuda de um gerador de texto, criar uma frase descritiva.
Em um dos exemplos descritos, um voluntário assistiu a uma gravação de uma pessoa saltando de uma cachoeira. Com base somente em sua atividade cerebral, o sistema gerou frases cada vez mais precisas, chegando a “uma pessoa salta sobre uma cachoeira profunda em uma crista de montanha”, após cem tentativas.
A precisão do método também foi testada em momentos de recordação. Os participantes foram convidados a relembrar cenas vistas anteriormente, e os modelos de IA conseguiram gerar descrições semelhantes, sugerindo que o cérebro mantém uma representação comum tanto na observação quanto na memória.
Aplicações e limites éticos
O estudo abre caminhos para melhorar interfaces cérebro-computador voltadas a pessoas com dificuldades de comunicação, mas também levanta questões importantes sobre privacidade mental. Alex Huth alerta que, embora o modelo atual exija consentimento e não consiga acessar pensamentos íntimos ou aleatórios, o avanço contínuo da tecnologia pode exigir regulações mais rigorosas no futuro.
“Se pudermos fazer isso com sistemas artificiais, talvez possamos ajudar pessoas com dificuldades de comunicação”, afirmou o cientista, que já havia participado de projeto semelhante em 2023.
–borderColorFollowMe: #4a4a4a;
–textColorFollowMe: #005880;
}






