Inteligência artificial
Tecnologia Brain-to-Voice ajuda homem paralítico a falar fluentemente

Uma equipe de engenheiros da University of California, Davis, criou um sistema brain-to-voice que permite que indivíduos com transtornos de comunicação falem fluentemente. O sistema combina uma interface cérebro-computador (BCI), IA avançada e novas pesquisas para suportar fala em tempo real, inteligível e expressiva. Ouça o que você precisa saber.
O que são Transtornos de Comunicação?
Quando você pensa no que o define, pode ser seu estilo ou perspectiva. Poucas pessoas diriam que sua voz. No entanto, toda vez que você fala, ouve sua própria voz, reafirmando que é você. Consequentemente, sua voz é uma parte vital da sua identidade. Perder essa parte de si mesmo pode ser prejudicial à sua saúde mental.
Infelizmente, esse cenário é a realidade de milhões que sofrem de condições neurológicas que podem limitar sua capacidade de falar fluentemente. Condições como AVC, disartria e disfonia podem levar a fala arrastada ou incoerente, limitando a capacidade de comunicação eficaz da pessoa.
Esse cenário não é raro. De acordo com estudos recentes, cerca de 800.000 pessoas sofrerão um AVC este ano. Os mesmos dados sugerem que 1 em cada 3 vítimas de AVC experimentará algum tipo de problema de comunicação após o evento. Essas doenças são devastadoras para o paciente e podem resultar em depressão e outras condições nocivas.
Como as Interfaces Cérebro-Computador (BCIs) Ajudam na Comunicação
Afortunadamente, engenheiros têm se dedicado intensamente a tentar resolver esses problemas. Desde computadores controlados pela respiração até softwares de rastreamento ocular, a tecnologia tem oferecido algumas soluções. Nesse contexto, as interfaces cérebro-computador são vistas por muitos como a evolução lógica dessa tecnologia.
Desde que Hans Berger registrou a atividade elétrica cerebral na década de 1920, os cientistas têm tentado usar esses sinais para entender a funcionalidade do cérebro. No entanto, foram necessários quase 80 anos de pesquisa antes que eles conseguissem começar a decodificar disparos neuronais para reproduzir imagens e movimentos.
Hoje, as BCIs são vistas como uma tecnologia emergente com aplicações em realidade virtual, automação, gerenciamento de sistemas e setores médicos. Especificamente, o setor médico tem usado esses dispositivos para ajudar aqueles que sofrem de distúrbios de mobilidade ou comunicação.
Curiosamente, as primeiras BCIs permitiram melhor comunicação entre pacientes e seus entes queridos. Esses sistemas iniciais dependiam de uma exibição de texto para comunicar. Mais tarde, o sistema de texto foi atualizado para ler as palavras em voz alta, criando respostas faladas. Embora as respostas audíveis fossem úteis, elas careciam de qualquer sensação humana.
Limitações dos Sistemas Tradicionais de Fala com BCI
Vários fatores limitantes têm atrapalhado o sucesso das BCIs até agora. Primeiro, o método de comunicação por texto não é natural. É desajeitado, e o timing está fora em comparação com a fala direta com outra pessoa.
Os tempos de resposta atrasados da funcionalidade de fala e sua voz robótica também afastam o usuário da sensação de ter uma conversa normal com amigos. Aspectos vitais como a capacidade de ouvir sua própria voz, intervir ou até mesmo articular palavras estavam ausentes nessa abordagem.
Estudo Brain-to-Voice
Afortunadamente, uma equipe de cientistas pode ter descoberto como resolver esses problemas após décadas de pesquisa. O recente estudo “An instantaneous voice-synthesis neuroprosthesis”1 apresenta uma nova neuroprótese brain-to-voice que pode traduzir instantaneamente a atividade cerebral em fala. Embora ainda esteja em estágios iniciais, tem potencial para melhorar milhões de vidas globalmente.
Como seus predecessores, o dispositivo permite que os usuários “falem” através de um computador. No entanto, essa abordagem depende de sensores implantados cirurgicamente nas áreas de Broca e Wernicke do cérebro. Essas são as regiões responsáveis pela produção da fala.

Fonte – University of California
Especificamente, quatro arrays de microeletrodos contendo 256 microeletrodos permitem que os engenheiros mapeiem a atividade neural para sons pretendidos. Notavelmente, o sistema pode decodificar características paralinguísticas ao decifrar a atividade intracortical com menos de um segundo de atraso.
Algoritmos de IA Usados no Sistema Brain-to-Voice
Os engenheiros utilizaram dados coletados de um sujeito de teste para criar um conjunto de dados para seu algoritmo proprietário de IA. Os sujeitos de teste foram mostrados frases que tentaram ler em voz alta. Essa etapa permitiu à equipe mapear sua atividade neural e usá-la para criar um loop fechado para síntese de voz.
Impressionantemente, o algoritmo pode detectar quando uma pessoa está tentando falar e converter automaticamente sua atividade neural em sílabas sem nenhum movimento da parte dela. Essa conversão ocorre de forma contínua, tornando-a muito semelhante ao ritmo de uma conversa tradicional.
Além disso, o sistema de feedback auditivo em loop fechado permite que o protocolo sintetize a voz do usuário, permitindo que ele ouça sua fala como em uma conversa real. O sistema sintetiza esses padrões vocais, possibilitando controle total sobre a cadência e o timing do paciente.
Teste Brain-to-Voice
A fase de testes desse experimento começou com a busca de um paciente adequado. A equipe localizou um homem que sofre de ELA (esclerose lateral amiotrófica), também chamada de doença de Lou Gehrig nos EUA. Essa doença devastadora leva à degeneração dos nervos ao redor da medula espinhal e do cérebro. Quem sofre de ELA pode perder a capacidade de falar com precisão à medida que perde o controle sobre os músculos faciais.
O paciente selecionado para o estudo sofre de ELA e disartria severa. Após implantar os sensores e programar o algoritmo de IA, o paciente foi solicitado a ler frases em voz alta. Essa técnica permitiu aos engenheiros registrar sua atividade cerebral.
Uma vez calibrado, o protótipo sintetiza instantaneamente sua voz, permitindo que ele se comunique em tempo real. O paciente conseguiu até conversar com sua família, mudar a entonação durante as conversas para destacar seus pontos. Impressionantemente, o sujeito de teste também cantou curtas melodias.
Resultados do Teste Brain-to-Voice
Os resultados demonstram que o sistema brain-to-voice é eficaz. Ele sintetizou com precisão a voz e os padrões de fala do paciente com alto nível de acurácia. Especificamente, o sistema entrega 60% de acurácia, comparado a apenas 4% quando a máquina não é utilizada.
Os engenheiros observaram que o paciente pôde alterar e modular sua voz sintetizada pela BCI em tempo real. Eles registraram o processo concluído em 1/14 de segundo, que é aproximadamente o mesmo tempo de qualquer atraso conversacional normal. Também notaram situações em que o paciente alterou sua voz para indicar que havia feito uma pergunta.
Interessantemente, a tecnologia não está limitada ao vocabulário atual do paciente. A equipe documentou várias ocasiões em que o paciente aprendeu novas palavras e o sistema as pronunciou corretamente. Esses dados demonstram as capacidades dessa abordagem para lidar com distúrbios de fala.
Benefícios do Brain-to-Voice
Existem muitos benefícios que a tecnologia brain-to-voice traz ao mercado. Primeiro, ela oferece uma maneira confiável e natural para aqueles que sofrem de paralisia e outras doenças que alteram a vida recuperar parte de uma rotina diária normal.
O protocolo pode fornecer respostas de fala instantaneamente. O trato vocal digital suporta vocais únicos dos pacientes e pode responder sem atraso detectável. As respostas têm se mostrado precisas e podem ser criadas usando apenas dados de sinais neurais.
Uma Nova Era para Pacientes com Transtornos de Comunicação
Um dos maiores benefícios dessa tecnologia é que permitirá que aqueles que sofrem de problemas de comunicação finalmente compartilhem sua história de forma relacionável. Essa tecnologia permitirá que usuários de neuropróteses participem da conversa e façam sua parte para ajudar outros com questões semelhantes.
Aplicações no Mundo Real e Cronograma para a Tecnologia Brain-to-Voice
Existe uma longa lista de aplicações para a tecnologia brain-to-office computer. Os computadores existem há muito tempo e, apesar de quase todos os aspectos tecnológicos terem sido atualizados, como gráficos, processamento e hardware, o teclado permanece relativamente intocado.
A introdução de uma interface cérebro-computador investigacional confiável muda o jogo. Ela abre a porta para interação perfeita entre humanos e computadores. Como tal, essa tecnologia pode abrir caminho para tratamentos e tecnologias mais avançados.
Cronograma Brain-to-Voice
Não há cronograma definido pelos pesquisadores. No entanto, dado o estado crítico daqueles que sofrem dessas doenças, é possível que essa tecnologia chegue ao mercado nos próximos 5‑10 anos. Muito mais pesquisa será necessária sobre os efeitos a longo prazo do implante antes de receber aprovação dos reguladores.
Pesquisadores do Brain-to-Voice
O estudo brain-to-voice foi liderado por pesquisadores da University of California. Especificamente, o artigo lista Maitreyee Wairagkar, Nicholas S. Card, Tyler Singer-Clark, Xianda Hou, Carrina Iacobacci, Lee M. Miller, Leigh R. Hochberg, David M. Brandman e Sergey D. Stavisky como principais colaboradores do projeto.
Futuro do Brain-to-Voice
De acordo com os engenheiros, ainda há muito trabalho a ser feito no sistema brain-to-voice. Eles esperam expandir os testes para incluir mais pacientes nos próximos meses. Também desejam incluir pacientes que sofrem de uma ampla variedade de distúrbios. Quem quiser participar do estudo pode contatar [email protected] para verificar se se qualifica.
Investindo no Setor de IA na Saúde
Os países de inteligência artificial desempenham um papel crescente na saúde e nos tratamentos. Esse sistema pode ajudar provedores de saúde a determinar doenças mais rapidamente, tratá‑las de forma mais eficaz e até descobrir as causas raízes de distúrbios traumáticos. Hoje, há vários players no cenário de IA na saúde. Aqui está uma empresa que conseguiu criar um nicho no mercado.
SoundHound AI, Inc.
A SoundHound AI, com sede em Santa Clara, Califórnia (SOUN ), teve uma jornada interessante desde seu lançamento como o aplicativo de identificação musical Midomi, até se tornar um dos nomes mais respeitados em interfaces conversacionais de IA.
A jornada da empresa começou em 2005 depois que Keyvan Mohajer começou a trabalhar com protocolos avançados de reconhecimento de áudio. Em 2015, a empresa mudou seu nome para SoundHound e transferiu seu foco para sua plataforma proprietária de IA de voz.
(SOUN )
Esse protocolo expandiu as capacidades de reconhecimento de fala por IA e foi projetado usando tecnologias de Deep Meaning Understanding. Hoje, a SoundHound é um fornecedor líder de sistemas de análise de fala por IA que detém mais de 250 patentes e pode suportar mais de 20 idiomas internacionais.
Últimas Notícias e Desenvolvimentos das Ações da SoundHound AI (SOUN)
Tecnologia Brain-to-Voice – O Futuro é Fluido
Ao examinar as vantagens tecnológicas que o estudo Brain-to-voice trouxe ao mercado, fica fácil entender por que muitos o consideram um marco importante no setor médico. No futuro, você poderá controlar robôs, veículos e outros aspectos vitais da sua vida usando uma BCI.
Este estudo mais recente destaca como essa tecnologia pode melhorar a vida de muitas pessoas. Como tal, os pesquisadores merecem uma ovação de pé por seus esforços.
Saiba mais sobre outras inovações impressionantes na área da saúde aqui.
Estudos Referenciados:
1. Wairagkar, M., Card, N.S., Singer-Clark, T. et al. An instantaneous voice-synthesis neuroprosthesis. Nature (2025). https://doi.org/10.1038/s41586-025-09127-3












