Kecerdasan buatan
Teknologi Brain-to-Voice Membantu Pria Lumpuh Berbicara dengan Lancar

Sebuah tim insinyur dari University of California, Davis, telah menciptakan sistem brain-to-voice yang memungkinkan individu yang menderita gangguan komunikasi untuk berbicara dengan lancar. Sistem ini menggabungkan antarmuka otak-komputer (BCI), AI canggih, dan penelitian baru untuk mendukung percakapan real-time, dapat dipahami, dan ekspresif. Dengar apa yang perlu Anda ketahui.
Apa Itu Gangguan Komunikasi?
Ketika Anda memikirkan apa yang mendefinisikan diri Anda, mungkin itu adalah gaya atau perspektif Anda. Sedikit orang yang akan menyebut suara mereka. Namun, setiap kali Anda berbicara, Anda mendengar suara Anda, menegaskan bahwa itu adalah Anda. Oleh karena itu, suara Anda merupakan bagian penting dari identitas Anda. Kehilangan bagian ini dapat berdampak buruk pada kesehatan mental Anda.
Sayangnya, skenario ini adalah kenyataan bagi jutaan orang yang menderita kondisi neurologis yang dapat membatasi kemampuan mereka berbicara dengan lancar. Kondisi seperti stroke, disartria, dan disfonia dapat menyebabkan bicara yang cadel atau tidak koheren, membatasi kemampuan seseorang untuk berkomunikasi secara efektif ke depannya.
Situasi ini bukanlah kejadian langka. Menurut studi, hampir 800.000 orang akan mengalami stroke tahun ini. Data yang sama menunjukkan bahwa 1 dari setiap 3 korban stroke akan mengalami beberapa bentuk masalah komunikasi setelah kejadian tersebut. Penyakit ini menghancurkan pasien dan dapat menyebabkan depresi serta kondisi berbahaya lainnya.
Bagaimana Antarmuka Otak-Komputer (BCI) Membantu Komunikasi
Untungnya, para insinyur telah mengerahkan banyak upaya untuk membantu menyelesaikan masalah ini. Dari komputer yang dikendalikan oleh napas hingga perangkat lunak pelacakan mata, teknologi tampaknya memberikan beberapa solusi. Dalam konteks ini, antarmuka otak-komputer dianggap oleh banyak orang sebagai evolusi logis dari teknologi tersebut.
Sejak Hans Berger merekam aktivitas listrik otak pada tahun 1920-an, para ilmuwan telah berusaha menggunakan sinyal tersebut untuk mengintip fungsi otak. Namun, dibutuhkan hampir 80 tahun penelitian sebelum mereka dapat mulai mendekode tembakan neuron untuk mereproduksi gambar dan gerakan.
Saat ini, BCI dipandang sebagai teknologi yang sedang berkembang dengan aplikasi di VR, otomasi, manajemen sistem, dan sektor medis. Secara khusus, sektor medis telah menggunakan perangkat ini untuk membantu mereka yang menderita gangguan mobilitas atau komunikasi.
Menariknya, BCI pertama memungkinkan komunikasi yang lebih baik antara pasien dan orang terdekat mereka. Sistem awal ini mengandalkan tampilan teks untuk berkomunikasi. Kemudian, sistem teks tersebut diperbarui untuk membaca kata-kata secara keras, menghasilkan respons suara. Meskipun respons suara tersebut membantu, mereka tidak memiliki nuansa manusia.
Keterbatasan Sistem Bicara BCI Tradisional
Beberapa faktor pembatas telah mengurangi keberhasilan BCI hingga saat ini. Pertama, metode komunikasi teks tidak alami. Metode ini terasa canggung, dan timingnya tidak sinkron dibandingkan berbicara langsung dengan seseorang.
Waktu respons yang tertunda pada fitur bicara dan suara robotiknya juga memisahkan pengguna dari perasaan memiliki percakapan normal dengan teman. Aspek penting seperti kemampuan mendengar suara Anda sendiri, menyela, atau bahkan mengucapkan kata dengan jelas tidak ada dalam pendekatan ini.
Studi Brain-to-Voice
Untungnya, tim ilmuwan mungkin telah menemukan cara mengatasi masalah ini setelah puluhan tahun penelitian. Studi terbaru “Neuroprostesis Sintesis Suara Instan“1 memperkenalkan neuroprostesis brain-to-voice baru yang dapat secara instan menerjemahkan aktivitas otak menjadi ucapan. Meskipun masih dalam tahap awal, teknologi ini berpotensi meningkatkan jutaan kehidupan secara global.
Seperti pendahulunya, perangkat ini memungkinkan pengguna untuk “berbicara” melalui komputer. Namun, pendekatan ini mengandalkan sensor yang ditanam secara bedah ke area Broca dan Wernicke otak. Kedua wilayah ini bertanggung jawab atas produksi bicara.

Sumber – University of California
Secara khusus, empat array mikroelektroda yang berisi 256 mikroelektroda memungkinkan insinyur memetakan aktivitas neural ke suara yang diinginkan. Secara signifikan, sistem ini dapat mendekode fitur paralinguistik dengan menguraikan aktivitas intrakortikal dalam waktu kurang dari satu detik.
Algoritma AI yang Digunakan dalam Sistem Brain-to-Voice
Para insinyur menggunakan data yang dikumpulkan dari subjek uji untuk membuat set data bagi algoritma AI proprietari mereka. Subjek uji ditampilkan kalimat yang mereka coba bacakan dengan keras. Langkah ini memungkinkan tim memetakan aktivitas neural mereka dan menggunakannya untuk membuat loop tertutup bagi sintesis suara.
Secara mengesankan, algoritma dapat mendeteksi ketika seseorang berusaha berbicara dan secara otomatis mengubah aktivitas neural mereka menjadi suku kata tanpa gerakan apa pun. Konversi ini terjadi mulus, sangat mirip dengan tempo percakapan tradisional.
Selain itu, sistem umpan balik audio loop tertutup memungkinkan protokol mensintesis suara pengguna, sehingga mereka dapat mendengar ucapan mereka seperti dalam percakapan nyata. Sistem ini mensintesis pola suara tersebut, memberikan kontrol penuh atas irama dan timing pasien.
Uji Brain-to-Voice
Fase pengujian eksperimen tersebut dimulai dengan menemukan pasien yang cocok. Tim menemukan seorang pria yang menderita ALS (amyotrophic lateral sclerosis), yang juga disebut penyakit Lou Gehrig di AS. Penyakit menghancurkan ini menyebabkan degenerasi saraf di sekitar sumsum tulang belakang dan otak. Penderita ALS dapat kehilangan kemampuan berbicara secara akurat karena kehilangan kontrol atas otot wajah mereka.
Pasien yang dipilih untuk studi ini menderita ALS dan disartria parah. Setelah menanamkan sensor dan memprogram algoritma AI, pasien diminta membaca kalimat dengan keras. Teknik ini memungkinkan insinyur merekam aktivitas otaknya.
Setelah dikalibrasi, prototipe secara instan mensintesis suaranya, memungkinkan dia berkomunikasi secara real-time. Pasien bahkan dapat berkomunikasi dengan keluarganya, mengubah intonasi selama percakapan untuk menekankan poinnya. Secara mengesankan, subjek uji bahkan menyanyikan melodi pendek.
Hasil Uji Brain-to-Voice
Hasil uji menunjukkan bahwa sistem brain-to-voice efektif. Sistem ini mensintesis suara dan pola bicara pasien dengan tingkat akurasi tinggi. Secara khusus, sistem memberikan akurasi 60%, dibandingkan hanya 4% tanpa menggunakan mesin.
Para insinyur mencatat bahwa pasien dapat mengubah dan memodulasi suara yang disintesis BCI secara real-time. Mereka merekam proses selesai dalam 1/14 detik, yang kira-kira sama dengan jeda percakapan normal. Mereka juga mencatat contoh di mana pasien mengubah suaranya untuk menunjukkan bahwa mereka mengajukan pertanyaan.
Menariknya, teknologi ini tidak terbatas pada kosakata pasien saat ini. Tim mencatat beberapa contoh di mana pasien diajarkan kata baru dan sistem mengucapkannya dengan benar. Data ini menunjukkan kemampuan pendekatan ini dalam menangani gangguan bicara.
Manfaat Brain-to-Voice
Ada banyak manfaat yang dibawa teknologi brain-to-voice ke pasar. Pertama, teknologi ini menyediakan cara yang andal dan alami bagi mereka yang menderita kelumpuhan dan penyakit mengubah hidup lainnya untuk mendapatkan kembali sebagian semblance kehidupan sehari-hari yang normal.
Protokol ini dapat secara instan memberikan respons bicara. Saluran vokal digital mendukung vokal unik pasien dan dapat merespons tanpa penundaan yang terdeteksi. Respons tersebut terbukti akurat dan dapat dibuat hanya dengan data sinyal neural.
Era Baru bagi Pasien dengan Gangguan Komunikasi
Salah satu manfaat terbesar dari teknologi ini adalah memungkinkan mereka yang menderita gangguan komunikasi akhirnya dapat berbagi cerita mereka secara dapat dipahami. Teknologi ini akan memungkinkan pengguna neuroprostesis berpartisipasi dalam percakapan dan berkontribusi membantu orang lain dengan masalah serupa.
Aplikasi Dunia Nyata dan Garis Waktu untuk Teknologi Brain-to-Voice
Ada daftar panjang aplikasi untuk teknologi komputer brain-to-office. Komputer telah ada sejak lama, dan meskipun hampir semua aspek teknologinya telah diperbarui, seperti grafis yang lebih baik, pemrosesan, dan perangkat keras, keyboard tetap relatif tidak berubah.
Pengenalan antarmuka otak-komputer investigatif yang andal mengubah permainan. Ini membuka pintu untuk interaksi mulus antara manusia dan komputer. Dengan demikian, teknologi ini dapat membuka pintu bagi perawatan dan teknologi yang lebih maju.
Garis Waktu Brain-to-Voice
Belum ada garis waktu yang ditetapkan oleh peneliti. Namun, mengingat kondisi kritis mereka yang menderita penyakit ini, ada kemungkinan teknologi ini dapat masuk pasar dalam 5-10 tahun ke depan. Masih diperlukan banyak penelitian mengenai efek jangka panjang implan sebelum mendapatkan persetujuan regulator.
Peneliti Brain-to-Voice
Studi brain-to-voice dipimpin oleh peneliti di University of California. Secara khusus, makalah tersebut mencantumkan Maitreyee Wairagkar, Nicholas S. Card, Tyler Singer-Clark, Xianda Hou, Carrina Iacobacci, Lee M. Miller, Leigh R. Hochberg, David M. Brandman, dan Sergey D. Stavisky sebagai kontributor utama proyek ini.
Masa Depan Brain-to-Voice
Menurut para insinyur, masih banyak pekerjaan yang harus dilakukan pada sistem brain-to-voice. Mereka berharap dapat memperluas pengujian untuk mencakup lebih banyak pasien dalam beberapa bulan mendatang. Mereka juga ingin melibatkan pasien yang menderita beragam gangguan. Mereka yang ingin berpartisipasi dalam studi dapat menghubungi [email protected] untuk melihat apakah mereka memenuhi syarat.
Berinvestasi di Sektor AI Kesehatan
Kecerdasan buatan memainkan peran yang semakin berkembang dalam perawatan kesehatan dan pengobatan. Sistem ini dapat membantu penyedia layanan kesehatan menentukan penyakit lebih cepat, mengobatinya lebih efektif, bahkan menemukan penyebab utama gangguan traumatis. Saat ini, ada beberapa pemain di arena AI kesehatan. Berikut satu perusahaan yang berhasil menemukan ceruk pasar.
SoundHound AI, Inc.
SoundHound AI yang berbasis di Santa Clara, California (SOUN ) telah menjalani perjalanan menarik sejak peluncurannya sebagai aplikasi identifikasi musik, Midomi, hingga menjadi salah satu nama paling terkemuka dalam antarmuka percakapan AI.
Perjalanan perusahaan dimulai pada tahun 2005 setelah Keyvan Mohajer mulai bekerja dengan protokol pengenalan audio canggih. Pada tahun 2015, perusahaan ini berganti nama menjadi SoundHound dan mengalihkan fokusnya ke platform AI suara proprietari mereka.
(SOUN )
Protokol ini memperluas kemampuan pengenalan suara AI dan dirancang menggunakan teknologi Deep Meaning Understanding. Saat ini, SoundHound menjadi penyedia sistem analisis suara AI terkemuka yang memiliki lebih dari 250 paten dan dapat mendukung lebih dari 20 bahasa internasional.
Berita dan Perkembangan Saham SoundHound AI (SOUN) Terbaru
Teknologi Brain-to-Voice – Masa Depan yang Mulus
Ketika Anda meneliti keunggulan teknologi yang diperkenalkan oleh studi Brain-to-voice ke pasar, mudah dipahami mengapa banyak yang menganggapnya sebagai tonggak penting dalam sektor medis. Di masa depan, Anda dapat mengendalikan robot, kendaraan, dan aspek penting lain dalam hidup Anda menggunakan BCI.
Studi terbaru ini menyoroti bagaimana teknologi ini dapat meningkatkan kehidupan banyak orang. Oleh karena itu, para peneliti pantas mendapatkan tepuk tangan berdiri atas upaya mereka.
Pelajari terobosan kesehatan keren lainnya di sini.
Studi yang Dirujuk:
1. Wairagkar, M., Card, N.S., Singer-Clark, T. et al. Neuroprostesis Sintesis Suara Instan. Nature (2025). https://doi.org/10.1038/s41586-025-09127-3












