
یک ایمپلنت خوانش مغز که سیگنالهای عصبی را به گفتار شنیداری ترجمه میکند، به زنی مبتلا به فلج این امکان را داده است تا آنچه قصد گفتنش را دارد، تقریباً بهصورت آنی بشنود.
محققان این دستگاه — که بهعنوان رابط مغز-کامپیوتر (BCI) شناخته میشود — را با الگوریتمهای هوش مصنوعی (AI) ارتقا دادهاند. این الگوریتمها جملاتی را که زن در ذهنش تصور میکرد، رمزگشایی کرده و سپس آنها را با استفاده از یک صدای مصنوعی بهصورت بلند بیان کردند. برخلاف تلاشهای قبلی که تنها پس از اتمام کامل یک جمله توسط کاربر، صداها را تولید میکردند، رویکرد کنونی میتواند بهصورت همزمان کلمات را تشخیص دهد و آنها را در عرض سه ثانیه به گفتار تبدیل کند.
یافتههای این پژوهش که در تاریخ ۳۱ مارس در مجله Nature Neuroscience منتشر شد، گامی بزرگ بهسوی رابطهای مغز-کامپیوتر با کاربرد عملی محسوب میشود.
مریم نداف، روزنامه نگار علم در گزارشی که درباره این پیشرفت در نیچر منتشر کرده است با کریستین هرف، عصبشناس محاسباتی در دانشگاه ماستریخت هلند که در این پژوهش مشارکت نداشته است گفتگو کرده است، او میگوید رابطهای قدیمی تولید گفتار شبیه به «گفتوگویی در واتساپ» بودند. او توضیح میدهد: «من یک جمله مینویسم، شما یک جمله مینویسید و برای نوشتن جمله بعدی به زمان نیاز دارید… این روند مانند یک گفتوگوی عادی جریان ندارد.»
به گفته او، رابطهای مغز-کامپیوتری که گفتار را بهصورت زنده پخش میکنند، «سطح بعدی» در تحقیقات هستند، زیرا به کاربران اجازه میدهند لحن و تأکیدهای خاص گفتار طبیعی را منتقل کنند.
خوانش سیگنالهای مغزی
شرکتکننده در این مطالعه، آن (Ann)، پس از سکته مغزی در ساقه مغز خود در سال ۲۰۰۵ توانایی تکلم خود را از دست داد. حدود ۱۸ سال بعد، او تحت عمل جراحی قرار گرفت تا یک مستطیل نازک کاغذی حاوی ۲۵۳ الکترود روی سطح قشر مغز او قرار داده شود. این ایمپلنت میتواند فعالیت ترکیبی هزاران نورون را بهصورت همزمان ثبت کند.
محققان صدای مصنوعی را طوری شخصیسازی کردند که شبیه صدای آن پیش از آسیبش باشد. آنها این کار را با آموزش الگوریتمهای هوش مصنوعی بر اساس ضبطهایی از ویدئوی عروسی او انجام دادند.
در این مطالعه اخیر، آن بهصورت بیصدا ۱۰۰ جمله را از مجموعهای شامل ۱,۰۲۴ کلمه و ۵۰ عبارت که روی صفحه نمایش ظاهر میشدند، با حرکت لبها بیان کرد. دستگاه BCI سیگنالهای عصبی او را هر ۸۰ میلیثانیه ثبت میکرد، این ثبت از ۵۰۰ میلیثانیه پیش از شروع بیان بیصدا جملات توسط آن آغاز میشد. این دستگاه بین ۴۷ تا ۹۰ کلمه در دقیقه تولید کرد (در حالی که گفتوگوی طبیعی معمولاً با سرعت حدود ۱۶۰ کلمه در دقیقه انجام میشود).
نتایج این مطالعه، پیشرفت چشمگیری نسبت به نسخه قدیمیتر این فناوری که آن در مطالعه قبلی آزمایش کرده بود، و همچنین نسبت به دستگاه ارتباطی کمکی فعلی او که بیش از ۲۰ ثانیه برای پخش یک جمله زمان نیاز دارد، نشان میدهد.

هرف میگوید که اگرچه این رابط مغز-کامپیوتر برای جملات کوتاه خوب عمل میکند، اما همچنان با «تأخیر قابلتوجهی» نسبت به گفتوگوی طبیعی کار میکند. او اشاره میکند که مطالعات نشان دادهاند «وقتی تأخیر بیش از ۵۰ میلیثانیه باشد، واقعاً باعث سردرگمی میشود.»
ادوارد چانگ، یکی از نویسندگان این مطالعه و جراح مغز و اعصاب در دانشگاه کالیفرنیا، سانفرانسیسکو، میگوید: «این جایی است که ما اکنون در آن قرار داریم. اما میتوانید تصور کنید که با حسگرهای بیشتر، دقت بالاتر، و پردازش سیگنال پیشرفتهتر، این وضعیت تنها تغییر خواهد کرد و بهتر خواهد شد.»
سابقهای از رابطهای مغز و ماشین
آغاز یک رویا: دهههای ۱۹۶۰ و ۱۹۷۰
داستان رابطهای مغز-کامپیوتر به دهههای ۱۹۶۰ و ۱۹۷۰ بازمیگردد، زمانی که دانشمندان تازه شروع به کشف رازهای مغز کرده بودند. در سال ۱۹۶۹، ادوارد اِوارتس و همکارانش در مؤسسه ملی سلامت آمریکا (NIH) کشف کردند که نورونهای خاصی در قشر حرکتی مغز میمونها، به حرکات بازوی آنها واکنش نشان میدهند. این کشف نشان داد که میتوان فعالیت مغز را به حرکات فیزیکی مرتبط کرد. در همان زمان، ابرهارد فتز در دانشگاه واشنگتن آزمایشی انجام داد که در آن میمونها یاد گرفتند با استفاده از بازخورد زیستی، سرعت شلیک نورونهای مغزشان را کنترل کنند. این آزمایش، پایهای برای کنترل ارادی سیگنالهای مغزی شد و جرقهای برای آینده رابطهای مغز-کامپیوتر به شمار میرفت.
در دهه ۱۹۷۰، واژه «رابط مغز-کامپیوتر» برای اولین بار توسط ژاک ویدال در دانشگاه UCLA به کار برده شد. ویدال ایدهای جسورانه مطرح کرد: استفاده از سیگنالهای الکتروانسفالوگرافی (EEG) — که فعالیت الکتریکی مغز را از روی پوست سر ثبت میکند — برای کنترل دستگاههای خارجی. او با حمایت مالی آژانس پروژههای تحقیقاتی پیشرفته دفاعی (DARPA) — که در اوج جنگ سرد به دنبال فناوریهای نوین برای کاربردهای نظامی بود — سیستمی آزمایشی طراحی کرد. اگرچه این سیستم بیشتر نظری بود، اما راه را برای پیشرفتهای عملیتر در دهههای بعد باز کرد. در واقع، اولین سیستمهای عملی کنترل مکاننما با EEG در دهه ۱۹۸۰ توسط محققانی مانند جاناتان وولپاو توسعه یافت.
گامهای بزرگ: دهههای ۱۹۹۰ و ۲۰۰۰
در دهه ۱۹۹۰، رابطهای مغز-کامپیوتر تهاجمی (که نیاز به کاشت الکترود در مغز دارند) شروع به شکوفایی کردند. در سال ۱۹۹۹، مطالعهای مهم توسط چپین و همکارانش در مجله Nature Neuroscience منتشر شد که نشان داد موشها میتوانند با سیگنالهای مغزی خود یک بازوی رباتیک را کنترل کنند. این آزمایش، دریچهای به سوی کاربردهای عملیتر باز کرد.
در همین زمان، گروهی از محققان در دانشگاه براون، به رهبری لی هاخبرگ و جان دونوگ، پروژهای به نام BrainGate را آغاز کردند. آنها سیستمی با الکترودهای کاشتهشده در مغز طراحی کردند که میتوانست سیگنالهای مغزی را با دقت بالا ثبت کند. اولین آزمایش انسانی این پروژه در سال ۲۰۰۴ انجام شد و نتایج آن در سال ۲۰۰۶ در مجله Nature منتشر شد. در این آزمایش، افرادی که به دلیل فلج کامل قادر به حرکت نبودند، توانستند با فکر کردن، یک مکاننما، بازوی رباتیک، یا حتی صفحهکلید را کنترل کنند. این موفقیت، امیدی بزرگ برای افرادی با ناتوانیهای شدید بود.
در کنار روشهای تهاجمی، رابطهای غیرتهاجمی مبتنی بر EEG نیز در حال پیشرفت بودند. در اوایل دهه ۲۰۰۰، گرت فورشلر، محقق اتریشی، سیستمی طراحی کرد که به بیماران مبتلا به ALS (اسکلروز جانبی آمیوتروفیک) اجازه میداد با استفاده از سیگنالهای مغزی، کلمات را انتخاب کرده و ارتباط برقرار کنند. این «املاگرهای مغزی» به افرادی که توانایی تکلم و حرکت را از دست داده بودند، صدایی دوباره بخشید.
دهه ۲۰۱۰: ورود به زندگی روزمره
دهه ۲۰۱۰، با پیشرفتهای چشمگیر در یادگیری ماشینی و حسگرهای پوشیدنی، دورهای طلایی برای رابطهای مغز-کامپیوتر بود. شرکتهایی مانند Emotiv و NeuroSky هدستهای EEG مصرفی را به بازار عرضه کردند که برای بازی، مدیتیشن، و بازخورد عصبی طراحی شده بودند. اگرچه این دستگاهها دقت سیستمهای تحقیقاتی را نداشتند، اما ایده کنترل فناوری با ذهن را به زندگی روزمره مردم آوردند و محبوبیت زیادی پیدا کردند.
عصر جدید: ورود غولهای فناوری
در سالهای اخیر، شرکتهای بزرگ فناوری نیز به این میدان وارد شدهاند. در سال ۲۰۱۶، ایلان ماسک شرکت Neuralink را تأسیس کرد با هدف ایجاد ایمپلنتهای عصبی با پهنای باند بالا که بتواند ذهن انسان را با هوش مصنوعی پیوند دهد. در ژانویه ۲۰۲۴، Neuralink اولین آزمایش انسانی خود را اعلام کرد؛ دستگاهی بیسیم به اندازه یک سکه که در جمجمه کاشته میشود. تا سال ۲۰۲۵، گزارش شد که اولین بیمار با استفاده از این ایمپلنت توانسته یک مکاننما را کنترل کند و حتی بازیهای ویدیویی انجام دهد.
در کنار روشهای تهاجمی، فناوریهای غیرتهاجمی نیز پیشرفت کردهاند. روشهایی مانند طیفنگاری نزدیک به مادون قرمز (fNIRS)، مغناطیسنگاری مغزی (MEG)، و EEG بهبودیافته، با کمک هوش مصنوعی، دقت رمزگشایی سیگنالهای مغزی را افزایش دادهاند. محققان اکنون در حال کاوش کاربردهایی مانند بهبود پس از سکته مغزی، تقویت شناختی، و حتی رابطهای گفتار خاموش هستند. برای مثال، در سال ۲۰۲۳، یک زن فلج با استفاده از یک رابط مغز-کامپیوتر توانست با صدای مصنوعی «صحبت» کند.
چالشها و آینده
تا سال ۲۰۲۵، رابطهای مغز-کامپیوتر هنوز بیشتر در مرحله تحقیقاتی و کاربردهای اولیه بالینی هستند، اما این حوزه با سرعت در حال رشد است. با این حال، پیشرفتهای فنی با پرسشهای اخلاقی همراه شدهاند. موضوعاتی مانند حریم خصوصی، خودمختاری، و مالکیت دادههای مغزی، بحثهای داغی را در میان دانشمندان و سیاستگذاران به راه انداخته است. اگر روزی این فناوری به زندگی روزمره ما وارد شود، باید مطمئن شویم که از آن به شکلی مسئولانه استفاده میشود.
واقعیت در مقابل تبلیغات
با قدرت گرفتن بخش خصوصی در حوزه رابط مغز و رایانه (BCI)، بهویژه شرکتهایی مانند نورولینک متعلق به ایلان ماسک که از دسترسی گسترده به رسانهها برخوردارند، باید با حساسیت بیشتری به ادعاهای آنها نگاه کرد. برخلاف پروژههای علمی دانشگاهی که نتایج خود را با شفافیت از طریق مقالات داوریشده منتشر میکنند، شرکتهای تجاری معمولاً اطلاعات فنی، روشهای محاسبه، تعداد نمونهها و دادههای آزمایشهایشان را بهطور کامل در اختیار دانشمندان و عموم قرار نمیدهند.
برای مثال، نورولینک در سال ۲۰۲۱ ویدیویی منتشر کرد که در آن یک میمون با استفاده از ایمپلنت مغزی بازی پونگ را کنترل میکرد. این نمایش با واکنش گسترده رسانهای روبهرو شد، اما بسیاری از جزئیات فنی آن—مانند روش پردازش سیگنالها، دقت عملکرد، یا تعداد دفعات موفق آزمایش—هیچگاه بهصورت علمی منتشر نشد. همین موضوع باعث شد برخی دانشمندان نسبت به اعتبار ادعاها تردید کنند.
از سوی دیگر، شرکتهای نوپای فناوری (استارتاپها) اغلب برای جذب سرمایه از مدلهای اقتصادی خاصی پیروی میکنند که در آن ایجاد هیجان رسانهای یا “موج خبری” میتواند به جذب سرمایهگذاران کمک کند. این رویه میتواند منجر به انتشار اخبار اغراقشده شود، اخباری که گاه با واقعیتهای علمی فاصله دارند. چنین اغراقهایی ممکن است اثرات منفی متعددی داشته باشند: ایجاد امیدهای کاذب برای بیماران، دلسردی عمومی در صورت عدم تحقق وعدهها، و هدایت نادرست منابع مالی از نهادهای دانشگاهی به سمت بخش خصوصی بدون پشتوانه علمی کافی.
با این حال، نمیتوان نقش صنعت را در توسعه فناوریهای نوظهور نادیده گرفت. مشارکت بخش خصوصی فرصتهایی تازه برای نوآوری ایجاد میکند، اما در عین حال مسائلی مانند مالکیت معنوی و تضاد با مدلهای سنتی علم (بر پایه شفافیت و دسترسی آزاد) را هم به همراه دارد. شاید اکنون زمان آن رسیده باشد که جامعهشناسان علم و سیاستگذاران علمی، مدلهای توسعه علم را بازنگری کنند و سازوکارهایی برای اطمینان از شفافیت، اعتبار و پاسخگویی در پروژههای فناورانه طراحی کنند. شفافیت میتواند بهترین مانع در برابر ادعاهای نادرست باشد و به حفظ اعتماد عمومی به علم کمک کند.