ایمپلنت خوانش مغز: صدایی برای خاموشان

یک ایمپلنت خوانش مغز که سیگنال‌های عصبی را به گفتار شنیداری ترجمه می‌کند، به زنی مبتلا به فلج این امکان را داده است تا آنچه قصد گفتنش را دارد، تقریباً به‌صورت آنی بشنود.

محققان این دستگاه — که به‌عنوان رابط مغز-کامپیوتر (BCI) شناخته می‌شود — را با الگوریتم‌های هوش مصنوعی (AI) ارتقا داده‌اند. این الگوریتم‌ها جملاتی را که زن در ذهنش تصور می‌کرد، رمزگشایی کرده و سپس آن‌ها را با استفاده از یک صدای مصنوعی به‌صورت بلند بیان کردند. برخلاف تلاش‌های قبلی که تنها پس از اتمام کامل یک جمله توسط کاربر، صداها را تولید می‌کردند، رویکرد کنونی می‌تواند به‌صورت هم‌زمان کلمات را تشخیص دهد و آن‌ها را در عرض سه ثانیه به گفتار تبدیل کند.

یافته‌های این پژوهش که در تاریخ ۳۱ مارس در مجله Nature Neuroscience منتشر شد، گامی بزرگ به‌سوی رابط‌های مغز-کامپیوتر با کاربرد عملی محسوب می‌شود.

مریم نداف، روزنامه نگار علم در گزارشی که درباره این پیشرفت در نیچر منتشر کرده است با  کریستین هرف، عصب‌شناس محاسباتی در دانشگاه ماستریخت هلند که در این پژوهش مشارکت نداشته است گفتگو کرده است، او می‌گوید رابط‌های قدیمی تولید گفتار شبیه به «گفت‌وگویی در واتس‌اپ» بودند. او توضیح می‌دهد: «من یک جمله می‌نویسم، شما یک جمله می‌نویسید و برای نوشتن جمله بعدی به زمان نیاز دارید… این روند مانند یک گفت‌وگوی عادی جریان ندارد.»

به گفته او، رابط‌های مغز-کامپیوتری که گفتار را به‌صورت زنده پخش می‌کنند، «سطح بعدی» در تحقیقات هستند، زیرا به کاربران اجازه می‌دهند لحن و تأکیدهای خاص گفتار طبیعی را منتقل کنند.

خوانش سیگنال‌های مغزی

شرکت‌کننده در این مطالعه، آن (Ann)، پس از سکته مغزی در ساقه مغز خود در سال ۲۰۰۵ توانایی تکلم خود را از دست داد. حدود ۱۸ سال بعد، او تحت عمل جراحی قرار گرفت تا یک مستطیل نازک کاغذی حاوی ۲۵۳ الکترود روی سطح قشر مغز او قرار داده شود. این ایمپلنت می‌تواند فعالیت ترکیبی هزاران نورون را به‌صورت هم‌زمان ثبت کند.

محققان صدای مصنوعی را طوری شخصی‌سازی کردند که شبیه صدای آن پیش از آسیبش باشد. آن‌ها این کار را با آموزش الگوریتم‌های هوش مصنوعی بر اساس ضبط‌هایی از ویدئوی عروسی او انجام دادند.

در این مطالعه اخیر، آن به‌صورت بی‌صدا ۱۰۰ جمله را از مجموعه‌ای شامل ۱,۰۲۴ کلمه و ۵۰ عبارت که روی صفحه نمایش ظاهر می‌شدند، با حرکت لب‌ها بیان کرد. دستگاه BCI سیگنال‌های عصبی او را هر ۸۰ میلی‌ثانیه ثبت می‌کرد، این ثبت از ۵۰۰ میلی‌ثانیه پیش از شروع بیان بی‌صدا جملات توسط آن آغاز می‌شد. این دستگاه بین ۴۷ تا ۹۰ کلمه در دقیقه تولید کرد (در حالی که گفت‌وگوی طبیعی معمولاً با سرعت حدود ۱۶۰ کلمه در دقیقه انجام می‌شود).

نتایج این مطالعه، پیشرفت چشمگیری نسبت به نسخه قدیمی‌تر این فناوری که آن در مطالعه قبلی آزمایش کرده بود، و همچنین نسبت به دستگاه ارتباطی کمکی فعلی او که بیش از ۲۰ ثانیه برای پخش یک جمله زمان نیاز دارد، نشان می‌دهد.

Credit: Montreal Neurological Institute/Science Photo Library

هرف می‌گوید که اگرچه این رابط مغز-کامپیوتر برای جملات کوتاه خوب عمل می‌کند، اما همچنان با «تأخیر قابل‌توجهی» نسبت به گفت‌وگوی طبیعی کار می‌کند. او اشاره می‌کند که مطالعات نشان داده‌اند «وقتی تأخیر بیش از ۵۰ میلی‌ثانیه باشد، واقعاً باعث سردرگمی می‌شود.»

ادوارد چانگ، یکی از نویسندگان این مطالعه و جراح مغز و اعصاب در دانشگاه کالیفرنیا، سان‌فرانسیسکو، می‌گوید: «این جایی است که ما اکنون در آن قرار داریم. اما می‌توانید تصور کنید که با حسگرهای بیشتر، دقت بالاتر، و پردازش سیگنال پیشرفته‌تر، این وضعیت تنها تغییر خواهد کرد و بهتر خواهد شد.»

سابقه‌ای از رابط‌های مغز و ماشین


آغاز یک رویا: دهه‌های ۱۹۶۰ و ۱۹۷۰

داستان رابط‌های مغز-کامپیوتر به دهه‌های ۱۹۶۰ و ۱۹۷۰ بازمی‌گردد، زمانی که دانشمندان تازه شروع به کشف رازهای مغز کرده بودند. در سال ۱۹۶۹، ادوارد اِوارتس و همکارانش در مؤسسه ملی سلامت آمریکا (NIH) کشف کردند که نورون‌های خاصی در قشر حرکتی مغز میمون‌ها، به حرکات بازوی آن‌ها واکنش نشان می‌دهند. این کشف نشان داد که می‌توان فعالیت مغز را به حرکات فیزیکی مرتبط کرد. در همان زمان، ابرهارد فتز در دانشگاه واشنگتن آزمایشی انجام داد که در آن میمون‌ها یاد گرفتند با استفاده از بازخورد زیستی، سرعت شلیک نورون‌های مغزشان را کنترل کنند. این آزمایش، پایه‌ای برای کنترل ارادی سیگنال‌های مغزی شد و جرقه‌ای برای آینده رابط‌های مغز-کامپیوتر به شمار می‌رفت.

در دهه ۱۹۷۰، واژه «رابط مغز-کامپیوتر» برای اولین بار توسط ژاک ویدال در دانشگاه UCLA به کار برده شد. ویدال ایده‌ای جسورانه مطرح کرد: استفاده از سیگنال‌های الکتروانسفالوگرافی (EEG) — که فعالیت الکتریکی مغز را از روی پوست سر ثبت می‌کند — برای کنترل دستگاه‌های خارجی. او با حمایت مالی آژانس پروژه‌های تحقیقاتی پیشرفته دفاعی (DARPA) — که در اوج جنگ سرد به دنبال فناوری‌های نوین برای کاربردهای نظامی بود — سیستمی آزمایشی طراحی کرد. اگرچه این سیستم بیشتر نظری بود، اما راه را برای پیشرفت‌های عملی‌تر در دهه‌های بعد باز کرد. در واقع، اولین سیستم‌های عملی کنترل مکان‌نما با EEG در دهه ۱۹۸۰ توسط محققانی مانند جاناتان وولپاو توسعه یافت.

گام‌های بزرگ: دهه‌های ۱۹۹۰ و ۲۰۰۰

در دهه ۱۹۹۰، رابط‌های مغز-کامپیوتر تهاجمی (که نیاز به کاشت الکترود در مغز دارند) شروع به شکوفایی کردند. در سال ۱۹۹۹، مطالعه‌ای مهم توسط چپین و همکارانش در مجله Nature Neuroscience منتشر شد که نشان داد موش‌ها می‌توانند با سیگنال‌های مغزی خود یک بازوی رباتیک را کنترل کنند. این آزمایش، دریچه‌ای به سوی کاربردهای عملی‌تر باز کرد.

در همین زمان، گروهی از محققان در دانشگاه براون، به رهبری لی هاخبرگ و جان دونوگ، پروژه‌ای به نام BrainGate را آغاز کردند. آن‌ها سیستمی با الکترودهای کاشته‌شده در مغز طراحی کردند که می‌توانست سیگنال‌های مغزی را با دقت بالا ثبت کند. اولین آزمایش انسانی این پروژه در سال ۲۰۰۴ انجام شد و نتایج آن در سال ۲۰۰۶ در مجله Nature منتشر شد. در این آزمایش، افرادی که به دلیل فلج کامل قادر به حرکت نبودند، توانستند با فکر کردن، یک مکان‌نما، بازوی رباتیک، یا حتی صفحه‌کلید را کنترل کنند. این موفقیت، امیدی بزرگ برای افرادی با ناتوانی‌های شدید بود.

در کنار روش‌های تهاجمی، رابط‌های غیرتهاجمی مبتنی بر EEG نیز در حال پیشرفت بودند. در اوایل دهه ۲۰۰۰، گرت فورشلر، محقق اتریشی، سیستمی طراحی کرد که به بیماران مبتلا به ALS (اسکلروز جانبی آمیوتروفیک) اجازه می‌داد با استفاده از سیگنال‌های مغزی، کلمات را انتخاب کرده و ارتباط برقرار کنند. این «املاگرهای مغزی» به افرادی که توانایی تکلم و حرکت را از دست داده بودند، صدایی دوباره بخشید.

دهه ۲۰۱۰: ورود به زندگی روزمره

دهه ۲۰۱۰، با پیشرفت‌های چشمگیر در یادگیری ماشینی و حسگرهای پوشیدنی، دوره‌ای طلایی برای رابط‌های مغز-کامپیوتر بود. شرکت‌هایی مانند Emotiv و NeuroSky هدست‌های EEG مصرفی را به بازار عرضه کردند که برای بازی، مدیتیشن، و بازخورد عصبی طراحی شده بودند. اگرچه این دستگاه‌ها دقت سیستم‌های تحقیقاتی را نداشتند، اما ایده کنترل فناوری با ذهن را به زندگی روزمره مردم آوردند و محبوبیت زیادی پیدا کردند.

عصر جدید: ورود غول‌های فناوری

در سال‌های اخیر، شرکت‌های بزرگ فناوری نیز به این میدان وارد شده‌اند. در سال ۲۰۱۶، ایلان ماسک شرکت Neuralink را تأسیس کرد با هدف ایجاد ایمپلنت‌های عصبی با پهنای باند بالا که بتواند ذهن انسان را با هوش مصنوعی پیوند دهد. در ژانویه ۲۰۲۴، Neuralink اولین آزمایش انسانی خود را اعلام کرد؛ دستگاهی بی‌سیم به اندازه یک سکه که در جمجمه کاشته می‌شود. تا سال ۲۰۲۵، گزارش شد که اولین بیمار با استفاده از این ایمپلنت توانسته یک مکان‌نما را کنترل کند و حتی بازی‌های ویدیویی انجام دهد.

در کنار روش‌های تهاجمی، فناوری‌های غیرتهاجمی نیز پیشرفت کرده‌اند. روش‌هایی مانند طیف‌نگاری نزدیک به مادون قرمز (fNIRS)، مغناطیس‌نگاری مغزی (MEG)، و EEG بهبودیافته، با کمک هوش مصنوعی، دقت رمزگشایی سیگنال‌های مغزی را افزایش داده‌اند. محققان اکنون در حال کاوش کاربردهایی مانند بهبود پس از سکته مغزی، تقویت شناختی، و حتی رابط‌های گفتار خاموش هستند. برای مثال، در سال ۲۰۲۳، یک زن فلج با استفاده از یک رابط مغز-کامپیوتر توانست با صدای مصنوعی «صحبت» کند.

چالش‌ها و آینده

تا سال ۲۰۲۵، رابط‌های مغز-کامپیوتر هنوز بیشتر در مرحله تحقیقاتی و کاربردهای اولیه بالینی هستند، اما این حوزه با سرعت در حال رشد است. با این حال، پیشرفت‌های فنی با پرسش‌های اخلاقی همراه شده‌اند. موضوعاتی مانند حریم خصوصی، خودمختاری، و مالکیت داده‌های مغزی، بحث‌های داغی را در میان دانشمندان و سیاست‌گذاران به راه انداخته است. اگر روزی این فناوری به زندگی روزمره ما وارد شود، باید مطمئن شویم که از آن به شکلی مسئولانه استفاده می‌شود.

واقعیت در مقابل تبلیغات



با قدرت گرفتن بخش خصوصی در حوزه رابط مغز و رایانه (BCI)، به‌ویژه شرکت‌هایی مانند نورولینک متعلق به ایلان ماسک که از دسترسی گسترده به رسانه‌ها برخوردارند، باید با حساسیت بیشتری به ادعاهای آن‌ها نگاه کرد. برخلاف پروژه‌های علمی دانشگاهی که نتایج خود را با شفافیت از طریق مقالات داوری‌شده منتشر می‌کنند، شرکت‌های تجاری معمولاً اطلاعات فنی، روش‌های محاسبه، تعداد نمونه‌ها و داده‌های آزمایش‌هایشان را به‌طور کامل در اختیار دانشمندان و عموم قرار نمی‌دهند.

برای مثال، نورولینک در سال ۲۰۲۱ ویدیویی منتشر کرد که در آن یک میمون با استفاده از ایمپلنت مغزی بازی پونگ را کنترل می‌کرد. این نمایش با واکنش گسترده رسانه‌ای روبه‌رو شد، اما بسیاری از جزئیات فنی آن—مانند روش پردازش سیگنال‌ها، دقت عملکرد، یا تعداد دفعات موفق آزمایش—هیچ‌گاه به‌صورت علمی منتشر نشد. همین موضوع باعث شد برخی دانشمندان نسبت به اعتبار ادعاها تردید کنند.

از سوی دیگر، شرکت‌های نوپای فناوری (استارتاپ‌ها) اغلب برای جذب سرمایه از مدل‌های اقتصادی خاصی پیروی می‌کنند که در آن ایجاد هیجان رسانه‌ای یا “موج خبری” می‌تواند به جذب سرمایه‌گذاران کمک کند. این رویه می‌تواند منجر به انتشار اخبار اغراق‌شده شود، اخباری که گاه با واقعیت‌های علمی فاصله دارند. چنین اغراق‌هایی ممکن است اثرات منفی متعددی داشته باشند: ایجاد امیدهای کاذب برای بیماران، دلسردی عمومی در صورت عدم تحقق وعده‌ها، و هدایت نادرست منابع مالی از نهادهای دانشگاهی به سمت بخش خصوصی بدون پشتوانه علمی کافی.

با این حال، نمی‌توان نقش صنعت را در توسعه فناوری‌های نوظهور نادیده گرفت. مشارکت بخش خصوصی فرصت‌هایی تازه برای نوآوری ایجاد می‌کند، اما در عین حال مسائلی مانند مالکیت معنوی و تضاد با مدل‌های سنتی علم (بر پایه شفافیت و دسترسی آزاد) را هم به همراه دارد. شاید اکنون زمان آن رسیده باشد که جامعه‌شناسان علم و سیاست‌گذاران علمی، مدل‌های توسعه علم را بازنگری کنند و سازوکارهایی برای اطمینان از شفافیت، اعتبار و پاسخگویی در پروژه‌های فناورانه طراحی کنند. شفافیت می‌تواند بهترین مانع در برابر ادعاهای نادرست باشد و به حفظ اعتماد عمومی به علم کمک کند.

دیدگاهتان را بنویسید

*

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.