» سلامت و پزشکی » این فناوری جدید گفتار را به افراد دارای معلولیت بازمی‌گرداند
سلامت و پزشکی

این فناوری جدید گفتار را به افراد دارای معلولیت بازمی‌گرداند

۱۴۰۴-۰۱-۱۴ 2020

میلیون‌ها نفر در سراسر جهان به دلیل سکته مغزی، بیماری اسکلروز جانبی آمیوتروفیک (ALS) یا سایر آسیب‌های عصبی، توانایی صحبت کردن خود را از دست داده‌اند. اما خوشبختانه، یک فناوری نوآورانه در حال شکستن این مانع ارتباطی است.

به گزارش تکناک، محققان به تازگی سیستمی پیشرفته توسعه داده‌اند که فعالیت‌های مغزی را به‌طور مستقیم و در زمان واقعی به گفتار تبدیل می‌کند و به افراد مبتلا به فلج شدید امکان می‌دهد دوباره به‌طور طبیعی ارتباط برقرار کنند.

عبور از محدودیت‌های فناوری‌های قبلی

برخلاف فناوری‌های پیشین که مکالمات را با توقف‌های ناخوشایند همراه می‌کردند، این نوآوری جدید تقریباً هم‌زمان با قصد فرد برای صحبت کردن عمل می‌کند. این سیستم با پردازش سیگنال‌های مغزی در بازه‌های ۸۰ میلی‌ثانیه‌ای، گفتاری روان و طبیعی تولید می‌کند.

گوپالا آنومانچیپالی، استاد مهندسی برق و علوم کامپیوتر در دانشگاه کالیفرنیا برکلی و یکی از محققان اصلی این پروژه، در بیانیه‌ای اعلام کرد: ما توانسته‌ایم قابلیت رمزگشایی سریع گفتار، مشابه دستگاه‌هایی مثل الکسا و سیری را به ابزار خود بیاوریم. همچنین متوجه شدیم که می‌توان داده‌های عصبی را هم‌زمان رمزگشایی کرد و برای اولین بار توانستیم گفتاری بدون وقفه و با کمترین تأخیر ارائه دهیم. نتیجه این پیشرفت، گفتاری طبیعی‌تر و روان‌تر است.

بازگرداندن توانایی ارتباط

این پژوهش بر روی یک زن ۴۷ ساله به نام آن که ۱۸ سال پیش دچار سکته مغزی در ساقه مغز شده بود، متمرکز شد. این اتفاق او را دچار فلج چهاراندام (کوادری‌پلژی) و آنارتریا (ناتوانی در حرکت عضلات گفتاری) کرد، اما او همچنان توانایی درک و پردازش زبان را داشت. در سال‌های گذشته، او از تخته‌ حروف شفاف و دستگاه‌های ردیابی چشم استفاده می‌کرد که سرعت ارتباطی بسیار پایین در حد ۲.۶ کلمه در دقیقه داشتند. اما این فناوری جدید به او امکان داد گفتاری نزدیک به مکالمه عادی داشته باشد.

فناوری نوآورانه‌ای که توانایی گفتار را به افراد دارای معلولیت بازمی‌گرداند

دکتر ادوارد چانگ، جراح مغز و اعصاب و محقق ارشد این پروژه از دانشگاه کالیفرنیا سانفرانسیسکو (UCSF)، درباره این فناوری گفت: این فناوری جدید پتانسیل فوق‌العاده‌ای برای بهبود کیفیت زندگی افراد دارای فلج شدید که بر گفتار آن‌ها تأثیر گذاشته، دارد. پیشرفت‌های اخیر در هوش مصنوعی باعث شده‌اند رابط‌های مغز و کامپیوتر (BCI) با سرعت بیشتری به کاربردهای عملی نزدیک شوند.

فناوری پیشرفته برای گفتار هم‌زمان

این فناوری شامل یک آرایه الکترودی با ۲۵۳ کانال است که در سطح مغز بیمار کاشته شده و ناحیه کنترل‌کننده عضلات گفتاری را پوشش می‌دهد. هنگامی که فرد تلاش می‌کند بدون صدا کلمات را ادا کند، این سیستم سیگنال‌های عصبی را دریافت کرده و آن‌ها را در لحظه به گفتار و متن تبدیل می‌کند.

چئول جون چو، یکی از پژوهشگران اصلی مطالعه، توضیح می‌دهد: ما سیگنال‌هایی را بررسی می‌کنیم که در مرحله تبدیل فکر به دستور حرکتی گفتار ایجاد می‌شوند. سپس، پس از انتخاب کلمات و برنامه‌ریزی برای حرکت عضلات گفتاری، این سیگنال‌ها را رمزگشایی می‌کنیم.

عبور از مانع تأخیر گفتاری

فناوری‌های قبلی قبل از تولید گفتار، تمام داده‌های عصبی را جمع‌آوری می‌کردند که باعث ایجاد یک تأخیر تقریبا ۸ ثانیه برای هر جمله می‌شد. اما این سیستم جدید، اطلاعات را در بازه‌های کوچک پردازش می‌کند و گفتار را تقریباً هم‌زمان با تولید در مغز فرد به‌صورت صوتی پخش می‌کند.

آنومانچیپالی توضیح می‌دهد: ما مشاهده کردیم که پس از ارسال سیگنال قصد گفتار، در کمتر از یک ثانیه، اولین صدا تولید می‌شود. علاوه بر این، دستگاه قادر است گفتار را به‌طور مداوم رمزگشایی کند، بنابراین فرد می‌تواند بدون توقف به صحبت ادامه دهد.

دقت و سرعت بالا در تشخیص گفتار

این سیستم با مجموعه‌ای از ۵۰ عبارت رایج آزمایش شد و توانست سرعت ۹۰.۹ کلمه در دقیقه را ثبت کند. حتی زمانی که دامنه واژگان به ۱۰۲۴ کلمه افزایش یافت، همچنان سرعت ۴۷.۵ کلمه در دقیقه را حفظ کرد.

فناوری نوآورانه‌ای که توانایی گفتار را به افراد دارای معلولیت بازمی‌گرداند

این سیستم در مجموعه کلمات کوچک‌تر، با دقت ۸۸ درصد کار کرد. در آزمایش‌های سخت‌تر، مانند استفاده از کلمات جدیدی از الفبای آوایی ناتو (مانند Alpha، Bravo، Charlie)، به دقت ۴۶ درصد رسید. این نشان می‌دهد که سیستم توانایی یادگیری اصول پایه گفتار را دارد.

آینده فناوری‌های ارتباطی مبتنی بر مغز

این تحقیق نشان می‌دهد که این فناوری محدود به یک نوع دستگاه خاص نیست و می‌تواند در انواع روش‌های ثبت سیگنال‌های عصبی نیز استفاده شود.

کایلو لیتلجان، یکی از نویسندگان ارشد مطالعه، تأکید می‌کند: با موفقیت آزمایش این فناوری جدید بر روی مجموعه داده‌های دیگر، ما نشان دادیم که این تکنیک می‌تواند در روش‌های مختلف ثبت سیگنال، از جمله الکترودهای سطحی و ضبط تک‌واحدی، استفاده شود.

آن، شرکت‌کننده این پژوهش، پس از آزمایش فناوری اعلام کرد که شنیدن صدای خود به‌طور هم‌زمان، احساس هویت و کنترل بیشتری به او بخشیده است.

گام‌های بعدی: بازآفرینی گفتار طبیعی

محققان در حال تلاش برای افزودن ویژگی‌های طبیعی‌تر به خروجی گفتار هستند، مانند تغییرات لحن و تأکید که در مکالمات روزمره نقش دارند. لیتلجان می‌گوید: افزودن ویژگی‌های طبیعی‌تر به خروجی گفتار یکی از چالش‌های قدیمی در حوزه پردازش صوت است و حل آن می‌تواند ما را به سمت تولید گفتاری کاملاً طبیعی سوق دهد.

فناوری نوآورانه‌ای که توانایی گفتار را به افراد دارای معلولیت بازمی‌گرداند

امیدی برای آینده ارتباطات افراد دارای معلولیت گفتاری

این فناوری گامی بزرگ در بازگرداندن توانایی ارتباطی به افراد دارای فلج شدید است. درحالی‌که رابط‌های گفتاری قبلی با چالش‌هایی مانند سرعت پایین، محدودیت دامنه واژگان و نبود جریان طبیعی مکالمه مواجه بودند، فناوری جدید این مشکلات را برطرف کرده است.

اگرچه این فناوری هنوز به مرحله استفاده گسترده بالینی نرسیده، اما پژوهشگران با هدف بهبود دقت، کاهش تأخیر، و توسعه نسخه‌هایی که در خارج از محیط آزمایشگاهی نیز قابل‌استفاده باشند، کار خود را ادامه خواهند داد. در صورت موفقیت، این فناوری امیدی برای میلیون‌ها نفر خواهد بود تا هیچ‌کس به دلیل فلج، برای همیشه سکوت نکند.

به این نوشته امتیاز بدهید!