محققان دانشگاه Radboud و UMC Utrecht در تبدیل امواج مغزی به گفتار با دقت ۱۰۰ درصد به پیشرفت بزرگی دست یافتند. با استفاده از ترکیبی از ایمپلنتهای مغزی و هوش مصنوعی، محققان توانستند کلمات گفتاری را با دقت ۹۲ تا ۱۰۰ درصد پیشبینی کنند. و از آن برای ترسیم مستقیم فعالیت مغز به گفتار، در بیماران مبتلا به صرع استفاده کردند.
هدف این فناوری بازگرداندن توانایی گفتار به افرادی است که فلج هستند و نمیتوانند صحبت کنند. محققان بر این باورند که موفقیت این پروژه نشان دهنده پیشرفت قابل توجهی در حوزه رابطهای مغز و کامپیوتر است.
در حالی که این فناوری در حال حاضر بر روی کلمات فردی متمرکز است، اهداف آینده شامل توانایی پیش بینی جملات و پاراگرافهای کامل بر اساس امواج مغزی است.
تبدیل امواج مغزی به گفتار توسط هوش مصنوعی
این پیشرفت جدید در مجله مهندسی Journal of Neural منتشر شده است. به گفته نویسنده اصلی، جولیا برزوتسکایا، محقق مؤسسه مغز، شناخت و رفتار مغز در این تحقیق، نشاندهنده پیشرفت امیدوارکنندهای در زمینه رابطهای مغز و رایانه است. برزوتسکایا و همکارانش در دانشگاه UMC Utrecht و Radboud از ایمپلنتهای مغزی در بیماران مبتلا به صرع برای استنباط آنچه مردم میگویند، استفاده کردند.
برزوتسکایا میگوید: در نهایت، ما امیدواریم که بتوانیم این فناوری را برای بیمارانی که فلج هستند و قادر به برقراری ارتباط نیستند، در دسترس قرار دهیم. این افراد توانایی حرکت عضلات خود و در نتیجه صحبت کردن را از دست دادهاند. با توسعه یک رابط مغز و کامپیوتر، میتوانیم فعالیت مغز را تجزیه و تحلیل کنیم و دوباره به آنها صدایی بدهیم.
برزوتسکایا ادامه داد: برای این آزمایش محققان از افراد غیرفلج با ایمپلنتهای موقت مغزی خواستند تا زمانی که فعالیت مغزشان اندازهگیری میشود، تعدادی کلمه را با صدای بلند بگویند. پس از آن توانستیم نقشهبرداری مستقیم بین فعالیت مغز از یک طرف و گفتار از طرف دیگر ایجاد کنیم. ما همچنین از مدلهای هوش مصنوعی پیشرفته برای ترجمه مستقیم این امواج مغزی به گفتار شنیداری استفاده کردیم.
این بدان معناست که ما نه تنها قادر به حدس زدن حرف مردم بودیم، بلکه میتوانستیم بلافاصله آن کلمات را به صداهای قابل فهم و قابل درک تبدیل کنیم. علاوه بر این، گفتار بازسازی شده حتی از نظر لحن و نحوه صحبت کردن، شبیه گوینده اصلی بود.
محققان در سراسر جهان در حال کار بر روی روشهایی برای تشخیص کلمات و جملات در الگوهای مغز هستند. محققان توانستند گفتار قابل فهم را با مجموعه دادههای نسبتاً کوچک بازسازی کنند و نشان دادند که مدلهای آنها میتوانند نقشه پیچیده بین فعالیت مغز و گفتار را با دادههای محدود کشف کنند.
مهمتر از همه، آنها همچنین تستهای شنیداری را با داوطلبان انجام دادند تا ارزیابی کنند که کلمات ترکیب شده چقدر قابل شناسایی هستند. نتایج مثبت این آزمایشها نشان میدهد که این فناوری نه تنها در شناسایی صحیح کلمات، بلکه در رساندن آن کلمات به صورت شنیداری و قابل درک، درست مانند یک صدای واقعی، موفق است.
محدودیتهای این کار
برزوتسکایا خاطر نشان کرد که: «در حال حاضر، هنوز تعدادی محدودیت وجود دارد. در این آزمایشها، از شرکتکنندگان خواستیم که دوازده کلمه را با صدای بلند بگویند، و این کلماتی بود که ما سعی کردیم آنها را تشخیص دهیم. به طور کلی، پیشبینی کل جملات و پاراگرافها پیچیدهتر از پیشبینی تک تک کلمات است. در آینده، مدلهای زبان بزرگی که در تحقیقات هوش مصنوعی استفاده میشوند، میتوانند سودمند باشند.
هدف ما این است که جملات و پاراگرافهای کاملی از آنچه مردم سعی دارند بگویند تنها بر اساس فعالیت مغزشان پیشبینی کنیم. برای رسیدن به آنجا، به آزمایشهای بیشتر، ایمپلنتهای پیشرفتهتر، مجموعه دادههای بزرگتر و مدلهای هوش مصنوعی پیشرفتهتر نیاز داریم.
نظر شما چیست؟ آیا با تبدیل امواج مغزی به گفتار در آینده همه میتوانند صحبت کنند؟ میدانستید شما هم میتوانید از دستیارهای هوش مصنوعی مولد با زبان فارسی استفاده کنید؟ زیگپ اولین دستیار هوش مصنوعی ایرانی که مجهز به دستیار صوتی نیز هست. تنها کافی است اپلیکیشن زیگپ را دانلود کنید و به راحتی و با امنیت بالا از آن استفاده کنید.