امواج مغزی

هوش مصنوعی امواج مغزی را به گفتار تبدیل می‌کند

سرفصل‌های مقاله

محققان دانشگاه Radboud و UMC Utrecht در تبدیل امواج مغزی به گفتار با دقت ۱۰۰ درصد به پیشرفت بزرگی دست یافتند. با استفاده از ترکیبی از ایمپلنت‌های مغزی و هوش مصنوعی، محققان توانستند کلمات گفتاری را با دقت ۹۲ تا ۱۰۰ درصد پیش‌بینی کنند. و از آن برای ترسیم مستقیم فعالیت مغز به گفتار، در بیماران مبتلا به صرع استفاده کردند.

هدف این فناوری بازگرداندن توانایی گفتار به افرادی است که فلج هستند و نمی‌توانند صحبت کنند. محققان بر این باورند که موفقیت این پروژه نشان دهنده پیشرفت قابل توجهی در حوزه رابط‌های مغز و کامپیوتر است.

در حالی که این فناوری در حال حاضر بر روی کلمات فردی متمرکز است، اهداف آینده شامل توانایی پیش بینی جملات و پاراگراف‌های کامل بر اساس امواج مغزی است.

تبدیل امواج مغزی به گفتار توسط هوش مصنوعی

امواج مغزی
تبدیل امواج مغزی به گفتار

این پیشرفت جدید در مجله مهندسی Journal of Neural منتشر شده است. به گفته نویسنده اصلی، جولیا برزوتسکایا، محقق مؤسسه مغز، شناخت و رفتار مغز در این تحقیق، نشان‌دهنده پیشرفت امیدوارکننده‌ای در زمینه رابط‌های مغز و رایانه است. برزوتسکایا و همکارانش در دانشگاه UMC Utrecht و Radboud از ایمپلنت‌های مغزی در بیماران مبتلا به صرع برای استنباط آنچه مردم می‌گویند، استفاده کردند.

برزوتسکایا می‌گوید: در نهایت، ما امیدواریم که بتوانیم این فناوری را برای بیمارانی که فلج هستند و قادر به برقراری ارتباط نیستند، در دسترس قرار دهیم. این افراد توانایی حرکت عضلات خود و در نتیجه صحبت کردن را از دست داده‌اند. با توسعه یک رابط مغز و کامپیوتر، می‌توانیم فعالیت مغز را تجزیه و تحلیل کنیم و دوباره به آن‌ها صدایی بدهیم.

برزوتسکایا ادامه داد: برای این آزمایش محققان از افراد غیرفلج با ایمپلنت‌های موقت مغزی خواستند تا زمانی که فعالیت مغزشان اندازه‌گیری می‌شود، تعدادی کلمه را با صدای بلند بگویند. پس از آن توانستیم نقشه‌برداری مستقیم بین فعالیت مغز از یک طرف و گفتار از طرف دیگر ایجاد کنیم. ما همچنین از مدل‌های هوش مصنوعی پیشرفته برای ترجمه مستقیم این امواج مغزی به گفتار شنیداری استفاده کردیم.

این بدان معناست که ما نه تنها قادر به حدس زدن حرف مردم بودیم، بلکه می‌توانستیم بلافاصله آن کلمات را به صداهای قابل فهم و قابل درک تبدیل کنیم. علاوه بر این، گفتار بازسازی شده حتی از نظر لحن و نحوه صحبت کردن، شبیه گوینده اصلی بود.

محققان در سراسر جهان در حال کار بر روی روش‌هایی برای تشخیص کلمات و جملات در الگوهای مغز هستند. محققان توانستند گفتار قابل فهم را با مجموعه داده‌های نسبتاً کوچک بازسازی کنند و نشان دادند که مدل‌های آنها می‌توانند نقشه پیچیده بین فعالیت مغز و گفتار را با داده‌های محدود کشف کنند.

مهمتر از همه، آنها همچنین تست‌های شنیداری را با داوطلبان انجام دادند تا ارزیابی کنند که کلمات ترکیب شده چقدر قابل شناسایی هستند. نتایج مثبت این آزمایش‌ها نشان می‌دهد که این فناوری نه تنها در شناسایی صحیح کلمات، بلکه در رساندن آن کلمات به صورت شنیداری و قابل درک، درست مانند یک صدای واقعی، موفق است.

محدودیت‌های این کار

برزوتسکایا خاطر نشان کرد که: «در حال حاضر، هنوز تعدادی محدودیت وجود دارد. در این آزمایش‌ها، از شرکت‌کنندگان خواستیم که دوازده کلمه را با صدای بلند بگویند، و این کلماتی بود که ما سعی کردیم آن‌ها را تشخیص دهیم. به طور کلی، پیش‌بینی کل جملات و پاراگراف‌ها پیچیده‌تر از پیش‌بینی تک‌ تک کلمات است. در آینده، مدل‌های زبان بزرگی که در تحقیقات هوش مصنوعی استفاده می‌شوند، می‌توانند سودمند باشند.

هدف ما این است که جملات و پاراگراف‌های کاملی از آنچه مردم سعی دارند بگویند تنها بر اساس فعالیت مغزشان پیش‌بینی کنیم. برای رسیدن به آنجا، به آزمایش‌های بیشتر، ایمپلنت‌های پیشرفته‌تر، مجموعه داده‌های بزرگ‌تر و مدل‌های هوش مصنوعی پیشرفته‌تر نیاز داریم.

نظر شما چیست؟ آیا با تبدیل امواج مغزی به گفتار در آینده همه می‌توانند صحبت کنند؟ می‌دانستید شما هم می‌توانید از دستیارهای هوش مصنوعی مولد با زبان فارسی استفاده کنید؟ زیگپ اولین دستیار هوش مصنوعی ایرانی که مجهز به دستیار صوتی نیز هست. تنها کافی است اپلیکیشن زیگپ را دانلود کنید و به راحتی و با امنیت بالا از آن استفاده کنید.

نوید رضایی
نوید رضایی