قابلیت تبدیل گفتار به نوشتار اکنون در تمام رایانههای مدرن تعبیه شده است. اما اگر لازم نبود به رایانه خود دیکته کنید چه میشد؟ اگر میتوانستید تنها با فکر کردن تایپ کنید؟
استارتاپ سابی (Sabi) در سیلیکون ولی با همین هدف از حالت پنهان خارج میشود. این شرکت در حال توسعه یک دستگاه پوشیدنی مغزی است که گفتار درونی فرد را به کلمات روی صفحه نمایش رایانه رمزگشایی میکند. رائول چابرا، مدیرعامل این شرکت، میگوید اولین محصول آنها، یک کلاه بافتنی مغزخوان، تا پایان سال در دسترس خواهد بود. این شرکت همچنین در حال طراحی یک نسخه کلاه بیسبال نیز هست.
این فناوری به عنوان رابط مغز و رایانه (BCI) شناخته میشود، دستگاهی که یک مسیر ارتباطی مستقیم بین مغز و یک دستگاه خارجی فراهم میکند. در حالی که بسیاری از شرکتها مانند نورالینک ایلان ماسک در حال توسعه BCIهای کاشتهشده از طریق جراحی برای افراد دارای ناتوانیهای حرکتی شدید هستند، دستگاه سابی میتواند به هر کسی اجازه دهد تا به یک سایبورگ تبدیل شود.
این دقیقاً چشمانداز ماسک از آینده نیست که شامل تراشههای مغزی کاشتهشده برای ادغام انسانها با هوش مصنوعی میشود. اما وینود کاسلا، سرمایهگذار خطرپذیر که از اولین سرمایهگذاران اوپنایآی (OpenAI) بود، میگوید یک دستگاه غیرتهاجمی و پوشیدنی تنها راه برای ترغیب افراد زیادی به استفاده از فناوری BCI است.
کاسلا، بنیانگذار کاسلا ونچرز (Khosla Ventures) و یکی از سرمایهگذاران سابی، میگوید: «بزرگترین و مهمترین کاربرد BCI این است که بتوانید با فکر کردن با رایانه خود صحبت کنید. اگر قرار است یک میلیارد نفر روزانه از BCI برای دسترسی به رایانههایشان استفاده کنند، این فناوری نمیتواند تهاجمی باشد.»
کلاه مغزخوان سابی بر اساس EEG یا الکتروانسفالوگرافی کار میکند که از دیسکهای فلزی روی پوست سر برای ثبت فعالیت الکتریکی مغز استفاده مینماید. رمزگشایی گفتار تصوری از EEG از قبل امکانپذیر است، اما در حال حاضر به مجموعههای کوچکی از کلمات یا دستورات محدود میشود و نه به گفتار پیوسته و طبیعی.
عیب سیستمهای پوشیدنی این است که حسگرها باید از طریق لایهای از پوست و استخوان به مغز گوش دهند که سیگنالهای عصبی را تضعیف میکند. دستگاههای کاشتهشده از طریق جراحی سیگنالهای بسیار قویتری را دریافت میکنند زیرا بسیار نزدیک به نورونها قرار دارند. سابی معتقد است که راه افزایش دقت با یک دستگاه پوشیدنی، افزایش چشمگیر تعداد حسگرهای آن است. اکثر دستگاههای EEG دارای دوازده تا چند صد حسگر هستند. کلاه سابی بین ۷۰,۰۰۰ تا ۱۰۰,۰۰۰ حسگر مینیاتوری خواهد داشت.
چابرا میگوید: «با توجه به این حسگر با چگالی بالا، دقیقاً مشخص میکند که فعالیت عصبی چیست و در کجا رخ میدهد. ما از این اطلاعات برای به دست آوردن دادههای بسیار قابل اعتمادتر برای رمزگشایی آنچه فرد فکر میکند، استفاده میکنیم.»
این شرکت در نظر دارد سرعت تایپ اولیه را حدود ۳۰ کلمه در دقیقه تعیین کند. این سرعت از تایپ اکثر افراد کندتر است، اما او میگوید با صرف زمان بیشتر توسط کاربران با کلاه، سرعت بهبود خواهد یافت.
یکی از مشکلات بزرگ در رمزگشایی گفتار تصوری، تنوع زیاد در الگوهای طبیعی فکر است. حتی اگر دو نفر به گفتن یک عبارت مشابه فکر کنند، مغزشان کمی متفاوت عمل میکند.
BCIها برای رمزگشایی فعالیت عصبی به دستورات قابل اجرا و در زمان واقعی، به هوش مصنوعی متکی هستند. برای دستگاههای کاشتهشده، مدلهای هوش مصنوعی بر روی دادههای عصبی یک فرد آموزش میبینند. اما یک دستگاه پوشیدنی باید بتواند گفتار مورد نظر را از بسیاری از کاربران رمزگشایی کند.
برای رفع این مشکل، سابی در حال ساخت نوعی مدل هوش مصنوعی در مقیاس بزرگ به نام مدل بنیادی مغز (brain foundation model) است که بر روی دادههای عصبی گسترده از افراد زیادی آموزش دیده تا الگوهای بنیادی فعالیت مرتبط با گفتار درونی را بیاموزد. چابرا میگوید این شرکت تاکنون ۱۰۰,۰۰۰ ساعت داده مغزی از ۱۰۰ داوطلب جمعآوری کرده است.
جوجو پلت، یک مشاور مستقل نوروتکنولوژی مستقر در سان فرانسیسکو، میگوید اگر توسعهدهندگان امیدوارند محصولی قابل دوام داشته باشند، دستگاههای حسگر مغزی مصرفکننده باید به طور جهانی آسان برای استفاده باشند. اکثر BCIها باید قبل از هر بار استفاده کالیبره شوند، زیرا سیگنالهای مغزی میتوانند از روزی به روز دیگر بر اساس سطح خستگی و تمرکز کاربر تغییر کنند. دستگاههای مصرفکننده باید بلافاصله کار کنند—و به طور مداوم—تا افراد به طور منظم از آنها استفاده کنند.
پلت میگوید: «این دستگاهها باید آماده استفاده از جعبه باشند. آنها باید با من سازگار شوند نه من با آنها.»
راحتی و نامحسوس بودن نیز برای دستگاههای پوشیدنی کلیدی خواهد بود. پلت میگوید حتی برای کاربردهای پزشکی یا کمکی، بیماران یک دستگاه نامحسوس را ترجیح میدهند. به همین دلیل است که نورالینک، پارادرومیکس و سینکرون همگی در حال توسعه دستگاههای کاشتنی هستند که از نظر ظاهری نامرئی هستند.
همین امر در مورد دستگاههای پوشیدنی مصرفکننده نیز صدق میکند. حلقهها و ساعتهای هوشمند برای کوچک، جمع و جور و راحت بودن طراحی شدهاند. یک شرکت دستگاه پوشیدنی مغزی، نورابل، حسگرهای EEG را در یک جفت هدفون نصب کرده است که کاملاً شبیه چیزی هستند که برای گوش دادن به موسیقی استفاده میکنید.
تایپ کردن با مغز جذاب به نظر میرسد، اما سوالاتی را در مورد حریم خصوصی و امنیت دادههای عصبی نیز مطرح میکند. چابرا میگوید هنگامی که دادهها از دستگاه خارج شده و در فضای ابری بارگذاری میشوند، از ابتدا تا انتها رمزگذاری میشوند. مدلهای هوش مصنوعی سابی قادرند بر روی دادههای رمزگذاریشده آموزش ببینند نه دادههای خام عصبی. این شرکت با کارشناسان امنیت عصبی از دانشگاه استنفورد و جاهای دیگر برای ممیزی کل پشته فناوری خود مشورت میکند.
چابرا میگوید: «ما باید تشخیص دهیم که دادههای عصبی خصوصیترین نوع دادهای هستند که یک فرد میتواند داشته باشد. عدم برخورد با دقت با آن ناعادلانه خواهد بود.»