مدل مدت‌ها انتظار کشیده شده GPT-5 از OpenAI در آستانه انتشار است

خلاصه

آزمایش‌کنندگان اولیه GPT-5 از توانایی‌های آن در کدنویسی و حل مسئله تحت تأثیر قرار گرفته‌اند.
چالش‌ها شامل محدودیت‌های داده و خطاهای ناشی از سخت‌افزار در طول آموزش مدل هستند.
مدیرعامل OpenAI، آلتمن، می‌گوید که این شرکت در "محاسبات زمان آزمایش" برای کارهای پیچیده سرمایه‌گذاری می‌کند.

سانفرانسیسکو، ۶ اوت (رویترز) - GPT-5، جدیدترین نسخه از فناوری هوش مصنوعی OpenAI که در سال ۲۰۲۲ موتور محرک ChatGPT بود، در آستانه انتشار قرار دارد و کاربران با دقت بررسی خواهند کرد که آیا این جهش نسبت به GPT-4 به اندازه بهبودهای قبلی این آزمایشگاه تحقیقاتی است یا خیر.

دو نفر از آزمایش‌کنندگان اولیه این مدل جدید به رویترز گفتند که از توانایی آن در کدنویسی و حل مسائل علمی و ریاضی تحت تأثیر قرار گرفته‌اند، اما معتقدند که جهش از GPT-4 به GPT-5 به بزرگی جهش از GPT-3 به GPT-4 نیست. این آزمایش‌کنندگان که قراردادهای عدم افشا امضا کرده‌اند، نخواستند نامشان برای این داستان فاش شود.

OpenAI از اظهارنظر در مورد این خبر خودداری کرد.

جهش GPT-4 بر اساس قدرت محاسباتی و داده‌های بیشتر بود و شرکت امیدوار بود که "مقیاس‌پذیری" (scaling up) به روشی مشابه، به طور مداوم منجر به بهبود مدل‌های هوش مصنوعی شود.

اما OpenAI که تحت حمایت مایکروسافت (MSFT.O) است و در حال حاضر ۳۰۰ میلیارد دلار ارزش دارد، در مقیاس‌پذیری با مشکلاتی مواجه شد. یکی از مشکلات، دیوار داده‌ای بود که این شرکت با آن برخورد کرد و ایلیا سوتسکور، دانشمند ارشد سابق OpenAI، سال گذشته گفت که در حالی که قدرت پردازش در حال رشد است، میزان داده‌ها افزایش نمی‌یابد.

او به این واقعیت اشاره داشت که مدل‌های زبان بزرگ بر روی مجموعه‌های داده عظیم که کل اینترنت را کاوش می‌کنند، آموزش می‌بینند و آزمایشگاه‌های هوش مصنوعی گزینه‌های دیگری برای حجم زیادی از داده‌های متنی تولید شده توسط انسان ندارند.

علاوه بر کمبود داده، مشکل دیگر این بود که "اجرای آموزش" (training runs) برای مدل‌های بزرگ بیشتر احتمال دارد به دلیل پیچیدگی سیستم، با خرابی‌های ناشی از سخت‌افزار مواجه شود و محققان ممکن است تا پایان اجرای آموزش، که می‌تواند ماه‌ها طول بکشد، از عملکرد نهایی مدل‌ها مطلع نباشند.

OpenAI نگفته است که GPT-5 چه زمانی منتشر خواهد شد، اما طبق گزارش‌های رسانه‌ها، صنعت انتظار دارد که این اتفاق هر لحظه رخ دهد. بوریس پاور، رئیس تحقیقات کاربردی در OpenAI، در پستی در پلتفرم X در روز دوشنبه گفت: "مشتاقم ببینم که عموم مردم از GPT-5 چگونه استقبال می‌کنند."

ناوین چادا، شریک مدیریت در صندوق سرمایه‌گذاری خطرپذیر Mayfield که در شرکت‌های هوش مصنوعی سرمایه‌گذاری می‌کند اما سرمایه‌گذار OpenAI نیست، گفت: "OpenAI چنان جهش بزرگی از GPT-3 به GPT-4 انجام داد که از آن زمان تاکنون، انتظار عظیمی برای GPT-5 وجود داشته است. امید این است که GPT-5 کاربردهای هوش مصنوعی را فراتر از چت، به سمت اجرای وظایف کاملاً خودمختار سوق دهد."

"محاسبات زمان آزمایش"

نزدیک به سه سال پیش، ChatGPT دنیای هوش مصنوعی مولد را معرفی کرد و با توانایی خود در نوشتن متون و اشعار شبه انسانی، کاربران را به وجد آورد و به سرعت به یکی از سریع‌ترین برنامه‌ها در رشد پایگاه کاربری تبدیل شد.

در مارس ۲۰۲۳، OpenAI پس از ChatGPT، مدل زبان بزرگ GPT-4 را منتشر کرد که جهش‌های بزرگی در هوش به ارمغان آورد. در حالی که GPT-3.5، نسخه قبلی این مدل، نمره آزمون وکالت را در ۱۰ درصد پایین‌ترین حد دریافت کرد، GPT-4 آزمون وکالت شبیه‌سازی شده را در ۱۰ درصد برتر قبول شد.

سپس GPT-4 به مدلی تبدیل شد که باید از آن پیشی گرفت و جهان با این واقعیت کنار آمد که مدل‌های هوش مصنوعی می‌توانند در بسیاری از کارها از انسان‌ها بهتر عمل کنند.

به زودی، شرکت‌های دیگر نیز به این جریان پیوستند. در همان سال، گوگل (GOOGL.O) از آلفابت و آنتروپیک - که تحت حمایت آمازون (AMZN.O) و گوگل است - مدل‌های رقابتی با GPT-4 را منتشر کردند. ظرف یک سال، مدل‌های متن‌باز هم‌رده با GPT-4 مانند مدل‌های Llama 3 از متا پلتفرمز (META.O) نیز منتشر شدند.

OpenAI علاوه بر آموزش مدل‌های بزرگ، اکنون در مسیر دیگری به نام "محاسبات زمان آزمایش" (test-time compute) سرمایه‌گذاری کرده است که قدرت پردازشی بیشتری را برای حل وظایف چالش‌برانگیز مانند ریاضیات یا عملیات پیچیده‌ای که نیازمند استدلال و تصمیم‌گیری شبیه به انسان هستند، هدایت می‌کند.

سم آلتمن، مدیرعامل این شرکت، اوایل سال جاری گفت که GPT-5 هم محاسبات زمان آزمایش و هم مدل‌های بزرگ آن را ترکیب خواهد کرد. او همچنین گفت که مدل‌ها و محصولات OpenAI "پیچیده" شده‌اند.

گزارش از آنا تانگ در سانفرانسیسکو؛ ویرایش توسط سایانتانی گوش و مورالیکومار آنانتارامان

برچسب‌ها OpenAI GPT-5 هوش مصنوعی مدل زبان بزرگ یادگیری عمیق فناوری ChatGPT محاسبات زمان آزمایش

این گزارش ترجمه و بازنویسی خبری با موتور هوش مصنوعی افق آبی است و برای خوانندهٔ فارسی‌زبان بازتنظیم شده. منبع اصلی: reuters