خلاصه
- آزمایشکنندگان اولیه GPT-5 از تواناییهای آن در کدنویسی و حل مسئله تحت تأثیر قرار گرفتهاند.
- چالشها شامل محدودیتهای داده و خطاهای ناشی از سختافزار در طول آموزش مدل هستند.
- مدیرعامل OpenAI، آلتمن، میگوید که این شرکت در "محاسبات زمان آزمایش" برای کارهای پیچیده سرمایهگذاری میکند.
سانفرانسیسکو، ۶ اوت (رویترز) - GPT-5، جدیدترین نسخه از فناوری هوش مصنوعی OpenAI که در سال ۲۰۲۲ موتور محرک ChatGPT بود، در آستانه انتشار قرار دارد و کاربران با دقت بررسی خواهند کرد که آیا این جهش نسبت به GPT-4 به اندازه بهبودهای قبلی این آزمایشگاه تحقیقاتی است یا خیر.
دو نفر از آزمایشکنندگان اولیه این مدل جدید به رویترز گفتند که از توانایی آن در کدنویسی و حل مسائل علمی و ریاضی تحت تأثیر قرار گرفتهاند، اما معتقدند که جهش از GPT-4 به GPT-5 به بزرگی جهش از GPT-3 به GPT-4 نیست. این آزمایشکنندگان که قراردادهای عدم افشا امضا کردهاند، نخواستند نامشان برای این داستان فاش شود.
OpenAI از اظهارنظر در مورد این خبر خودداری کرد.
جهش GPT-4 بر اساس قدرت محاسباتی و دادههای بیشتر بود و شرکت امیدوار بود که "مقیاسپذیری" (scaling up) به روشی مشابه، به طور مداوم منجر به بهبود مدلهای هوش مصنوعی شود.
اما OpenAI که تحت حمایت مایکروسافت (MSFT.O) است و در حال حاضر ۳۰۰ میلیارد دلار ارزش دارد، در مقیاسپذیری با مشکلاتی مواجه شد. یکی از مشکلات، دیوار دادهای بود که این شرکت با آن برخورد کرد و ایلیا سوتسکور، دانشمند ارشد سابق OpenAI، سال گذشته گفت که در حالی که قدرت پردازش در حال رشد است، میزان دادهها افزایش نمییابد.
او به این واقعیت اشاره داشت که مدلهای زبان بزرگ بر روی مجموعههای داده عظیم که کل اینترنت را کاوش میکنند، آموزش میبینند و آزمایشگاههای هوش مصنوعی گزینههای دیگری برای حجم زیادی از دادههای متنی تولید شده توسط انسان ندارند.
علاوه بر کمبود داده، مشکل دیگر این بود که "اجرای آموزش" (training runs) برای مدلهای بزرگ بیشتر احتمال دارد به دلیل پیچیدگی سیستم، با خرابیهای ناشی از سختافزار مواجه شود و محققان ممکن است تا پایان اجرای آموزش، که میتواند ماهها طول بکشد، از عملکرد نهایی مدلها مطلع نباشند.
OpenAI نگفته است که GPT-5 چه زمانی منتشر خواهد شد، اما طبق گزارشهای رسانهها، صنعت انتظار دارد که این اتفاق هر لحظه رخ دهد. بوریس پاور، رئیس تحقیقات کاربردی در OpenAI، در پستی در پلتفرم X در روز دوشنبه گفت: "مشتاقم ببینم که عموم مردم از GPT-5 چگونه استقبال میکنند."
ناوین چادا، شریک مدیریت در صندوق سرمایهگذاری خطرپذیر Mayfield که در شرکتهای هوش مصنوعی سرمایهگذاری میکند اما سرمایهگذار OpenAI نیست، گفت: "OpenAI چنان جهش بزرگی از GPT-3 به GPT-4 انجام داد که از آن زمان تاکنون، انتظار عظیمی برای GPT-5 وجود داشته است. امید این است که GPT-5 کاربردهای هوش مصنوعی را فراتر از چت، به سمت اجرای وظایف کاملاً خودمختار سوق دهد."
"محاسبات زمان آزمایش"
نزدیک به سه سال پیش، ChatGPT دنیای هوش مصنوعی مولد را معرفی کرد و با توانایی خود در نوشتن متون و اشعار شبه انسانی، کاربران را به وجد آورد و به سرعت به یکی از سریعترین برنامهها در رشد پایگاه کاربری تبدیل شد.
در مارس ۲۰۲۳، OpenAI پس از ChatGPT، مدل زبان بزرگ GPT-4 را منتشر کرد که جهشهای بزرگی در هوش به ارمغان آورد. در حالی که GPT-3.5، نسخه قبلی این مدل، نمره آزمون وکالت را در ۱۰ درصد پایینترین حد دریافت کرد، GPT-4 آزمون وکالت شبیهسازی شده را در ۱۰ درصد برتر قبول شد.
سپس GPT-4 به مدلی تبدیل شد که باید از آن پیشی گرفت و جهان با این واقعیت کنار آمد که مدلهای هوش مصنوعی میتوانند در بسیاری از کارها از انسانها بهتر عمل کنند.
به زودی، شرکتهای دیگر نیز به این جریان پیوستند. در همان سال، گوگل (GOOGL.O) از آلفابت و آنتروپیک - که تحت حمایت آمازون (AMZN.O) و گوگل است - مدلهای رقابتی با GPT-4 را منتشر کردند. ظرف یک سال، مدلهای متنباز همرده با GPT-4 مانند مدلهای Llama 3 از متا پلتفرمز (META.O) نیز منتشر شدند.
OpenAI علاوه بر آموزش مدلهای بزرگ، اکنون در مسیر دیگری به نام "محاسبات زمان آزمایش" (test-time compute) سرمایهگذاری کرده است که قدرت پردازشی بیشتری را برای حل وظایف چالشبرانگیز مانند ریاضیات یا عملیات پیچیدهای که نیازمند استدلال و تصمیمگیری شبیه به انسان هستند، هدایت میکند.
سم آلتمن، مدیرعامل این شرکت، اوایل سال جاری گفت که GPT-5 هم محاسبات زمان آزمایش و هم مدلهای بزرگ آن را ترکیب خواهد کرد. او همچنین گفت که مدلها و محصولات OpenAI "پیچیده" شدهاند.
گزارش از آنا تانگ در سانفرانسیسکو؛ ویرایش توسط سایانتانی گوش و مورالیکومار آنانتارامان