زمانی که OpenAI شروع به ارائه نمایشهای خصوصی از فناوری جدید GPT-4 خود در اواخر سال ۲۰۲۲ کرد، مهارتهای آن حتی با تجربهترین محققان هوش مصنوعی را نیز شوکه کرد. این فناوری میتوانست به سؤالات پاسخ دهد، شعر بنویسد و کد کامپیوتری را به گونهای تولید کند که بسیار جلوتر از زمان خود به نظر میرسید.
بیش از دو سال بعد، OpenAI جانشین خود را منتشر کرده است: GPT-4.5. این فناوری جدید نشاندهنده پایان یک دوره است. OpenAI گفت GPT-4.5 آخرین نسخه از سیستم چتبات آن خواهد بود که «استدلال زنجیرهای» را انجام نمیدهد.
پس از این انتشار، فناوری OpenAI ممکن است، مانند یک انسان، قبل از پاسخ دادن، زمان قابل توجهی را صرف فکر کردن در مورد یک سوال کند، نه اینکه یک پاسخ فوری ارائه دهد.
GPT-4.5، که میتواند برای قدرت بخشیدن به گرانترین نسخه ChatGPT استفاده شود، احتمالاً به اندازه GPT-4 هیجان ایجاد نمیکند، زیرا تا حد زیادی تحقیقات هوش مصنوعی به سمت مسیرهای جدیدی تغییر کرده است. با این حال، این شرکت گفت که این فناوری نسبت به فناوریهای چتبات قبلی خود «احساس طبیعیتری» خواهد داشت.
میا گلاس، معاون تحقیقات در OpenAI، گفت: «آنچه مدل را متمایز میکند، توانایی آن در تعامل در مکالمات گرم، شهودی و روان طبیعی است، و ما فکر میکنیم که درک قویتری از معنای کاربران هنگام درخواست چیزی دارد.»
در پاییز، این شرکت فناوری به نام OpenAI o1 را معرفی کرد که برای استدلال در مورد وظایف مربوط به ریاضیات، کدنویسی و علم طراحی شده بود. این فناوری جدید بخشی از یک تلاش گستردهتر برای ساخت هوش مصنوعی بود که میتواند از طریق وظایف پیچیده استدلال کند. شرکتهایی مانند گوگل، متا و DeepSeek، یک استارتآپ چینی، در حال توسعه فناوریهای مشابهی هستند.
هدف این است که سیستمهایی ساخته شوند که بتوانند به دقت و منطقی یک مسئله را از طریق یک سری مراحل مجزا حل کنند، که هر کدام بر اساس مرحله قبلی ساخته شدهاند، شبیه به نحوه استدلال انسان. این فناوریها میتوانند به ویژه برای برنامهنویسان کامپیوتر که از سیستمهای هوش مصنوعی برای نوشتن کد استفاده میکنند، مفید باشند.
این سیستمهای استدلالی مبتنی بر فناوریهایی مانند GPT-4.5 هستند که مدلهای زبان بزرگ یا L.L.M. نامیده میشوند.
L.L.M.ها مهارتهای خود را با تجزیه و تحلیل مقادیر زیادی متن جمعآوریشده از سراسر اینترنت، از جمله مقالات ویکیپدیا، کتابها و گزارشهای گفتگو، یاد میگیرند. با مشخص کردن الگوها در تمام آن متن، آنها یاد گرفتند که خودشان متن تولید کنند.
برای ساخت سیستمهای استدلالی، شرکتها L.L.M.ها را از طریق یک فرآیند اضافی به نام یادگیری تقویتی قرار میدهند. از طریق این فرآیند - که میتواند هفتهها یا ماهها طول بکشد - یک سیستم میتواند از طریق آزمایش و خطای گسترده، رفتار را یاد بگیرد.
به عنوان مثال، با کار کردن بر روی مسائل مختلف ریاضی، میتواند یاد بگیرد که کدام روشها منجر به پاسخ صحیح میشوند و کدام روشها اینطور نیستند. اگر این فرآیند را با تعداد زیادی از مسائل تکرار کند، میتواند الگوها را شناسایی کند.
OpenAI و دیگران بر این باورند که این آینده توسعه هوش مصنوعی است. اما از برخی جهات، آنها مجبور شدهاند در این مسیر گام بردارند، زیرا دادههای اینترنتی مورد نیاز برای آموزش سیستمهایی مانند GPT-4.5 تمام شده است.
برخی از سیستمهای استدلالی در برخی از آزمونهای استاندارد، عملکرد بهتری نسبت به L.L.M.های معمولی دارند. اما آزمونهای استاندارد همیشه معیار خوبی برای نحوه عملکرد فناوریها در موقعیتهای دنیای واقعی نیستند.
کارشناسان خاطرنشان میکنند که سیستم استدلالی جدید لزوماً نمیتواند مانند یک انسان استدلال کند. و مانند سایر فناوریهای چتبات، آنها هنوز هم میتوانند اشتباه کنند و چیزهایی را جعل کنند - پدیدهای که توهم نامیده میشود.
OpenAI گفت که از روز پنجشنبه، GPT-4.5 برای هر کسی که مشترک ChatGPT Pro باشد، در دسترس خواهد بود، یک سرویس 200 دلاری در ماه که دسترسی به تمام آخرین ابزارهای این شرکت را فراهم میکند.
(نیویورک تایمز در ماه دسامبر از OpenAI و شریک آن، مایکروسافت، به دلیل نقض حق نسخهبرداری از محتوای خبری مربوط به سیستمهای هوش مصنوعی شکایت کرد.)