تصویرسازی: النا اسکوتی/وال استریت ژورنال
تصویرسازی: النا اسکوتی/وال استریت ژورنال

نبرد چت‌جی‌پی‌تی، کلود و دیپ‌سیک: کدام یک دستیار هوش مصنوعی من خواهند بود؟

هوش مهم است، اما ویژگی‌ها نیز مهم هستند—در اینجا نحوه عملکرد ربات‌های محبوب هنگام انجام کارهای دنیای واقعی آورده شده است.

مقدمه

این نسخه فقط برای استفاده شخصی و غیرتجاری شما است. توزیع و استفاده از این مطالب تابع توافقنامه مشترک ما و قانون حق چاپ است. برای استفاده غیرشخصی یا سفارش چندین نسخه، لطفاً با Dow Jones Reprints با شماره 1-800-843-0008 تماس بگیرید یا به www.djreprints.com مراجعه کنید.

https://www.wsj.com/tech/personal-tech/chatgpt-claude-deepseek-ai-features-compared-c5e1483c

من همچنان منتظر می‌مانم تا تیمم برای من یک لیوان با عنوان «بهترین رئیس جهان» بخرد. بعد یادم می‌افتد که آن‌ها ربات هستند. چاپلوسی در محیط کار یکی از مهارت‌های متعدد آن‌ها نیست.

دو همکار هوش مصنوعی در نمودار سازمانی من، چت‌جی‌پی‌تی از OpenAI و کلود از Anthropic هستند. در طول چند ماه گذشته، آن‌ها بخشی از کار من را بر عهده گرفته‌اند... بنابراین من می‌توانم حتی کارهای بیشتری انجام دهم. و اکنون من در حال آزمایش یک دستیار سوم، دیپ‌سیک هستم.

آن‌ها فقط ایمیل‌ها را بازنویسی نمی‌کنند یا جلسات را خلاصه نمی‌کنند. این افراد در حال ساختن صفحات گسترده، آماده کردن تحقیقات، ایجاد تقویم و بله، حتی سفارش دادن گل برای همسرم هستند.

من ماهانه 20 دلار برای کلود و چت‌جی‌پی‌تی پرداخت می‌کنم. چرا هر دو؟ زیرا ما در دوران پرآشوب هوش مصنوعی زندگی می‌کنیم، جایی که بهترین دستیار هوش مصنوعی یک هفته، در هفته بعد هم از رده خارج می‌شود. نمونه بارز: ظهور غافلگیرکننده اخیر دیپ‌سیک. خوشبختانه، آن رایگان است. من همچنین جمینی گوگل، متا ای‌آی و مایکروسافت کوپایلوت را آزمایش کرده‌ام، اما به گفته شینیا تواین بزرگ، آن‌ها به اندازه کافی مرا تحت تأثیر قرار نمی‌دهند.

انتخاب بهترین دستیار هوش مصنوعی برای کار شما فقط مربوط به این مدل‌های هوشمندتر نیست، بلکه مربوط به ابزارها و ویژگی‌هایی است که به شما در انجام کارها کمک می‌کنند. شما یک هوش مصنوعی را نه به خاطر اینکه چقدر خوب می‌تواند کار شما را انجام دهد، بلکه به خاطر اینکه چه تعداد کار را می‌توانید به آن محول کنید، قضاوت خواهید کرد.

اریک برینجولفسون، اقتصاددان دانشگاه استنفورد و بنیانگذار شرکت مشاوره هوش مصنوعی در محل کار، Workhelix می‌گوید: «هر شغل مجموعه‌ای از وظایف است. وقتی مشاغل را در آن سطح تجزیه و تحلیل می‌کنید، واقعاً می‌توانید پیشرفت کنید تا بفهمید که آیا فناوری می‌تواند کمک کند یا خیر.»

وظایفی که می‌توانید به این دستیاران برون‌سپاری کنید بستگی به شغل شما، گردش کار شما و مهم‌تر از همه، قابلیت‌های هوش مصنوعی دارد. بله، این خیلی شبیه به استخدام است—شما کاندیدی را می‌خواهید که مهارت‌های مناسب را داشته باشد.

متفکر عمیق

از کلود خواستم فهرستی از مخاطبین را در یک صفحه گسترده سازماندهی کند—سپس بلافاصله در ادامه گفت: «من همچنین می‌توانم به ایجاد الگوهای ایمیل برای برقراری ارتباط با این مخاطبین کمک کنم.» کارمند لومون کامل: کاملاً متمرکز، کارآمد و شاد. (من طرفداران "Severance" را می‌بینم.)

این دلیل اصلی تبدیل شدن کلود به گزینه اصلی من است. نوشته آن برتر است، و نه تنها کار را انجام می‌دهد بلکه توضیح می‌دهد که چه کاری انجام داده و وظایف بعدی را پیشنهاد می‌کند، همه با شخصیتی سرزنده.

آخرین خبرها همه در مورد مدل‌های «استدلال» است که پرس‌وجوها را به مراحلی تقسیم می‌کنند و در پاسخ‌های خود «فکر می‌کنند». DeepThink R1 دیپ‌سیک کل فرآیند فکری خود را نشان می‌دهد. وقتی پرسیدم آیا هات داگ ساندویچ است یا خیر، 28 ثانیه مرا در تفکر خود راهنمایی کرد—همراه با تحلیلی از دستورالعمل‌های وزارت کشاورزی ایالات متحده.

با رفتن به DeepThink R1، مدل قبل از ارائه پاسخ نهایی، فرآیند فکری خود را نشان می‌دهد.
با رفتن به DeepThink R1، مدل قبل از ارائه پاسخ نهایی، فرآیند فکری خود را نشان می‌دهد.
جوانا استرن/وال استریت ژورنال

o1 OpenAI نیز برای فکر کردن وقت می‌گذارد، اما تمام کار خود را نشان نمی‌دهد. داریو آمودی، مدیرعامل آنتروپیک، هفته گذشته به من گفت که شرکتش استدلال را به عنوان یک ویژگی جداگانه نمی‌بیند—کلود سوننت 3.5 در حال حاضر قابلیت‌های مشابهی دارد.

استاد جزئیات

چت‌جی‌پی‌تی مرا درک می‌کند. واقعاً مرا درک می‌کند. ویژگی حافظه آن جزئیات مربوط به شما را پیگیری می‌کند و ترجیحات شما را برای سفارشی کردن پاسخ‌ها یاد می‌گیرد. به تنظیمات، سپس شخصی‌سازی بروید، و می‌توانید آن را فعال کنید تا یک پرونده کوچک در مورد شما بسازد.

اگر حافظه چت‌جی‌پی‌تی را فعال کرده‌اید، می‌توانید آنچه را که در مورد شما می‌داند، در تنظیمات ببینید و تنظیم کنید.
اگر حافظه چت‌جی‌پی‌تی را فعال کرده‌اید، می‌توانید آنچه را که در مورد شما می‌داند، در تنظیمات ببینید و تنظیم کنید.
جوانا استرن/وال استریت ژورنال

مال من شامل این موارد است: «جوانا در حال نوشتن کتابی در مورد هوش مصنوعی در زندگی خود برای یک سال است» (درست) و «کمر جوانا درد می‌کند» (امروز درست نیست). این باعث می‌شود پاسخ‌ها شخصی‌تر به نظر برسند، اما می‌توانید خطوط جداگانه را حذف کنید، آن را خاموش کنید و حتی به طور کامل پاک کنید.

چت‌جی‌پی‌تی حتی عادات من را هم یاد گرفته است. اگر متنی را جایگذاری کنم، فقط می‌داند که من می‌خواهم آن را ویرایش کنم، نیازی به اعلان نیست.

برای کلود و دیپ‌سیک، حافظه بیشتر شبیه... ماهی قرمز است. آن‌ها جزئیات را در طول یک چت یا پروژه به خاطر می‌آورند، اما وقتی تازه شروع می‌کنید همه چیز را فراموش می‌کنند. آمودی می‌گوید حافظه کلود بهبود خواهد یافت. دیپ‌سیک به درخواست‌های من برای اظهار نظر پاسخی نداد.

مدیر پروژه

همانطور که من ماجراجویی کتاب هوش مصنوعی خود را آغاز می‌کنم، یک دستیار تحقیق انسانی استخدام کرده‌ام. اما کلود قبلاً حدود 85 درصد از کارهای سخت را با استفاده از ویژگی پروژه‌های خود انجام داده است.

من تمام اسناد مربوط به کتابم (پیشنهاد، طرح‌ها، یادداشت‌های پراکنده) را در یک پروژه، اساساً یک ظرف داده کوچک، بارگذاری کردم. اکنون کلود می‌تواند هر زمان که به چیزی نیاز دارم با آن‌ها کار کند.

پروژه کلود من برای کتابی که روی آن کار می‌کنم به اسناد و دستورالعمل‌هایی در مورد نحوه کار آن دسترسی دارد.
پروژه کلود من برای کتابی که روی آن کار می‌کنم به اسناد و دستورالعمل‌هایی در مورد نحوه کار آن دسترسی دارد.
جوانا استرن/وال استریت ژورنال

در یک مقطع، من به یک صفحه گسترده اصلی از تمام شرکت‌ها و افرادی که در اسناد من ذکر شده بودند، با فیلدهایی برای پیگیری پیشرفت خود نیاز داشتم. کلود نام‌ها را بیرون کشید و آن‌ها را در یک برگه با قالب‌بندی مناسب جمع‌آوری کرد. اکنون، من پروژه را باز می‌کنم و از کلود می‌پرسم که بعد چه کاری باید انجام دهم.

چت‌جی‌پی‌تی به تازگی ویژگی پروژه را اضافه کرده است، اما وقتی صحبت از مدیریت وظایف کتاب من می‌شود، من ویژگی‌های شخصیتی کلود را ترجیح می‌دهم.

حرفه ای تحقیق

اما کلود بدون دسترسی به وب در زمان واقعی، از رویدادهای جاری غافل است. برای همه چیزهایی که می‌داند، دیوید هسلهاف می‌تواند رئیس جمهور باشد، و ما همگی می‌توانیم با ماشین‌های پرنده سبک جتسون رفت و آمد کنیم.

در همین حال، چت‌جی‌پی‌تی و دیپ‌سیک حالت‌های مرور وب دارند. آن‌ها را روشن کنید، و آن‌ها اطلاعات زمان واقعی را به همراه پیوندهایی به منابع می‌آورند. برای افرادی که در چند هفته آینده با آن‌ها مصاحبه می‌کنم، چت‌جی‌پی‌تی و دیپ‌سیک بیوگرافی‌های به‌روزی را به همراه پیوندهایی به کارهای اخیر جمع‌آوری کردند.

آمودی می‌گوید ادغام وب کلود "بسیار زود" در راه است و با رقبا متفاوت خواهد بود.

ارتباط دهنده خوب

من یک عادت جدید دارم. وقتی در ماشین هستم یا در حال پیاده‌روی، ایده‌هایم را به چت‌جی‌پی‌تی می‌گویم، و آن را یادداشت می‌کند.

نظرات خود را به اشتراک بگذارید

به نظر شما کدام چت‌بات مفیدتر است؟ در گفتگو زیر شرکت کنید.

چت‌جی‌پی‌تی با حالت صوتی پیشرفته، به روشی طبیعی و مکالمه‌ای پاسخ می‌دهد. نمی‌تواند در این حالت اقدامی انجام دهد (بنابراین هنوز ایمیل ارسال نمی‌شود)، اما می‌توانم بعداً بپرسم، «هی، آن ایده نابغه‌ای که امروز صبح داشتم چه بود؟» و آن را به من یادآوری می‌کند. همچنین می‌تواند یادداشت‌ها را به عنوان یک فایل متنی صادر کند تا بتوانم آن‌ها را به یک پروژه در کلود اضافه کنم.

مایکروسافت کوپایلوت، متا ای‌آی و گوگل جمینی لایو همگی حالت‌های صوتی تعاملی دارند، که در اینجا بررسی کردم. دیپ‌سیک و کلود معادل آن را ندارند.

خود راه انداز

این همه به کجا منتهی می‌شود؟ عوامل هوش مصنوعی. ربات‌های بعدی اقدامات دنیای واقعی را از طرف ما انجام خواهند داد. در حالی که ما هنوز دقیقاً در مرحله «مدیریت کل صندوق ورودی من» نیستیم، ابزار اپراتور جدید OpenAI (بخشی از طرح حرفه‌ای 200 دلاری در ماه) نگاهی اجمالی ارائه می‌دهد.

من اپراتور را با پرسیدن از چت‌جی‌پی‌تی آزمایش کردم: «برای همسرم چند گل از Bouqs.com سفارش بده. چیزی با رنگ‌های نارنجی و زرد پیدا کن و از زنبق پرهیز کن.» با حیرت تماشا کردم که در یک مرورگر مجازی کروم در سایت حرکت می‌کند. وقتی برای اولین بار یک چیدمان مهمانی 200 دلاری پیشنهاد داد، آن را تغییر مسیر دادم و به سرعت جایگزینی را پیدا کرد که دوست داشتم.

اپراتور چت‌جی‌پی‌تی با موفقیت به Bouqs.com هدایت شد، انتخاب را پیمایش کرد و گل‌ها را بدون زنبق انتخاب کرد.
اپراتور چت‌جی‌پی‌تی با موفقیت به Bouqs.com هدایت شد، انتخاب را پیمایش کرد و گل‌ها را بدون زنبق انتخاب کرد.
جوانا استرن/وال استریت ژورنال
یک روز بعد گل‌های سفارش داده شده توسط هوش مصنوعی به خانه جوانا رسید.
یک روز بعد گل‌های سفارش داده شده توسط هوش مصنوعی به خانه جوانا رسید.
جوانا استرن/وال استریت ژورنال

خیلی کند بود و اشتباهاتی داشت، و من هنوز باید خودم جزئیات پرداخت را مدیریت می‌کردم. همچنین دوست نداشتم اطلاعات شخصی خود را در یک مرورگر از راه دور تایپ کنم. اما از نحوه پیمایش آن در وب شگفت زده شدم. گذشته از این، هیچ چیز به اندازه این که ربات من این‌ها را برای شما سفارش داده است، نمی‌گوید «دوستت دارم».

کلود قابلیت‌های مشابهی را از طریق حالت استفاده از کامپیوتر خود ارائه می‌دهد، اما این امر به تنظیمات فنی بیشتری نیاز دارد.

بنابراین برای کسانی که پیگیر هستند: کلود گزینه اصلی من برای برنامه‌ریزی پروژه، وظایف اداری و مستندات واضح است و شخصیتی عالی دارد. چت‌جی‌پی‌تی با دانش وب در زمان واقعی، صدای دوستانه و موارد دیگر، کمبودها را جبران می‌کند.

دیپ‌سیک باهوش است، اما تا کنون فاقد ویژگی‌هایی است که در دفتر کار پیشرفت کند. شاید الان زمان خوبی برای خرید آن لیوان برای من باشد.

با جوانا استرن در [email protected] بنویسید.