نبرد چت باتها | مقایسه ChatGPT4 و Bard
کمپانی وابسته به مایکروسافت OpenAI و گوگل (Google) هر دو چت باتها یا رباتهای گفتگوی مبتنی بر هوش مصنوعی خود را در هفتههای اخیر عرضه کردهاند. موتورهای مکالمه هر یک از آنها نیز به شیوههای گوناگونی به سوالات کاربران پاسخ داده، مطالب مورد پرسش را ادراک کرده و جوابهای خلاقانهای ارائه میکنند. به منظور بررسی عملکرد هر یک از این چت باتها، تیم Financial Times آزمایشهای مختلفی را در زمینههای گوناگون بر روی این دو برنامه پیادهسازی کرده و نتایج حاصل را نیز منتشر کرده است. با توان تحلیل همراه باشید تا نظر متخصصان عرصههای مختلف را در مورد مقایسه ChatGPT4 و Bard مورد بررسی قرار دهیم.
مقایسه ChatGPT4 و Bard | طراحی و شیوه عملکرد آنها
این چت باتها به منظور پاسخدهی به سوالات کاربران و بر اساس دادههای موجود در اینترنت طراحی شدهاند. از جمله این وبسایتها به متون بسیار زیاد موجود در ویکیپدیا (Wikipedia)، کتابها و سایر اسناد موجود به منظور پیشبینی کردن کلمه محتمل بعدی مورد استفاده در جمله جستجو شده توسط کاربر مربوطه میتوان اشاره کرد. این امر به ChatGPT و Bard اجازه میدهد تا پاسخهای جالب توجه و مشابه با شیوه گفتار انسانها را به ما تحویل بدهند.
OpenAI و گوگل جزئیات کاملی در مورد شیوه تولید و عرضه چت باتهای خود ارائه نکردهاند. با این حال، به احتمال زیاد تفاوت زیادی میان دادهها و اهداف آموزشی آنها وجود دارد.
چت بات Bard به صورت ویژه به منظور برقرار کردن دیالوگهای طبیعی به سبک ارتباط میان انسانها طراحی شده است. این در حالیست که هدف از طراحی ChatGPT 4، تولید پاسخهای مفهومی در طیف گستردهای از موضوعات مختلف است. در مقایسه ChatGPT4 و Bard باید بدانید که GPT 4 به اینترنت متصل نبوده و تنها دادهها و رویدادهای تا ماه سپتامبر سال ۲۰۲۱ (اواسط شهریور ۱۴۰۰) را پوشش میدهد. به نظر میرسد که Bard نیز تنها میتواند نتایج حاصل از جستجو در Google را ارائه کند. شایان ذکر است که به نظر نمیرسد Bard بتواند کیفیت پاسخهای ارائه شده توسط گوگل را افزایش داده و بهبود ببخشد.
با توجه به اینکه تیم FT قصد داشت تا قابلیتهای این چت باتها را به مقدار بیشتری مورد آزمایش قرار دهد، کارهایی که اموری از قبیل خلاقیت، استعداد ذاتی و تخیل را در برمیگرفتند در آزمایش خود دخیل کرد. در ادامه به بررسی نتایج حاصل از این آزمایشها و نظر متخصصان Financial Times در اینباره میپردازیم.
خلاصه تحلیل متخصصان FT از مقایسه ChatGPT4 و Bard
در این رابطه از این چت باتها سوالاتی در مورد ارائه خلاصهای از تحلیل اخیر FT از فروش Credit Suisse توسط بانک سوئیس به رقیبان بزرگی مثل UBS پرسیده شد.
پاسخ ChatGPT 4 بدین صورت بود:
این در حالی بود که Bard به تیم تحقیقاتی اجازه نمیداد تا کل ماجرا را طی یک جستجو واحد وارد کند. بنابراین، میتوان چنین امری را یکی از معایب Bard در مقایسه ChatpGPT4 و Bard محسوب کرد. با توجه به دریافت نیمی از سوالات تیم FT در مورد این ماجرا، پاسخ Bard بدین صورت بود:
اوون واکر (Owen Walker)، خبرنگار حیطه بانکداری آمریکا، در این رابطه اینطور میگوید که:
پاسخ ارائه شده توسط ChatGPT 4 یک نمای کلی چشمگیر از تحلیل تیم FT محسوب میشود. تنها مشکل موجود در رابطه با این پاسخ بدین صورت است که باید به میزان ۵ تریلیون دلار دارایی «تحت مدیریت» وجود داشته باشد؛ اما این امر از سوالات طرح شده در ماجرای اصلی ارائه شده با این چت بات مشخص نبود. بنابراین میتوان از این اشکال چشمپوشی کرد.
از طرف دیگر، با وجود اینکه پاسخ دقیقی توسط Bard ارائه شده است، اما نسبت به پاسخ ارائه شده توسط GPT 4 فرمول محورتر بوده و ضعیفتر است. علاوه بر این، پاراگراف اول پاسخ ارائه شده توسط Bard خلاصه تکراری از متن کلی محسوب میشود.
آیا هوش مصنوعی میتواند برنده بعدی بازار سهام را مشخص کند؟
تیم FT قوانین مسابقه سالانه انتخاب سهام برنده توسط Financial Times را به این دو چت بات ارائه کردند. شرکتکنندگان این مسابقه باید پنج مورد از سهام موجود در کل دنیا را انتخاب کرده و موقعیت خرید استقراضی (Long) یا فروش استقراضی (Short) را برای هر کدام از آنها انتخاب کنند. بدین صورت مشخص میشود که هر یک از مشارکتکنندگان چه موضعگیری نسبت به سقوط و پیروزی سهام در این بازار دارند.
برنده این مسابقه فردی است که بیشترین درآمد کلی را از پورتفولیو یا سبد سهام خود به دست بیاورد. با توجه به این ماجرا، از این دو چت بات در مورد ارائه پیشبینی خود در مورد برنده این مسابقه در سال ۲۰۲۳ سوال پرسیده شد. ChatGPT 4 پاسخی مبنی بر اینکه تنها قادر است تا دادههای موجود تا سپتامبر ۲۰۲۱ را تحلیل کند به ما ارائه کرد، در حالی که محدودیتهای Bard هنوز مشخص نیست. در ادامه به بررسی پاسخهای ارائه شده توسط این دو چت بات میپردازیم.
رابین ویگلزورت (Robin Wigglesworth)، ویراستار Alphaville، در این رابطه اظهار کرد:
GPT 4 و Bard هر دو پاسخهای به نسبت مشابهی را ارائه کردهاند. سهام کمپانیهای بلوچیپ (کمپانیهایی با ارزش سهام بالا) در عرصه تکنولوژی را انتخاب کردند که عملکرد مطلوبی را تا سپتامبر سال ۲۰۲۱ از خود نشان دادهاند. این امر نشاندهنده تمایلات انسانی برای انتخاب گزینههای سهامی است که شانس بیشتری برای کسب پیروزی دارند.
هر دوی این چت باتها سهامی از قبیل تسلا (Tesla)، آمازون (Amazon) و مایکروسافت (Microsoft) را انتخاب کردهاند. Bard با انتخاب سازنده خود، Alphabet، تعصب خود را برای ارائه پاسخ نشان داد. در حالی که GPT 4 با انتخاب سهام بازار داغ انویدیا (Nvidia) و سازنده واکسن کووید ۱۹ یعنی مدرنا (Moderna)، متعهد بودن خود به سوالات و دادههای ارائه شده توسط کاربر را نشان داده است.
نتایج این سرفصل نشاندهنده بازده ۷۴.۴ درصدی در سال ۲۰۲۱ برای GPT 4 و بازده ۴۰.۵ درصدی برای Bard بودند. بنابراین میتوان گفت که هر دوی این نتایج، پاسخ خوبی به نظر میرسند. اما اگر تنها به زمان انتخاب سهام و پایان سال توجه کنیم، میزان بازده حاصل از این پورتفولیو به ترتیب تا ۱۶.۳ درصد و ۲۱.۱ درصد کاهش پیدا میکنند.
ممکن است هنوز هم چنین نتایجی، نتایج مطلوبی به نظر برسند اما رویکرد هوش مصنوعی برای انتخاب سهام حوزه تکنولوژی در آن نقطهای شکست میخورد که روند افزایش نرخ بهره در سال ۲۰۲۲ آغاز میشود. بدین ترتیب، بازده هر دو پورتفولیو یا سبد سهام ارائه شده در مقایسه ChatpGPT4 و Bard در طول سال ۲۰۲۲ به میزان ۴۰ درصد کاهش پیدا میکند. این در حالیست که شاخص S&P 500 طی این فرایند تنها به میزان ۱۹.۴ درصد رکود را تجربه کرد.
آیا AI میتواند جوک بگوید؟
طی این آزمایشات از هر دوی چت بات خواسته شد تا یک جوک بگویند و دلیل خندهدار بودن این جوک را نیز ذکر کنند. در ادامه، موضوعی که به نظر تیم انجامدهنده این آزمایش موضوع دشواری بود مورد انتخاب قرار گرفت. در این بخش میتوانید نتایج حاصل از این آزمایش را مشاهده کرده و خودتان قضاوت کنید.
برای مشاهده نتایج پاسخ ChatGPT بر روی این لینک کلیک کنید.
برای مشاهده نتایج حاصل از پاسخ Bard بر روی این لینک کلیک کنید.
آیا AI قادر به تصور کردن یک مکالمه خواهد بود؟
در مقایسه ChatGPT4 و Bard تصمیم گرفته شد تا توانایی این چت باتها برای تفکر خلاقانه انسانی مورد آزمایش قرار بگیرد. بنابراین از GPT 4 و Bard خواسته شد تا یک مکالمه خیالی از نشست بین شی جینپینگ (Xi Jinping) و ولادمیر پوتین (Vladimir Putin) ارائه کنند.
در تصویر پیش رو میتوانید نتایج حاصل از این پرسش را در پاسخ GPT 4 مشاهده کنید:
در تصویر زیر نیز میتوانید نتایج حاصل از پاسخ تخصصی Bard را در اینباره مشاهده کنید:
گیدیون رشمن (Gideon Rachman)، مفسر ارشد امور خارجی، در رابطه با این دو پاسخ اینطور مینویسد:
این دو نفر، رهبرانی هستند که موضوعات حیاتی زیادی برای گفتگو با یکدیگر دارند. به نظر میرسد که هر دو چت بات ChatGPT و Google Bard از راهنمای دیپلماسی باسیل فاولتی (Basil Fawlty) پیروی میکنند بدین صورت که: «هیچ اشارهای به جنگ نکنید». بدون شک این یک رویکرد مضحک است. در مذاکره میان این دو رهبر در مسکو، جنگ روسیه و اوکراین از موضوعات اصلی گفتگو خواهد بود. سوال اینجاست که بحث آنها تا چه اندازهای صریح خواهد بود. به عقیده من، مکالمات میان این دو شخص با یکدیگر مبهم خواهد بود، اما این امکان نیز وجود دارد که مکالمه صریحی نیز با یکدیگر داشته باشند.
حدس من از این مکالمه بدین صورت خواهد بود:
شی : علاقه دارم دیدگاه شما در مورد شیوه ادامه یافتن این جنگ و پایان یافتن آن را بدانم.
پوتین : من متوجه نگرانیهای شما هستم. ما مصمم هستیم تا اوکراین را از فاشیسم رها کرده و مداخله آمریکا در منطقه را شکست دهیم. مشکلات نیروهای ما مربوط به حجم عظیم تسلیحاتی است که آمریکا و ناتو وارد اوکراین کردهاند. بدون شک اگر چین بتواند منابع موشکی و سایر تسلیحات حیاتی مورد نیاز روسیه را تامین کند، کمک بزرگی به این جدال کرده است.
شی : من درخواست شما را درک کرده و آن را با دقت مورد بررسی قرار میدهم. همانطور که متوجه هستید، این یک وضعیت بسیار حساس محسوب میشود. به نظر من بهتر است تا مقامات دولتی خود برای بررسی و پوششدهی این کار تفویض کنیم تا زمینههایی که میتوانیم در آنها با یکدیگر همکاری داشته باشیم را پوششدهی کنند.
شایان ذکر است که چین تمایل دارد تا در روند صلح با اوکراین نیز نقش داشته باشد. در این زمینه چه کمکی از دست ما برمیآید؟
پوتین : ما قدردان طرح صلح چین هستیم. اما احساس میکنیم که هنوز زمان آن فرا نرسیده است تا شما با زلنسکی (Zelensky) صحبتی داشته باشید.
در صورتی که ChatpGPT یا GoogleBard کار خود را به درستی انجام میدادند، این نمونهای از مکالمه واقعگرایانه میان دو رهبر روسیه و چین محسوب میشد. در حال حاضر، چت باتهای مورد بررسی در این حوزه شکست خورده و نگران از دست رفتن موقعیت شغلی دیپلماتهای جهان نباید بود.
آیا هوش مصنوعی میتواند یک شعار تبلیغاتی بنویسد؟
طی آزمایشات صورت گرفته در مقایسه ChatGPT4 و Bard ، از این چت باتها خواسته شد تا یک شعار تبلیغاتی جدید برای یک شرکت خیالی تولید دسر لذیذ برای سگها ارائه کنند. در ادامه میتوانید پاسخ هر یک از آنها را مشاهده کنید. علاوه بر این، از هر دو پاسخ ارائه شده توسط چت باتها، در نرم افزار هوش مصنوعی تبدیل متن به تصویر MidJourney استفاده شد تا تصویر مربوط به این پاسخها نیز تولید شود.
هری هیدون (Harry Haydon)، استراتژیست برند در FT، در اینباره اینطور مینویسد:
در صورتی که این فرایند یک مسابقه میان دو آژانس تبلیغاتی بود، GPT 4 روانه جشن و پایکوبی کسب پیروزی بود و مدیر حساب کاربری Bard در حال بازگشتن به دفتر کار خود بود تا برگه اخراج خود را دریافت کند.
Bard اشتباه بزرگی را در زمینه در نظر نگرفتن خلاصه متن مورد پرسش مرتکب شده و طی یک روند تنبلانه از شعارهای کلیشه و تکراری مثل «خوراکیهای خوشمزهای که سگ شما را وادار میکند تا برای بیشتر خوردن آنها به شما التماس کند» استفاده میکند. این شعار به هیچ عنوان باعث نمیشود تا مشتری خریدار غذای سگ به این فکر بیافتد که این کمپانی از چه رویکرد متمایزی برای تولید محصول خود استفاده کرده است. همانطور که در خلاصه پیش رو نیز توضیح داده شده است، بدیهیست که USP یک محصول در واقع کیفیت برتر آن است.
GPT 4 خلاصه شعار تبلیغاتی خود را به زیبایی هرچه تمامتر ارائه میکند: «دل سگ خود را به دست بیاورید: دسرهای لذیذ برای سگهای شایسته». جای هیچگونه سوالی نیست که در حال مشاهده کردن یک تبلیغ غذای سگ شیک و عالی رتبه هستید. علاوه بر این، امتیاز اضافهای در زمینه گرافیکی و تصاویر همهجانبه این آژانس تبلیغاتی خیالی در زمینه پلتفرمهای دیجیتالی مختلف به GPT 4 تعلق میگیرد.
در حقیقت، هر دوی این تبلیغات شبیه به آثاری هستند که توسط افراد غیرمتخصص ارائه شدهاند. بنابراین، هنوز به عصر چیرگی رباتها بر انسانها نزدیک نیستیم اما این اتفاق چندان دور از نظر نیست.
سخن پایانی
در مقایسه ChatGPT4 و Bard باید گفت که آزمایشات مختلف و زیادی بر روی این چت باتها صورت گرفته است. در این مقاله به بررسی نتایج حاصل از آزمایشات تیم Financial Times بر روی این چت باتها و نظر افراد متخصص در مورد پاسخهای هر یک از این دو چت بات در زمینههای سیاسی، تبلیغاتی، محاوره و غیره پرداختیم. در نهایت و با توجه به نتایج مورد بررسی در این مقاله میتوان اینطور نتیجهگیری کرد که GPT 4 از کارایی بالاتر و عملکرد بهتری در مقایسه با Bard برخوردار است اما هیچ کدام از این دو چت بات به حیطه تخصصی انسانها در دنیای واقعی نزدیک نیستند. با این حال و با توجه به پاسخهای ارائه شده، فرا رسیدن عصر رباتها و هوش مصنوعی چندان از ذهن ما دور نیست. نظر شما در مورد رباتهای مکالمه مبتنی بر هوش مصنوعی چیست؟ آیا این چت باتها موجب از کار بیکار شدن افراد زیادی در آینده میشوند؟