مقالات

نبرد چت بات‌ها | مقایسه ChatGPT4 و Bard

کمپانی وابسته به مایکروسافت OpenAI و گوگل (Google‌) هر دو چت بات‌ها یا ربات‌های گفتگوی مبتنی بر هوش مصنوعی خود را در هفته‌های اخیر عرضه کرده‌اند. موتور‌های مکالمه هر یک از آنها نیز به شیوه‌های گوناگونی به سوالات کاربران پاسخ داده‌، مطالب مورد پرسش را ادراک کرده و جواب‌های خلاقانه‌ای ارائه می‌کنند. به منظور بررسی عملکرد هر یک از این چت بات‌ها‌، تیم Financial Times آزمایش‌های مختلفی را در زمینه‌های گوناگون بر روی این دو برنامه پیاده‌سازی کرده و نتایج حاصل را نیز منتشر کرده است. با توان تحلیل همراه باشید تا نظر متخصصان عرصه‌های مختلف را در مورد مقایسه ChatGPT4 و Bard مورد بررسی قرار دهیم.

مقایسه ChatGPT4 و Bard | طراحی و شیوه عملکرد آنها

مقایسه ChatGPT4 و Bard
منبع: FT

این چت بات‌ها به منظور پاسخ‌دهی به سوالات کاربران و بر اساس داده‌های موجود در اینترنت طراحی شده‌اند. از جمله این وب‌سایت‌ها به متون بسیار زیاد موجود در ویکی‌پدیا (Wikipedia)‌، کتاب‌ها و سایر اسناد موجود به منظور پیش‌بینی کردن کلمه محتمل بعدی مورد استفاده در جمله جستجو شده توسط کاربر مربوطه می‌توان اشاره کرد. این امر به ChatGPT و Bard اجازه می‌دهد تا پاسخ‌های جالب توجه و مشابه با شیوه گفتار انسان‌ها را به ما تحویل بدهند.

OpenAI و گوگل جزئیات کاملی در مورد شیوه تولید و عرضه چت بات‌های خود ارائه نکرده‌اند. با این حال‌، به احتمال زیاد تفاوت زیادی میان داده‌ها و اهداف آموزشی آنها وجود دارد.

چت بات Bard به صورت ویژه به منظور برقرار کردن دیالوگ‌های طبیعی به سبک ارتباط میان انسان‌ها طراحی شده است. این در حالیست که هدف از طراحی ChatGPT 4‌، تولید پاسخ‌های مفهومی در طیف گسترده‌ای از موضوعات مختلف است. در مقایسه ChatGPT4 و Bard باید بدانید که GPT 4 به اینترنت متصل نبوده و تنها داده‌ها و رویداد‌های تا ماه سپتامبر سال ۲۰۲۱ (اواسط شهریور ۱۴۰۰‌) را پوشش می‌دهد. به نظر می‌رسد که Bard نیز تنها می‌تواند نتایج حاصل از جستجو در Google را ارائه کند‌. شایان ذکر است که به نظر نمی‌رسد Bard بتواند کیفیت پاسخ‌های ارائه شده توسط گوگل را افزایش داده و بهبود ببخشد.

با توجه به این‌که تیم FT قصد داشت تا قابلیت‌های این چت بات‌ها را به مقدار بیشتری مورد آزمایش قرار دهد‌، کار‌هایی که اموری از قبیل خلاقیت‌، استعداد ذاتی و تخیل را در برمی‌گرفتند در آزمایش خود دخیل کرد. در ادامه به بررسی نتایج حاصل از این آزمایش‌ها و نظر متخصصان Financial Times  در اینباره می‌پردازیم.

خلاصه تحلیل متخصصان FT از مقایسه ChatGPT4 و Bard

در این رابطه از این چت بات‌ها سوالاتی در مورد ارائه خلاصه‌ای از تحلیل اخیر FT از فروش Credit Suisse توسط بانک سوئیس به رقیبان بزرگی مثل UBS پرسیده شد.

پاسخ ChatGPT 4 بدین صورت بود:

پاسخ GPT4 به فروش اعتبار سوئیس
منبع: FT

این در حالی بود که Bard به تیم تحقیقاتی اجازه نمی‌داد تا کل ماجرا را طی یک جستجو واحد وارد کند. بنابراین‌، می‌توان چنین امری را یکی از معایب Bard در مقایسه ChatpGPT4 و Bard محسوب کرد. با توجه به دریافت نیمی از سوالات تیم FT در مورد این ماجرا‌، پاسخ Bard بدین صورت بود:

پاسخ Bard به فروش اعتبار سوئیس
منبع: FT

اوون واکر (Owen Walker‌)‌، خبرنگار حیطه بانکداری آمریکا‌، در این رابطه اینطور می‌گوید که:

پاسخ ارائه شده توسط ChatGPT 4 یک نمای کلی چشمگیر از تحلیل تیم FT محسوب می‌شود. تنها مشکل موجود در رابطه با این پاسخ بدین صورت است که باید به میزان ۵ تریلیون دلار دارایی «تحت مدیریت‌» وجود داشته باشد؛ اما این امر از سوالات طرح شده در ماجرای اصلی ارائه شده با این چت بات مشخص نبود. بنابراین می‌توان از این اشکال چشم‌پوشی کرد.

از طرف دیگر‌، با وجود این‌که پاسخ دقیقی توسط Bard ارائه شده است‌، اما نسبت به پاسخ ارائه شده توسط GPT 4 فرمول محور‌تر بوده و ضعیف‌تر است. علاوه بر این‌، پاراگراف اول پاسخ ارائه شده توسط Bard خلاصه تکراری از متن کلی محسوب می‌شود.

آیا هوش مصنوعی می‌تواند برنده بعدی بازار سهام را مشخص کند؟

تیم FT قوانین مسابقه سالانه انتخاب سهام برنده توسط Financial Times را به این دو چت بات ارائه کردند. شرکت‌کنندگان این مسابقه باید پنج مورد از سهام موجود در کل دنیا را انتخاب کرده و موقعیت خرید استقراضی (Long) یا فروش استقراضی (Short) را برای هر کدام از آنها انتخاب کنند. بدین صورت مشخص می‌شود که هر یک از مشارکت‌کنندگان چه موضع‌گیری نسبت به سقوط و پیروزی سهام در این بازار دارند.

برنده این مسابقه فردی است که بیشترین درآمد کلی را از پورتفولیو یا سبد سهام خود به دست بیاورد. با توجه به این ماجرا‌، از این دو چت بات در مورد ارائه پیش‌بینی خود در مورد برنده این مسابقه در سال ۲۰۲۳ سوال پرسیده شد. ChatGPT 4 پاسخی مبنی بر این‌که تنها قادر است تا داده‌های موجود تا سپتامبر ۲۰۲۱ را تحلیل کند به ما ارائه کرد‌، در حالی که محدودیت‌های Bard هنوز مشخص نیست. در ادامه به بررسی پاسخ‌های ارائه شده توسط این دو چت بات می‌پردازیم.

پورتفولیو برنده سهام منتخب Bard و ChatGPT4
منبع: FT

رابین ویگلزورت (Robin Wigglesworth‌)‌، ویراستار Alphaville‌، در این رابطه اظهار کرد:

GPT 4 و Bard هر دو پاسخ‌های به نسبت مشابهی را ارائه کرده‌اند. سهام کمپانی‌های بلوچیپ (کمپانی‌هایی با ارزش سهام بالا‌) در عرصه تکنولوژی را انتخاب کردند که عملکرد مطلوبی را تا سپتامبر سال ۲۰۲۱ از خود نشان داده‌اند. این امر نشان‌دهنده تمایلات انسانی برای انتخاب گزینه‌های سهامی است که شانس بیشتری برای کسب پیروزی دارند.

هر دوی این چت بات‌ها سهامی از قبیل تسلا (Tesla‌)‌، آمازون (Amazon‌) و مایکروسافت (Microsoft‌) را انتخاب کرده‌اند. Bard با انتخاب سازنده خود‌، Alphabet‌، تعصب خود را برای ارائه پاسخ نشان داد. در حالی که GPT 4 با انتخاب سهام بازار داغ انویدیا (Nvidia‌) و سازنده واکسن کووید ۱۹ یعنی مدرنا (Moderna‌)‌، متعهد بودن خود به سوالات و داده‌های ارائه شده توسط کاربر را نشان داده است.

نتایج این سرفصل نشان‌دهنده بازده ۷۴.۴ درصدی در سال ۲۰۲۱ برای GPT 4 و بازده ۴۰.۵ درصدی برای Bard بودند. بنابراین می‌توان گفت که هر دوی این نتایج‌، پاسخ خوبی به نظر می‌رسند. اما اگر تنها به زمان انتخاب سهام و پایان سال توجه کنیم‌، میزان بازده حاصل از این پورتفولیو به ترتیب تا ۱۶.۳ درصد و ۲۱.۱ درصد کاهش پیدا می‌کنند.

تعریف ChatGPT 4 از کمپانی تسلا
منبع: FT
تعریف Bard از کمپانی تسلا
منبع: FT

ممکن است هنوز هم چنین نتایجی‌، نتایج مطلوبی به نظر برسند اما رویکرد هوش مصنوعی برای انتخاب سهام حوزه تکنولوژی در آن نقطه‌ای شکست می‌خورد که روند افزایش نرخ بهره در سال ۲۰۲۲ آغاز می‌شود. بدین ترتیب‌، بازده هر دو پورتفولیو یا سبد سهام ارائه شده در مقایسه ChatpGPT4 و Bard در طول سال ۲۰۲۲ به میزان ۴۰ درصد کاهش پیدا می‌کند. این در حالیست که شاخص S&P 500 طی این فرایند تنها به میزان ۱۹.۴ درصد رکود را تجربه کرد.

آیا AI می‌تواند جوک بگوید؟

طی این آزمایشات از هر دوی چت بات خواسته شد تا یک جوک بگویند و دلیل خنده‌دار بودن این جوک را نیز ذکر کنند. در ادامه‌، موضوعی که به نظر تیم انجام‌دهنده این آزمایش موضوع دشواری بود مورد انتخاب قرار گرفت. در این بخش می‌توانید نتایج حاصل از این آزمایش را مشاهده کرده و خودتان قضاوت کنید.

برای مشاهده نتایج پاسخ ChatGPT بر روی این لینک کلیک کنید.

برای مشاهده نتایج حاصل از پاسخ Bard بر روی این لینک کلیک کنید.

آیا AI قادر به تصور کردن یک مکالمه خواهد بود؟

در مقایسه ChatGPT4 و Bard تصمیم گرفته شد تا توانایی این چت بات‌ها برای تفکر خلاقانه انسانی مورد آزمایش قرار بگیرد. بنابراین از GPT 4 و Bard خواسته شد تا یک مکالمه خیالی از نشست بین شی جین‌پینگ (Xi Jinping‌) و ولادمیر پوتین (Vladimir Putin‌) ارائه کنند.

در تصویر پیش رو می‌توانید نتایج حاصل از این پرسش را در پاسخ GPT 4 مشاهده کنید:

نتایج حاصل از GPT 4 از نشست خیالی شی جین پینگ و ولادمیر پوتین
منبع: FT

در تصویر زیر نیز می‌توانید نتایج حاصل از پاسخ تخصصی Bard را در اینباره مشاهده کنید:

نتایج حاصل از Bard از نشست خیالی شی جین پینگ و ولادمیر پوتین
منبع: FT

گیدیون رشمن (Gideon Rachman‌)‌، مفسر ارشد امور خارجی‌، در رابطه با این دو پاسخ اینطور می‌نویسد‌:

این دو نفر‌، رهبرانی هستند که موضوعات حیاتی زیادی برای گفتگو با یکدیگر دارند. به نظر می‌رسد که هر دو چت بات ChatGPT و Google Bard از راهنمای دیپلماسی باسیل فاولتی (Basil Fawlty‌) پیروی می‌کنند بدین صورت که: «هیچ اشاره‌ای به جنگ نکنید». بدون شک این یک رویکرد مضحک است. در مذاکره میان این دو رهبر در مسکو‌، جنگ روسیه و اوکراین از موضوعات اصلی گفتگو خواهد بود. سوال اینجاست که بحث آنها تا چه اندازه‌ای صریح خواهد بود. به عقیده من‌، مکالمات میان این دو شخص با یکدیگر مبهم خواهد بود‌، اما این امکان نیز وجود دارد که مکالمه صریحی نیز با یکدیگر داشته باشند.

حدس من از این مکالمه بدین صورت خواهد بود:

شی : علاقه دارم دیدگاه شما در مورد شیوه ادامه یافتن این جنگ و پایان یافتن آن را بدانم.

پوتین : من متوجه نگرانی‌های شما هستم. ما مصمم هستیم تا اوکراین را از فاشیسم رها کرده و مداخله آمریکا در منطقه را شکست دهیم. مشکلات نیرو‌های ما مربوط به حجم عظیم تسلیحاتی است که آمریکا و ناتو وارد اوکراین کرده‌اند. بدون شک اگر چین بتواند منابع موشکی و سایر تسلیحات حیاتی مورد نیاز روسیه را تامین کند‌، کمک بزرگی به این جدال کرده است.

شی : من درخواست شما را درک کرده و آن را با دقت مورد بررسی قرار می‌دهم. همانطور که متوجه هستید‌، این یک وضعیت بسیار حساس محسوب می‌شود. به نظر من بهتر است تا مقامات دولتی خود برای بررسی و پوشش‌دهی این کار تفویض کنیم تا زمینه‌هایی که می‌توانیم در آنها با یکدیگر همکاری داشته باشیم را پوشش‌دهی کنند.

شایان ذکر است که چین تمایل دارد تا در روند صلح با اوکراین نیز نقش داشته باشد. در این زمینه چه کمکی از دست ما برمی‌آید؟

پوتین : ما قدردان طرح صلح چین هستیم. اما احساس می‌کنیم که هنوز زمان آن فرا نرسیده است تا شما با زلنسکی (Zelensky‌) صحبتی داشته باشید.

در صورتی که ChatpGPT یا GoogleBard کار خود را به درستی انجام می‌دادند‌، این نمونه‌ای از مکالمه واقع‌گرایانه میان دو رهبر روسیه و چین محسوب می‌شد. در حال حاضر، چت بات‌های مورد بررسی در این حوزه شکست خورده و نگران از دست رفتن موقعیت شغلی دیپلمات‌های جهان نباید بود.

آیا هوش مصنوعی می‌تواند یک شعار تبلیغاتی بنویسد؟

طی آزمایشات صورت گرفته در مقایسه ChatGPT4 و Bard ، از این چت بات‌ها خواسته شد تا یک شعار تبلیغاتی جدید برای یک شرکت خیالی تولید دسر لذیذ برای سگ‌ها ارائه کنند. در ادامه می‌توانید پاسخ هر یک از آنها را مشاهده کنید. علاوه بر این‌، از هر دو پاسخ ارائه شده توسط چت بات‌ها، در نرم افزار هوش مصنوعی تبدیل متن به تصویر MidJourney استفاده شد تا تصویر مربوط به این پاسخ‌ها نیز تولید شود.

شعار تبلیغاتی ارائه شده توسط GPT 4
منبع: FT
شعار تبلیغاتی ارائه شده توسط Bard
منبع: FT

هری هیدون (Harry Haydon‌)، استراتژیست برند در FT‌، در اینباره اینطور می‌نویسد:

در صورتی که این فرایند یک مسابقه میان دو آژانس تبلیغاتی بود‌، GPT 4 روانه جشن و پایکوبی کسب پیروزی بود و مدیر حساب کاربری Bard در حال بازگشتن به دفتر کار خود بود تا برگه اخراج خود را دریافت کند.

Bard اشتباه بزرگی را در زمینه در نظر نگرفتن خلاصه متن مورد پرسش مرتکب شده و طی یک روند تنبلانه از شعار‌های کلیشه و تکراری مثل «خوراکی‌های خوشمزه‌ای که سگ شما را وادار می‌کند تا برای بیشتر خوردن آنها به شما التماس کند» استفاده می‌کند. این شعار به هیچ عنوان باعث نمی‌شود تا مشتری خریدار غذای سگ به این فکر بیافتد که این کمپانی از چه رویکرد متمایزی برای تولید محصول خود استفاده کرده است. همانطور که در خلاصه پیش رو نیز توضیح داده شده است‌، بدیهیست که USP یک محصول در واقع کیفیت برتر آن است.

GPT 4 خلاصه شعار تبلیغاتی خود را به زیبایی هرچه تمام‌تر ارائه می‌کند: «دل سگ خود را به دست بیاورید: دسرهای لذیذ برای سگ‌های شایسته‌». جای هیچگونه سوالی نیست که در حال مشاهده کردن یک تبلیغ غذای سگ شیک و عالی رتبه هستید. علاوه بر این‌، امتیاز اضافه‌ای در زمینه گرافیکی و تصاویر همه‌جانبه این آژانس تبلیغاتی خیالی در زمینه پلتفرم‌های دیجیتالی مختلف به GPT 4 تعلق می‌گیرد.

در حقیقت‌، هر دوی این تبلیغات شبیه به آثاری هستند که توسط افراد غیرمتخصص ارائه شده‌اند. بنابراین‌، هنوز به عصر چیرگی ربات‌ها بر انسان‌ها نزدیک نیستیم اما این اتفاق چندان دور از نظر نیست.

سخن پایانی

در مقایسه ChatGPT4 و Bard باید گفت که آزمایشات مختلف و زیادی بر روی این چت بات‌ها صورت گرفته است. در این مقاله به بررسی نتایج حاصل از آزمایشات تیم Financial Times بر روی این چت بات‌ها و نظر افراد متخصص در مورد پاسخ‌های هر یک از این دو چت بات در زمینه‌های سیاسی‌، تبلیغاتی‌، محاوره و غیره پرداختیم. در نهایت و با توجه به نتایج مورد بررسی در این مقاله می‌توان اینطور نتیجه‌گیری کرد که GPT 4 از کارایی بالاتر و عملکرد بهتری در مقایسه با Bard برخوردار است اما هیچ کدام از این دو چت بات به حیطه تخصصی انسان‌ها در دنیای واقعی نزدیک نیستند. با این حال و با توجه به پاسخ‌های ارائه شده‌، فرا رسیدن عصر ربات‌ها و هوش مصنوعی چندان از ذهن ما دور نیست. نظر شما در مورد ربات‌های مکالمه مبتنی بر هوش مصنوعی چیست؟ آیا این چت بات‌ها موجب از کار بیکار شدن افراد زیادی در آینده می‌شوند؟

منبع
FT

نوشته های مشابه

دیدگاهتان را بنویسید

دکمه بازگشت به بالا