تصویر توسط نویسنده
بزرگترین تفاوت بین Google Bard و ChatGPT این است که، تا لحظه نگارش این مقاله، Bard از ChatGPT میداند اما ChatGPT به طرز خوشحالی از Bard بیاطلاع است. اما من می توانم با ChatGPT بازی کنم، در حالی که Google Bard هنوز برای بسیاری از ما دور از دسترس است.
منبع: اسکرین شات از ChatGPT
هر دو ChatGPT و Google Bard چت ربات های هوش مصنوعی هستند. سادهترین نسخه این فناوری از قبل در تلفن هوشمند شما وجود دارد – شما «خوب» را تایپ میکنید و تلفنتان پیشبینی میکند که کلمه بعدی که ممکن است بخواهید استفاده کنید «صبح» است.
ChatGPT در ابتدا توسط OpenAI توسعه داده شد و سپس توسط مایکروسافت با مبلغ چشمگیر 10 میلیارد دلار (علاوه بر سرمایه گذاری 1 میلیارد دلاری قبلی) در آن سرمایه گذاری شد. گوگل که اندکی نگران بود که انحصار جستجوی آنها به پایان برسد، با رونمایی از Bard، نسخه خود از فناوری با برخی نقص ها، پاسخ داد. در اولین دمو زنده خود، بارد چندین خطای واقعی مرتکب شد. حداقل برای گوگل شرم آور است.
ChatGPT و Google Bard کمی پیچیدهتر از متن پیشبینیکننده گوشیهای هوشمند هستند، اما برای درک تفاوتهای بین دو چت ربات هوش مصنوعی، این تنها چیزی است که برای شروع باید بدانید.
بیایید نگاهی عمیقتر به تفاوتهای فنی بین این دو موتور هوش مصنوعی بیندازیم.
شما اینجا هستید تا یک جدول سریع و آسان برای دریافت تفاوت های فنی بین دو موتور ارائه دهید. اینجا دقیقا همینه اگر میخواهید ظاهری ظریفتر داشته باشید، به راحتی بیشتر پیمایش کنید.
ChatGPT | بارد | |
مدل | GPT-3.5 | LaMDA یا مدل زبان برای کاربردهای گفتگو |
معماری شبکه های عصبی | تبدیل کننده | تبدیل کننده |
داده های آموزشی | متن وب، در درجه اول مجموعه داده ای به نام «خزیدن مشترک»، در اواسط سال 2021 قطع شد | 1.56 میلیون کلمه داده گفتگوی عمومی و متن وب |
هدف | برای اینکه یک چت بات همه منظوره نسل متن باشید | به طور خاص برای کمک به جستجو |
مولفه های | 175 میلیارد پارامتر | 137 میلیارد پارامتر |
ایجاد کننده | OpenAI | گوگل |
مزایای | – در حال حاضر برای همه باز است
– انعطاف پذیرتر و قادر به نوشتن متن باز – داده های آموزشی در سال 2021 قطع می شود |
– داده های آموزش از طریق امروز
– به طور خاص برای دیالوگ آموزش داده شده است، بنابراین وقتی از آن برای صحبت کردن استفاده می کنید، به نظر انسانی می رسد |
نقاط ضعف | – گفتگو آنقدرها هم قانع کننده نیست
– نه به دقت تنظیم شده است |
– در حال حاضر در دسترس نیست
– ممکن است برای ایجاد متن عمومی مناسب نباشد |
اکنون شما TL;DR را دارید، بیایید نگاهی عمیقتر به تمام این معیارها داشته باشیم.
ChatGPT در 30 نوامبر 2022 وارد صحنه شد. تا 4 دسامبر 2022، این سرویس روزانه بیش از یک میلیون کاربر داشت. در ژانویه 2023، این تعداد به بیش از 100 میلیون کاربر رسید.
به این دلیل که میتوانست پاسخهای محکمی را در تعدادی از موضوعات به شما ارائه دهد، به گونهای که تقریباً انسانی به نظر میرسید، فوراً محبوب شد و برای هر کسی که به اینترنت متصل بود در دسترس بود.
ChatGPT توسط OpenAI، یک آزمایشگاه هوش مصنوعی مستقر در سانفرانسیسکو که بر ایجاد یک هوش مصنوعی دوستانه تمرکز دارد، ایجاد شده است. ربات چت روی GPT-3.5 قرار دارد که یک مدل زبان بزرگ است که وقتی متنی به آن داده می شود، می تواند اعلان را ادامه دهد.
ChatGPT علاوه بر آن، آموزش های بیشتری نیز دریافت کرد – مربیان انسانی مدل را با تعامل با آن بهبود بخشیدند و به مدل برای پاسخ های با کیفیت بالاتر «پاداش» دادند.
داده های آموزشی
GPT-3.5 بر روی یک مجموعه داده عظیم از متن وب، از جمله مجموعه داده محبوبی به نام Common Crawl، آموزش داده شد. Common Crawl حاوی پتابایت داده های وب با داده های خام صفحه وب، عصاره های فراداده و استخراج متن است. به عنوان مثال، این شامل مجموعه ای از URL های خود ما از StrataScratch است. آیا عجیب نیست که فکر کنیم ChatGPT با استفاده از وب سایت هایی که ما هر روز در آنها می رویم آموزش دیده است؟
Common Crawl مسئول 60 درصد داده های آموزشی بود، اما GPT-3.5 نیز داده ها را از منابع دیگر دریافت کرد.
منبع: ویکی پدیا
Bard پاسخ گوگل به محبوبیت ChatGPT است. برخلاف ChatGPT، Bard از مدل LaMDA خود گوگل، که مخفف Language Model for Dialogue Applications است، پشتیبانی میشود. و برخلاف ChatGPT، به این دلیل ساده که اکثر مردم هنوز نمی توانند به آن دسترسی داشته باشند، هیجان انگیز نیست. اگرچه گوگل در اوایل فوریه یک نسخه نمایشی پر از خطا از Bard را میزبانی کرد، در حال حاضر فقط برای تعداد کمی از منتخب در دسترس است.
مزیت اصلی بارد گوگل این است که به روی اینترنت باز است. از ChatGPT بپرسید که رئیس جمهور کیست، اما نمی داند. این به این دلیل است که داده های آموزشی در اواسط سال 2021 قطع شد. بارد، در عین حال، امروزه از اطلاعات موجود در اینترنت استفاده می کند. از بارد بپرسید، و در تئوری، بارد باید بتواند از داده های موجود در اینترنت امروز استخراج کند تا به شما بگوید رئیس جمهور کیست.
اگرچه هنوز نمیتوانید آن را برای چرخش در نظر بگیرید، اما به راحتی میتوانید ببینید که چگونه بارد از ChatGPT از چند جنبه کلیدی متمایز است.
منبع: پست وبلاگ گوگل در مورد LaMDA
داده های آموزشی
اول، LaMDA در گفتگو آموزش دیده بود، به ویژه برای صحبت کردن در مکالمه، نه فقط تولید متن مانند مدل های GPT-n. در حالی که ChatGPT دادههای آموزشی خود را پنهان نمیکند، ما هنوز اطلاعات زیادی در مورد دادههایی که بارد بر روی آنها آموزش دیده بود، نمیدانیم.
با نگاهی به مقاله تحقیقاتی LaMDA میتوانیم کمی برونیابی کنیم. محققان گوگل گفتند که 12.5 درصد از داده های آموزشی مانند مدل های GPT-n از Common Crawl آمده است. 12.5 درصد دیگر از ویکی پدیا آمده است. و طبق مقاله تحقیقاتی، آنها از 1.56 تریلیون کلمه “داده های گفتگوی عمومی و متن وب” استفاده کردند.
در اینجا تفکیک کامل است:
12.5٪ داده مبتنی بر C4 (مشتق شده از داده های Common Crawl) |
12.5% ویکی پدیای انگلیسی زبان |
12.5٪ اسناد کد از وب سایت های برنامه نویسی پرسش و پاسخ، آموزش ها و موارد دیگر |
6.25٪ اسناد وب انگلیسی |
6.25٪ اسناد وب غیر انگلیسی |
50٪ داده ها را از انجمن های عمومی باز می کند |
ما داده های Common Crawl را می دانیم و بدیهی است که شما ویکی پدیا را می شناسید. بقیه؟ این به طور عمدی پنهان شده است، احتمالاً برای محافظت از Bard (و LaMDA) در برابر کپیها.
LaMDA با تنظیم دقیق خانواده ای از مدل های زبان عصبی مبتنی بر ترانسفورماتور ساخته شده است که یک معماری شبکه عصبی منبع باز است که در اصل توسط گوگل توسعه یافته است. (یادداشت جانبی جالب – GPT نیز بر روی Transformer ساخته شده است.)
منبع: پست وبلاگ گوگل در مورد بارد
ChatGPT برخی از نردههای محافظ برای جلوگیری از بیشازحد بد و بیهودههای کامل دارد، اما Google بهطور واقعی تاکید کرده است که چگونه تضمینهای کیفیت را با دقت ایجاد کردهاند تا Bard را به چتربات بهتر و ایمنتری تبدیل کند. Bard برای ترویج “کیفیت، پایه و ایمنی” به خوبی تنظیم شده است.
گوگل در این مورد حرف های زیادی برای گفتن دارد، و من توصیه می کنم پست وبلاگش را در مورد آن بخوانید، اما اگر وقتتان کم است، اساساً به این تقسیم می شود:
- بارد باید پاسخهایی بدهد که منطقی باشد – هیچ چیز پوچ، بدون تناقض
- بارد باید پاسخهایی بدهد که بصیرتآمیز، شوخآمیز یا غیرمنتظره باشند
- بارد باید از هر چیزی که خطر آسیب به کاربر را در پی دارد اجتناب کند – غرغر، تعصب، کلیشه های نفرت انگیز برای ذکر چند مورد
- بارد نباید چیزها را بسازد
به لطف یک راهاندازی معیوب، ما از قبل میدانیم که گوگل آن نیاز پایین را کاملاً متوجه نشده است. اما قابل توجه است که گوگل آنقدر واضح در مورد این الزامات طراحی صحبت میکند، به گونهای که ChatGPT چنین نکرده است – حداقل هنوز.
ChatGPT پارامترهای مدل بیشتری نسبت به Bard دارد – 175 میلیارد در مقابل 137 میلیارد. میتوانید پارامترها را بهعنوان دستگیرهها یا اهرمهایی در نظر بگیرید که مدل آنها را برای تناسب با دادههایی که روی آنها آموزش داده میشود، تنظیم میکند. پارامترهای بیشتر به طور کلی به این معنی است که مدل ظرفیت بیشتری برای ثبت روابط پیچیده در زبان دارد، اما خطر بیش از حد برازش را نیز دارد.
Google Bard ممکن است انعطافپذیری کمتری داشته باشد، اما ممکن است در مقایسه با ChatGPT در موارد استفاده از زبان جدید قویتر باشد.
شایان ذکر است که Bard و ChatGPT هر دو بر روی مدلهایی (به ترتیب LaMDA و GPT-3.5) قرار دارند که بر روی شبکههای عصبی یادگیری عمیق مبتنی بر Transformer قرار دارند.
Transformer میتواند مدلی بسازد که برای خواندن یک جمله یا پاراگراف آموزش دیده است، به عنوان مثال، به نحوه ارتباط آن کلمات با یکدیگر توجه کند و سپس پیشبینی کند که چه کلماتی در آینده خواهند آمد – مشابه متن پیشبینیکننده گوشی هوشمند شما، همانطور که قبلاً ذکر کردم.
من در اینجا زیاد وارد علف های هرز نمی شوم، اما تنها چیزی که باید بدانید این است که این بدان معناست که در هسته خود، Bard و ChatGPT چندان متفاوت از یکدیگر نیستند.
در حالی که مالکیت دقیقاً یک تفاوت فنی نیست، ارزش آن را دارد که در نظر داشته باشید.
Google Bard به طور کامل توسط Google تولید شده و متعلق به LaMDA است که همچنین توسط Google ایجاد شده است.
ChatGPT توسط OpenAI، یک آزمایشگاه تحقیقاتی هوش مصنوعی مستقر در سانفرانسیسکو توسعه یافته است. OpenAI در ابتدا غیرانتفاعی بود اما در سال 2019 یک شرکت تابعه انتفاعی ایجاد کرد. OpenAI همچنین پشت Dall-E بود، نسل تبدیل متن به تصویر هوش مصنوعی که ممکن است با آن بازی کرده باشید.
در حالی که مایکروسافت پول زیادی در OpenAI سرمایه گذاری کرده است، در حال حاضر یک سازمان تحقیقاتی مستقل است.
پاسخ منصفانه به این سوال سخت است زیرا هر دو بسیار شبیه و در عین حال متفاوت هستند. برای یک، تقریباً هیچ کس در حال حاضر نمی تواند به Google Bard دسترسی داشته باشد. برای دیگری، داده های آموزشی ChatGPT تقریبا دو سال پیش قطع شد.
هر دو تولیدکننده متن هستند – شما یک درخواست ارائه میدهید و Google Bard و ChatGPT میتوانند به آن پاسخ دهند. هر دو دارای میلیاردها پارامتر برای تنظیم دقیق مدل هستند. هر دو دارای منابع داده آموزشی همپوشانی هستند، و هر دو بر روی Transformer، مدل شبکه عصبی یکسان ساخته شدهاند.
آنها نیز برای اهداف مختلف طراحی شده اند. Bard به شما کمک می کند تا در جستجوی گوگل پیمایش کنید. این برای مکالمه طراحی شده است. ChatGPT می تواند کل پست های وبلاگ را ایجاد کند. این به گونه ای طراحی شده است که تکه هایی از متن را که منطقی است بیرون بیاورد.
در نهایت، تفاوتهای فنی بین ChatGPT و Google Bard نشان میدهد که فناوری تولید متن مبتنی بر هوش مصنوعی چقدر پیشرفت کرده است. در حالی که هر دو راهی برای رفتن دارند، و هر دو در جنبههای کپیرایت و اخلاقیات با مناقشه مواجه شدهاند، هر دو مولد نمایشهای قدرتمندی از مدلهای هوش مصنوعی مدرن هستند.
ناتی روزیدی یک دانشمند داده و در استراتژی محصول است. او همچنین یک استاد کمکی تدریس تجزیه و تحلیل است، و بنیانگذار StrataScratch، پلتفرمی است که به دانشمندان داده کمک می کند تا برای مصاحبه های خود با سوالات مصاحبه واقعی از شرکت های برتر آماده شوند. با او ارتباط برقرار کنید توییتر: StrataScratch یا لینکدین