ChatGPT امسال به یکی از محبوبیتهای اینترنتی تبدیل شد، زیرا به نظر میرسید که یک مصنوع برگرفته از یک داستان علمی تخیلی باشد. محصول OpenAI ما را شگفت زده کرد، اما به همان اندازه که چشمگیر بود، مدل فاقد چیز مهمی بود – باز بودن. مدل منبع بسته کار زیادی برای جامعه توسعه دهندگان انجام نداد.
برای نجات، Hugging Face، پلتفرم هوش مصنوعی منبع باز، HuggingChat را راه اندازی کرد که به عنوان جایگزین ChatGPT منبع باز معرفی می شود. انتشار HuggingChat عملکردها و ادغام های مختلفی را برای توسعه دهندگان و کاربران به طور یکسان ارائه می دهد و رقابت سختی را برای ChatGPT ارائه می دهد.
الهام یا تقلید؟
به نظر می رسد رابط HuggingChat از ChatGPT الهام گرفته شده است. صفحه آبی براق دارای نقاط مکالمه و تاریخچه مکالمات در سمت چپ مشابه صفحه ChatGPT است.
ChatGPT پس از سپتامبر 2021 به اطلاعات دسترسی ندارد و بنابراین نمی تواند اطلاعات بلادرنگ ارائه دهد. به نظر می رسد چت ربات Hugging Face نیز در همین راستا است. شایان ذکر است که در موارد خاصی HuggingChat پاسخهای بهروز ارائه میدهد، اما ممکن است نادرست باشند. به عنوان مثال، ما از چت بات پرسیدیم “چه کسی برنده IPL 2022 شد؟” و هیچ بخشی از پاسخ از نظر واقعی درست نبود.
(گجرات تایتانز با برگزاری اولین تورنمنت خود، با غلبه بر راجستان رویالز برنده مسابقه و عنوان قهرمانی شد)
تفاوت ها
یکی از تفاوتهای کلیدی بین این دو مدل، مجموعه دادهای است که بر اساس آن آموزش دیدهاند. HuggingChat با OpenAssistant Conversations Dataset (OASST1) آموزش دیده است، در حال حاضر، مدل HuggingFace بر روی آخرین مدل مبتنی بر LLaMA OpenAssistant اجرا می شود، اما برنامه بلندمدت این است که همه مدل های چت با کیفیت خوب را از اسناد Hub در معرض دید قرار دهد.
مجموعه داده TheHugging Face حاوی دادههایی است که تا 12 آوریل 2023 جمعآوری شده است. این مجموعه داده نتیجه یک تلاش جمعسپاری در سراسر جهان توسط بیش از 13000 داوطلب است و شامل 161443 پیام است که در 66497 درخت مکالمه به 35 زبان مختلف توزیع شده و با 461 درجهبندی کیفیت حاشیهنویسی شده است.
از آنجایی که LLaMA متا به مجوزهای صنعتی محدود می شود، توزیع مستقیم مدل های مبتنی بر LLaMa امکان پذیر نیست. در عوض Open Assistant وزنههای XOR را برای مدلهای OA ارائه کرد. از سوی دیگر، مجموعه داده ChatGPT در حال حاضر در دسترس نیست.
پارامتر دیگری که باید در نظر گرفت این است که هزینه استفاده از ChatGPT بستگی به مدل زبان بزرگ (LLM) مورد استفاده دارد – GPT-3.5 یا GPT-4. اشتراک پولی تحت ChatGPT-Plus از آخرین GPT-4 استفاده می کند، بنابراین پاسخ های بهتری نسبت به نسخه رایگان مبتنی بر GPT-3.5 ارائه می دهد. GPT-4 مورد انتظار در مارس 2023 در ChatGPT ادغام شد. در حال حاضر، نسخه پولی 20 دلار به صورت ماهانه هزینه دارد. در مقابل، HuggingChat منبع باز و رایگان برای استفاده است.
بیشتر بخوانید: 7 روشی که توسعه دهندگان از LLaMA متا استفاده می کنند
هر دو چت ربات سبک نوشتاری متفاوتی دارند. ChatGPT پاسخ های ساختار یافته و با قالب بندی خوبی ارائه می دهد اما در مورد هیچ موضوعی موضع نمی گیرد. برعکس، صورت در آغوش گرفتن به شیوهای بسیار شخصیتر پاسخ میدهد و تمایل دارد خود را به صورت اول شخص مطرح کند. اما HuggingChat زمینه را به خوبی درک نمی کند.
از نظر کدنویسی، HuggingChat کد را به یکباره می دهد، در حالی که ChatGPT دستورالعمل را برای مدل GPT-3.5 به صورت رایگان ارائه می دهد و کدی را با دستورالعمل های عمیق ارائه می دهد که باید برای مدل پولی GPT-4 دنبال کنید.
در نتیجه، در حالی که HuggingChat ممکن است جدید و امیدوارکننده باشد، ChatGPT در حال حاضر به دلیل شهرت تثبیت شده و طیف وسیعی از ویژگیهایش، انتخاب برتر است. مدل HF هنوز به سطوح ChatGPT نزدیک نشده است، اما برای جلوگیری از انحصار نیاز به زمان است. با این وجود، دیدن چگونگی توسعه HuggingChat و اینکه آیا می تواند تسلط ChatGPT در بازار چت بات را به چالش بکشد، جالب خواهد بود.
گزینه دیگری که توسعه دهندگان می توانند به آن نگاه کنند این است دالی 2.0 دیتابریکس.