در حال حاضر، شرکتهای بزرگ فناوری فریاد میزنند تا موفقیت فراری ChatGPT، چت ربات هوش مصنوعی تولید شده توسط OpenAI با استفاده از مدل زبان بزرگ GPT-3 را تکرار کنند. بسیار شبیه به تغییرات بالقوه بازی در گذشته، مانند پلتفرمهای نرمافزار به عنوان سرویس مبتنی بر ابر (SaaS) یا فناوری بلاک چین (تاکید بر پتانسیل)، شرکتهای تأسیسشده و استارتآپها بهطور یکسان با LLM و جایگزینهای ChatGPT از ترس جا ماندن در معرض دید عموم قرار میگیرند.
در حالی که بسیاری از این موارد موفق خواهند شد – برخی در بازار انبوه و برخی دیگر با کاربردهای خاص – احتمالاً بسیاری دیگر با ادغام بازار شکست خواهند خورد.
در این صورت، چه کسانی به جای این شرکت ها می توانند OpenAI را به چالش بکشند؟
شرکت هایی با پروژه های مدل زبان بزرگ
گوگل – LaMDA
LaMDA گوگل بیشترین توجه ناظران جریان اصلی را از هر LLM خارج از GPT-3 به خود جلب کرده است، اما به دلایلی نه کاملاً یکسان.
ماهها قبل از اینکه ChatGPT در اواخر سال 2022 به سرفصلهای ملی تبدیل شود، LaMDA پس از تعلیق مهندس Google، Blake Lemoine، به دلیل ادعای – که به دروغ آشکار شد – که احساسات خود را توسعه داده است، بحثبرانگیز بود.
در واقع، LaMDA LLM مشابه رقیب اصلی خود عمل می کند، با این تفاوت که پارامترهای کمتری در 137 میلیارد در مقایسه با 175 میلیارد برای GPT-3.5 که برای آموزش ChatGPT استفاده شد، دارد.
LaMDA همچنین پایه رقیب چت بات گوگل به نام Bard است که غول جستجو در حال حاضر در حال آزمایش آن برای جستجو با کاربران منتخب است. بارد شروع بدی داشت، با این حال، زیرا یک خطای واقعی را در طول یک رویداد پرتاب ارائه کرد.
AI21 – Jurassic-2
استارتآپ AI21 مستقر در اسرائیل، اگرچه کمتر از رقیب خود OpenAI شناخته شده است، اما یک چالش جدی در بازار است. این شرکت مدل زبان بزرگ Jurassic-2 را در سال 2021 با تعداد پارامترهای مشابه GPT-3.5 – 178 میلیارد در مقایسه با 175 میلیارد – و قابلیت های سفارشی سازی ایجاد کرد.
محتوای شرکای ما
مارس 2023 پس از آن شاهد انتشار Jurassic-2 بودیم که بر عملکرد بهینهسازی شده در مقایسه با اندازه تمرکز داشت. طبق گفته AI21، کوچکترین نسخه Jurassic-2 حتی از بزرگترین نسخه قبلی خود بهتر عمل می کند. همچنین دارای یک API تصحیح گرامری و قابلیت تقسیم بندی متن است.
کاربران استودیوی AI21 میتوانند نسخههای LLM خود را با حداقل 50 تا 100 نمونه آموزشی آموزش دهند که سپس برای استفاده انحصاری در دسترس قرار میگیرند.
AI21 همچنین Jurassic-1 و اکنون Jurassic-2 را برای پشتیبانی از چت ربات WordTune Spices خود، که خود را به عنوان جایگزین ChatGPT با استفاده از بازیابی داده های زنده و استناد به منابع در فرمول های آن متمایز می کند، به کار گرفت. با توجه به خطرات خطای واقعی و سرقت ادبی مرتبط با چت ربات های LLM، این یک مزیت قابل توجه در یک زمینه رقابتی فزاینده است.
آنتروپیک – کلود
آنتروپیک که توسط کارمندان سابق OpenAI تأسیس شده است، به سرعت به عنوان رقیب شبه مولد خود موج می زند.
این شرکت مولد هوش مصنوعی مدل زبان بزرگ خود را به نام Claude راهاندازی کرده است که جایگزین ChatGPT آن چیزی است که آن را «هوش مصنوعی قانونی» مینامد. در واقع، این مدل به گونهای طراحی شده است که بر اساس اصول برنامهریزی شده (یعنی «قانون اساسی» آن) عمل کند، برخلاف ChatGPT، که از پاسخ دادن به برخی سؤالات بحثبرانگیز یا خطرناک منع شده است.
درست مانند سرمایه گذاری مایکروسافت در OpenAI، گوگل 300 میلیون دلار در Anthropic سرمایه گذاری کرده است تا 10 درصد از سهام این شرکت را در اختیار بگیرد.
Baidu – ERNIE 3.0
بایدو – پاسخ چین به گوگل – با سرمایه گذاری سنگین خود در هوش مصنوعی به دنبال مبارزه با مبارزات طولانی مدت خود در برابر رقیب Tencent است.
تیم بایدو مدل زبان بزرگ ERNIE 3.0 خود را به نسخه جدیدی به نام ERNIE 3.0 Titan گسترش داده است. در حالی که نسخه قبلی آن تنها 10 میلیارد پارامتر داشت، پلت فرم PaddlePaddle Titan با 260 میلیارد پارامتر کار می کند.
سازندگان تایتان ادعا میکنند که این «بزرگترین مدل از پیشآموزششده متراکم تاکنون» است و از مدلهای پیشرفته در وظایف پردازش زبان طبیعی (NLP) بهتر عمل میکند.
Nvidia – DGX AI
تامینکننده سختافزار و نرمافزار انویدیا در حال حاضر هسته اصلی عملیات ChatGPT است و تخمین زده میشود که 10000 پردازنده گرافیکی این شرکت برای آموزش ربات چت و 30000 عدد در آینده مورد استفاده قرار گیرد.
با این حال، این پویایی می تواند تغییر کند، زیرا جنسن هوانگ، مدیر عامل انویدیا در فوریه 2023 اعلام کرد که این شرکت قصد دارد ابررایانه DGX AI خود را از طریق ابر در دسترس قرار دهد.
این ابررایانه هوش مصنوعی که از قبل از طریق Oracle Cloud Infrastructure و Microsoft Azure قابل دسترسی است، این ظرفیت را خواهد داشت که به مشتریان اجازه دهد مدل های زبان بزرگ خود را آموزش دهند.
Nvidia شاهد تقویت مالی بوده است زیرا شرکت هایی مانند گوگل و مایکروسافت به دنبال پردازنده های گرافیکی لازم برای آموزش هستند.
DeepMind – چینچیلا
شرکت انگلیسی هوش مصنوعی و شرکت تابعه آلفابت Deepmind، که به خاطر برنامه AlphaGo خود معروف است، سرمایه گذاری زیادی در تحقیق و توسعه مدل زبان های بزرگ انجام می دهد. Deepmind روی چندین LLM، از جمله Gopher، Chinchilla و سیستم RETRO، که یک LLM را با یک پایگاه داده خارجی ترکیب میکند، تکرار کرده است.
این آزمایش در انواع هدفمندتر و کم مصرفتر از LLM پیشرو است – چینچیلا تنها 70 میلیارد پارامتر دارد، برخلاف سایرین که دارای دو، سه یا حتی بیشتر از آن هستند، اما در کارهای خاص از Gopher بزرگتر بهتر عمل میکند. به همین ترتیب برای RETRO با 7.5 میلیارد پارامتر، که پایگاه داده خارجی آن به آن اجازه می دهد تا از مدل های بسیار بزرگتر بهتر عمل کند.
متا – LLaMA
متا که از سرمایه گذاری در متاورس راضی نیست، با مدل LLaMA خود وارد فضای LLM نیز شده است. شرکت مارک زاکربرگ هنوز یک جایگزین ChatGPT در دسترس عموم ندارد اما در حال توسعه است.
برخلاف بسیاری دیگر، پارامتر ۶۵ میلیاردی LLM منبع باز (در صورت درخواست، بسیار مهم) با هدف اشتراک گذاری دانش و رفع اشکال جمع سپاری شده است.
اما تنها یک هفته پس از راهاندازی، یک تورنت برای LLM از طریق نشت 4Chan به اینترنت گستردهتر راه یافت و این نگرانی را ایجاد کرد که چنین دسترسی نامحدودی میتواند برای فیشینگ و سایر فعالیتهای جرایم سایبری استفاده شود.