توانایی های شگفت انگیز ChatGPT OpenAI بدون مدل های زبان بزرگ امکان پذیر نخواهد بود. این مدلها بر روی میلیاردها و گاهی تریلیونها نمونه متن آموزش داده میشوند. ایده پشت ChatGPT این است که زبان را آنقدر خوب درک کنیم، که میتوان پیشبینی کرد که چه کلمهای به طور قابل قبولی در چند ثانیه قرار میگیرد. برای تحقق این امر نیاز به آموزش، منابع محاسباتی و دانش توسعهدهنده است.
اما شاید آینده این مدلها بیشتر از رویکرد جوشاندن اقیانوس که از OpenAI و دیگران دیدهایم، که میخواهند قادر به پاسخگویی به هر سؤالی در زیر نور خورشید باشند، متمرکز باشد. اگر هر صنعت یا حتی هر شرکتی مدل مخصوص به خود را داشته باشد که برای درک اصطلاحات، زبان و رویکرد هر نهاد آموزش دیده باشد، چه؟ شاید در این صورت پاسخهای کاملاً ساختهشده کمتری دریافت کنیم، زیرا پاسخها از یک جهان محدودتر از کلمات و عبارات میآیند.
در آینده مبتنی بر هوش مصنوعی، داده های هر شرکت می تواند با ارزش ترین دارایی آن باشد. اگر شما یک شرکت بیمه هستید، واژگانی کاملاً متفاوت با یک بیمارستان، شرکت خودروسازی یا یک شرکت حقوقی دارید، و وقتی آن را با دادههای مشتریان خود و کل محتوای سراسر سازمان ترکیب میکنید، یک مدل زبانی خواهید داشت. در حالی که شاید بزرگ نباشد، مانند مدل زبان واقعاً بزرگ، فقط مدلی است که شما به آن نیاز دارید، مدلی که برای یک نفر ایجاد شده است و نه برای توده ها.
این همچنین به مجموعهای از ابزارها برای جمعآوری، جمعآوری و بهروزرسانی دائمی مجموعه دادههای شرکتی نیاز دارد، به گونهای که آن را برای این مدلهای کوچکتر زبان بزرگ (sLLM) قابل جذب کند.
ساخت این مدل ها می تواند یک چالش باشد. آنها احتمالاً از چیزی مانند منبع باز یا LLMهای موجود یک شرکت خصوصی استفاده میکنند و سپس آن را روی دادههای صنعت یا شرکت تنظیم میکنند تا بیشتر مورد توجه قرار گیرند، همه در محیطی امنتر از انواع LLM عمومی.
این یک فرصت بزرگ برای جامعه استارت آپی است و ما شاهد شرکت های زیادی هستیم که این ایده را آغاز کرده اند.