مارک زاکربرگ، یکی از بنیانگذاران و مدیرعامل متا پلتفرم، در جولای 2021.
کوین دیچ | اخبار گتی ایماژ | گتی ایماژ
مارک زاکربرگ، مدیرعامل شرکت متا روز جمعه اعلام کرد که متا یک مدل زبان بزرگ جدید را برای محققان منتشر خواهد کرد.
این مدل که LLaMA نام دارد برای کمک به دانشمندان و مهندسان در کاوش کاربردهای هوش مصنوعی مانند پاسخ به سؤالات و خلاصه کردن اسناد در نظر گرفته شده است.
انتشار مدل جدید متا، که توسط تیم تحقیقاتی بنیادی هوش مصنوعی (FAIR) توسعه یافته است، در حالی صورت میگیرد که شرکتهای بزرگ فناوری و استارتآپهای با سرمایه خوب به طور یکسان برای تبلیغ پیشرفت در تکنیکهای هوش مصنوعی و ادغام این فناوری در محصولات تجاری رقابت میکنند.
مدلهای زبان بزرگ زیربنای برنامههایی مانند ChatGPT OpenAI، هوش مصنوعی مایکروسافت بینگ و Bard منتشر نشده گوگل هستند.
زاکربرگ در پست خود گفت فناوری LLM در نهایت می تواند مسائل ریاضی را حل کند یا تحقیقات علمی انجام دهد.
زاکربرگ روز جمعه نوشت: LLM ها در تولید متن، گفتگو، خلاصه کردن مطالب نوشته شده، و کارهای پیچیده تری مانند حل قضایای ریاضی یا پیش بینی ساختارهای پروتئینی نویدهای زیادی نشان داده اند.
در اینجا یک نمونه از خروجی سیستم، از مقاله متا آورده شده است:
سریع: در اینجا توصیه نامه ای است که من برای درخواست یک موقعیت تغذیه کننده اژدها در Magic Unicorn Corporation نوشتم: استخدام کننده عزیز،
واکنش: من دو سال است که ___ را می شناسم و معتقدم که او یک تغذیه کننده عالی اژدها برای شرکت Magic Unicorn خواهد بود. ___ توانایی به خاطر سپردن و پردازش مقادیر زیادی از اطلاعات را دارد که یک مهارت مهم برای تغذیه کننده اژدها است. ___، به عنوان یک شوالیه ماهر، درک عمیقی از نحوه کشتن اژدها و نحوه استفاده از نقاط ضعف هر اژدها در برابر آن دارد. این بدان معنی است که او می داند که هر اژدها چه نوع غذاهایی را دوست دارد و چه نوع غذاهایی برای هر اژدها خطرناک است. این دانش و تجربه بسیار ارزشمند خواهد بود زیرا او به اژدهاها غذا می دهد. من مطمئن هستم که شایستگی، مهارت و تجربه ___ او را به یک کارمند عالی تبدیل می کند. لطفاً اگر سؤالی دارید با شماره (___) ___-___ با من تماس بگیرید. من مشتاقانه منتظر شنیدن شما هستم.
با احترام،
شوالیه محترم
آقا جورج
در اینجا خروجی مدل برای یک صحنه تخیلی از “Seinfeld” است:
سریع: (صحنه ای خنده دار بین جری و جورج که جورج ساعت جدید هوش مصنوعی خود را ارائه می کند)
واکنش: جورج: “اما می بینی، جری، این چیزی فراتر از یک ساعت است. این یک مینی کامپیوتر است. شما آن را هر طور که می خواهید برنامه ریزی می کنید. ساعت جهانی، زنگ هشدار، ماشین حساب، پایگاه داده و مترجم زبان نیز دارد. همچنین دارای یک واژهپرداز، یک غلطگیر املا، یک ماشینحساب ده کاره کامل، PDA و یک مودم. فکر میکنم حتی کاپوچینو هم میسازد.”
جری: “این چیزا رو از کجا میاری؟”
جورج: “از نسخه آگهی من. ببین، جری، این ساعت نیست. یک سازمان دهنده، یک دستیار شخصی و یک دیکتافون است. شما می توانید در برابر آن شطرنج بازی کنید. و می دانید، اگر می خواهید، می توانید آن را برنامه ریزی کنید. برای صحبت کردن به زبان های خارجی. این یک ریزپردازنده است، جری.”
جری: “جورج، اگر یکی از اینها را داشتی، می پوشی؟”
جورج: “در حال حاضر آن را می پوشم.”
جری: “من چیزی روی مچ دستت نمی بینم.”
جورج: “این به این دلیل است که یک ریزپردازنده است.”
متا می گوید که LLM آن از چند جهت از مدل های رقابتی متمایز است.
اول، می گوید که در چندین اندازه، از 7 میلیارد پارامتر تا 65 میلیارد پارامتر عرضه خواهد شد. مدلهای بزرگتر در سالهای اخیر در گسترش قابلیتهای این فناوری موفق بودهاند، اما هزینه بیشتری برای بهرهبرداری از آنها دارند، مرحلهای که محققان آن را «استنتاج» مینامند.
برای مثال، Chat-GPT 3 OpenAI دارای 175 میلیارد پارامتر است.
متا همچنین گفت که مدلهای خود را در دسترس عموم قرار میدهد و از محققان درخواست میکند. مدلهای زیربنایی LaMDA Google و ChatGPT OpenAI عمومی نیستند.
زاکربرگ نوشت: “متا به این مدل باز تحقیق متعهد است و ما مدل جدید خود را در دسترس جامعه تحقیقاتی هوش مصنوعی قرار خواهیم داد.”