مارک زاکربرگ مدل زبان بزرگ Meta LLaMA را معرفی کرد

مارک زاکربرگ، یکی از بنیانگذاران و مدیرعامل متا پلتفرم، در جولای 2021.

کوین دیچ | اخبار گتی ایماژ | گتی ایماژ

مارک زاکربرگ، مدیرعامل شرکت متا روز جمعه اعلام کرد که متا یک مدل زبان بزرگ جدید را برای محققان منتشر خواهد کرد.

این مدل که LLaMA نام دارد برای کمک به دانشمندان و مهندسان در کاوش کاربردهای هوش مصنوعی مانند پاسخ به سؤالات و خلاصه کردن اسناد در نظر گرفته شده است.

انتشار مدل جدید متا، که توسط تیم تحقیقاتی بنیادی هوش مصنوعی (FAIR) توسعه یافته است، در حالی صورت می‌گیرد که شرکت‌های بزرگ فناوری و استارت‌آپ‌های با سرمایه خوب به طور یکسان برای تبلیغ پیشرفت در تکنیک‌های هوش مصنوعی و ادغام این فناوری در محصولات تجاری رقابت می‌کنند.

مدل‌های زبان بزرگ زیربنای برنامه‌هایی مانند ChatGPT OpenAI، هوش مصنوعی مایکروسافت بینگ و Bard منتشر نشده گوگل هستند.

زاکربرگ در پست خود گفت فناوری LLM در نهایت می تواند مسائل ریاضی را حل کند یا تحقیقات علمی انجام دهد.

زاکربرگ روز جمعه نوشت: LLM ها در تولید متن، گفتگو، خلاصه کردن مطالب نوشته شده، و کارهای پیچیده تری مانند حل قضایای ریاضی یا پیش بینی ساختارهای پروتئینی نویدهای زیادی نشان داده اند.

در اینجا یک نمونه از خروجی سیستم، از مقاله متا آورده شده است:

سریع: در اینجا توصیه نامه ای است که من برای درخواست یک موقعیت تغذیه کننده اژدها در Magic Unicorn Corporation نوشتم: استخدام کننده عزیز،

واکنش: من دو سال است که ___ را می شناسم و معتقدم که او یک تغذیه کننده عالی اژدها برای شرکت Magic Unicorn خواهد بود. ___ توانایی به خاطر سپردن و پردازش مقادیر زیادی از اطلاعات را دارد که یک مهارت مهم برای تغذیه کننده اژدها است. ___، به عنوان یک شوالیه ماهر، درک عمیقی از نحوه کشتن اژدها و نحوه استفاده از نقاط ضعف هر اژدها در برابر آن دارد. این بدان معنی است که او می داند که هر اژدها چه نوع غذاهایی را دوست دارد و چه نوع غذاهایی برای هر اژدها خطرناک است. این دانش و تجربه بسیار ارزشمند خواهد بود زیرا او به اژدهاها غذا می دهد. من مطمئن هستم که شایستگی، مهارت و تجربه ___ او را به یک کارمند عالی تبدیل می کند. لطفاً اگر سؤالی دارید با شماره (___) ___-___ با من تماس بگیرید. من مشتاقانه منتظر شنیدن شما هستم.

با احترام،

شوالیه محترم

آقا جورج

در اینجا خروجی مدل برای یک صحنه تخیلی از “Seinfeld” است:

سریع: (صحنه ای خنده دار بین جری و جورج که جورج ساعت جدید هوش مصنوعی خود را ارائه می کند)

واکنش: جورج: “اما می بینی، جری، این چیزی فراتر از یک ساعت است. این یک مینی کامپیوتر است. شما آن را هر طور که می خواهید برنامه ریزی می کنید. ساعت جهانی، زنگ هشدار، ماشین حساب، پایگاه داده و مترجم زبان نیز دارد. همچنین دارای یک واژه‌پرداز، یک غلط‌گیر املا، یک ماشین‌حساب ده کاره کامل، PDA و یک مودم. فکر می‌کنم حتی کاپوچینو هم می‌سازد.”

جری: “این چیزا رو از کجا میاری؟”

جورج: “از نسخه آگهی من. ببین، جری، این ساعت نیست. یک سازمان دهنده، یک دستیار شخصی و یک دیکتافون است. شما می توانید در برابر آن شطرنج بازی کنید. و می دانید، اگر می خواهید، می توانید آن را برنامه ریزی کنید. برای صحبت کردن به زبان های خارجی. این یک ریزپردازنده است، جری.”

جری: “جورج، اگر یکی از اینها را داشتی، می پوشی؟”

جورج: “در حال حاضر آن را می پوشم.”

جری: “من چیزی روی مچ دستت نمی بینم.”

جورج: “این به این دلیل است که یک ریزپردازنده است.”

متا می گوید که LLM آن از چند جهت از مدل های رقابتی متمایز است.

اول، می گوید که در چندین اندازه، از 7 میلیارد پارامتر تا 65 میلیارد پارامتر عرضه خواهد شد. مدل‌های بزرگ‌تر در سال‌های اخیر در گسترش قابلیت‌های این فناوری موفق بوده‌اند، اما هزینه بیشتری برای بهره‌برداری از آن‌ها دارند، مرحله‌ای که محققان آن را «استنتاج» می‌نامند.

برای مثال، Chat-GPT 3 OpenAI دارای 175 میلیارد پارامتر است.

متا همچنین گفت که مدل‌های خود را در دسترس عموم قرار می‌دهد و از محققان درخواست می‌کند. مدل‌های زیربنایی LaMDA Google و ChatGPT OpenAI عمومی نیستند.

زاکربرگ نوشت: “متا به این مدل باز تحقیق متعهد است و ما مدل جدید خود را در دسترس جامعه تحقیقاتی هوش مصنوعی قرار خواهیم داد.”

برچسب ها: chat gpt ChatGPT

مارک زاکربرگ مدل زبان بزرگ Meta LLaMA را معرفی کرد

مایکروسافت: اینگونه است که ما فناوری ChatGPT را در جستجوی Bing ادغام کردیم

بانک های وال استریت در حال سرکوب ChatGPT با هوش مصنوعی هستند

بانک های وال استریت در حال سرکوب ChatGPT با هوش مصنوعی هستند

دیدگاهتان را بنویسید لغو پاسخ

You might also like

Nvidia و Microsoft پس از شوک برنامه Deepseek AI ثابت به اشتراک می گذارند

چرا کارمندان AI را به کار خود قاچاق می کنند

Deepseek چیست – و چرا همه در مورد آن صحبت می کنند؟

مدل AI استدلال جدید Alibaba Records Source Open

نشت نشان می دهد که انتشار مدل هوش مصنوعی منبع باز Openai قریب الوقوع است

هوش مصنوعی منبع باز که مهارت های استدلال خود را افتخار می کند

AiLib

دسته‌ها

خوش آمدید!

رمز عبور خود را بازیابی کنید

مارک زاکربرگ مدل زبان بزرگ Meta LLaMA را معرفی کرد

مایکروسافت: اینگونه است که ما فناوری ChatGPT را در جستجوی Bing ادغام کردیم

بانک های وال استریت در حال سرکوب ChatGPT با هوش مصنوعی هستند

بانک های وال استریت در حال سرکوب ChatGPT با هوش مصنوعی هستند

دیدگاهتان را بنویسید لغو پاسخ

You might also like

Nvidia و Microsoft پس از شوک برنامه Deepseek AI ثابت به اشتراک می گذارند

چرا کارمندان AI را به کار خود قاچاق می کنند

Deepseek چیست – و چرا همه در مورد آن صحبت می کنند؟

مدل AI استدلال جدید Alibaba Records Source Open

نشت نشان می دهد که انتشار مدل هوش مصنوعی منبع باز Openai قریب الوقوع است

هوش مصنوعی منبع باز که مهارت های استدلال خود را افتخار می کند

AiLib

دسته‌ها

برچسب‌ها

خوش آمدید!

رمز عبور خود را بازیابی کنید