متا، صاحب فیس بوک، یک مدل زبان قدرتمند ایجاد کرده است که پاسخ آن به ChatGPT فوق العاده محبوب OpenAI است.
مشاهده گالری – 2 تصویر
ChatGPT OpenAI راه را برای محبوبیت سیستمهای مبتنی بر هوش مصنوعی هموار کرده است و قدرت بیشمار مدلهای زبانی را نشان میدهد که بر روی مقادیر متفاوتی از مجموعههای داده آموزش دیدهاند که هر کدام حاوی گیگابایت داده است. پس از انتشار عمومی ChatGPT، اعلامیه هایی از سوی شرکت های دیگر برای پیوستن به مسابقه هوش مصنوعی، گوگل جزئیات بیشتری را در مورد پروژه های هوش مصنوعی مختلف خود فاش کرد، در حالی که مایکروسافت Bing Chat، یک ابزار موتور جستجوی مبتنی بر هوش مصنوعی را عرضه کرد.
حالا متا کلاهش را با الف به داخل رینگ انداخته است اطلاعیه جدید در مورد یک مدل زبان به نام LLamA. در حالی که مدل زبان متا برای عموم در دسترس نیست، اما کاربران میتوانند درخواست دسترسی به فایل دانلود کنند. به گفته متا، هدف پشت عرضه نیمه عمومی این استدسترسی دموکراتیک بیشتربه هوش مصنوعی، که توسعهدهندگان را قادر میسازد تا مشکلات درون هوش مصنوعی را شناسایی کنند. اساساً، متا در حال ارائه نرمافزار مدل زبان به جامعه هوش مصنوعی است تا کاربران بتوانند آن را عیبیابی کنند.
“هدف متا این است که مدل های پیشرفته هوش مصنوعی را با اعضای جامعه تحقیقاتی به اشتراک بگذارد تا به ما در ارزیابی و بهبود این مدل ها کمک کند. LLaMA برای اهداف تحقیقاتی به اشتراک گذاشته شد، مطابق با نحوه به اشتراک گذاری مدل های زبان بزرگ قبلی. در حالی که این مدل برای همه قابل دسترسی نیست، و برخی تلاش کردهاند فرآیند تایید را دور بزنند، ما معتقدیم استراتژی انتشار فعلی به ما اجازه میدهد تا بین مسئولیت و باز بودن تعادل برقرار کنیم.یکی از سخنگویان متا در ایمیلی نوشت.
متا در یک پست وبلاگی در 24 فوریه نوشت که با وجود جهشها و محدودیتهای توسعه در مدلهای زبان بزرگ، به دلیل منابع مورد نیاز برای اجرای مدلها در وهله اول، هنوز دسترسی محدودی برای محققان وجود دارد. این دسترسی محدود توسط محققان مانع از توانایی آنها در درک نکات و نکات مدل زبانی می شود، که به نوبه خود، پیشرفت در کاهش مسائل کلیدی مانند سوگیری در سیستم، سمیت، و تولید اطلاعات نادرست را کاهش می دهد.
“دسترسی به مدل به صورت موردی به محققان دانشگاهی داده خواهد شد. آنهایی که به سازمانهای دولتی، جامعه مدنی و دانشگاهی وابسته هستند. و آزمایشگاه های تحقیقاتی صنعت در سراسر جهان،” در این پست آمده است.
برای پرتاب کردن آچار دیگری در ترکیب، یک تورنت قابل دانلود از سیستم در 3 مارس در 4Chan آپلود شد، تنها یک هفته پس از اینکه متا شروع به بررسی متقاضیان تحقیق هوش مصنوعی که درخواست دسترسی به فایل را داشتند، شد. تقریباً بلافاصله، این پرونده در جوامع مختلف هوش مصنوعی پخش شد و باعث نگرانی برخی از متخصصان شد مبنی بر اینکه این فناوری پیشرفته راه خود را به دست افراد اشتباه باز خواهد کرد.
جفری لدیش محقق امنیت سایبری اندکی پس از انتشار این خبر در توییتر نوشت:برای هرزنامه های شخصی و تلاش های فیشینگ آماده شوید. منبع باز این مدل ها ایده وحشتناکی بود.“
همه نگران انتشار فاش شده مدل زبان نیستند، زیرا اعتقاد بر این است که انتشار عمومی سیستم منجر به شناسایی همه ایرادات درون سیستم و اقدامات حفاظتی در حال توسعه می شود.
لازم به ذکر است که مدل زبان فاش شده متا مانند Bing Chat یا ChatGPT نیست. این یک “خام“مدل زبانی که برای استفاده صحیح به تخصص فنی نیاز دارد. این سیستم از چهار مدل تشکیل شده است که هر کدام حاوی مقادیر مختلفی از داده ها است و به گفته متیو دی فرانته، هر کسی که با راه اندازی سرورها و محیط های توسعه برای پروژه های پیچیده آشنا باشد باید بتواند این مدل ها را داشته باشد. تا LLaMA را به حالت عملیاتی برسانند، به خصوص اگر زمان کافی و دستورالعمل های مناسب به آنها داده شود.
این بدون در نظر گرفتن سخت افزار مورد نیاز برای اجرای چنین مدلی است.