Deep Cogito Cogito V2 را منتشر کرده است ، خانواده جدیدی از مدل های هوش مصنوعی منبع باز که مهارت های استدلال خود را تیز می کند.
منتشر شده تحت مجوز منبع باز ، ترکیب جدید Cogito V2 شامل چهار مدل استدلال ترکیبی AI است: دو پارامتر متوسط در 70B و 109B و دو نسخه در مقیاس بزرگ در 405b و 671b.
بزرگترین ، یک مدل 671B مخلوط (MOE) ، در حال حاضر به عنوان یکی از قدرتمندترین هوش مصنوعی منبع باز در جهان مورد استفاده قرار می گیرد. این شرکت گزارش می دهد که با جدیدترین ها از Deepseek رقابت می کند و شکاف سیستم های اختصاصی مانند O3 و Claude 4 Opus را می بندد.
اما داستان واقعی فقط مربوط به اندازه یا قدرت نیست. این در مورد تغییر اساسی در نحوه یادگیری هوش مصنوعی است. Cogito V2 به جای اینکه فقط در زمان استنتاج برای یافتن پاسخ ، طولانی تر فکر کند ، برای درونی کردن فرایندهای استدلال خود طراحی شده است.
این استدلال درونی از طریق تکنیکی به نام تقطیر و تقویت (IDA) تکرار می شود ، که اکتشافات را از یک جستجو به پارامترهای اصلی مدل تقسیم می کند. هدف این است که یک شهود قوی تر ایجاد شود و به مدل اجازه می دهد تا نتیجه استدلال خود را بدون نیاز به انجام کل جستجو پیش بینی کند.
از آنجا که مدل های هوش مصنوعی منبع باز “احساس روده” بهتری برای رویکرد صحیح دارند ، زنجیره های استدلال آنها 60 ٪ کوتاه تر از رقبایی مانند Deepseek R1 است.
این کارآیی تا بودجه گسترش می یابد. Deep Cogito می گوید که تمام مدلهای خود را – از آزمایشات تا آموزش نهایی – برای کل ترکیبی کمتر از 3.5 میلیون دلار توسعه داده است. هنوز هم مبلغ زیادی برای شما یا من وجود دارد ، اما در مقایسه با هزینه های بسیاری از آزمایشگاه های پیشرو AI.
مدل پرچمدار 671B توجه ویژه ای را به خود جلب کرد ، که نه تنها برای بهبود پاسخ های نهایی خود بلکه برای اصلاح خود روند تفکر آموزش دیده است. این رویکرد مدل را از “پر کردن” دلسرد می کند و یک مسیر مستقیم تر به راه حل را پاداش می دهد. داده های عملکرد نشان می دهد که با مدل هوش مصنوعی منبع باز Cogito ، در حالی که نزدیک به گزینه های اختصاصی نزدیک است ، بیش از آخرین نسخه های Deepseek در معیارهای کلیدی است:
شاید یکی از شگفت آور ترین نتایج ، توانایی مدل ها در استدلال در مورد تصاویر باشد. مهارتی که هرگز به صراحت برای آنها آموزش نگرفته اند.
این تیم نمونه ای از این استدلال را به اشتراک گذاشت که در آن مدل هوش مصنوعی منبع باز Cogito دو تصویر از یک اردک و یک شیر را با هم مقایسه کرد و یک فرایند تفکر عمیق در مورد زیستگاه ها ، رنگ ها و ترکیب آنها صرفاً از طریق یادگیری انتقال نشان داد. Deep Cogito معتقد است که این خاصیت نوظهور می تواند راهی قدرتمند برای داده های آموزش بوت استرپ برای سیستم های استدلال چند مدلی در آینده باشد.
با نگاهی به آینده ، تیم عمیق Cogito قصد دارد “در تلاش برای ایجاد سرپرست ،” صعود به دستاوردهای خودسازی تکراری “را صعود کند. آنها تعهد خود را که تمام مدل های هوش مصنوعی ایجاد شده از منبع باز هستند ، دوباره نشان داده اند.
همچنین ببینید: نشت نشان می دهد که انتشار مدل هوش مصنوعی منبع باز Openai قریب الوقوع است
آیا می خواهید در مورد AI و داده های بزرگ از رهبران صنعت اطلاعات بیشتری کسب کنید؟ نمایشگاه AI & Big Data را که در آمستردام ، کالیفرنیا و لندن برگزار می شود ، بررسی کنید. این رویداد جامع با سایر رویدادهای پیشرو از جمله کنفرانس اتوماسیون هوشمند ، BlockX ، هفته تحول دیجیتال و Cyber Security & Cloud Expo همکاری می کند.
سایر رویدادهای آینده فناوری شرکت و وبینارهای موجود در TechForge را در اینجا کاوش کنید.