تیم QWEN از Alibaba به تازگی نسخه جدیدی از مدل AI استدلال منبع باز خود را با برخی معیارهای چشمگیر منتشر کرده است.
با QWEN3-235B-A22B-TINKING-2507 ملاقات کنید. در طی سه ماه گذشته ، تیم Qwen سخت کار کرده است و آنچه را که آنها “توانایی تفکر” هوش مصنوعی خود می نامند ، انجام داده است و هدف آن بهبود کیفیت و عمق استدلال آن است.
نتیجه تلاشهای آنها الگویی است که از چیزهای واقعاً سخت برتری دارد: استدلال منطقی ، ریاضیات پیچیده ، مشکلات علمی و برنامه نویسی پیشرفته. در این زمینه هایی که به طور معمول به یک متخصص انسانی احتیاج دارند ، این مدل جدید QWEN اکنون استاندارد را برای مدل های منبع باز تعیین می کند.
در مورد معیارهای استدلال ، آخرین مدل AI منبع باز Qwen به 92.3 در AIME25 و 74.1 در LiveCodebench V6 برای برنامه نویسی دست پیدا می کند. این شرکت همچنین در تست های قابلیت کلی تر ، 79.7 را در Arena-Hard V2 به ثمر می رساند ، که اندازه گیری آن با ترجیحات انسانی اندازه گیری می کند.
در قلب آن ، این یک مدل AI استدلال عظیم از تیم QWEN با 235 میلیارد پارامتر در کل است. با این حال ، از مخلوط کردن از کارآزمایی (MOE) استفاده می کند ، به این معنی که فقط بخشی از آن پارامترها-حدود 22 میلیارد-را در هر زمان فعال می کند. فکر کنید مانند داشتن یک تیم عظیم از 128 متخصص در تماس ، اما فقط هشت مورد مناسب برای یک کار خاص وارد شده اند تا در واقع روی آن کار کنند.
شاید یکی از چشمگیرترین ویژگی های آن ، حافظه عظیم آن باشد. مدل AI استدلال منبع باز Qwen دارای طول زمینه بومی 262،144 نشانه است. یک مزیت بزرگ برای کارهایی که شامل درک مقادیر گسترده ای از اطلاعات است.
برای توسعه دهندگان و Tinkerers در آنجا ، تیم QWEN شروع به کار کرده است. این مدل در بغل کردن صورت موجود است. می توانید آن را با استفاده از ابزارهایی مانند SGLANG یا VLLM برای ایجاد نقطه پایانی API خود مستقر کنید. این تیم همچنین به چارچوب Qwen-Agent خود به عنوان بهترین راه برای استفاده از مهارت های ابزار ابزار مدل اشاره می کند.
برای به دست آوردن بهترین عملکرد از مدل استدلال هوش مصنوعی منبع باز ، تیم QWEN چند نکته را به اشتراک گذاشته است. آنها برای بیشتر کارها ، طول خروجی حدود 32،768 توکن را پیشنهاد می کنند ، اما برای چالش های واقعاً پیچیده ، باید آن را به 81.920 توکن افزایش دهید تا فضای هوش مصنوعی به اندازه کافی برای “فکر کردن” بدهید. آنها همچنین توصیه می کنند که دستورالعمل های خاص مدل را در سریع خود ارائه دهید ، مانند درخواست آن برای “گام به گام” برای مشکلات ریاضی ، برای دریافت دقیق ترین و خوب ترین پاسخ ها.
انتشار این مدل جدید QWEN یک هوش مصنوعی استدلال قدرتمند و در عین حال باز را ارائه می دهد که می تواند برخی از بهترین مدل های اختصاصی در آنجا را رقیب کند ، به خصوص در مورد کارهای پیچیده و خم شدن مغز. جالب خواهد بود که ببینیم در نهایت توسعه دهندگان با آن چه می سازند.
(تصویر توسط تونگ لام)
همچنین ببینید: برنامه اقدام AI: رهبری ایالات متحده باید “بدون چالش” باشد
آیا می خواهید در مورد AI و داده های بزرگ از رهبران صنعت اطلاعات بیشتری کسب کنید؟ نمایشگاه AI & Big Data را که در آمستردام ، کالیفرنیا و لندن برگزار می شود ، بررسی کنید. این رویداد جامع با سایر رویدادهای پیشرو از جمله کنفرانس اتوماسیون هوشمند ، BlockX ، هفته تحول دیجیتال و Cyber Security & Cloud Expo همکاری می کند.
سایر رویدادهای آینده فناوری شرکت و وبینارهای موجود در TechForge را در اینجا کاوش کنید.