علاقه زیادی به آنچه آزمایشگاه ماشین آلات تفکر میرا موراتی با 2 میلیارد دلار بودجه بذر و تیم All-Star محققان سابق OpenAi که به آزمایشگاه پیوسته اند ، ساخته شده است. در یک پست وبلاگ منتشر شده در روز چهارشنبه ، آزمایشگاه تحقیقاتی موراتی اولین نگاه خود را به یکی از پروژه های خود به جهانیان بخشید: ایجاد مدل های هوش مصنوعی با پاسخ های قابل تکرار.
پست وبلاگ تحقیقاتی با عنوان “شکست دادن به نانوسترمینیسم در استنباط LLM” ، سعی می کند علت اصلی آنچه را که تصادفی در پاسخ های مدل هوش مصنوعی معرفی می کند ، باز کند. به عنوان مثال ، چند بار همین سوال را از چتگپ بپرسید ، و به احتمال زیاد شما طیف گسترده ای از پاسخ ها را دریافت خواهید کرد. این امر عمدتاً در جامعه هوش مصنوعی به عنوان یک واقعیت پذیرفته شده است-مدل های هوش مصنوعی امروز به عنوان سیستم های غیر تعیین کننده در نظر گرفته می شوند-اما آزمایشگاه ماشین های تفکر این مسئله را یک مشکل قابل حل می داند.
این پست ، که توسط محقق آزمایشگاه Thinking Machines Horace He ، تألیف شده است ، استدلال می کند که علت اصلی تصادفی مدل های AI روشی است که هسته های GPU – برنامه های کوچک که در داخل تراشه های رایانه ای Nvidia اجرا می شوند – در پردازش استنباط به هم می خورند (هر آنچه که بعد از فشار وارد کردن در چتگپ می شود). وی پیشنهاد می کند که با کنترل دقیق این لایه از ارکستراسیون ، می توان مدل های هوش مصنوعی را قطعی تر کرد.
فراتر از ایجاد پاسخ های قابل اطمینان تر برای شرکت ها و دانشمندان ، وی خاطرنشان می کند که دریافت مدل های هوش مصنوعی برای تولید پاسخ های قابل تولید نیز می تواند آموزش یادگیری تقویت (RL) را بهبود بخشد. RL فرایند پاداش دادن به مدل های AI برای پاسخ های صحیح است ، اما اگر پاسخ ها کمی متفاوت باشند ، داده ها کمی پر سر و صدا می شوند. به گفته وی ، ایجاد پاسخ های مدل AI سازگار تر می تواند کل فرآیند RL را “نرم تر” کند. Thinking Machines Lab به سرمایه گذاران گفته است که قصد دارد از RL برای سفارشی کردن مدل های هوش مصنوعی برای مشاغل استفاده کند.
موراتی ، مدیر ارشد پیشین فناوری Openai ، در ماه ژوئیه گفت که اولین محصول آزمایشگاه ماشین آلات در ماه های آینده رونمایی می شود و این “برای محققان و نوپا در حال توسعه مدل های سفارشی” مفید خواهد بود. هنوز مشخص نیست که این محصول چیست ، یا اینکه آیا از تکنیک های این تحقیق برای ایجاد پاسخ های قابل تکرار بیشتر استفاده می کند.
آزمایشگاه Thinking Machines همچنین گفته است که قصد دارد به طور مکرر پست های وبلاگ ، کد و سایر اطلاعات مربوط به تحقیقات خود را در تلاش برای “بهره مندی از مردم ، بلکه بهبود فرهنگ تحقیقاتی خودمان” منتشر کند. به نظر می رسد این پست ، اولین مورد در سری وبلاگ های جدید این شرکت با نام “Connectionism” بخشی از این تلاش است. Openai همچنین هنگام تأسیس تعهد به تحقیقات باز کرد ، اما این شرکت با بزرگتر شدن بسته تر شده است. خواهیم دید که آزمایشگاه تحقیقاتی موراتی در مورد این ادعا صادق است یا خیر.
این وبلاگ تحقیقاتی نگاهی نادر در یکی از مخفیانه ترین استارتاپ های هوش مصنوعی سیلیکون ولی ارائه می دهد. در حالی که دقیقاً فاش نمی کند که این فناوری به کجا می رود ، نشان می دهد که آزمایشگاه Thinking Machines در حال مقابله با برخی از بزرگترین سؤال در مرز تحقیقات AI است. تست واقعی این است که آیا آزمایشگاه Thinking Machines می تواند این مشکلات را حل کند و محصولات خود را برای توجیه ارزش 12 میلیارد دلاری خود ایجاد کند.
رویداد TechCrunch
سانفرانسیسکو
|
27-29 اکتبر ، 2025