xAI متعلق به ایلان ماسک قابلیت های درک تصویر را به مدل Grok AI خود اضافه کرده است. این بدان معنی است که کاربران پولی در پلتفرم اجتماعی X او که به چت ربات هوش مصنوعی دسترسی دارند، می توانند تصویری را آپلود کنند و در مورد آن از هوش مصنوعی سؤال بپرسند.
ماسک در یک پست جداگانه گفت که Grok حتی می تواند با استفاده از ویژگی جدید درک تصویر، معنای شوخی را توضیح دهد. او افزود که این عملکرد در مراحل اولیه است و نشان می دهد که “به سرعت بهبود خواهد یافت”.
در ماه آگوست، شرکت هوش مصنوعی ماسک مدل Grok-2 را منتشر کرد، یک نسخه پیشرفته از چت بات که شامل قابلیت های تولید تصویر بود. با استفاده از مدل FLUX.1 توسط آزمایشگاه جنگل سیاه. مانند نسخه های قبلی، Grok-2 برای توسعه دهندگان یا کاربران X پریمیوم (پرداخت کننده) در دسترس قرار گرفت.
در آن زمان، xAI گفت که نسخه آینده، درک چندوجهی را به Grok on X و مدلی که از طریق API توسعه دهنده ارائه می دهد، اضافه می کند.
Grok ممکن است به زودی اسناد را نیز درک کند، با توجه به پاسخ ماسک به کاربری که از این مدل به دلیل ناتوانی در مدیریت فرمتهای فایل خاص (مانند PDF) انتقاد کرده است. ماسک در پاسخ گفت: «مدت زیادی نیست» و مدعی شد: «ما در ماهها کار را انجام میدهیم که سالها طول کشید.»
این شبکه اجتماعی در تلاش است تا ویژگیهای بیشتری را به ربات چت هوش مصنوعی و سطوح کاربران پولی در X اضافه کند تا این پیشنهاد جذابتر شود. در اوایل این ماه، X ابزار جدیدی به نام Radar برای مشترکین Premium+ برای مشاهده روندهای بلادرنگ و ارائه بینش در مورد مکالمات ارائه کرد.