به گفته آندریاس براون، مدیر ارشد فنی مایکروسافت آلمان، OpenAI هفته آینده GPT-4 را منتشر خواهد کرد و برنامه هوش مصنوعی مولد به کاربران اجازه می دهد متن را به ویدیو تبدیل کنند.
چت GPT-3 جهان را طوفانی کرده است اما مدل زبان یادگیری عمیق فقط متن تولید می کند. براون GPT-3 را “چند وجهی” توصیف کرده است که نسل هایی فراتر از متن را ارائه می دهد.
براون در یک رویداد هوش مصنوعی در آلمان در 9 مارس که توسط روزنامه آلمانی گزارش شده است گفت: “ما هفته آینده GPT-4 را معرفی خواهیم کرد، در آنجا مدل های چندوجهی خواهیم داشت که امکانات کاملاً متفاوتی را ارائه می دهند – به عنوان مثال، ویدئوها.” هیزه.
تولید محتوای چندوجهی
Chat GPT-4 احتمالاً نه تنها ویدیو، بلکه تصاویر و کلیپ های صوتی نیز تولید می کند. تاکنون، تولیدکنندههای تصویر هوش مصنوعی از چتباتهایی مانند Chat GPT جدا بودهاند. اما هیجان نسبت به قابلیتهای مدلهای نسل بعدی که میتوانند محتوا در قالبهای مختلف تولید کنند، در حال افزایش است.
تریستان وولف در این باره می نویسد: «ما در مورد مدل های هوش مصنوعی صحبت می کنیم که می توانند متن، تصاویر و صدا را همزمان درک کنند و از آنها برای کسب دانش درباره دنیای اطراف خود و همچنین تعامل با آن استفاده کنند. متوسط.
مایکروسافت قبلاً یک مدل زبان چندوجهی ارائه کرده است که در قالبهای مختلف به نام Kosmos-1 عمل میکند.
در ارائه Kosmos-1، هوش مصنوعی می تواند تصاویر را همراه با یک عکس بخواند. برای مثال، تصویری از ساعتی که 10:10 را نشان میدهد با این سؤال وارد هوش مصنوعی میشود: «زمان الان؟» که هوش مصنوعی پاسخ می دهد، “10:10 در یک ساعت بزرگ.”
همچنین میتواند به بیننده بگوید که یک زن چه مدل موی خاصی دارد یا پوستر فیلم را تشخیص میدهد و میتواند به کاربر بگوید چه زمانی آن فیلم منتشر میشود.
ولف می افزاید: «Kosmos-1 از اطلاعات متن و تصویر برای پاسخ دادن به سؤالات استفاده می کند و به آن «ظرفیت شناختی» بی سابقه ای می دهد.
“لحظه آیفون”
در طول رویداد “AI in Focus – Digital Kickoff” در آلمان، مدیر عامل شرکت مایکروسافت آلمان، ماریان جانیک، که ChatGPT را “یک لحظه آیفون” توصیف می کند، به براون پیوست.
او می گوید که این در مورد جایگزین کردن شغل نیست، بلکه برای انجام کارهای تکراری به روشی متفاوت از قبل است. هیزه گزارش ها.
او می گوید: «اختلال لزوماً به معنای از دست دادن شغل نیست. استفاده از ارزش افزوده هوش مصنوعی به متخصصان زیادی نیاز دارد.
Chat GPT بسیار محبوب شده است و به سریع ترین برنامه مصرف کننده در تاریخ تبدیل شده است که به 100 میلیون کاربر رسیده است.
OpenAI، که DALL-E را نیز اداره می کند، بود انتقاد کرد توسط یکی از بنیانگذاران آن ایلان ماسک که در سال 2018 شرکت را ترک کرد.
“OpenAI به عنوان یک منبع باز ایجاد شد (به همین دلیل نام آن را “Open” AI گذاشتم)، یک شرکت غیرانتفاعی به عنوان وزنه تعادل برای گوگل، اما اکنون به یک شرکت منبع بسته و حداکثر سود تبدیل شده است که به طور موثر توسط مایکروسافت کنترل می شود. او در 17 فوریه نوشت.
نه مایکروسافت و نه OpenAI تاکنون به نظرات همکاران آلمانی خود پاسخی نداده اند.
اعتبار تصویر: عکس سرصفحه مجوز از طریق $$$.