تواناییهای پیشرفته ChatGPT، مانند اشکالزدایی کد، نوشتن یک مقاله یا شوخی کردن، منجر به محبوبیت گسترده آن شده است. علیرغم تواناییهایش، کمک آن به متن محدود شده است – اما این به زودی تغییر خواهد کرد.
به گفته آندریاس براون، مدیر ارشد فناوری مایکروسافت آلمان، در AI in Focus — Digital Kickoff، GPT-4 قرار است هفته آینده راه اندازی شود و امکان تولید متن به ویدیو را فراهم کند.
همچنین: ChatGPT چگونه کار می کند؟
براون با توجه به Heise، یک رسانه خبری آلمانی در رویداد، گفت: “ما هفته آینده GPT-4 را معرفی خواهیم کرد؛ در آنجا مدل های چندوجهی خواهیم داشت که امکانات کاملاً متفاوتی را ارائه می دهند – به عنوان مثال، ویدئوها.”
ChatGPT بر روی یک معماری مدل زبان ایجاد شده توسط OpenAI به نام Generative Pre-trained Transformer، همچنین به عنوان GPT، به ویژه GPT-3 یا GPT-3.5، که ربات چت را به خروجی متن محدود می کند، اجرا می شود.
از آنجایی که GPT-4 یک هوش مصنوعی چندوجهی است، موارد استفاده برای آن برخلاف مدلهای قبلی فراتر از متن است. هولگر کن، مدیر استراتژی تجاری مایکروسافت آلمان، گفت که هوش مصنوعی می تواند متن را به ویدیو، موسیقی و تصاویر نیز ترجمه کند.
همچنین: ChatGPT نمی تواند موسیقی بسازد، اما مدل جدید هوش مصنوعی گوگل می تواند
تولیدکننده متن به ویدیو مفهومی کاملاً جدید نیست، غولهای فناوری مانند متا و گوگل در حال حاضر مدلهایی دارند.
Meta دارای Make-A-Video و Google دارای Imagen Video است که هر دو از هوش مصنوعی برای تولید ویدئو از ورودی کاربر استفاده می کنند. با این حال، هم فناوری متا و هم فناوری گوگل در مرحله تحقیقاتی باقی مانده و برای عموم در دسترس نیست و OpenAI را در موقعیتی عالی قرار می دهد تا در فضای هوش مصنوعی مولد پیشتاز بماند.