ChatGPT ممکن است بازی خود را با انتشار افزایش دهد GPT4 اما در مسابقه برای ایجاد ویدیوی تولید شده توسط هوش مصنوعی شکست خورده است.
استارتاپ نیویورکی Runway Research (در برگه جدید باز می شود) سیستم Gen 2 جدید خود را اعلام کرده است که میتواند محتوای ویدیویی حلقهای 3 ثانیهای را از طریق پیامهای متنی یا تصویری تولید کند، و اگرچه در حال حاضر در دسترس عموم نیست، یک ویدیوی تبلیغاتی قول میدهد «خیلی زود» وارد شود، و شما میتوانید در انتظار ثبت نام کنید. فهرست (در برگه جدید باز می شود) اکنون.
پیش نمایش های سایت خود Runway جالب است. ویدیوها شبیه گیف های فوق العاده شارژ شده هستند، اما هر چیزی که بتوانید تصور کنید می توانید ایجاد کنید. Bard AI و ChatGPT گوگل هر دو ایجاد متن به ویدئو را نشان داده اند اما هیچکدام از مرحله آزمایش فراتر نرفته اند. برخی انتظار داشتند که GPT4 با قابلیت های ویدئویی راه اندازی شود، اما در حالی که می تواند تصاویر را پردازش و ویرایش کند، در حال حاضر هیچ عملکرد ویدئویی وجود ندارد.
هوش مصنوعی Runway که در درجه اول یک سرویس ویرایش ویدیو و تصویر است، همچنین میتواند بافتها یا افکتهای مختلف را روی یک ویدیوی موجود لایهبندی کند و فریم به فریم آن را مطابقت دهد. این همه احتمالات را باز می کند و به شما امکان می دهد مثلاً یک ویدیوی موجود را به یک کارتون تبدیل کنید. یک نمونه ویدیویی در وب سایت خود Runway نشان می دهد که نقاط به سبک دالماسی در حال انتقال به یک گلدن رتریور است.
ویدیوی Runway AI چگونه کار می کند؟
در یک مقاله تحقیقاتی (در برگه جدید باز می شود) Runway با عنوان “ساختار و محتوای هدایتشونده ویدئو سنتز با مدلهای انتشار” نحوه عملکرد این فناوری را تشریح میکند. حرکت نسبتاً سنگینی است اما به قول خودشان اینطور توصیف می کنند:
«مدل انتشار ویدیوی پنهان ما ویدیوهای جدیدی را با ساختار و اطلاعات محتوا ترکیب میکند. در حالی که محتوا با تصاویر یا زبان طبیعی کنترل میشود، با شرطی کردن تخمینهای عمق، سازگاری ساختاری را تضمین میکنیم. نتایج پایدار زمانی با اتصالات زمانی اضافی در مدل و تصویر مشترک و آموزش ویدیویی به دست میآیند. علاوه بر این، یک روش راهنمایی جدید، با الهام از راهنمایی بدون طبقهبندی، امکان کنترل کاربر بر روی ثبات زمانی در خروجیها را فراهم میکند.
به زبان ساده، Runway از انتشار ویدئو آگاه از محتوا و مدلی استفاده میکند که بر روی مجموعهای از ویدئوهای بدون شرح و دادههای متن-تصویر آموزش داده شده است تا زمینه را برای هوش مصنوعی فراهم کند.
شاید بیشتر از چت ربات های هوش مصنوعی، پتانسیل آسیب رساندن به ویدیوهای تولید شده توسط هوش مصنوعی بسیار واقعی است. در حالی که ویدیوها و تصاویر دیپ فیک رایج تر می شوند، هنوز یک اعتبار ضمنی در مورد محتوای ویدیویی وجود دارد که باید در مورد آن تجدید نظر کنیم. با هر فن آوری جدید، همیشه محتوای ناراحت کننده نیز وجود خواهد داشت و باید فیلترهایی در محل قرار گیرند.
ما Runway را زیر نظر خواهیم داشت و پس از آماده شدن برای راه اندازی آن را آزمایش خواهیم کرد.