تولیدکنندههای متن مانند ChatGPT و تولیدکنندههای تصویر مانند Stable Diffusion و Dall-E2 همهی خشم هستند. با این حال، مولدهای ویدئویی هوش مصنوعی مرز بعدی برای هوش مصنوعی مولد هستند. Runway AI ربات Gen-2 AI خود را معرفی کرد که می تواند کلیپ های ویدیویی را بر اساس متن تولید کند
هوش مصنوعی متن به تصویر اکنون در همه جا وجود دارد – بسیار رایج، آسان برای استفاده، و تقریباً جریان اصلی. با این حال، مرز بعدی برای هوش مصنوعی مولد، متن به ویدئو است. خوشبختانه، برای علاقه مندان به فناوری، این نزدیک است.
روش کار تبدیل متن به ویدیو بسیار ساده است، و بر اساس مدلی که اکنون با آن بسیار آشنا شده ایم – شما یک توضیح می نویسید و یک مدل هوش مصنوعی به هر شکلی که می خواهید فیلمی را ایجاد می کند. اگرچه بیشتر هوش مصنوعیهای مولد فقط میتوانند رویای انجام این کار را داشته باشند، یک استارتآپ هوش مصنوعی آمریکایی به نام Runway اعلام کرده است که مدل هوش مصنوعی مولد آنها، مدلی که میتواند از نشانههای متنی ساده ویدیو بسازد، در گوشه و کنار است.
Runway به کاربران خود یک ویرایشگر ویدیوی مبتنی بر وب با ویژگیهای هوش مصنوعی مانند حذف پسزمینه و تشخیص وضعیت بدن میدهد. در ماه فوریه، این کسبوکار اولین مدل ویرایش ویدیوی هوش مصنوعی خود، Gen-1 را رونمایی کرد و در مدل متن به تصویر منبع باز Stable Diffusion همکاری کرد.
Gen-1 اساساً به تغییر فیلمهای ویدیویی فعلی توجه داشت، و به کاربران این امکان را میداد که وارد یک کارتون سه بعدی خشن یا فیلم تلفن هوشمند لرزان شوند و یک پوشش تولید شده توسط هوش مصنوعی اضافه کنند.
Runway یک ویرایشگر ویدیوی مبتنی بر وب با ویژگیهای هوش مصنوعی مانند حذف پسزمینه و تشخیص وضعیت بدن ارائه میکند. در ماه فوریه، این کسبوکار اولین مدل ویرایش ویدیوی هوش مصنوعی خود، Gen-1 را رونمایی کرد و در مدل متن به تصویر منبع باز Stable Diffusion همکاری کرد.
به عنوان مثال، در کلیپ توییت زیر، ویدئویی از بستهبندی مقوایی با تصویری از یک کارخانه صنعتی ترکیب شده است تا فیلمی مناسب برای استوریبرد یا ارائه یک ویژگی صیقلیتر ایجاد شود.
در مقابل، به نظر میرسد که Gen-2 بیشتر بر روی ایجاد ویدیو از ابتدا متمرکز شده است، اگرچه اخطارهای زیادی وجود دارد که باید در نظر گرفته شود.
اولاً، بخشهای نمونه Runway مختصر، ناپایدار و به دور از واقعبینی عکس هستند، و دوم، دسترسی محدود است. طبق گزارش بلومبرگ، کاربران باید برای پیوستن به لیست انتظار Gen-2 از طریق Runway’s Discord ثبت نام کنند و سخنگوی این تجارت، کلسی روندنت، اعلام کرد که Runway “در هفته های آینده دسترسی گسترده ای را ارائه خواهد کرد.”
به عبارت دیگر، تنها چیزی که در حال حاضر برای ارزیابی Gen-2 در اختیار داریم، یک حلقه نمایشی و چند گزیده است که بیشتر آنها قبلاً به عنوان بخشی از Gen-1 تبلیغ شده بودند.
ویدیوها را با چیزی جز کلمات تولید کنید. اگر می توانید آن را بگویید، اکنون می توانید آن را ببینید.
معرفی، متن به ویدیو. با Gen-2.
بیشتر بدانید در pic.twitter.com/6qEgcZ9QV4
— باند (@runwayml) 20 مارس 2023
این تیم همچنین نمونه هایی را با مطبوعات به اشتراک گذاشت تا نشان دهد مدل هوش مصنوعی مولد آنها واقعاً چه توانایی هایی دارد.
این تازه شروع کار است. #Gen2 pic.twitter.com/meXhB3p0Eh
— آناستازیس ژرمنیدیس (@agermanidis) 21 مارس 2023
ویدیوها را با چیزی جز کلمات تولید کنید. اگر می توانید آن را بگویید، اکنون می توانید آن را ببینید.
معرفی، متن به ویدیو. با Gen-2.
بیشتر بدانید در pic.twitter.com/6qEgcZ9QV4
— باند (@runwayml) 20 مارس 2023
چند فضانورد در یک سیاره مرموز فرود آمدند.
متن به ویدیو. Gen-2 #بدون دوربین pic.twitter.com/Qxob7d4EdZ
— الخاندرو ماتامالا اورتیز (@matamalaortiz) 20 مارس 2023
با این حال، نتایج جالب است، و امکان تبدیل متن به ویدئو AI فریبنده است – نویدبخش احتمالات خلاقانه جدید و تهدیدات جدید برای اطلاعات نادرست و غیره. همچنین ارزش دارد که کار Runway را با تحقیقات متن به ویدئو انجام شده توسط غول های صنعت مقایسه کنید. مانند متا و گوگل. این کسبوکارها به شیوهای پیچیدهتر کار میکنند، زیرا کلیپهای تولید شده توسط هوش مصنوعی طولانیتر و منسجمتر هستند، اما نه بهگونهای که منابع عظیم آنها را نشان دهد. در مقایسه، Runway فقط یک تیم 45 نفره است.
به عبارت دیگر، شرکتها به کارهای جالب در زمینه هوش مصنوعی مولد، از جمله زمینهای ناشناخته مانند تبدیل متن به ویدئو، ادامه میدهند. بیشتر در راه است، AI تولید شده است یا نه.
همه را بخوانید آخرین خبرها، اخبار پرطرفدار، اخبار کریکت، اخبار بالیوود،
اخبار هند و اخبار سرگرمی اینجا. ما را در فیسبوک دنبال کنید، توییتر و اینستاگرام
تاریخ به روز رسانی: 21 مارس 2023 16:15:25 IST