هوش مصنوعی مولد لحظاتی را سپری می کند. ChatGPT و مولدهای هنری مانند DALL-E 2، Stable Diffusion و Midjourney پتانسیل خود را ثابت کردهاند، و اکنون میلیونها نفر مغز خود را درگیر این هستند که چگونه خروجیهایشان را به چیزی شبیه به بینایی در سرشان برسانند.
این هدف مهندسی سریع است – مهارت ایجاد یک ورودی برای ارائه یک نتیجه دلخواه از هوش مصنوعی مولد.
با وجود آموزش بیشتر بر روی داده ها و منابع محاسباتی نسبت به قبل، مدل های هوش مصنوعی مولد محدودیت هایی دارند.
به عنوان مثال، آنها برای تولید محتوای همسو با اهدافی مانند حقیقت، بینش، قابلیت اطمینان و اصالت آموزش ندیده اند.
آنها همچنین فاقد عقل سلیم و درک اساسی از جهان هستند، به این معنی که می توانند محتوای معیوب (و حتی بی معنی) تولید کنند.
به این ترتیب، مهندسی سریع برای باز کردن قابلیتهای هوش مصنوعی مولد ضروری است. و خوشبختانه این یک مهارت فنی نیست. بیشتر در مورد آزمون و خطا و در نظر گرفتن چند نکته است.
ChatGPT
ابتدا، اجازه دهید از ChatGPT برای نشان دادن چگونگی استفاده از مهندسی سریع برای خروجی متن استفاده کنیم. اگر به طور موثر از آن استفاده شود، ChatGPT می تواند مقاله، کد کامپیوتری، طرح های تجاری، نامه های پوششی، شعر، جوک و موارد دیگر تولید کند.
از آنجایی که این یک ربات چت است، ممکن است تمایل داشته باشید که به صورت مکالمه با آن درگیر شوید.
اما اگر میخواهید نتایج مناسبی داشته باشید، این بهترین روش نیست.
در عوض، این طرز فکر را بپذیرید که دستگاه را طوری برنامهریزی میکنید که یک کار نوشتن را برای شما انجام دهد.
یک محتوای مختصر مشابه آنچه که ممکن است به یک نویسنده حرفه ای استخدام شده بدهید ایجاد کنید.
نکته کلیدی این است که تا حد امکان زمینه را فراهم کنید و از زبانی خاص و دقیق استفاده کنید.
شما می توانید اطلاعاتی در مورد:
- تمرکز، قالب، سبک، مخاطب مورد نظر و طول متن مورد نظر شما
- لیستی از نکاتی که می خواهید به آنها پرداخته شود
- در صورت وجود، متن را از چه دیدگاهی می خواهید نوشته شود
- و الزامات خاص، مانند عدم وجود اصطلاحات خاص.
اگر قطعه طولانیتری میخواهید، میتوانید آن را در مراحل تولید کنید.
با چند پاراگراف اول شروع کنید و از ChatGPT بخواهید در اعلان بعدی ادامه دهد.
اگر از بخش خاصی راضی نیستید، میتوانید درخواست کنید که طبق دستورالعملهای جدید بازنویسی شود.
اما به یاد داشته باشید: مهم نیست که چقدر با درخواستهای خود سرکوب میکنید، ChatGPT در معرض نادرستی و ساختگی است.
بنابراین هیچ چیز را به صورت اسمی در نظر نگیرید.
در مثال زیر، خروجی یک “گزارش” را ذکر می کند که وجود ندارد.
احتمالاً این مورد را شامل می شود زیرا درخواست من از آن خواسته است که فقط از منابع معتبر استفاده کند.
مولدهای هنر
Midjourney یکی از محبوبترین ابزارها برای تولید هنر و یکی از سادهترین ابزارها برای مبتدیان است. پس بیایید از آن برای مثال بعدی خود استفاده کنیم.
برخلاف تولید متن، دستورهای پیچیده لزوما برای تولید تصویر بهتر نیستند.
مثال زیر نشان می دهد که چگونه یک دستور اولیه همراه با یک کلمه کلیدی سبک برای ایجاد انواع تصاویر جالب کافی است.
کلمه کلیدی سبک شما ممکن است به یک ژانر، جنبش هنری، تکنیک، هنرمند یا اثر خاص اشاره داشته باشد.
تصاویر زیر بر اساس درخواست است پلنگ روی درخت به دنبال آن کلمات کلیدی سبک متفاوتی وجود دارد. اینها (از بالا سمت چپ در جهت عقربه های ساعت) بودند سینتویو، هایپررئالیست، اکسپرسیونیست و به سبک زنا هالووی.
هالووی یک عکاس بریتانیایی است که به خاطر گرفتن سوژه هایش در صحنه های اثیری و تا حدودی سورئال، اغلب در زیر آب، شهرت دارد.
همچنین می توانید کلمات کلیدی مربوط به موارد زیر را اضافه کنید:
- کیفیت تصویر، مانند “زیبا” یا “با وضوح بالا”
- اشیایی که می خواهید به تصویر کشیده شوند
- و نور و رنگ
با Midjourney، حتی می توانید از دستورات خاص خاصی برای ویژگی های مختلف از جمله استفاده کنید ––ar یا –جنبه برای تنظیم نسبت تصویر، –– خیر برای حذف اشیاء خاص، و ––ج برای تولید نتایج “غیر معمول” بیشتر. این دستور مقادیر بین 0 تا 100 را بعد از آن می پذیرد، جایی که پیش فرض 0 است و 100 منجر به غیرعادی ترین نتیجه می شود.
همچنین می توانید استفاده کنید –– ها یا –– شیک کردن برای تولید تصاویر هنری بیشتر (به قیمت دنبال کردن سریع دستورات).
مثال زیر برخی از این ایده ها را برای ایجاد یک تصویر فانتزی با ظاهری رویایی و آینده نگرانه به کار می برد. درخواست استفاده شده در اینجا بود منظره شهری رویایی آینده نگر، زیبا، ابرها، رنگ های جالب، نورپردازی سینمایی، 8k، 4k ––ar 7:4 ––c 25 ––بدون پنجره.
در صورت استفاده از دو نقطه، Midjourney چندین درخواست را برای یک تصویر می پذیرد. این می تواند منجر به نتایجی مانند تصویر زیر شود، جایی که من دستورات جداگانه ای برای جغد و گیاهان ارائه کردم. اعلان کامل بود نقاشی رنگ روغن یک جغد اثیری :: گل ها، رنگ ها :: چکیده :: حکمت ––ar 7:4.
یک نوع پیشرفته تر از درخواست، گنجاندن یک تصویر به عنوان بخشی از درخواست است. سپس Midjourney هنگام ایجاد تصویر جدید، سبک آن تصویر را در نظر می گیرد.
یک راه خوب برای یافتن الهام و ایده، کاوش در گالری Midjourney و کتابخانه های سبک است.
شغل آینده؟
همانطور که مدلهای مولد هوش مصنوعی وارد زندگی روزمره میشوند، احتمالاً مهارتهای تشویقی بیشتر مورد تقاضا قرار میگیرند، بهویژه از سوی کارفرمایان که به دنبال کسب نتایج با استفاده از ژنراتورهای هوش مصنوعی هستند.
برخی از مفسران می پرسند که آیا تبدیل شدن به یک “مهندس سریع” ممکن است راهی برای حرفه ای ها مانند طراحان، مهندسان نرم افزار و نویسندگان محتوا باشد تا با ادغام هوش مصنوعی مولد در کار خود، مشاغل خود را از اتوماسیون نجات دهند. دیگران پیشنهاد کرده اند که مهندسی سریع خود یک شغل خواهد بود.
پیش بینی نقش مهندسی سریع با پیشرفت مدل های هوش مصنوعی دشوار است.
اما تقریباً مسلم است که ژنراتورهای پیچیده تر می توانند درخواست های پیچیده تری را رسیدگی کنند و از کاربران دعوت کنند تا خلاقیت خود را گسترش دهند. آنها احتمالاً درک بهتری از ترجیحات ما خواهند داشت و نیاز به سرهم بندی را کاهش می دهند.
مارسل شارث، مدرس تحلیل تجاری، دانشگاه سیدنی است
این مقاله از The Conversation تحت مجوز Creative Commons بازنشر شده است. مقاله اصلی را بخوانید.