در حالی که رسانهها، عموم مردم و متخصصان هوش مصنوعی از امکانات جدید Chat GPT لذت میبرند، بیشتر آنها متوجه معنای این کاربرد فناوریهای زبان طبیعی برای علم داده نمیشوند.
آنها نتوانستهاند ببینند این رشته تا کجا پیش رفته است – و اکنون برای کاربران روزمره تکنیکهای تحلیلی مخفیانه و پیشرفته که عادی شدهاند، چه معنایی دارد.
به گفته آبیشک گوپتا، دانشمند و مهندس اصلی داده در نرم افزار Talentica، مدل زبانی زیربنایی برای Chat GPT GPT-3.5 است. این مدل از Chat GPT سودمندتر است. این نرم افزار در تولید کد نرم افزار مهارت بیشتری دارد و برای طیف وسیعی از وظایف فناوری زبان طبیعی به غیر از پاسخگویی به سؤال و تولید زبان، از جمله طبقه بندی اسناد، خلاصه سازی، و تجزیه و تحلیل سازمان متن قابل استفاده است.
بیشتر از همه، این مدل زبان به شدت برای مهندسی سریع و یادگیری چند شات سازگار است، چارچوب هایی که همه آنها به جز محدودیت های قبلی علم داده در مورد مهندسی ویژگی و مقادیر داده های آموزشی منسوخ شده اند.
گوپتا خاطرنشان کرد: با تطبیق GPT-3.5 با مهندسی سریع و یادگیری چند شات، “وظایف رایج به دانشمند داده نیاز ندارند.” “یک فرد معمولی می تواند آنها را فقط با دانستن نحوه ایجاد اعلان و تا حدودی دانستن دانش در مورد GPT-3.5 انجام دهد.”
مهندسی سریع
مهندسی سریع نشان می دهد که چگونه GPT-3.5 انقلابی در علم داده ایجاد کرده است و این کار را برای کاربران غیر فنی آسان کرده است. قبل از اینکه بتوانند مهندسی سریع با این مدل زبان را انجام دهند، دانشمندان داده گران قیمت و سخت یافتنی عمدتاً مجبور بودند مدل های جداگانه ای برای هر کاربرد فناوری های زبان طبیعی بسازند.
اما با در دسترس بودن GPT-3.5، گوپتا فاش کرد: «حالا که این مدل واحد را داریم، میتوانیم زمان رسیدن به بازار را سرعت بخشیم.» گوپتا نشان داد. “و، این همان مدلی است که می توانیم برای کارهای مختلف از آن استفاده کنیم.” بنابراین، مهم نیست که وظایف چقدر متفاوت است – مانند خواندن ایمیل ها و نوشتن پاسخ ها یا خلاصه کردن یک مقاله تحقیقاتی در پنج خط – کاربران فقط باید به اندازه کافی اعلان را مهندسی کنند تا مدل را برای انجام آن آموزش دهند.
گوپتا توضیح داد: “یک فرمان فرمان خاصی است که ما به مدل می دهیم.” و در مدلسازی دستورات، نمونههای خاصی به آن میدهیم که میتواند الگوها را شناسایی کند. بر اساس این دستورات و الگوها، مدل میتواند بفهمد که وظیفه چیست.» به عنوان مثال، به سادگی باید به یک مدل یک متن خاص داده و TL;DR (خیلی طولانی، خوانده نشد) بنویسید و مدل میفهمد که کار خلاصهسازی متن است – سپس آن را انجام میدهد.
فروشگاه های مهندسی سریع
مزیت سرمایه مهندسی سریع این است که نیاز به مهندسی ویژگی های مدل های فردی را که برای یک کار آموزش دیده اند جایگزین می کند. مهندسی ویژگی اغلب وقت گیر، سخت و نیازمند دانش تخصصی آماری و کدگذاری است. برعکس، هر کاربری میتواند یک درخواست زبان طبیعی صادر کند، که این جنبه از تنظیم مدل را برای یک پایگاه کاربری بسیار گستردهتر، از جمله افراد غیرمتخصص، قابل دسترسی میکند. اثربخشی آن به ایجاد اعلان مناسب بستگی دارد.
گوپتا توصیه کرد: «اگر یک اعلان خوب ارائه دهید، خروجی بسیار بهتر از یک دستور معمولی خواهد بود. “کلمات خاصی وجود دارد که به مدل کمک می کند تا در مقایسه با سایر کلمات، کار را بهتر درک کند. راههای خودکار خاصی برای ایجاد این اعلانها وجود دارد.»
بهترین روش برای مهندسی سریع، استفاده از یک پایگاه داده مهندسی سریع است که تقریباً معادل یک فروشگاه ویژگی است، به این صورت که اعلانهایی را در خود جای میدهد که میتوانند برای اهداف مختلف مورد استفاده مجدد و اصلاح قرار گیرند. گوپتا گفت: «مردم پایگاه دادهای از دستورات ارائه کردهاند که میتواند برای کارهای خاصی که معمولاً شناخته شده هستند، استفاده شود.
چند آموزش شات
سازمانها علاوه بر دادن دستورات از طریق اعلانها، میتوانند نمونههایی را نیز برای آموزش GPT-3.5 برای یک کار معین در اعلانها ارائه کنند. مورد دوم بخشی از معدود پدیده یادگیری شات است که در آن مقدار داده های آموزشی برای مدل های تدریس به چند نمونه (آموزش چند شات)، تک (تک شات یادگیری) یا صفر (یادگیری صفر شات) کاهش می یابد. این کاهش مثال در مقایسه با تمام داده های آموزشی – و حاشیه نویسی های مورد نیاز برای داده های آموزشی – قابل توجه است که در غیر این صورت می تواند وظایف یادگیری ماشین را مختل کند.
گوپتا اظهار داشت: در این مورد، یکی «فقط چند نمونه از الگوها را به مدل میدهد و به طور خودکار انواع مشابهی از الگوها را برای کار راهحل تولید میکند». اگر وظیفه سیستم شناسایی پایتخت های هر کشور باشد، کاربر می تواند قبل از درخواست پایتخت های دیگر کشورها مثالی بزند که دهلی نو پایتخت هند است. گوپتا نتیجهگیری کرد که نمونهای از این مورد استفاده از یادگیری تک شات، سیستم را آموزش میدهد، سپس «با دادن الگو به مدل، میتوانید هر سؤالی را بر اساس آن الگو بپرسید».
یادگیری چند وظیفه ای
اگرچه چنین مثالی ممکن است بی اهمیت به نظر برسد، اما نشان دهنده سهولت استفاده، عدم دانش تخصصی و کمبود مهارت های فنی مورد نیاز برای تنظیم GPT-3.5 برای تقریباً هر کار فناوری زبان طبیعی است. در نهایت، این ماهیت سودمند GPT-3.5 اثربخشی یادگیری چندوظیفهای و دسترسی رو به رشد مدلهای یادگیری ماشینی پیشرفته را نشان میدهد.
درباره نویسنده
جلانی هارپر یک مشاور تحریریه است که به بازار فناوری اطلاعات خدمات می دهد. او در برنامه های کاربردی داده محور متمرکز بر فناوری های معنایی، حاکمیت داده و تجزیه و تحلیل تخصص دارد.
برای خبرنامه رایگان insideBIGDATA ثبت نام کنید.
به ما در لینکدین بپیوندید:
در فیس بوک به ما بپیوندید: