در 14 مارس، شرکت OpenAI سانفرانسیسکو GPT-4، آخرین نسخه مدل بزرگ زبان (LLM) را منتشر کرد. OpenAI همچنین برنامه هایی مانند GPT-3 و DALL-E2 را توسعه داده است که دومی یک ابزار تولید تصویر مبتنی بر هوش مصنوعی است.
OpenAI اکنون دارای مدل های زبان چندوجهی است که می تواند داده ها را از منابع ورودی مختلف جمع آوری کند. جدیدترین نوآوریهای مبتنی بر GPT-4 میتوانند به پرسشهای مصرفکننده با تصاویر و موسیقی پاسخ دهند. اما ChatGPT-4 همچنین نشان دهنده یک جهش قابل توجه از GPT 3.5 است که خود یک جهش بزرگ برای بشر از موتورهای جستجوی مبتنی بر کلمات کلیدی بود.
ChatGPT OpenAI از زمان آغاز به کارش در نوامبر 2022 بسیار مورد توجه قرار گرفته است و در جامعه پردازش زبان طبیعی (NLP) و بسیاری از زمینه های دیگر به طور گسترده در مورد آن صحبت شده است.
ChatGPT در بسیاری از وظایف پیچیده NLP خوب است زیرا بر اساس دانش زیادی آموزش دیده است و بر اساس بازخورد انسانی تنظیم شده است. به عنوان مثال، در ترجمه زبان طبیعی به کد، تکمیل متن بسیار پوشیده شده و ساختن داستان ها بر اساس عناصر و سبک های تعریف شده توسط کاربر خوب است.
همچنین در کارهای معمولی NLP مانند طبقه بندی متن، استخراج موجودیت، ترجمه و غیره خوب است. همچنین، محققان ChatGPT را به شیوه ای محاوره ای آموزش داده اند. ChatGPT می تواند به درخواست های بعدی پاسخ دهد، اشتباهات را تصدیق کند، فرضیات نادرست را به چالش بکشد و درخواست های نادرست را رد کند.
در مجموع، زمانی که OpenAI ChatGPT را راهاندازی کرد، این یک جهش ناگهانی در یادگیری ماشینی نبود، بلکه یک فرآیند تکاملی ثابت در طول ماهها و سالها بود که منجر به اعتماد کافی در میان افتخارآفرینان OpenAI برای عرضه عمومی محصول انقلابیشان چند ماه پیش شد.
ترانسفورماتورهای از پیش آموزشدیده مولد (GPT) خانوادهای از مدلهای زبان OpenAI هستند که معمولاً روی مجموعه عظیمی از دادههای متنی آموزش داده میشوند تا متنی شبیه به زبان انسان تولید کنند.
2018- GPT-1 (متن بزرگی از متن پیوسته را می آموزد.)
2019- GPT-2 (متن را ترجمه می کند، به پرسش ها پاسخ می دهد، خلاصه می کند و متن را تولید می کند.)
2020- GPT-3 (متن انسان مانند و متن ادامه دار را تولید می کند.
2023- GPT-4 (این یک مدل زبان بزرگ چندوجهی است و 10 برابر پیشرفته تر از نسل قبلی خود، GPT-3.5 است.)
ChatGPT-4 را وارد کنید
شایان ذکر است که روند تکاملی که اکنون GPT-4 را در اختیار ما قرار می دهد، طی پنج ماه پس از عرضه پر شور نسخه قبلی خود، نسخه GPT3.5، در نوامبر انجام شده است. GPT-4 بهتر از GPT-3.5 به یک دلیل اصلی است: توانایی آن در تولید پاسخ های خلاقانه تر به سوالات. GPT-3.5 البته بسیار خلاقانه است. اما GPT-4 همه چیز را پیچیده تر می کند.
سعی کنید از هر دو مدل بخواهید کار خلاقانه ای انجام دهند، مانند نوشتن شعری با خطوط به دو زبان انگلیسی و فرانسوی، و ChatGPT با آخرین مدل GPT-4 کار بهتری را انجام می دهد. به عنوان مثال، پاسخ GPT-4 از هر دو زبان در هر خط استفاده می کند، اما GPT-3.5 بین آنها جابجا می شود و از یک زبان در یک خط و زبان دیگر در خط بعدی استفاده می کند.
همانطور که GPT-3.5 فقط میتواند به درخواستهای متنی پاسخ دهد، GPT-4 نیز چند وجهی است و میتواند به درخواستهای متنی و بصری پاسخ دهد. برای واضح بودن، وقتی میگوییم «ورودیهای بصری»، نیازی نیست که تصویر تصویری از یک دستور تایپ شده باشد. می تواند تصویری از هر چیزی باشد. بنابراین، GPT-4 می تواند تقریباً هر تصویری را، از یک مسئله ریاضی دست نویس گرفته تا یک میم Reddit، درک و توصیف کند.
محدودیت های GPT-3.5
یکی از نقاط ضعف GPT-3.5 تمایل آن به ایجاد اطلاعات بی معنی و نادرست با اطمینان است. در زبان هوش مصنوعی به عنوان “توهم AI” شناخته می شود و ممکن است منجر به بی اعتمادی به دانش تولید شده توسط هوش مصنوعی شود.
در GPT-4، توهم همچنان یک مسئله است. با این حال، مطالعه فنی GPT-4 نشان می دهد که مدل جدید 19 تا 29 درصد کمتر از مدل GPT-3.5 احتمال توهم را دارد.
حتی جدا از آنچه مطالعه فنی می گوید، پاسخ های مدل GPT-4 در ChatGPT به طور قابل ملاحظه ای واقعی تر است. به همین ترتیب، پنجره زمینه و اندازه زمینه بین GPT-4 و GPT-3.5 نیز بهبود یافته است.
یک پنجره زمینه، مقدار اطلاعاتی است که یک مدل میتواند در طول یک جلسه چت «به خاطر بسپارد» و برای چه مدت. اندازه زمینه و پنجره GPT-4 بسیار بهتر از نسخه قبلی خود است. در زندگی واقعی، این بدان معنی است که GPT-4 می تواند زمینه یک مکالمه و دستورالعمل های داده شده در طول مکالمه را بهتر و برای مدت طولانی تری به خاطر بسپارد.
نگاه اجمالی به آینده
محققان اخیراً ادعا کرده اند که GPT-4 در آزمون وکالت در ایالات متحده گذرانده است. در مقاله خود، محققان عملکرد صفر شات یک نسخه اولیه GPT-4 را با عملکرد نسل های قبلی GPT در کل آزمون نوار یکنواخت (UBE)، از جمله نه تنها آزمون چند حالته چند حالته (MBE) مقایسه می کنند. اما همچنین مؤلفههای آزمون مقاله چند حالته باز (MEE) و آزمون عملکرد چند حالته (MPT).
GPT-4 تا حد زیادی از آزمایشکنندگان انسانی و مدلهای قبلی در MBE پیشی میگیرد و 26 درصد پیشرفت نسبت به ChatGPT نشان میدهد و در پنج حوزه از هفت موضوع از انسانها بهتر عمل میکند. این نتایج نه تنها پیشرفت سریع و چشمگیر را در عملکرد مدل های زبانی بزرگ به طور کلی نشان می دهد، بلکه همچنین پتانسیل چنین مدل هایی را برای کمک به ارائه خدمات حقوقی در جامعه نشان می دهد.
بدون شک GPT-4 پیشرفت قابل توجهی نسبت به مدل های قبل از خود دارد. با وجود اینکه هنوز برخی از مشکلات GPT-3.5 را دارد، این مدل یک گام بزرگ رو به جلو در جستجوی مدلهای زبان هوش مصنوعی درخشان است زیرا از بسیاری جهات بسیار بهتر از GPT-3.5 است و ویژگیهای جدیدی دارد.
نیوش جیواناندام داستان هایی درباره چشم انداز هوش مصنوعی در هند و سراسر جهان می نویسد، با تمرکز بر تأثیر بلندمدت بر افراد و جامعه. دیدگاه ها شخصی هستند و موضع این نشریه را نشان نمی دهند.