اما عملکرد آن نسبت به نسخه قبلی خود – GPT-3.5 چگونه است؟
طبق گزارش خود OpenAI، آخرین افزوده شده به سری چت ربات های OpenAI، GPT-4 بسیار قابل اعتمادتر، خلاقانه تر است و می تواند دستورالعمل های ظریف تری را نسبت به GPT-3.5 در یک مکالمه معمولی انجام دهد.
در آزمایشی برای نشان دادن برتری GTP-4، این شرکت هر دو نسخه را در یک آزمون نوار شبیه سازی شده که در اصل برای انسان طراحی شده بود، آزمایش کرد. در حالی که GPT-4 امتحان را با امتیازی در 10 صدک برتر گذراند، امتیاز GPT-3.5 حدود 10 درصد پایین بود که نشان میدهد جانشین بسیار باهوشتر از سلف خود است.
در سایر آزمایشهای در دسترس عموم، GPT-4 یا بهتر از GPT-3 عمل میکند یا به همان اندازه عمل میکند. به عنوان مثال، در Reading & Writing مبتنی بر شواهد SAT، GPT-4 در صدک 93 قرار گرفت، در حالی که GPT-3 دارای امتیاز صدک 87 بود. در نمونه دیگری از درخشش آن، GPT-4 در رتبه 80 درصد در آزمون فارغ التحصیلی (GRE) کمی قرار گرفت، در حالی که GPT-3 در رتبه 25 پایین قرار گرفت.
در یکی از بزرگترین تغییرات، شرکت ادعا می کند که GPT-4 اکنون می تواند درخواست های تصویر را بپذیرد – GPT-3.5 فقط می تواند درخواست های متنی را بپذیرد. این بدان معناست که ربات چت اکنون می تواند تصویر را بخواند، زمینه را درک کند و پاسخ های متنی را منتشر کند. برخلاف GPT-3، GPT-4 یک زبان و همچنین یک مدل بصری است.
همچنین اکنون فریب چت ربات جدید هوش مصنوعی برای کاربران دشوارتر شده است. طبق Trusted Reviews، GPT-4 برای رسیدگی به سوالات مخرب آموزش دیده است. به همین دلیل، اکنون در ارائه اطلاعات واقعی بهتر است و از قابلیت های استدلال پیشرفته بهتری نسبت به GPT-3 برخوردار است.