10 روشی که GPT-4 چشمگیر است اما همچنان ناقص است

به نظر می رسید که سیستم به درستی پاسخ می دهد. اما پاسخ، ارتفاع در را در نظر نگرفت، که ممکن است از عبور یک تانک یا ماشین نیز جلوگیری کند.

سام آلتمن، مدیر اجرایی OpenAI، گفت که ربات جدید می تواند “کمی” استدلال کند. اما مهارت های استدلال آن در بسیاری از موقعیت ها از بین می رود. نسخه قبلی ChatGPT این سوال را کمی بهتر حل کرد زیرا تشخیص داد که ارتفاع و عرض مهم است.

این می تواند تست های استاندارد شده را انجام دهد.

OpenAI گفت که سیستم جدید می تواند در بین 10 درصد از دانش آموزان برتر در آزمون یکنواخت وکالت، که وکلا را در 41 ایالت و منطقه واجد شرایط می کند، امتیاز کسب کند. همچنین طبق تست‌های شرکت می‌تواند در آزمون‌های SAT نمره 1300 (از 1600) و در آزمون‌های Advanced Placement دبیرستان در رشته‌های زیست‌شناسی، حساب دیفرانسیل و انتگرال، اقتصاد کلان، روان‌شناسی، آمار و تاریخ را کسب کند.

نسخه‌های قبلی این فناوری در آزمون وکالت یکنواخت شکست خورده بودند و در اکثر آزمون‌های تعیین سطح پیشرفته تقریباً به همان اندازه نمره بالا نگرفتند.

در یک بعدازظهر اخیر، آقای براکمن برای نشان دادن مهارت‌های آزمایشی‌اش، به ربات جدید یک سوال امتحان وکالت چند پاراگراف درباره مردی داد که یک تجارت تعمیر کامیون دیزلی را اداره می‌کند.

پاسخ درست بود اما مملو از موارد قانونی بود. بنابراین آقای براکمن از ربات خواست تا پاسخ را به زبان انگلیسی ساده برای افراد غیرمجاز توضیح دهد. این کار را نیز انجام داد.

بحث در مورد آینده خوب نیست.

اگرچه به نظر می‌رسید ربات جدید درباره چیزهایی که قبلاً اتفاق افتاده است استدلال می‌کند، اما وقتی از او خواسته می‌شود فرضیه‌هایی درباره آینده بسازد، مهارت کمتری داشت. به نظر می رسید به جای ایجاد حدس های جدید، از آنچه دیگران گفته اند استفاده می کند.

وقتی دکتر اتزیونی از ربات جدید پرسید: “مشکلات مهمی که در تحقیقات NLP در دهه آینده باید حل شود چیست؟” – با اشاره به نوع تحقیق “پردازش زبان طبیعی” که توسعه سیستم هایی مانند ChatGPT را هدایت می کند – نمی تواند ایده های کاملاً جدیدی را فرموله کند.

و هنوز هم توهم دارد.

ربات جدید هنوز چیزها را درست می کند. این مشکل که “توهم” نامیده می شود، همه ربات های گفتگوی پیشرو را آزار می دهد. از آنجایی که سیستم‌ها درک درستی از درست و نادرستی ندارند، ممکن است متنی کاملاً نادرست تولید کنند.

هنگامی که آدرس وب سایت هایی را که آخرین تحقیقات سرطان را توصیف می کنند، پرسیده می شود، گاهی اوقات آدرس های اینترنتی ایجاد می شود که وجود نداشتند.

برچسب ها: chat gpt ChatGPT

10 روشی که GPT-4 چشمگیر است اما همچنان ناقص است

OpenAI GPT-4 را منتشر می کند و بینگ چت ارتقا یافته است

5 روشی که GPT-4 از ChatGPT پیشی می گیرد

5 روشی که GPT-4 از ChatGPT پیشی می گیرد

دیدگاهتان را بنویسید لغو پاسخ

You might also like

Gen AI در 95 ٪ موارد تفاوت مالی ایجاد نمی کند

Google Cloud از AI Ally برای تیم های امنیتی رونمایی می کند

پیشنهاد Chrome 34.5B $ AI AI: استراتژی یا شیرین کاری؟

انگلیس خواستار استفاده از فرصت طراحی تراشه AI یک بار در 20 سال است

هزینه های پنهان اجرای AI هر مدیرعامل باید بداند

چرا روسای امنیت خواستار تنظیم فوری هوش مصنوعی مانند Deepseek هستند

AiLib

دسته‌ها

خوش آمدید!

رمز عبور خود را بازیابی کنید

10 روشی که GPT-4 چشمگیر است اما همچنان ناقص است

این می تواند تست های استاندارد شده را انجام دهد.

بحث در مورد آینده خوب نیست.

و هنوز هم توهم دارد.

OpenAI GPT-4 را منتشر می کند و بینگ چت ارتقا یافته است

5 روشی که GPT-4 از ChatGPT پیشی می گیرد

5 روشی که GPT-4 از ChatGPT پیشی می گیرد

دیدگاهتان را بنویسید لغو پاسخ

You might also like

Gen AI در 95 ٪ موارد تفاوت مالی ایجاد نمی کند

Google Cloud از AI Ally برای تیم های امنیتی رونمایی می کند

پیشنهاد Chrome 34.5B $ AI AI: استراتژی یا شیرین کاری؟

انگلیس خواستار استفاده از فرصت طراحی تراشه AI یک بار در 20 سال است

هزینه های پنهان اجرای AI هر مدیرعامل باید بداند

چرا روسای امنیت خواستار تنظیم فوری هوش مصنوعی مانند Deepseek هستند

AiLib

دسته‌ها

برچسب‌ها

خوش آمدید!

رمز عبور خود را بازیابی کنید