چهار ماه پیش، یک شرکت کوچک در سانفرانسیسکو با معرفی یک ربات گفتگوی آنلاین جدید که میتوانست به سؤالات پیچیده پاسخ دهد، شعر بنویسد و حتی احساسات انسانی را تقلید کند، به بحث صنعت فناوری تبدیل شد.
اکنون این شرکت با نسخه جدیدی از فناوری که رباتهای چت خود را تقویت میکند، بازگشته است. این سیستم در رقابت دره سیلیکون برای پذیرش هوش مصنوعی و تصمیم گیری نسل بعدی رهبران صنعت فناوری پیشرو خواهد بود.
OpenAI که حدود 375 کارمند دارد اما با میلیاردها دلار سرمایه گذاری از سوی مایکروسافت و افراد مشهور صنعت حمایت شده است، روز سه شنبه اعلام کرد که فناوری ای را منتشر کرده است که GPT-4 نامیده می شود. این موتور به گونه ای طراحی شده است که ربات های چت و انواع سیستم های دیگر، از موتورهای جستجو گرفته تا معلمان آنلاین شخصی را نیرو می دهد.
اکثر مردم از طریق نسخه جدیدی از چت ربات ChatGPT شرکت از این فناوری استفاده خواهند کرد، در حالی که مشاغل آن را در سیستم های مختلف، از جمله نرم افزارهای تجاری و وب سایت های تجارت الکترونیک، ترکیب می کنند. این فناوری در حال حاضر ربات چت را در دسترس تعداد محدودی از افراد با استفاده از موتور جستجوی بینگ مایکروسافت قرار می دهد.
پیشرفت OpenAI، تنها در عرض چند ماه، صنعت فناوری را در یکی از غیرقابل پیش بینی ترین لحظات خود در دهه های اخیر قرار داده است. بسیاری از رهبران صنعت بر این باورند که تحولات در هوش مصنوعی نشان دهنده یک تغییر اساسی در فناوری است، به همان اندازه که ایجاد مرورگرهای وب در اوایل دهه 1990 اهمیت دارد. این پیشرفت سریع دانشمندان کامپیوتر را متحیر کرده است.
GPT-4 که مهارتهای خود را با تجزیه و تحلیل حجم عظیمی از دادههای جمعآوریشده از اینترنت میآموزد، به روشهای مختلفی بر آنچه که ChatGPT اصلی را تامین میکرد، بهبود میبخشد. دقیق تر است. به عنوان مثال، میتواند آزمون یکنواخت وکالت را در اختیار بگیرد، بدهی مالیاتی افراد را بلافاصله محاسبه کند و توضیحات مفصلی از تصاویر ارائه دهد.
اما فناوری جدید OpenAI هنوز دارای برخی از کاستیهای عجیب و غریب انسانی است که خودیهای صنعت و افرادی را که با جدیدترین رباتهای چت کار کردهاند را عصبانی کرده است. در برخی موضوعات متخصص و در برخی دیگر سخت گیر است. این می تواند در تست های استاندارد بهتر از بسیاری از افراد عمل کند و توصیه های پزشکی دقیقی را به پزشکان ارائه دهد، اما می تواند محاسبات اولیه را نیز به هم بزند.
شرکتهایی که آیندهشان را روی این فناوری شرطبندی میکنند – حداقل در حال حاضر – ممکن است نادیدهگیری را تحمل کنند، که در صنعتی که از ابتدا بر اساس این تصور ساخته شده بود که رایانهها از خالقان انسانیشان دقیقتر هستند، مدتها تابو بود.
سام آلتمن، مدیر اجرایی OpenAI در مصاحبهای گفت: «نمیخواهم اینطور به نظر برسد که ما استدلال یا هوش را حل کردهایم، که مطمئناً حل نکردهایم». اما این یک گام بزرگ به جلو نسبت به آنچه در حال حاضر وجود دارد است.
سایر شرکتهای فناوری احتمالاً ویژگیهای GPT-4 را در مجموعهای از محصولات و خدمات، از جمله نرمافزار مایکروسافت برای انجام وظایف تجاری و سایتهای تجارت الکترونیکی که میخواهند روشهای جدیدی را برای آزمایش مجازی محصولات خود به مشتریان ارائه دهند، بگنجانند. تعدادی از غول های صنعت مانند گوگل و شرکت مادر فیس بوک، متا نیز در حال کار بر روی چت بات های خود و فناوری هوش مصنوعی هستند.
ChatGPT و فناوریهای مشابه در حال حاضر رفتار دانشآموزان و مربیانی را تغییر میدهند که تلاش میکنند بفهمند آیا این ابزارها باید در آغوش گرفته یا ممنوع شوند. از آنجایی که سیستم ها می توانند برنامه های کامپیوتری بنویسند و سایر وظایف تجاری را انجام دهند، در آستانه تغییر ماهیت کار نیز هستند.
حتی چشمگیرترین سیستم ها به جای جایگزینی کارگران ماهر، تمایل دارند که آنها را تکمیل کنند. این سیستم ها را نمی توان به جای پزشکان، وکلا یا حسابداران استفاده کرد. برای تشخیص اشتباهات آنها همچنان به متخصصان نیاز است. اما آنها به زودی می توانند جایگزین برخی از حقوقدانان شوند (که کار آنها توسط وکلای آموزش دیده بررسی و ویرایش می شود) و بسیاری از کارشناسان هوش مصنوعی معتقدند که آنها جایگزین کارگرانی خواهند شد که محتوا را در اینترنت تعدیل می کنند.
گرگ براکمن، رئیس OpenAI گفت: “قطعاً اختلالی وجود دارد، به این معنی که برخی از مشاغل از بین می روند و برخی مشاغل جدید ایجاد می شوند.” اما من فکر می کنم که اثر خالص این است که موانع ورود کاهش می یابد و بهره وری کارشناسان افزایش می یابد.
روز سهشنبه، OpenAI شروع به فروش دسترسی به GPT-4 کرد تا کسبوکارها و سایر توسعهدهندگان نرمافزار بتوانند برنامههای کاربردی خود را در بالای آن بسازند. این شرکت همچنین از این فناوری برای ساخت نسخه جدیدی از چت بات محبوب خود استفاده کرده است که برای هر کسی که دسترسی به ChatGPT Plus را خریداری کند در دسترس است – یک سرویس اشتراک با قیمت 20 دلار در ماه.
تعداد انگشت شماری از شرکت ها در حال حاضر با GPT-4 کار می کنند. مدیریت ثروت مورگان استنلی در حال ساخت سیستمی است که فوراً اطلاعات را از اسناد شرکت و سایر سوابق بازیابی می کند و آن را به مشاوران مالی در نثر محاوره ای ارائه می دهد. خان آکادمی، یک شرکت آموزش آنلاین، از این فناوری برای ایجاد یک معلم خصوصی استفاده می کند.
سال خان، مدیر اجرایی و بنیانگذار آکادمی خان، گفت: «این فناوری جدید می تواند بیشتر شبیه یک معلم خصوصی عمل کند. ما میخواهیم تکنیکهای جدید را به دانشآموز آموزش دهد در حالی که دانشآموز بیشتر کار را انجام میدهد.»
مانند فناوری های مشابه، سیستم جدید گاهی اوقات “توهم” می کند. بدون هشدار اطلاعات کاملا نادرست تولید می کند. در مورد وبسایتهایی که جدیدترین تحقیقات سرطان را ارائه میکنند، ممکن است چندین آدرس اینترنتی را ارائه دهد که وجود ندارند.
GPT-4 یک شبکه عصبی، نوعی سیستم ریاضی است که مهارتها را با تجزیه و تحلیل دادهها یاد میگیرد. این همان فناوری است که دستیارهای دیجیتالی مانند سیری برای تشخیص دستورات گفتاری و خودروهای خودران برای شناسایی عابران پیاده استفاده می کنند.
در حدود سال 2018، شرکتهایی مانند گوگل و OpenAI شروع به ساخت شبکههای عصبی کردند که از حجم عظیمی از متن دیجیتالی، از جمله کتابها، مقالات ویکیپدیا، گزارشهای چت و سایر اطلاعات ارسال شده در اینترنت، درس میگرفتند. به آنها مدل های زبان بزرگ یا LLM می گویند
با مشخص کردن میلیاردها الگو در تمام آن متن، LLM ها یاد می گیرند که متن خود را تولید کنند، از جمله توییت ها، شعرها و برنامه های کامپیوتری. OpenAI داده های بیشتر و بیشتری را در LLM خود قرار داد.
OpenAI همچنین این فناوری را با استفاده از بازخورد آزمایشکنندگان انسانی اصلاح کرد. همانطور که مردم ChatGPT را آزمایش کردند، پاسخهای چتبات را رتبهبندی کردند و آنهایی را که مفید و صادق بودند از پاسخهای غیرمفید جدا کردند. سپس، با استفاده از تکنیکی به نام یادگیری تقویتی، سیستم ماهها به تجزیه و تحلیل این رتبهبندیها و به دست آوردن درک بهتری از آنچه باید و نباید انجام دهد، پرداخت.
لوک متز، محقق OpenAI میگوید: «انسانها چیزهایی را که دوست دارند ببینند و کدام چیزها را دوست ندارند، ارزیابی میکنند.
ChatGPT اصلی بر اساس یک مدل زبان بزرگ به نام GPT-3.5 بود. GPT-4 OpenAI از مقادیر قابل توجهی داده یاد گرفت.
مدیران OpenAI از افشای میزان اطلاعاتی که چت ربات جدید از آن آموخته است خودداری کردند، اما آقای براکمن گفت که مجموعه دادهها «مقیاس اینترنت» است، به این معنی که به اندازه کافی وبسایتها را در بر میگیرد تا نمونهای نماینده از همه انگلیسیزبانان در اینترنت ارائه کند.
قابلیتهای جدید GPT-4 ممکن است برای افراد عادی که در ابتدا از این فناوری استفاده میکنند آشکار نباشد. اما احتمالاً به سرعت مورد توجه قرار میگیرند زیرا افراد عادی و متخصصان همچنان از این سرویس استفاده میکنند.
با توجه به یک مقاله طولانی از نیویورک تایمز و درخواست برای خلاصه کردن آن، ربات تقریباً هر بار یک خلاصه دقیق ارائه می دهد. چند جمله تصادفی به آن خلاصه اضافه کنید و از چت بات بپرسید که آیا خلاصه اصلاح شده دقیق است یا خیر، و به جملات اضافه شده به عنوان تنها نادرستی اشاره می کند.
آقای آلتمن این رفتار را «استدلال» توصیف کرد. اما این فناوری نمی تواند استدلال انسان را تکرار کند. در تجزیه و تحلیل، خلاصه کردن و پاسخ به سؤالات پیچیده در مورد یک کتاب یا مقاله خوب است. اگر در مورد وقایعی که هنوز اتفاق نیفتاده اند از او بپرسند بسیار کمتر مهارت دارد.
میتواند یک جوک بنویسد، اما نشان نمیدهد که میداند واقعاً چه چیزی باعث خنده کسی میشود. اورن اتزیونی، مدیر اجرایی مؤسسه هوش مصنوعی آلن، آزمایشگاهی برجسته در سیاتل، میگوید: «این چیزهای خندهدار را درک نمیکند.
همانند فناوریهای مشابه، کاربران ممکن است راههایی برای ترغیب سیستم به رفتارهای عجیب و ترسناک بیابند. این نوع ربات که از شما خواسته می شود از شخص دیگری یا نمایشنامه تقلید کند، گاهی اوقات به مناطقی که برای دوری از آن طراحی شده بود، منحرف می شود.
GPT-4 همچنین می تواند به تصاویر پاسخ دهد. با توجه به یک عکس، نمودار یا نمودار، این فناوری میتواند توضیحات مفصل و چند پاراگراف تصویر را ارائه دهد و به سؤالات مربوط به محتوای آن پاسخ دهد. این می تواند یک فناوری مفید برای افرادی باشد که دارای اختلال بینایی هستند.
در یک بعد از ظهر اخیر، آقای براکمن نشان داد که سیستم چگونه به تصاویر واکنش نشان می دهد. او تصویری از تلسکوپ فضایی هابل به چت ربات جدید داد و از آن خواست تا عکس را «با جزئیات دقیق» توصیف کند. با یک توضیح چهار پاراگراف پاسخ داد، که شامل توضیحی در مورد خط سفید اثیری بود که در سراسر عکس کشیده شده بود. ربات چت نوشت: «ردی از ماهواره یا ستاره در حال تیراندازی».
مدیران OpenAI گفتند که این شرکت فوراً بخش توصیف تصویر این فناوری را منتشر نمیکند زیرا مطمئن نیستند که چگونه میتوان از آن سوء استفاده کرد.
ساخت و ارائه ربات های چت بسیار گران است. چت ربات جدید OpenAI هزینه های شرکت را افزایش می دهد، از آنجایی که بر روی مقادیر بیشتری از داده ها آموزش دیده است. میرا موراتی، مدیر ارشد فناوری OpenAI، گفت که این شرکت می تواند دسترسی به این سرویس را در صورت ایجاد ترافیک بیش از حد کاهش دهد.
اما در درازمدت، OpenAI قصد دارد سیستمهایی بسازد که میتوانند انواع مختلف رسانهها، از جمله صدا و ویدئو و همچنین متن و تصویر را کنترل کنند.
آقای براکمن گفت: «ما میتوانیم همه این مهارتهای دانشی همهمنظوره را در نظر بگیریم و آنها را در همه حوزههای مختلف پخش کنیم. “این فناوری را وارد یک حوزه کاملاً جدید می کند.”