ChatGPT هنگامی که در سال 2022 منتشر شد آشکار شد و تهدید کرد که همه چیز را از نحوه انجام تکالیف دانشآموزان گرفته تا نحوه نوشتن کدهای کامپیوتری توسط مهندسان نرمافزار به هم میزند. این نرم افزار بر اساس مدلی به نام GPT-3.5 ساخته شده بود و اکنون شرکت پشتیبان آن از نسخه جدید آن رونمایی کرده است.
توسط تام اکر، گزارشگر فناوری
سه شنبه 14 مارس 2023 ساعت 18:02، انگلستان
خالق ChatGPT نسخه ارتقا یافته هوش مصنوعی را در پشت ربات چت قدرتمند خود منتشر می کند که می تواند تصاویر را تشخیص دهد.
نرم افزار چشمگیر OpenAI اینترنت در اواخر سال گذشته طوفان شد و توانایی آن برای ایجاد پاسخهایی شبیه به انسان به تقریباً هر متنی که به آن میدهید، از داستان های ساختن برای آمدن با خطوط چت آپ.
این چنین افشاگری را ثابت کرد که غول فناوری مایکروسافت از نسخه ای از فناوری مشابه به عنوان ستون فقرات برای خود استفاده می کند موتور جستجوی جدید بینگ، در حالی که رقیب گوگل در حال توسعه ربات چت خود است.
OpenAI اکنون از نسل بعدی مدل GPT با نام GPT-4 رونمایی کرده است.ChatGPT توسط GPT-3.5 تغذیه می شود).
این یک “مدل چندوجهی بزرگ” است که به گفته شرکت “به لطف دانش عمومی گسترده تر و توانایی های حل مسئله، می تواند مسائل دشوار را با دقت زیادی حل کند”.
“مدل چند وجهی” چیست؟
در حالی که ChatGPT مبتنی بر یک مدل زبانی است که فقط قادر به تشخیص و تولید متن است، یک مدل چندوجهی توانایی انجام این کار را با اشکال مختلف رسانه پیشنهاد میکند.
پروفسور الیور لمون، متخصص هوش مصنوعی از دانشگاه هریوت وات در ادینبورگ، توضیح داد: «این بدان معناست که نه تنها متن، بلکه تصاویر بالقوه را با هم ترکیب میکند.
“شما نه تنها در یک مکالمه با متن در تعامل هستید، بلکه می توانید در مورد تصاویر سوال بپرسید.”
در یک پست وبلاگی که GPT-4 را اعلام کرد، OpenAI تأیید کرد که می تواند ورودی های تصویر را بپذیرد، آنها را تشخیص دهد و توضیح دهد.
در یک مثال، از مدل خواسته می شود توضیح دهد که چرا یک عکس خاص خنده دار است.
OpenAI گفت GPT-4 “عملکرد در سطح انسانی را در معیارهای مختلف حرفه ای و آکادمیک نشان می دهد” با نتایج بهبود یافته در دقت واقعی در مقایسه با نسخه های قبلی.
این نسخه محدود به مشترکین ChatGPT Plus ممتاز این شرکت است، در حالی که دیگران باید به لیست انتظار بپیوندند.
هوش مصنوعی جدید می تواند ببیند
اعلام OpenAI پس از آن منتشر شد که یکی از مدیران مایکروسافت اعلام کرد که GPT-4 در این هفته منتشر خواهد شد.
این غول فناوری آمریکایی اخیراً سرمایه گذاری چند میلیارد دلاری در این شرکت انجام داده است.
آندریاس براون، مدیر ارشد فناوری مایکروسافت آلمان، در سخنرانی هفته گذشته روی صحنه، همانطور که توسط سایت خبری آلمانی Heise گزارش شد، گفت که تشخیص تصویر واقعاً جزو قابلیتهای GPT-4 خواهد بود.
آندری کارپاتی، کارمند OpenAI، توییت کرد که این ویژگی به این معنی است که هوش مصنوعی می تواند “دیدن” را داشته باشد.
با این حال، هر گونه انتظاری که GPT-4 ممکن است بتواند در واقع تصاویر را به همان روشی که GPT-3.5 می تواند متن تولید کند، تولید کند، به نظر می رسد بسیار دور از انتظار بوده است.
در حال حاضر ابزارهای هوش مصنوعی اختصاص داده شده به تولید تصاویر، مانند Dall-E 2 خود OpenAI وجود دارد. این ابزار می تواند تصاویر را از پیام های متنی ساده ایجاد کند.
سایر هوش مصنوعی مولد در حال کار در شرکت هایی مانند متا و گوگل می توانند ویدیو و موسیقی تولید کنند.
نام متا Make-A-Video هنوز برای عموم منتشر نشده است، اما این شرکت میگوید که به افراد اجازه میدهد کلیپهای ویدیویی سریع و قابل اشتراکگذاری را از پیامهای متنی تولید کنند.
محققان گوگل در اوایل سال جاری فاش کردند که هوش مصنوعی ساخته اند که می تواند آهنگ های کوتاه موسیقی بسازد، باز هم بر اساس چیزی جز پیام های متنی کوتاه. مانند ابزار ویدئویی متا، در دسترس عموم نیست.
بیشتر بخوانید:
نحوه مواجهه معلمان با ChatGPT
ChatGPT برای مصاحبه شغلی توصیه می شود
موفقیت ChatGPT ظاهراً دست شرکتهای فناوری را که به نظر میرسید مشتاق به کارگیری فناوریهای هوش مصنوعی خود محتاط هستند، واداشته است.
گزارش شده است که گوگل برنامه های خود را برای یک چت بات جاه طلبانه به نام بارد در نتیجه تسریع کرده است. با اعمال محدودیت های سختگیرانه بر روی مدل های منتشر شده قبلی.
شرکت های فناوری اغلب با انتشار هوش مصنوعی پخته نشده برای استفاده عموم سوخته اند. در سال 2016، مایکروسافت قرمز شد زمانی که به چت باتی به نام تای یاد داده شد که چیزهای توهین آمیز بگوید.