اعتبار تصویر: چشم من باش
OpenAI جدیدترین مدل هوش مصنوعی قدرتمند خود، GPT-4 را به دنیا معرفی کرده است، و اولین چیزی که آنها با قابلیت های جدید آن همکاری کردند، کمک به افراد دارای اختلالات بینایی است. Be My Eyes، که به افراد نابینا و کم بینا اجازه میدهد از افراد بینا بخواهند آنچه را که تلفنشان میبیند توصیف کنند، یک «داوطلب مجازی» دریافت میکند که در هر زمانی کمکی با هوش مصنوعی ارائه میدهد.
از زمانی که در سال 2015 شروع به کار کرد، بارها درباره Be My Eyes نوشتهایم، و البته ظهور بینایی کامپیوتر و سایر ابزارها در داستان کمک به افراد کم بینا در مسیریابی راحتتر در زندگی روزمره نقش برجستهای داشته است. اما خود برنامه فقط می تواند کارهای زیادی انجام دهد، و یکی از ویژگی های اصلی همیشه این بود که بتواند از یک داوطلب کمک بگیرد، که می تواند نمای دوربین گوشی شما را نگاه کند و توضیحات یا دستورالعمل های دقیقی ارائه دهد.
نسخه جدید این برنامه اولین نسخه ای است که قابلیت چندوجهی GPT-4 را ادغام می کند، یعنی توانایی آن نه تنها در چت کردن قابل فهم، بلکه برای بازرسی و درک تصاویر ارائه شده.
کاربران میتوانند تصاویر را از طریق برنامه برای یک داوطلب مجازی مجهز به هوش مصنوعی ارسال کنند، که به هر سؤالی در مورد آن تصویر پاسخ میدهد و کمک بصری فوری برای کارهای مختلف ارائه میکند.
به عنوان مثال، اگر یک کاربر تصویری از داخل یخچال خود ارسال کند، داوطلب مجازی نه تنها میتواند به درستی آنچه در آن است شناسایی کند، بلکه آنچه را که میتوان با آن مواد تهیه کرد را نیز تعمیم و تجزیه و تحلیل کرد. این ابزار همچنین می تواند تعدادی دستور العمل برای آن مواد ارائه دهد و راهنمای گام به گام نحوه درست کردن آنها را ارسال کند.
اما ویدیوی همراه با توضیحات روشن تر است. در آن، لوسی، کاربر Be My Eyes، برنامه را نشان میدهد که به او در انجام یکسری چیزهای زنده کمک میکند. اگر شما با پتوآی سریع یک صفحهخوان آشنا نیستید، ممکن است برخی از دیالوگها را از دست بدهید، اما او آن را برای توصیف ظاهر لباس، شناسایی یک گیاه، خواندن نقشه، ترجمه یک برچسب، راهنمایی او به یک دستگاه خاص در باشگاه ورزشی تردمیل را انجام دهید و به او بگویید کدام دکمه ها را در دستگاه فروش خودکار فشار دهد. (می توانید در زیر ویدئو را ببینید.)
داوطلب مجازی چشم من باش
این یک نمایش بسیار مختصر است که نشان میدهد چقدر زیرساختهای شهری و تجاری ما برای افراد دارای مشکلات بینایی غیردوستانه است. و همچنین نشان می دهد که چت چند وجهی GPT-4 در شرایط مناسب چقدر می تواند مفید باشد.
بدون شک، داوطلبان انسانی همچنان برای کاربران برنامه Be My Eyes مفید خواهند بود – هیچ جایگزینی برای آنها وجود ندارد، فقط برای زمانی که به آنها نیاز است، میله را بالا می برند (و در واقع اگر پاسخ هوش مصنوعی به اندازه کافی خوب نباشد، می توان آنها را فورا احضار کرد. ).
به عنوان مثال، هوش مصنوعی به طور مفید در باشگاه پیشنهاد میکند که «ماشینهای موجود دستگاههایی هستند که افراد روی آنها نیستند». با تشکر! همانطور که سام آلتمن، یکی از بنیانگذاران OpenAI امروز گفت، قابلیت ها در ابتدا چشمگیرتر از زمانی است که برای مدتی از آن استفاده کرده اید، اما ما همچنین باید مراقب باشیم که این اسب هدیه را از نزدیک در دهان نگاه کنیم.
تیم Be My Eyes از نزدیک با OpenAI و جامعه آن برای تعریف و هدایت قابلیتهای آن در حین ادامه توسعه آن کار میکند.
در حال حاضر این ویژگی در بین “زیر مجموعه کوچک” کاربران Be My Eyes در نسخه بتا بسته است که در هفته های آینده گسترش خواهد یافت. این تیم می نویسد: “ما امیدواریم که Virtual Volunteer را در ماه های آینده به طور گسترده در دسترس قرار دهیم.” درست مانند خدمات داوطلبانه موجود ما، این ابزار برای همه اعضای جامعه نابینا و کم بینا با استفاده از برنامه چشم من باش رایگان است.
با توجه به اینکه ChatGPT چقدر سریع برای ارائه خدمات برای پلتفرمهای SaaS شرکتی و سایر برنامههای کاربردی نسبتاً معمولی انتخاب شد، دیدن این که این جدید فوراً برای کمک به مردم کار میکند باعث دلگرمی است. در اینجا می توانید اطلاعات بیشتری در مورد GPT-4 بخوانید.