ChatGPT ممکن است اینترنت را تحت تأثیر قرار داده باشد، اما هنوز در نحوه تعامل شما با آن بسیار محدود است. اما چت ربات های آینده ممکن است چندان محدود نباشند. در واقع آنها حتی ممکن است آواتارهایی شبیه انسان داشته باشند که بتوانید با آنها مکالمه گفتاری داشته باشید، نه اینکه مجبور به تایپ و خواندن پیام ها شوید.
من با یک شرکت، شرکت اسرائیلی D-ID، در مورد این امکان در کنگره جهانی موبایل در بارسلون صحبت کردم. D-ID (در برگه جدید باز می شود) به نوعی در مورد ایجاد افراد دیجیتال است، و در حال حاضر این به معنای افزودن یک ارتباط انسانی بیشتر به چت ربات های هوش مصنوعی است – چیزی که امیدوار است با راه اندازی API جدید خود به آن دست یابد.
این API قابلیتهای پخش بیدرنگ را ارائه میکند و به شما امکان میدهد مانند یک انسان معمولی با ربات چت صحبت کنید. خود آن چت بات می تواند از فناوری تبدیل متن به ویدیو استفاده کند و این تصور را ایجاد کند که آواتار دیجیتال آن در واقع با صدای انسان صحبت می کند. البته میتوانید انتخاب کنید که به جای آن تایپ کنید، اگر ترجیح میدهید که بهتر از صحبت کردن با دستگاه باشد.
API بودن به این معنی است که سیستم D-ID را می توان با سایر برنامه ها و خدمات ادغام کرد. ایده کلی این است که کسبوکارها دستیارهای مجازی بسازند و ارائه دهند که افراد بتوانند در سطح شخصیتر با آنها ارتباط برقرار کنند – جایی که جنبه صورت ظاهر میشود.
به گفته گیل پری، مدیرعامل و یکی از بنیانگذاران D-ID، انسانها برای مکالمههایی که فقط بر متن یا صدا تکیه میکنند سیمکشی نشدهاند. در عوض، داشتن چهره انسانی (یا حداقل نمایشی از آن) همه چیز را جذابتر و طبیعیتر میکند – و به زبانهای مختلف قابل راهاندازی است.
به علاوه، از منظر کسب و کار، داشتن یک فرد هوش مصنوعی که کارها را برای شما انجام می دهد، در هزینه استخدام افراد واقعی صرفه جویی می کند. خواه مکالمه با مشتریان، آموزش کارکنان، یا هر چیز دیگری که هوش مصنوعی در وضعیت فعلی خود می تواند انجام دهد.
در حال حاضر مردم نسبت به هوش مصنوعی بدبین و محتاط هستند و پری پیشنهاد کرد که این طبیعت بدون چهره ممکن است بخشی از دلیل آن باشد. افزودن یک چهره انسانی میتواند به افراد کمک کند در مکالمه با ربات چت راحتتر احساس کنند، حتی اگر بدانند که در انتهای تماس، انسانی وجود ندارد.
من یک نسخه ی نمایشی از چت ربات های مختلف D-ID را در MWC دیدم، از جمله قابلیت های جدید استریم یکپارچه. مطمئناً دیدن انواع مختلف آواتارها در عمل جالب بود، اما حتی پیشرفتهترین آنها نیز کمی جلوه درهای عجیب داشتند.
این به ویژه در مورد انیمیشن های سخنگو صادق بود. همه چیز کاملاً هماهنگ نبود، و در بعضی مواقع بیشتر شبیه تکان دادن دهان تصادفی به نظر میرسید تا آواتاری که سعی میکرد صدا را به صدا درآورد – که واضح است که واقعاً این کار را نمیکند.
من همچنین متوجه چند تاخیر آشکار در تشخیص گفتار و نوشتن شدم زیرا ربات در حال تعامل با مردم بود. اما این واقعیت را تغییر نمیدهد که میتوانید با ربات صحبت کنید، از اینکه بفهمید چه میگویید و بدون نیاز به تایپ کردن یا خواندن یک مورد، پاسخی ارائه دهد.
تنها سوال این است که آیا و چه زمانی این نوع تجربه در دسترس عموم قرار خواهد گرفت. هدف D-ID ارائه API خود به مشاغل و کاربران سازمانی است. اما، همانطور که با انفجار اخیر ChatGPT در محبوبیت دیدیم، احتمال زیادی وجود دارد که شاهد نمایش این نوع فناوری در عرصه عمومی تر باشیم. بهویژه با توجه به تعداد شرکتهای مبتنی بر هوش مصنوعی که به نظر میرسید در MWC حضور داشتند و تعداد رقبای ChatGPT که در هفتههای اخیر ظاهر شدهاند.