خلاصه: محققان پاسخهای کتبی پزشکان و ChatGPT را با سؤالات بهداشتی در دنیای واقعی مقایسه کردند و دریافتند که گروهی از متخصصان مراقبتهای بهداشتی دارای مجوز در ۷۹ درصد مواقع پاسخهای ChatGPT را ترجیح میدهند و پاسخهای ChatGPT را با کیفیت بالاتر و همدلانهتر ارزیابی میکنند.
در حالی که دستیاران هوش مصنوعی مانند ChatGPT جایگزین پزشکان نمی شوند، این مطالعه نشان می دهد که پزشکانی که با چنین فناوری هایی همکاری می کنند ممکن است پزشکی را متحول کنند.
حقایق کلیدی:
- یک مطالعه پاسخهای پزشکان و ChatGPT را با سؤالات بهداشتی در دنیای واقعی مقایسه کرد و نشان داد که پاسخهای ChatGPT توسط پانلی از متخصصان مراقبتهای بهداشتی دارای مجوز در 79 درصد موارد ترجیح داده میشوند و به عنوان کیفیت بالاتر و همدلانهتر رتبهبندی میشوند.
- این مطالعه نمونهای متنوع از سوالات مراقبتهای بهداشتی و پاسخهای پزشک را از پلتفرم رسانههای اجتماعی Reddit’s AskDocs بهدست آورد، جایی که میلیونها بیمار به صورت عمومی سؤالات پزشکی را ارسال میکنند که پزشکان به آنها پاسخ میدهند.
- این مطالعه نشان میدهد که ادغام دستیاران هوش مصنوعی مانند ChatGPT در پیامهای مراقبتهای بهداشتی میتواند گردش کار را بهبود بخشد، بر سلامت بیمار تأثیر بگذارد، نابرابریهای سلامتی را که جمعیت اقلیت از آن رنج میبرند حذف کند و به پزشکان در ارائه مراقبتهای با کیفیت بالاتر و کارآمدتر کمک کند.
منبع: UCSD
گمانه زنی های گسترده ای در مورد اینکه چگونه می توان از پیشرفت های دستیاران هوش مصنوعی (AI) مانند ChatGPT در پزشکی استفاده کرد، وجود دارد.
یک مطالعه جدید منتشر شده در JAMA Internal Medicine به سرپرستی دکتر جان دبلیو. آیرز از موسسه کوالکام در دانشگاه کالیفرنیا سن دیگو، نگاه اولیه ای به نقشی که دستیاران هوش مصنوعی می توانند در پزشکی ایفا کنند، ارائه می دهد.
این مطالعه پاسخهای کتبی پزشکان و کسانی که از ChatGPT را با سؤالات سلامت در دنیای واقعی مقایسه کردند. گروهی از متخصصان مراقبت های بهداشتی دارای مجوز، پاسخ های ChatGPT را در 79٪ موارد ترجیح می دهند و پاسخ های ChatGPT را با کیفیت بالاتر و همدلانه تر ارزیابی می کنند.
آیرز، که همچنین معاون مدیر نوآوری در بخش بیماریهای عفونی و بهداشت عمومی جهانی در دانشکده پزشکی دانشگاه کالیفرنیا سن دیگو است، گفت: «فرصتها برای بهبود مراقبتهای بهداشتی با هوش مصنوعی بسیار زیاد است. “مراقبت تقویت شده با هوش مصنوعی آینده پزشکی است.”
آیا ChatGPT برای مراقبت های بهداشتی آماده است؟
در مطالعه جدید، تیم تحقیقاتی تصمیم گرفتند به این سوال پاسخ دهند: آیا ChatGPT میتواند به سوالاتی که بیماران برای پزشکان خود میفرستند به دقت پاسخ دهد؟ اگر بله، مدلهای هوش مصنوعی میتوانند در سیستمهای سلامت ادغام شوند تا پاسخهای پزشک به سؤالات ارسالی بیماران را بهبود بخشند و بار روزافزون پزشکان را کاهش دهند.
دکتر دیوی اسمیت، یکی از نویسندگان این مطالعه، پزشک دانشمند، مدیر مؤسسه تحقیقات بالینی و ترجمه آلتمن UC San Diego Altman و استاد دانشکده UC San Diego، گفت: «ChatGPT ممکن است بتواند یک امتحان مجوز پزشکی را قبول کند. پزشکی، “اما پاسخ دادن مستقیم به سوالات بیمار با دقت و همدلی یک بازی توپ متفاوت است.”
دکتر اریک لیز، یکی از نویسندگان این مطالعه، وابسته به مؤسسه کوالکام و استادیار دانشکده بهداشت عمومی و علوم طول عمر انسانی دانشگاه سن دیگو سن دیگو هربرت ورتیم، اضافه کرد: «همهگیری COVID-19 پذیرش مراقبتهای بهداشتی مجازی را تسریع کرد.
در حالی که این امر دسترسی به مراقبت را برای بیماران آسانتر میکند، پزشکان زیر بار سیل پیامهای الکترونیکی بیماران که به دنبال توصیههای پزشکی هستند، هستند که به رکوردشکنی سطوح فرسودگی شغلی پزشک کمک کرده است.»
طراحی یک مطالعه برای آزمایش ChatGPT در یک محیط مراقبت های بهداشتی
برای به دست آوردن نمونه بزرگ و متنوعی از سؤالات مراقبت های بهداشتی و پاسخ های پزشک که حاوی اطلاعات شخصی قابل شناسایی نبود، تیم به رسانه های اجتماعی روی آورد که در آن میلیون ها بیمار به طور عمومی سؤالات پزشکی را ارسال می کنند که پزشکان به آنها پاسخ می دهند: AskDocs Reddit.
r/AskDocs یک زیرمجموعه با تقریباً 452000 عضو است که سؤالات پزشکی را ارسال می کنند و متخصصان مراقبت بهداشتی تأیید شده پاسخ ها را ارسال می کنند. در حالی که هر کسی می تواند به یک سوال پاسخ دهد، ناظران اعتبار متخصصان مراقبت های بهداشتی را تأیید می کنند و پاسخ ها سطح اعتبار پاسخ دهنده را نشان می دهد.
نتیجه مجموعه وسیع و متنوعی از سوالات پزشکی بیمار و پاسخ های همراه از متخصصان پزشکی مجاز است.
در حالی که برخی ممکن است تعجب کنند که آیا تبادل پرسش و پاسخ در رسانه های اجتماعی یک آزمون منصفانه است، اعضای تیم خاطرنشان کردند که این تبادلات بازتابی از تجربه بالینی آنها بود.
این تیم به طور تصادفی از 195 تبادل از AskDocs نمونه برداری کردند که در آن یک پزشک تایید شده به یک سوال عمومی پاسخ داد. تیم سؤال اصلی را در اختیار ChatGPT قرار داد و از آن خواست تا پاسخی را بنویسد.
گروهی متشکل از سه متخصص مراقبتهای بهداشتی دارای مجوز، هر سوال و پاسخهای مربوطه را ارزیابی کردند و متوجه نشدند که آیا پاسخ از یک پزشک است یا ChatGPT. آنها پاسخ ها را بر اساس کیفیت اطلاعات و همدلی مقایسه کردند و اشاره کردند که کدام یک را ترجیح می دهند.
گروه ارزیاب های حرفه ای مراقبت های بهداشتی در 79 درصد مواقع پاسخ های ChatGPT را به پاسخ های پزشک ترجیح می دادند.
جسیکا کلی، پرستار شرکت Human Longevity و یکی از نویسندگان مطالعه، گفت: «پیامهای ChatGPT با اطلاعات دقیق و دقیق پاسخ میدادند که اغلب جنبههای بیشتری از سؤالات بیمار را نسبت به پاسخهای پزشک نشان میداد.
علاوه بر این، پاسخهای ChatGPT به طور قابلتوجهی از نظر کیفیت بالاتر از پاسخهای پزشک رتبهبندی شدند: پاسخهای با کیفیت خوب یا بسیار خوب برای ChatGPT 3.6 برابر بیشتر از پزشکان بود (پزشکان 22.1٪ در مقابل ChatGPT 78.5٪). پاسخها همدلانهتر بودند: پاسخهای همدلانه یا بسیار همدلانه برای ChatGPT 9.8 برابر بیشتر از پزشکان بود (پزشکان 4.6٪ در مقابل ChatGPT 45.1٪).
دکتر آرون گودمن، دانشیار بالینی دانشکده پزشکی دانشگاه کالیفرنیا سن دیگو و یکی از نویسندگان مطالعه، افزود: “من هرگز تصور نمی کردم این را بگویم، اما ChatGPT نسخه ای است که من می خواهم به صندوق ورودی خود بدهم. این ابزار روشی را که من از بیمارانم حمایت می کنم تغییر خواهد داد.»
استفاده از دستیاران هوش مصنوعی برای پیام های بیمار
دکتر آدام پولیاک، استادیار علوم کامپیوتر در کالج Bryn Mawr و یکی از نویسندگان این مطالعه، گفت: «در حالی که مطالعه ما ChatGPT را در مقابل پزشکان قرار داد، راه حل نهایی این نیست که پزشک خود را به کلی بیرون برانید». در عوض، پزشکی که از ChatGPT استفاده میکند، پاسخی برای مراقبت بهتر و همدلانه است.»
دکتر کریستوفر لانگهورست، مدیر ارشد پزشکی و مدیر ارشد دیجیتال در UC San Diego Health گفت: «مطالعه ما از جمله اولین مطالعاتی است که نشان میدهد چگونه دستیاران هوش مصنوعی میتوانند به طور بالقوه مشکلات ارائه مراقبتهای بهداشتی در دنیای واقعی را حل کنند. این نتایج نشان میدهد که ابزارهایی مانند ChatGPT میتوانند به طور موثر توصیههای پزشکی با کیفیت بالا و شخصیسازی شده را برای بررسی توسط پزشکان تهیه کنند، و ما این فرآیند را در UCSD Health آغاز میکنیم.
دکتر مایک هوگارت، پزشک بیوانفورماتیک، یکی از مدیران موسسه تحقیقات بالینی و ترجمه آلتمن در دانشگاه کالیفرنیا سن دیگو، استاد دانشکده پزشکی دانشگاه کالیفرنیا سن دیگو و یکی از نویسندگان مطالعه، افزود: «یکپارچه سازی هوش مصنوعی مهم است. دستیاران در پیام های مراقبت های بهداشتی در چارچوب یک کارآزمایی تصادفی کنترل شده برای قضاوت در مورد اینکه چگونه استفاده از دستیارهای هوش مصنوعی بر نتایج برای پزشکان و بیماران تأثیر می گذارد، انجام شود.
علاوه بر بهبود گردش کار، سرمایهگذاری در پیامرسانی دستیار هوش مصنوعی میتواند بر سلامت بیمار و عملکرد پزشک تأثیر بگذارد.
دکتر مارک دردزه، دانشیار علوم کامپیوتر جان سی مالون در جانز هاپکینز و یکی از نویسندگان این مطالعه، خاطرنشان کرد: «ما میتوانیم از این فناوریها برای آموزش پزشکان در ارتباط بیمار محور، حذف نابرابریهای سلامتی که توسط جمعیتهای اقلیت که اغلب به دنبال آن هستند، استفاده کنیم. مراقبت های بهداشتی از طریق پیام رسانی، ساختن سیستم های ایمنی پزشکی جدید و کمک به پزشکان با ارائه مراقبت های با کیفیت بالاتر و کارآمدتر.”
خلاصه و حقایق کلیدی ایجاد شده با کمک فناوری ChatGPT AI
درباره این AI، ChatGPT و اخبار تحقیقات پزشکی
نویسنده: میکا اونو
منبع: UCSD
مخاطب: میکا اونو – UCSD
تصویر: این تصویر از طریق Dall-E 2 به Neuroscience News اعتبار داده شده است
تحقیق اصلی: دسترسی آزاد.
«مقایسه پاسخهای چتبات پزشک و هوش مصنوعی به سؤالات بیمار ارسالشده در تالار گفتگوی رسانههای اجتماعی عمومی» توسط جان دبلیو. آیرز و همکاران. JAMA Internal Medicine
خلاصه
مقایسه پاسخهای چتبات پزشک و هوش مصنوعی به سؤالات بیمار ارسالشده در تالار گفتمان عمومی رسانههای اجتماعی
اهمیت
گسترش سریع مراقبت های بهداشتی مجازی باعث افزایش پیام های بیماران همراه با کار بیشتر و فرسودگی شغلی در بین متخصصان مراقبت های بهداشتی شده است. دستیاران هوش مصنوعی (AI) به طور بالقوه می توانند با تهیه پیش نویس پاسخ هایی که می توانند توسط پزشکان بررسی شوند، به ایجاد پاسخ به سؤالات بیمار کمک کنند.
هدف، واقعگرایانه
برای ارزیابی توانایی دستیار چت بات هوش مصنوعی (ChatGPT)، که در نوامبر 2022 منتشر شد، برای ارائه پاسخ های با کیفیت و همدلانه به سوالات بیمار.
طراحی، تنظیم، و شرکت کنندگان
در این مطالعه مقطعی، یک پایگاه داده عمومی و غیرقابل شناسایی از سؤالات از یک انجمن عمومی رسانه های اجتماعی (Reddit’s r/AskDocs) برای ترسیم تصادفی 195 تبادل از اکتبر 2022 استفاده شد که در آن یک پزشک تأیید شده به یک سؤال عمومی پاسخ داد.
پاسخهای چت بات با وارد کردن سؤال اصلی در یک جلسه جدید (بدون سؤال قبلی در جلسه) در 22 و 23 دسامبر 2022 ایجاد شد. سؤال اصلی به همراه پاسخهای پزشک و ربات گفتگوی ناشناس و بهطور تصادفی در سه تکرار مورد ارزیابی قرار گرفت. تیمی از متخصصان مراقبت های بهداشتی دارای مجوز
ارزیابان “کدام پاسخ بهتر بود” را انتخاب کردند و “کیفیت اطلاعات ارائه شده” را قضاوت کردند (خیلی فقیر، فقیر، قابل قبول، خوب، یا خیلی خوب) و «روش همدلی یا کنار تخت ارائه شده» (همدل نیست، کمی همدلانه، نسبتاً همدلانه، همدل، و بسیار همدلانه). میانگین پیامدها در مقیاس 1 تا 5 و بین چت بات و پزشکان مقایسه شد.
نتایج
از 195 سوال و پاسخ، ارزیابان در 78.6٪ (95٪ فاصله اطمینان (CI، 75.0٪ – 81.8٪) از 585 ارزیابی، پاسخ های چت بات را به پاسخ های پزشک ترجیح دادند. میانگین پاسخهای پزشک (IQR) به طور قابلتوجهی کوتاهتر از پاسخهای چت بات بود (52 [17-62] کلمات در مقابل 211 [168-245] کلمات; تی = 25.4; پ <.001).
پاسخ های چت بات به طور قابل توجهی با کیفیت بالاتر از پاسخ های پزشک رتبه بندی شدند (تی = 13.3; پ <.001). نسبت پاسخ ها به عنوان رتبه بندی شده است خوب یا خیلی خوب به عنوان مثال، کیفیت (≥ 4)، برای چت بات بالاتر از پزشکان بود (ربات چت: 78.5٪، 95٪ CI، 72.3٪ – 84.1٪؛ پزشکان: 22.1٪، 95٪ CI، 16.4٪ – 28.2٪؛). این میزان شیوع 3.6 برابر بیشتر بود خوب یا خیلی خوب پاسخ های با کیفیت برای چت بات
پاسخ های چت بات نیز به طور قابل توجهی همدلانه تر از پاسخ های پزشک رتبه بندی شدند.تی= 18.9; پ<.001). نسبت پاسخ های رتبه بندی شده همدلیا بسیار همدلانه(≥4) برای چت بات بیشتر از پزشکان بود (پزشکان: 4.6٪، 95٪ CI، 2.1٪ – 7.7٪؛ چت بات: 45.1٪، 95٪ CI، 38.5٪ – 51.8٪؛ پزشکان: 4.6٪، 95٪ CI ، 2.1٪ – 7.7٪. این میزان شیوع 9.8 برابر بیشتر بود همدلیا بسیار همدلانهپاسخ برای چت بات
نتیجه گیری
در این مطالعه مقطعی، یک ربات چت پاسخهایی با کیفیت و همدلانه به سوالات بیمار مطرح شده در یک انجمن آنلاین ایجاد کرد. کاوش بیشتر در مورد این فناوری در تنظیمات بالینی، مانند استفاده از ربات چت برای پیشنویس پاسخهایی که پزشکان میتوانند سپس ویرایش کنند، ضروری است. کارآزماییهای تصادفیسازیشده میتوانند بیشتر ارزیابی کنند که آیا استفاده از دستیارهای هوش مصنوعی ممکن است پاسخها را بهبود بخشد، فرسودگی شغلی پزشک را کاهش دهد و نتایج بیمار را بهبود بخشد.