ChatGPT تقریباً توانست از عهده آزمون مجوز پزشکی ایالات متحده USMLE برآید و قبول شود!


ربات هوش مصنوعی مکالمه‌گر ChatGPT لحظات حساسی را سپری می کند و در آستانه تغییر تولید محتوای نوشتاری، جستجو در وب و حتی آموزش خود است.

آخرین دستاورد ChatGPT چیست؟!

قبولی در آزمون مجوز پزشکی ایالات متحده ( USMLE ).

ما در مورد امتحانی صحبت می‌کنیم که به دلیل دشواری‌اش مشهور است، امتحانی که پزشکان دست کم معمولاً به ۳۰۰ تا ۴۰۰ ساعت آمادگی برای شرکت در آن نیاز دارند و همه چیز از مفاهیم علوم پایه گرفته تا اخلاق زیستی در آن مورد پرسش قرار می‌گیرد.

USMLE در واقع سه امتحان تشکیل شده و وقتی که ChatGPT می‌تواند به سوالات آن پاسخ دهد، باید اعتراف کنیم که این ربات‌های هوش مصنوعی روزی می‌توانند برای آموزش پزشکی و حتی برای انجام انواع خاصی از تشخیص‌ها مفید باشند.

محققان در مقاله منتشر شده خود می نویسند: «ChatGPT از عهده قبولی در هر ۳ آزمون، در محدوده نزدیک به آستانه قبولی بدون هیچ آموزش یا تقویت تخصصی برآمد. علاوه بر این، ChatGPT سطح بالایی از هماهنگی و بینش را در توضیحات خود نشان داد.»

ChatGPT نوعی هوش مصنوعی است که به عنوان مدل زبان بزرگ یا LLM شناخته می‌شود. این LLMها به طور خاص برای پاسخ‌های نوشتاری طراحی شده‌اند و از طریق مقادیر انبوهی از متن‌های نمونه‌ای و برخی الگوریتم‌های هوشمندانه، می‌توانند پیش‌بینی کنند که کدام کلمات باید با هم در یک جمله قرار گیرند.

ChatGPT در واقع هیچ چیز را نمی‌داند، اما با تجزیه و تحلیل حجم عظیمی از مطالب آنلاین، می‌تواند جملاتی بامفهوم در مورد هر موضوعی بسازد.

این بامفهوم بودن کلید اصلی است. بسته به احتمال در پی آمدن عبارات مختلف، هوش مصنوعی می تواند به طرز عجیبی هوشمندانه به نظر برسد یا به مسخره‌ترین نتایج برسد.

اما محققان استارت‌آپ Ansible Health آن را با استفاده از نمونه سوالات USMLE آزمایش کردند و بررسی کردند که پاسخ‌ها در Google در دسترس نباشد.ب نابراین آنها می‌دانستند که ChatGPT بر اساس داده‌هایی که روی آن آموزش دیده است، پاسخ‌های جدیدی ایجاد خواهد کرد.

برای آزمایش، ChatGPT بین ۵۲.۴ تا ۷۵ درصد در سه امتحان امتیاز کسب کرد (نمره قبولی معمولاً حدود ۶۰ درصد است). در ۸۸.۹ درصد از پاسخ‌های خود، حداقل یک بینش و درک جالب داشت که توسط محققان به عنوان چیزی «جدید، غیربدیهی و معتبر از نظر بالینی» توصیف شد.

نویسندگان این مطالعه در بیانیه‌ای مطبوعاتی گفتند: «دستیابی به نمره قبولی برای این آزمون تخصصی دشوار، و انجام آن بدون هیچ گونه تقویت انسانی، نقطه عطف قابل‌توجهی در بلوغ هوش مصنوعی بالینی است».

ChatGPT همچنین ثابت کرد که در پاسخ‌های خود به طرز چشمگیری سازگار است و حتی می‌توانست پشت هر پاسخ دلیلی ارائه دهد. همچنین از میزان دقت ۵۰.۳ درصدی PubMedGPT، رباتی که به طور خاص در ادبیات پزشکی آموزش دیده است، فراتر رفت.

البته  ChatGPT در آینده نزدیک جای متخصصان پزشکی را نخواهد گرفت. با این حال، پتانسیل تجزیه دانش آنلاین آن به وضوح بسیار زیاد است، به خصوص که این ربات‌های هوش مصنوعی در سال‌های آینده همچنان بهتر می‌شوند. به جای جایگزینی انسان ها در حرفه پزشکی، آنها می‌توانند به دستیاران حیاتی آنها تبدیل شوند.

محققان می نویسند : «این نتایج نشان می دهد که مدل های زبان بزرگ ممکن است پتانسیل کمک به آموزش پزشکی و به طور بالقوه تصمیم گیری بالینی را داشته باشند .

این تحقیق در PLOS Digital Health منتشر شده.