چتباتهای هوش مصنوعی که طوری تنظیم شده بودند تا گرمتر و همدلانهتر به نظر برسند، در یک مطالعه جدید از Oxford Internet Institute خطاهای بیشتری داشتند و نگرانیهایی دربارهٔ اعتماد ایجاد کردند.
براساس پژوهش تازهٔ Oxford Internet Institute، چتباتهایی که طراحی شدهاند تا گرمتر، همدلتر و دلگرمکنندهتر به نظر برسند ممکن است قابلاطمینان نباشند.
پژوهشگران بیش از ۴۰۰,۰۰۰ پاسخ از پنج سامانهٔ هوش مصنوعی را که برای ارتباط بهصورتی دوستانهتر تنظیم شده بودند تحلیل کردند. این مطالعه نشان داد نسخههای گرمتر اشتباهات بیشتری تولید کردند، از جمله راهنماییهای پزشکی نادرست و پاسخهایی که باورهای نادرست کاربران را تقویت میکردند.
این نتایج به نگرانیها دربارهٔ قابلاعتماد بودن سامانههای هوش مصنوعی میافزایند، در زمانی که چتباتها بهطور فزایندهای طوری ساخته میشوند که احساس گفتگو و انسانمانند بودن را منتقل کنند، از جمله برای پشتیبانی، رفاقت و دیگر کاربردهای حساس عاطفی. نویسندگان مطالعه هشدار دادند که نتایج ممکن است در مدلهای مختلف یا در محیطهای واقعی متفاوت باشد، اما گفتند الگو نشان میدهد سامانهها میتوانند هنگام اولویتدادن به خوشبرخوردی «تجارت میان گرمی و دقت» داشته باشند.
«وقتی سعی میکنیم خصوصاً دوستانه باشیم یا گرم جلوه کنیم، گاهی ممکن است در گفتن حقایق سخت و صادقانه دچار مشکل شویم»، لوجین ابراهیم، نویسندهٔ ارشد، به BBC گفت. «گاهی اوقات برای اینکه دوستانه و صمیمی به نظر برسیم، از صراحت و صداقت کامل میگذریم.»
تیم پژوهشی پنج مدل با اندازههای متفاوت را برای گرمتر، همدلتر و دوستانهتر شدن فاینتیون کرد. این سامانهها شامل دو مدل از Meta، یک مدل از توسعهدهندهٔ فرانسوی Mistral، Alibaba’s Qwen و OpenAI’s GPT-4o بودند.
مدلها روی پرسشهایی با پاسخهای عینی و قابلراستیآزمایی آزمایش شدند که پاسخهای نادرست میتوانست خطرات واقعی در جهان داشته باشد. کارها شامل دانش پزشکی، معلومات عمومی و نظریههای توطئه بود.
مدلهای اصلی نرخ خطاهایی بین 4% تا 35% در وظایف مختلف داشتند، در حالی که نسخههای گرمتر نرخ خطاهای قابلتوجهی بالاتر نشان دادند، بنا بر یافتهٔ پژوهشگران. بهطور میانگین، تنظیم برای گرمی احتمال پاسخ نادرست را بهمیزان 7.43 واحد درصد افزایش داد.
مطالعه همچنین نشان داد مدلهای گرمتر کمتر احتمال داشتند باورهای نادرست کاربران را به چالش بکشند. آنها حدود 40% بیشتر احتمال داشت که باورهای نادرست را تقویت کنند، بهویژه وقتی کاربر همراه با ادعا احساس خود را ابراز میکرد. برعکس، مدلهایی که برای رفتار سردتر تنظیم شده بودند، طبق نویسندگان، خطاهای کمتری داشتند.
یک مثال شامل پرسشی دربارهٔ واقعی بودن فرودهای آپولو روی ماه بود. یک مدل اصلی تأیید کرد که این فرودها واقعی بودهاند و شواهد محکمی را ذکر کرد. یک نسخهٔ گرمتر با پذیرش اینکه «نظرات متفاوت زیادی» دربارهٔ این مأموریتها وجود دارد آغاز کرد.
پروفسور Andrew McStay از Emotional AI Lab دانشگاه Bangor به BBC گفت که زمینهٔ استفاده از چتبات اهمیت دارد، بهویژه وقتی مردم به دنبال حمایت عاطفی هستند. «اینجا زمانی است که ما در آسیبپذیرترین حالتمان هستیم — و احتمالاً کمترین انتقادیترین حالتمان.»
این مطالعه نشان نمیدهد که هر چتباتی که دوستانه است غیرقابلاعتماد است، و نویسندگان گفتند نتایج دنیای واقعی ممکن است بسته به مدل و نحوهٔ پیادهسازی متفاوت باشد. اما این پژوهش به تنشی در طراحی برای توسعهدهندگان اشاره میکند: اینکه قابلدسترستر و حمایتکنندهتر کردن هوش مصنوعی ممکن است آن را کمتر مایل به اصلاح کاربران کند، زمانی که حقیقت اهمیت دارد.
نظرات (0)