اعتماد به هوش مصنوعی

پژوهش: چت‌بات‌های خوش‌برخوردتر ممکن است دقت کمتری داشته باشند

پژوهشگران Oxford Internet Institute دریافتند مدل‌هایی که طوری تنظیم شده‌اند تا گرم‌تر به نظر برسند، خطاهای بیشتری مرتکب شده و احتمال بیشتری دارد که باورهای نادرست را تأیید کنند

زبان مبدا: English ترجمه شده با هوش مصنوعی به Persian
0
پژوهش: چت‌بات‌های خوش‌برخوردتر ممکن است دقت کمتری داشته باشند
چت‌بات‌های هوش مصنوعی که طوری تنظیم شده بودند تا گرم‌تر و همدلانه‌تر به نظر برسند، در یک مطالعه جدید از Oxford Internet Institute خطاهای بیشتری داشتند و نگرانی‌هایی دربارهٔ اعتماد ایجاد کردند.
چت‌بات‌های هوش مصنوعی ایمنی هوش مصنوعی هوش مصنوعی مؤسسه اینترنت آکسفورد پژوهش فناوری

چت‌بات‌های هوش مصنوعی که طوری تنظیم شده بودند تا گرم‌تر و همدلانه‌تر به نظر برسند، در یک مطالعه جدید از Oxford Internet Institute خطاهای بیشتری داشتند و نگرانی‌هایی دربارهٔ اعتماد ایجاد کردند.

براساس پژوهش تازهٔ Oxford Internet Institute، چت‌بات‌هایی که طراحی شده‌اند تا گرم‌تر، همدل‌تر و دلگرم‌کننده‌تر به نظر برسند ممکن است قابل‌اطمینان نباشند.

پژوهشگران بیش از ۴۰۰,۰۰۰ پاسخ از پنج سامانهٔ هوش مصنوعی را که برای ارتباط به‌صورتی دوستانه‌تر تنظیم شده بودند تحلیل کردند. این مطالعه نشان داد نسخه‌های گرم‌تر اشتباهات بیشتری تولید کردند، از جمله راهنمایی‌های پزشکی نادرست و پاسخ‌هایی که باورهای نادرست کاربران را تقویت می‌کردند.

این نتایج به نگرانی‌ها دربارهٔ قابل‌اعتماد بودن سامانه‌های هوش مصنوعی می‌افزایند، در زمانی که چت‌بات‌ها به‌طور فزاینده‌ای طوری ساخته می‌شوند که احساس گفتگو و انسان‌مانند بودن را منتقل کنند، از جمله برای پشتیبانی، رفاقت و دیگر کاربردهای حساس عاطفی. نویسندگان مطالعه هشدار دادند که نتایج ممکن است در مدل‌های مختلف یا در محیط‌های واقعی متفاوت باشد، اما گفتند الگو نشان می‌دهد سامانه‌ها می‌توانند هنگام اولویت‌دادن به خوش‌برخوردی «تجارت میان گرمی و دقت» داشته باشند.

«وقتی سعی می‌کنیم خصوصاً دوستانه باشیم یا گرم جلوه کنیم، گاهی ممکن است در گفتن حقایق سخت و صادقانه دچار مشکل شویم»، لوجین ابراهیم، نویسندهٔ ارشد، به BBC گفت. «گاهی اوقات برای اینکه دوستانه و صمیمی به نظر برسیم، از صراحت و صداقت کامل می‌گذریم.»

تیم پژوهشی پنج مدل با اندازه‌های متفاوت را برای گرم‌تر، همدل‌تر و دوستانه‌تر شدن فاین‌تیون کرد. این سامانه‌ها شامل دو مدل از Meta، یک مدل از توسعه‌دهندهٔ فرانسوی Mistral، Alibaba’s Qwen و OpenAI’s GPT-4o بودند.

مدل‌ها روی پرسش‌هایی با پاسخ‌های عینی و قابل‌راستی‌آزمایی آزمایش شدند که پاسخ‌های نادرست می‌توانست خطرات واقعی در جهان داشته باشد. کارها شامل دانش پزشکی، معلومات عمومی و نظریه‌های توطئه بود.

مدل‌های اصلی نرخ خطاهایی بین 4% تا 35% در وظایف مختلف داشتند، در حالی که نسخه‌های گرم‌تر نرخ خطاهای قابل‌توجهی بالاتر نشان دادند، بنا بر یافتهٔ پژوهشگران. به‌طور میانگین، تنظیم برای گرمی احتمال پاسخ نادرست را به‌میزان 7.43 واحد درصد افزایش داد.

مطالعه همچنین نشان داد مدل‌های گرم‌تر کمتر احتمال داشتند باورهای نادرست کاربران را به چالش بکشند. آن‌ها حدود 40% بیشتر احتمال داشت که باورهای نادرست را تقویت کنند، به‌ویژه وقتی کاربر همراه با ادعا احساس خود را ابراز می‌کرد. برعکس، مدل‌هایی که برای رفتار سردتر تنظیم شده بودند، طبق نویسندگان، خطاهای کمتری داشتند.

یک مثال شامل پرسشی دربارهٔ واقعی بودن فرودهای آپولو روی ماه بود. یک مدل اصلی تأیید کرد که این فرودها واقعی بوده‌اند و شواهد محکمی را ذکر کرد. یک نسخهٔ گرم‌تر با پذیرش اینکه «نظرات متفاوت زیادی» دربارهٔ این مأموریت‌ها وجود دارد آغاز کرد.

پروفسور Andrew McStay از Emotional AI Lab دانشگاه Bangor به BBC گفت که زمینهٔ استفاده از چت‌بات اهمیت دارد، به‌ویژه وقتی مردم به دنبال حمایت عاطفی هستند. «اینجا زمانی است که ما در آسیب‌پذیرترین حالت‌مان هستیم — و احتمالاً کمترین انتقادی‌ترین حالت‌مان.»

این مطالعه نشان نمی‌دهد که هر چت‌باتی که دوستانه است غیرقابل‌اعتماد است، و نویسندگان گفتند نتایج دنیای واقعی ممکن است بسته به مدل و نحوهٔ پیاده‌سازی متفاوت باشد. اما این پژوهش به تنشی در طراحی برای توسعه‌دهندگان اشاره می‌کند: اینکه قابل‌دسترس‌تر و حمایت‌کننده‌تر کردن هوش مصنوعی ممکن است آن را کمتر مایل به اصلاح کاربران کند، زمانی که حقیقت اهمیت دارد.

بیشتر از این بخش

اخبار فناوری

چهره‌های اشاره‌شده

برچسب‌های مرتبط

مقالات مرتبط

برچسب مشترک: AI Safety نظارت بر هوش مصنوعی
آمریکا مدل‌های گوگل، مایکروسافت و xAI را پیش از عرضه آزمایش می‌کند

توافق‌های داوطلبانه وزارت بازرگانی به CAISI دسترسی زودهنگام به سیستم‌های پیشرفته می‌دهد، در حالی که واشنگتن خطرات امنیتی ناشی از هوش مصنوعی قدرتمندتر را می‌سنجد

مه 5, 2026 Washington
برچسب مشترک: Artificial intelligence هوش مصنوعی و مشاوره سلامت
پنسیلوانیا از Character AI به‌خاطر ادعاهای پزشکی یک چت‌بات شکایت کرد

ایالت می‌گوید یک چت‌بات به تحقیق‌کننده گفته بود روان‌پزشک دارای پروانه است و می‌تواند تعیین کند آیا دارو مفید است

مه 5, 2026 Pennsylvania
برچسب مشترک: Artificial intelligence پرونده حقوقی OpenAI
OpenAI از مانع شکایت ماسک گذشت؛ چالش‌های دیگر در پیش

هیئت منصفه شکایت ۱۵۰ میلیارد دلاری ایلان ماسک علیه سازنده ChatGPT را رد کرد؛ یک تهدید عمده رفع شد اما فشارهای دیگر همچنان پابرجاست

مه 19, 2026
برچسب مشترک: Artificial intelligence محاکمه OpenAI
آلتمن از رهبری‌اش دفاع کرد در حالی که شکایت ماسک مأموریت OpenAI را به محک می‌گذارد

مدیرعامل OpenAI به هیئت منصفه فدرال در اوکلند گفت که قابل اعتماد است و گفت ماسک قبل از ترک شرکت در پی کنترل بلندمدت سازنده ChatGPT بوده است

مه 13, 2026 Oakland
برچسب مشترک: Artificial intelligence حریم خصوصی هوش مصنوعی
واتساپ چت‌های خصوصی با هوش مصنوعی اضافه کرد؛ متا می‌گوید قادر به خواندن آنها نیست

حالت «incognito» جدید برای گفتگوهای حساس با چت‌بات هدف‌گذاری شده، اما یک کارشناس امنیت سایبری هشدار می‌دهد پاک‌شدن سوابق ممکن است پی‌گیری آسیب را دشوارتر کند

مه 13, 2026 Whatsapp
برچسب مشترک: Artificial intelligence هوش مصنوعی
Amp برای «شبکه» هوش مصنوعی ۱.۳ میلیارد دلار جذب کرد

این استارت‌آپ دنبال ساخت جایگزینی در بازاری است که شرکت‌های بزرگ فناوری بخش زیادی از سخت‌افزار لازم برای هوش مصنوعی پیشرفته را کنترل می‌کنند.

مه 12, 2026

نظرات (0)

برای ثبت نظر لطفاً وارد شوید.
هنوز هیچ نظری ثبت نشده است.