محققان در تلاش برای یافتن روشی معتبر جهت شناسایی هر گونه واکنش حساس از یک «من» در سیستمهای هوش مصنوعی، به مفهومی که بسیاری از موجودات زنده از جمله خرچنگها و انسانها را به هم پیوند میدهد، یعنی «درد»، توجه کردهاند.
این مطالعه توسط محققان Google DeepMind و مدرسه اقتصاد و علوم سیاسی لندن (LSE) انجام شده است.
تیم پژوهشی، یک بازی متنی طراحی کرده و از چند مدل زبان بزرگ (LLM) خواستهاند که در این بازی شرکت کرده و در دو سناریو مختلف امتیاز بیشتری کسب کنند. در یکی از سناریوها، به مدلها اعلام شد که کسب امتیاز بالا به دردسر خواهد انجامید، در حالی که در سناریو دیگر، یک گزینه با امتیاز کمتر ولی لذتبخشتر به مدلها داده شده است.
هدف از این سناریو، منحرف کردن مدلها از هدف اصلی یعنی اجتناب از درد یا لذت بردن بوده است. به گفته محققان، نتایج این آزمایش میتواند راهی برای انسانها فراهم کند تا نحوه تعامل با سیستمهای هوش مصنوعی پیچیدهتر را برای درک و شبیهسازی احساسات کاوش کنند.
در موجودات زنده، احساسات شامل تجربه عواطف مختلف مانند درد، لذت و ترس است. بیشتر متخصصان هوش مصنوعی بر این باورند که مدلهای هوش مصنوعی مولد، علیرغم برخی ادعاها، فاقد آگاهی ذهنی هستند و احتمالاً هیچگاه نیز قادر به تجربه آن نخواهند بود.
البته نویسندگان این مطالعه تأکید دارند که هیچیک از چترباتهایی که بررسی کردهاند، به طور واقعی حساس نبودهاند، بلکه مطالعه آنها چارچوبی برای آزمایشهای آینده به منظور بررسی این ویژگیها در سیستمهای هوش مصنوعی فراهم میآورد.
جاناتان برچ، یکی از نویسندگان این تحقیق و استاد دپارتمان فلسفه، منطق و روش علمی در LSE، میگوید: «این یک حوزه جدید از تحقیقات است. باید بپذیریم که هنوز آزمایشی جامع برای ارزیابی هوش مصنوعی نداریم.»
برخی مطالعات پیشین که بر اساس گزارشهای مدلهای هوش مصنوعی از وضعیتهای داخلیشان بودهاند، باعث بروز تردیدهایی شده است؛ چرا که ممکن است مدلها تنها رفتارهای انسانی که بر روی آنها آموزش داده شدهاند را بازتولید کنند.
اما مطالعه جدید بر اساس تحقیقات پیشین بر روی حیوانات انجام شده است. در یکی از آزمایشهای معروف، تیمی از محققان با استفاده از شوکهای الکتریکی با ولتاژهای مختلف، خرچنگهای گوشهنشین را آزمایش کرده و مشاهده کردند که چه سطحی از درد باعث میشود که این سختپوستان پوسته خود را رها کنند.
برچ میگوید: «مشکل واضح با هوش مصنوعی این است که در این آزمایش هیچ حیوانی وجود ندارد، بنابراین هیچ رفتار فیزیکی برای تحلیل کردن نیز مشاهده نمیشود.» به همین دلیل، در مطالعات پیشین که به ارزیابی احساسات مدلهای زبان بزرگ پرداختهاند، تنها سیگنال رفتاری که در دسترس بود، خروجی متنی مدلها بود.
در این تحقیق، نویسندگان LLMها را بدون پرسیدن سوالات مستقیم در مورد حالتهای تجربی آنها ارزیابی کردند. به جای آن، از پارادایم «معامله» استفاده کردند که در رفتارشناسی حیوانات برای بررسی انگیزهها و انتخابها به کار میرود. داریا زاخارووا، یکی از همکاران این پژوهش میگوید: «در این تحقیق، ما یک دوراهی برای مدلها ایجاد کردیم و سپس مشاهده کردیم که چگونه در پاسخ به آن، تصمیمگیری میکنند.»
source