کرمان رصد

آخرين مطالب

هوش مصنوعی نمی‌تواند پاسخ درستی را به پرسش‌های «تاریخی» بدهد! علمي

هوش مصنوعی نمی‌تواند پاسخ درستی را به پرسش‌های «تاریخی» بدهد!
  بزرگنمايي:

کرمان رصد - ایسنا / گروهی از پژوهشگران یک معیار جدید را برای آزمایش سه مدل زبانی بزرگ «چت‌جی‌پی‌تی-4»(GPT-4) شرکت «اوپن‌ای‌آی»(OpenAI)، «لاما»(Llama) شرکت «متا»(Meta) و «جمینای»(Gemini) گوگل درباره پرسش‌های تاریخی ایجاد کرده‌اند. این معیار موسوم به «Hist-LLM»، درستی پاسخ‌ها را بر اساس بانک اطلاعات تاریخ جهانی «سشات»(Seshat) آزمایش می‌کند که یک پایگاه داده گسترده از دانش تاریخی است و نام ایزدبانوی خرد مصر باستان را دارد.
به نقل از تک کرانچ، پژوهشگران مؤسسه پژوهشی «Complexity Science Hub» مستقر در اتریش، نتایج این بررسی را ناامیدکننده خواندند. مدل زبانی که بهترین عملکرد را داشت، «GPT-4 Turbo» بود، اما دقت آن فقط حدود 46 درصد تخمین زده شد که خیلی بیشتر از دقت حدس زدن تصادفی نیست.
«ماریا دل ریو چانونا»(Maria del Rio-Chanona)، دانشیار علوم رایانه «کالج دانشگاهی لندن»(UCL) و از پژوهشگران این پروژه گفت: نکته اصلی پژوهش ما این است که اگرچه مدل‌های زبانی بزرگ، چشمگیر هستند، اما هنوز عمق لازم را برای درک تاریخ پیشرفته ندارند. آنها برای حقایق اساسی، عالی هستند، اما وقتی صحبت از پژوهش‌های تاریخی دقیق‌تر در سطح دکتری به میان می‌آید، هنوز به کارآیی لازم نرسیده‌اند.
پژوهشگران پرسش‌های تاریخ را که مدل‌های زبانی بزرگ در پاسخ دادن به آنها اشتباه کرده بودند، در اختیار تک‌ کرانچ گذاشتند. به عنوان مثال، آنها از GPT-4 Turbo پرسیده بودند که آیا «زره فلس» در یک دوره زمانی خاص در مصر باستان وجود داشته است یا خیر و مدل زبانی بزرگ پاسخ مثبت داد. این درحالی بود که زره فلس 1500 سال پس از آن دوره در مصر ظاهر شد.
چرا مدل‌های زبانی بزرگ در پاسخ دادن به پرسش‌های تاریخی بد عمل می‌کنند؛ در حالی که می‌توانند در پاسخ دادن به پرسش‌های بسیار پیچیده در مواردی مانند کدنویسی بسیار خوب باشند؟ چانونا پاسخ داد: احتمالا به این دلیل است که مدل‌های زبانی بزرگ تمایل دارند از داده‌های تاریخی بسیار برجسته برون‌یابی کنند و بازیابی دانش تاریخی مبهم‌تر را دشوار می‌دانند.
به عنوان مثال، پژوهشگران از GPT-4 پرسیدند که آیا مصر باستان در طول یک دوره تاریخی خاص، ارتش ثابت حرفه‌ای داشته است یا خیر. در حالی که پاسخ صحیح منفی است، GPT-4 به اشتباه پاسخ مثبت داد. این پاسخ احتمالا به این دلیل داده شده که اطلاعات عمومی زیادی درباره سایر امپراتوری‌های باستانی مانند ایران مبنی بر داشتن ارتش‌ ثابت وجود دارد.
چانونا گفت: اگر 100 بار به شما A و B و 1 بار C گفته شود و سپس درباره C از شما پرسیده شود، ممکن است A و B را به خاطر بسپارید و سعی داشته باشید از آن استنباط کنید.
پژوهشگران تمایلات دیگری را نیز درباره مدل‌های زبانی بزرگ شناسایی کردند؛ از جمله این که مدل‌های شرکت اوپن‌ای‌آی و لاما درباره مناطق خاصی مانند جنوب صحرای آفریقا عملکرد بدتری داشتند. این نشان‌دهنده سوگیری‌های احتمالی در داده‌های آموزشی آنهاست.
«پیتر تورچین»(Peter Turchin)، سرپرست این پژوهش گفت: نتایج نشان می‌دهند که مدل‌های زبانی بزرگ هنوز در برخی حوزه‌های خاص نمی‌توانند جایگزین انسان باشند.
با وجود این، پژوهشگران هنوز امیدوارند که مدل‌های زبانی بزرگ در آینده بتوانند به مورخان کمک کنند. آنها در حال کار کردن روی اصلاح معیار خود با گنجاندن داده‌های بیشتر درباره مناطق کمتر ارائه‌شده و افزودن پرسش‌های پیچیده‌تر هستند.
در مقاله این پژوهش آمده است: اگرچه نتایج ما مناطقی را برجسته می‌کنند که مدل‌های زبانی بزرگ به بهبود یافتن در آنها نیاز دارند، اما این نتایج بر پتانسیل این مدل‌ها برای کمک به پژوهش‌های تاریخی نیز تأکید می‌کنند.

لینک کوتاه:
https://www.kermanrasad.ir/Fa/News/694822/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

سایه سنگین بخشنامه خیلی محرمانه!

راز 22ساله سردار

ترامپ برهم زننده نظم جهانی

یک تحلیلگر: ترامپ در ارتباط با ایران در تله نتانیاهو نمی‌افتد

هم میهن نوشت: از تروریسم تا پراگماتیسم

شاخص کلیدی دولت اسلامی بهره‌گیری از آموزه‌های دینی است

رییس عقیدتی سیاسی گروه 44 نزاجا: راه و اندیشه حضرت امام خمینی(ره) راه و اندیشه ای اصیل و نجات بخش است

سیاهچاله ای بزرگتر از کهکشان آندرومدا

برگ‌ها الهام‌بخش پنل‌های خورشیدی آینده می‌شوند

چشم عینک AR را ببینید!

ادای احترام استاندار، مدیر کل بنیاد سمنان و مسئولان ارشد اجرائی نسبت به مقام شامخ شهدای مهدیشهر

مادر شهیدان والا مقام «محمدحسن و عباس گیوه‌کی» آسمانی شد

حضور جانبازان در مدیریت‌های کلان کشور مایه مباهات و افتخار است

لیگ برتر والیبال| اعلام نتایج و رده‌بندی هفته بیست‌وسوم و قطعی شدن حضور 4 تیم در پلی‌آف

برگزاری جشنواره تقدیر از دانشجویان برتر دانشگاه پیام نور استان کرمان

حضور 4 تیم دیگر در پلی‌آف قطعی شد

ارومیه تسلیم پیکان شد/ مهرگان به پلی‌آف رسید

جدال تیم پالایش نفت بندرعباس با مس کرمان در لیگ دسته اول فوتبال کشور

رتبه نخست کرمان در افتتاح پروژه های انرژی خورشیدی کشور

حضور 4 تیم در پلی‌آف لیگ برتر والیبال قطعی شد

ارائه کارت شناسایی برای تماشای بازی استقلال- مس الزامی است

کینه این قوم علیه ظریف عمیق است

چرا ترامپ رویای مالکیت غزه را در سر دارد؟

«ترامپی»؛ توهین روزنامه اصولگرا به ظریف

نشنال اینترست: آیا اسرائیل باید نگران شهر موشکی ایران باشد؟

زمزمه حذف تابعیت قهری در بهارستان

جراحی در جاده مخصوص

زیباترین تصاویر تلسکوپ جیمز وب

خوشه‌ی جذاب ستاره‌ای باز Westerlund 1

توسعه همکاری‌های مشترک بیمه دی و بانک دی

دیدار مدیرکل بنیاد شهید و امور ایثارگران استان اردبیل با خانواده های معظم شهدا و ایثارگران

مقصد سفر جدید پزشکیان مشخص شد

دکتر مدرس خیابانی: رفسنجان می‌تواند به قطب تولید گلوله فولادی کشور تبدیل شود

ارسال لایحه به مجلس درباره همکاری ایران و روسیه

اکتفا به یک بیانیه کلی و تهدید به شکایت/ چرا مومنی پاسخ شجاعی را نمی‌دهد؟

تحلیل متفاوت روزنامه‌نگار صهیونیست به طرح کوچاندن فلسطینیان

دبل پیروزی فولاد سیرجان برابر تیم والیبال گیتی‌پسند

عطایی از یک شوک بزرگ فرار کرد

کارشناسی داوری دیدار آلومینیوم – مس رفسنجان

نارضایتی ورزشکاران قوچانی از قیمت‌گذاری اماکن ورزشی

خلاصه والیبال فولاد سیرجان 3 – گیتی پسند 2

صعود چهار تیم به پلی‌آف لیگ برتر والیبال قطعی شد

واگذاری غول بزرگ

تبدیل کرانه باختری به غزه دوم

یک تحلیلگر: همه چیز تغییر کرده از جمله ترامپ

گرافن کلید طلایی دستیابی به فناوری 6G است

تصویری خیره‌کننده از کاسیوپئا

تلسکوپ فضایی جیمز وب اولین جمعیت کوتوله قهوه‌ای احتمالی خارج از کهکشان ما را شناسایی کرده است !

مدیرعامل بیمه دی: کار تیمی نشانه بلوغ سازمانی است

سفر رییس جمهور به سیرجان / 20 بهمن ، اولین سفر پزشکیان به استان حاج قاسم