معیارهای سنجش عملکرد
آیا مدلهای ایرانی در استدلال و حساسیت فرهنگی به پای ChatGPT میرسند؟