machine reading comprehension

در این پروژه هدف این است که مدل پاسخ سوال پرسیده شده را از متن داده شده استخراج کرده و برگرداند و اگر هم پاسخ در متن وجود ندارد چیزی بر نگرداند. در این تسک از مدل bert-base با معماری ترنسفورمر استفاده شده است تا به خوبی بتواند ارتباط بین پرسش پرسیده شده و متن داده شده را بیابد. برای آموزش این مدل از دیتاست PQUAD شامل 80000 پرسش و پاسخ از متن های مختلف مه عموما از ویکی پدیا جمع آورش شده اند. فرمت این دیتاست مثل دیتاست squad می باشد و جدیدترین و کامل ترین مجموعه داده برای این تسک میباشد. مدلی که روی آن این آموزش انجام شده است. مدل XLM-RoBerta-base می باشد که نسخه کامل تر و با پشتیبانی از زبان های بیشتر از جمله فارسی است.   در فرآیند آموزش این مدل، سوالاتی که پاسخ آن ها در متن داده شده وجود ندارد با توکن [cls] لیبل زده شده اند که مدل بتواند بدون جواب بودن سوال را تشخیص دهد و اگر از آن سوالی پرسیده شد که جواب آن در متن وجود نداشت پاسخی بر نگرداند. برای این کار هنگام پیش بینی مدل، score پاسخ های مختلف محاسبه شده و نسبت به score توکن خاص مقایسه میشود. در واقع با این کار threshold مناسبی برا پاسخ دادن یا ندادن مدل ست شده است.   چند نمونه: context: 'در بین سال های ۱۹۳۷ تا ۱۹۷۸، مسابقات با حضور ۱۶ تیم برگزار می شد. البته در مسابقات سال ۱۹۳۸ کشور اتریش جزوی از آلمان شده بود و به همین دلیل بود که مسابقات با حضور ۱۵ تیم برگزار شد. همچنین در مسابقات سال ۱۹۵۰ بود که به علت انصراف تیم های هند، اسکاتلند و ترکیه، مسابقات با شرکت ۱۳ تیم برگزار شد. در آن سال ها اکثر تیم های شرکت کننده، از اروپا و آمریکای جنوبی بودند و تیم های کمی از قاره های آمریکای شمالی، آسیا، آفریقا و اقیانوسیه در این رقابت ها بودند و اکثر آن ها نیز به راحتی از تیم های اروپایی و آمریکایی جنوبی، شکست می خوردند. در واقع تا سال ۱۹۸۶، تنها آمریکا بود که جزو قاره اروپا و آمریکای جنوبی نبود اما توانسته بود از دور نخست رقابت ها صعود کند و در رقابت های سال ۱۹۳۰، به دور نیمه نهایی رسیده بود. همچنین تیم های ملی کوبا در سال ۱۹۳۸، کره شمالی در سال ۱۹۶۶ و مکزیک در سال ۱۹۷۰ بود که توانسته بودند به مرحله یک چهارم نهایی برسند.' question: 'مسابقات جام جهانی سال ۱۹۵۰ با حضور چند تیم برگزار شد؟' prediction: {'score': 1.0, 'text': ' ۱۳ تیم'}   context: 'کادوسیان قبیله ای ایرانی بودند که بنا بر استفان بیزانتی[یادداشت 4] بین دریاهای خزر و سیاه و بنا بر استرابو در کرانه جنوب غرب دریای خزر و جنوب ارس بین آلبانی در شمال و ماردی در شرق یعنی در بخش کوهستانی مادیه پیرامون پاراچوآتراس[یادداشت 5] می زیستند. گفته شده نی نوس شاه آشوری آنان را شکست داد. در دوره مادها آنان آشکارا قادر به حفظ استقلالشان بوده اند و حتی گفته شده در دوره آرتئس وقتی یک پارسی به نام پارسد که از مادها گریخته بود (برادر زن رهبرشان)، مجبور شان کرد با مادها بجنگند. شاه مادها را شکست داده اند؛ بنابراین کادوسیان هرگز تابع شاهان ماد نبوده اند و فقط این کوروش بود که گفته شده داوطلبانه فرمانبردارش شدند. بنابر گفته گزنفون، او هنگام مرگ پسرش را ساتراپ مادها ارمنیان و کادوسیان کرد.' question: 'تنها فردی که کادوسیان داوطلبانه مایل به فرمانبرداری از او شدند چه نام داشت؟' prediction: {'score': 1.0, 'text': ' کوروش'}