Cutmix

/*! elementor - v3.17.0 - 08-11-2023 */
.elementor-heading-title{padding:0;margin:0;line-height:1}.elementor-widget-heading .elementor-heading-title[class*=elementor-size-]>a{color:inherit;font-size:inherit;line-height:inherit}.elementor-widget-heading .elementor-heading-title.elementor-size-small{font-size:15px}.elementor-widget-heading .elementor-heading-title.elementor-size-medium{font-size:19px}.elementor-widget-heading .elementor-heading-title.elementor-size-large{font-size:29px}.elementor-widget-heading .elementor-heading-title.elementor-size-xl{font-size:39px}.elementor-widget-heading .elementor-heading-title.elementor-size-xxl{font-size:59px}
CutMix: Regularization Strategy to Train Strong Classifiers
with Localizable Features
استراتژی های dropout در مناطق مختلف برای بهبود عملکرد شبکه های عصبی پیچشی پیشنهاد شده است. این استراتژی ها موثر بوده اند برای هدایت مدل به تمرکز بر روی بخش های کم تمایز اشیاء (مانند پا به جای سر یک فرد)، بدین ترتیب به شبکه اجازه می دهد بهتر عمل کند و قابلیت Localization بهتری داشته باشد.
از طرف دیگر، روش های فعلی dropout منطقه ای، با پوشاندن یک پارچه از پیکسل های سیاه یا نویز تصادفی، پیکسل های اطلاعاتی را از تصاویر آموزشی حذف می کنند. این حذف غیر مطلوب است زیرا منجر به از دست دادن اطلاعات و ناکارآمدی در طول آموزش می شود
. به همین دلیل، ما استراتژی افزایش برش را پیشنهاد می دهیم: پارچه ها در بین تصاویر آموزشی برش خورده و چسبانده می شوند و برچسب های حقیقی نیز به نسبت منطقه پارچه ها مخلوط می شوند. با استفاده کارآمد از پیکسل های آموزش و حفظ اثر بازدارندگی dropout منطقه ای، استفاده از CutMix به طور مداوم عملکرد روش های افزایش در Cifar و ImageNet را بهبود می بخشد، همچنین در وظیفه لوکالیزیشن ImageNet با نظارت ضعیف نیز بهترین عملکرد را دارد.
علاوه بر این، در مقایسه با روش های افزایش قبلی، استفاده از مدل ImageNet با آموزش CutMix به عنوان مدل پیش آموزش دیده، باعث بهبود عملکرد در بنچمارک های تشخیص Pascal و شرح دادن تصویر MS-COCO می شود. همچنین نشان داده شده است که CutMix عملکرد مدل در برابر خرابی های ورودی را بهبود می بخشد و عملکرد تشخیص خارج از توزیع را نیز بهبود می بخشد.
/*! elementor - v3.17.0 - 08-11-2023 */
.elementor-widget-image{text-align:center}.elementor-widget-image a{display:inline-block}.elementor-widget-image a img[src$=".svg"]{width:48px}.elementor-widget-image img{vertical-align:middle;display:inline-block}
بررسی نتایج روش های Mixup، Cutout و CutMix ما در وظایف دسته بندی ImageNet، محلی سازی ImageNet و تشخیص Pascal VOC 07 (آموزش انتقال با SSD finetuning) نشان می دهد که CutMix به طرز قابل توجهی عملکرد را در وظایف مختلف بهبود می بخشد.
کات میکس به زبان ساده
که در این شکل
کات و میکس و کاتمیکس مشاهاده می شود
تصاویر نمایش فعالیت کلاس (CAM) برای نمونه های "Saint Bernard" و "Miniature Poodle" با استفاده از روش های افزایش نمونه مختلف. از بالا تا پایین، تصاویر اصلی، تصویر ورودی افزوده شده، CAM برای کلاس "Saint Bernard" و CAM برای کلاس "Miniature Poodle " نشان داده شده است. لازم به ذکر است که CutMix می تواند از منطقه مخلوط در تصویر استفاده کند، اما Cutout نمی تواند.
مقایسه بین Cutmix و Cutout و Mixup
در بالا هم تاثییر کات میکس روی مدل ResNet تغییر در پارامتر ها و همچنین تغییر در خطا رو مشاهده می کنید
ما مشاهده کردیم که روش Cutout با موفقیت به مدل کمک میکند تا بر روی بخشهای کم اهمیت تمرکز کند، مانند شکم سگ سنت برنارد، اما به دلیل استفاده نشده از پیکسلها کارایی پایینی دارد. در مقابل، روش Mixup از تمام پیکسلها بهره میبرد، اما آرتیفکتهای غیرطبیعی ایجاد میکند. نتیجه CAM برای Mixup نشان میدهد که مدل در انتخاب نشانهها برای تشخیص گیج شده است. ما فرض میکنیم که چنین گیجی منجر به عملکرد ناسالم در طبقهبندی و لوکالیزاسیون میشود.
CutMix با بهرهگیری بهینه از Cutout، با دقت قابل توجه دو کلاس شیء را به صورت محلی تعیین میکند.
نرخ استفاده از کات میکس ودیگر روش های data augmentation
مدل از کات میکس چی یاد میگیره ؟
این همه راجب کات میکس صحبت کردیم مقایسه انجام دادیم گفتیم باعث کاهش ارور میشه حالا ببینم چرا این اتفاقات می افته
ما CutMix را به گونهای توجیه کردهایم که دامنه کامل اشیاء به عنوان نشانههایی برای طبقهبندی در نظر گرفته میشود، همان انگیزه ای که Cutout نیز به آن پایبند است، در حالی که اطمینان حاصل میشود دو شیء از دیدگاههای جزئی در یک تصویر شناسایی میشوند تا کارآیی آموزش را افزایش دهد. برای تأیید این موضوع که CutMix در واقع در حال یادگیری شناسایی دو شیء از دیدگاههای مختلف در یک تصویر است، و با توجه به نمونه ی بالا که مقایسه بین کلاس های Saint Bernard و Miniature Poodle بود این گفته تا حدودی اثبات می شود
خلاصه داستان Cutmix
ما CutMix را برای آموزش شبکههای عصبی کانولوشنی با توانایی قوی در طبقهبندی و محلی سازی معرفی کردهایم. CutMix آسان برای پیادهسازی است و هیچ هزینه محاسباتی ندارد، در حالی که در وظایف مختلف به طرز شگفتانگیزی موثر است.
در طبقهبندی ImageNet، استفاده از CutMix برای ResNet-50 و ResNet 101 باعث افزایش دقت top-1 به ترتیب +2.28% و +1.70% میشود.
در طبقهبندی CIFAR، CutMix باعث بهبود قابل توجه عملکرد پایه با +1.98% شده و به خطای top-1 14.47% رسیده است.
در Localization شئهای ضعیفاً نظارت شده (WSOL)، CutMix دقت محلی سازی را به طور قابل توجهی افزایش داده و عملکرد مقایسه پذیری با روشهای WSOL برجسته را داشته است. علاوه بر این، استفاده ساده از مدل CutMix-ImageNet به عنوان پایه اولیه شبکه تشخیص اشیاء و شرح تصاویر، بهبود عملکرد کلی را به همراه داشته است.
در نهایت، نشان داده شده است که CutMix باعث بهبود مقاومت و عدم قطعیت طبقهبندی تصاویر نسبت به مدل وانیلا و سایر مدلهای منظمسازی شده میشود.
یک نمونه دیگر از شاهکار های Cutmix
معرفی می کنیم اقای cillian morty :)
سوالات
1-چرا کات میکس باعث بهبود عملکرد مدل می شود ؟
2-کات میکس با بهره گیری از چه روشی دو کلاس را دقیقت تر Localize می کند ؟
3-دلیل ناکار امادی Mixup چه بود ؟
4-چرا از drop out منطقه ای استفاده نکردیم
و دلیل استفاده از کات میکس چه بود ؟