Cutmix

نویسنده: تیم تحریریه

تاریخ انتشار: 15 بهمن 1402

/*! elementor - v3.17.0 - 08-11-2023 */ .elementor-heading-title{padding:0;margin:0;line-height:1}.elementor-widget-heading .elementor-heading-title[class*=elementor-size-]>a{color:inherit;font-size:inherit;line-height:inherit}.elementor-widget-heading .elementor-heading-title.elementor-size-small{font-size:15px}.elementor-widget-heading .elementor-heading-title.elementor-size-medium{font-size:19px}.elementor-widget-heading .elementor-heading-title.elementor-size-large{font-size:29px}.elementor-widget-heading .elementor-heading-title.elementor-size-xl{font-size:39px}.elementor-widget-heading .elementor-heading-title.elementor-size-xxl{font-size:59px} CutMix: Regularization Strategy to Train Strong Classifiers with Localizable Features استراتژی های dropout در مناطق مختلف برای بهبود عملکرد شبکه های عصبی پیچشی پیشنهاد شده است. این استراتژی ها موثر بوده اند برای هدایت مدل به تمرکز بر روی بخش های کم تمایز اشیاء (مانند پا به جای سر یک فرد)، بدین ترتیب به شبکه اجازه می دهد بهتر عمل کند و قابلیت Localization بهتری داشته باشد. از طرف دیگر، روش های فعلی dropout منطقه ای، با پوشاندن یک پارچه از پیکسل های سیاه یا نویز تصادفی، پیکسل های اطلاعاتی را از تصاویر آموزشی حذف می کنند. این حذف غیر مطلوب است زیرا منجر به از دست دادن اطلاعات و ناکارآمدی در طول آموزش می شود . به همین دلیل، ما استراتژی افزایش برش را پیشنهاد می دهیم: پارچه ها در بین تصاویر آموزشی برش خورده و چسبانده می شوند و برچسب های حقیقی نیز به نسبت منطقه پارچه ها مخلوط می شوند. با استفاده کارآمد از پیکسل های آموزش و حفظ اثر بازدارندگی dropout منطقه ای، استفاده از CutMix به طور مداوم عملکرد روش های افزایش در Cifar و ImageNet را بهبود می بخشد، همچنین در وظیفه لوکالیزیشن ImageNet با نظارت ضعیف نیز بهترین عملکرد را دارد. علاوه بر این، در مقایسه با روش های افزایش قبلی، استفاده از مدل ImageNet با آموزش CutMix به عنوان مدل پیش آموزش دیده، باعث بهبود عملکرد در بنچمارک های تشخیص Pascal و شرح دادن تصویر MS-COCO می شود. همچنین نشان داده شده است که CutMix عملکرد مدل در برابر خرابی های ورودی را بهبود می بخشد و عملکرد تشخیص خارج از توزیع را نیز بهبود می بخشد. /*! elementor - v3.17.0 - 08-11-2023 */ .elementor-widget-image{text-align:center}.elementor-widget-image a{display:inline-block}.elementor-widget-image a img[src$=".svg"]{width:48px}.elementor-widget-image img{vertical-align:middle;display:inline-block} بررسی نتایج روش های Mixup، Cutout و CutMix ما در وظایف دسته بندی ImageNet، محلی سازی ImageNet و تشخیص Pascal VOC 07 (آموزش انتقال با SSD finetuning) نشان می دهد که CutMix به طرز قابل توجهی عملکرد را در وظایف مختلف بهبود می بخشد. کات میکس به زبان ساده که در این شکل کات و میکس و کاتمیکس مشاهاده می شود تصاویر نمایش فعالیت کلاس (CAM) برای نمونه های "Saint Bernard" و "Miniature Poodle" با استفاده از روش های افزایش نمونه مختلف. از بالا تا پایین، تصاویر اصلی، تصویر ورودی افزوده شده، CAM برای کلاس "Saint Bernard" و CAM برای کلاس "Miniature Poodle " نشان داده شده است. لازم به ذکر است که CutMix می تواند از منطقه مخلوط در تصویر استفاده کند، اما Cutout نمی تواند. مقایسه بین Cutmix و Cutout و Mixup در بالا هم تاثییر کات میکس روی مدل ResNet تغییر در پارامتر ها و همچنین تغییر در خطا رو مشاهده می کنید ما مشاهده کردیم که روش Cutout با موفقیت به مدل کمک می‌کند تا بر روی بخش‌های کم اهمیت تمرکز کند، مانند شکم سگ سنت برنارد، اما به دلیل استفاده نشده از پیکسل‌ها کارایی پایینی دارد. در مقابل، روش Mixup از تمام پیکسل‌ها بهره می‌برد، اما آرتیفکت‌های غیرطبیعی ایجاد می‌کند. نتیجه CAM برای Mixup نشان می‌دهد که مدل در انتخاب نشانه‌ها برای تشخیص گیج شده است. ما فرض می‌کنیم که چنین گیجی منجر به عملکرد ناسالم در طبقه‌بندی و لوکالیزاسیون می‌شود. CutMix با بهره‌گیری بهینه از Cutout، با دقت قابل توجه دو کلاس شیء را به صورت محلی تعیین می‌کند. نرخ استفاده از کات میکس ودیگر روش های data augmentation مدل از کات میکس چی یاد میگیره ؟ این همه راجب کات میکس صحبت کردیم مقایسه انجام دادیم گفتیم باعث کاهش ارور میشه حالا ببینم چرا این اتفاقات می افته ما CutMix را به گونه‌ای توجیه کرده‌ایم که دامنه کامل اشیاء به عنوان نشانه‌هایی برای طبقه‌بندی در نظر گرفته می‌شود، همان انگیزه ای که Cutout نیز به آن پایبند است، در حالی که اطمینان حاصل می‌شود دو شیء از دیدگاه‌های جزئی در یک تصویر شناسایی می‌شوند تا کارآیی آموزش را افزایش دهد. برای تأیید این موضوع که CutMix در واقع در حال یادگیری شناسایی دو شیء از دیدگاه‌های مختلف در یک تصویر است، و با توجه به نمونه ی بالا که مقایسه بین کلاس های Saint Bernard و Miniature Poodle بود این گفته تا حدودی اثبات می شود خلاصه داستان Cutmix ما CutMix را برای آموزش شبکه‌های عصبی کانولوشنی با توانایی قوی در طبقه‌بندی و محلی سازی معرفی کرده‌ایم. CutMix آسان برای پیاده‌سازی است و هیچ هزینه محاسباتی ندارد، در حالی که در وظایف مختلف به طرز شگفت‌انگیزی موثر است. در طبقه‌بندی ImageNet، استفاده از CutMix برای ResNet-50 و ResNet 101 باعث افزایش دقت top-1 به ترتیب +2.28% و +1.70% می‌شود. در طبقه‌بندی CIFAR، CutMix باعث بهبود قابل توجه عملکرد پایه با +1.98% شده و به خطای top-1 14.47% رسیده است. در Localization شئ‌های ضعیفاً نظارت شده (WSOL)، CutMix دقت محلی سازی را به طور قابل توجهی افزایش داده و عملکرد مقایسه پذیری با روش‌های WSOL برجسته را داشته است. علاوه بر این، استفاده ساده از مدل CutMix-ImageNet به عنوان پایه اولیه شبکه تشخیص اشیاء و شرح تصاویر، بهبود عملکرد کلی را به همراه داشته است. در نهایت، نشان داده شده است که CutMix باعث بهبود مقاومت و عدم قطعیت طبقه‌بندی تصاویر نسبت به مدل وانیلا و سایر مدل‌های منظم‌سازی شده می‌شود. یک نمونه دیگر از شاهکار های Cutmix معرفی می کنیم اقای cillian morty :) سوالات 1-چرا کات میکس باعث بهبود عملکرد مدل می شود ؟ 2-کات میکس با بهره گیری از چه روشی دو کلاس را دقیقت تر Localize می کند ؟ 3-دلیل ناکار امادی Mixup چه بود ؟ 4-چرا از drop out منطقه ای استفاده نکردیم و دلیل استفاده از کات میکس چه بود ؟

Cutmix

با تشکر از توجه شما