Cafe Bazaar Comment Classification

/*! elementor - v3.17.0 - 08-11-2023 */ .elementor-heading-title{padding:0;margin:0;line-height:1}.elementor-widget-heading .elementor-heading-title[class*=elementor-size-]>a{color:inherit;font-size:inherit;line-height:inherit}.elementor-widget-heading .elementor-heading-title.elementor-size-small{font-size:15px}.elementor-widget-heading .elementor-heading-title.elementor-size-medium{font-size:19px}.elementor-widget-heading .elementor-heading-title.elementor-size-large{font-size:29px}.elementor-widget-heading .elementor-heading-title.elementor-size-xl{font-size:39px}.elementor-widget-heading .elementor-heading-title.elementor-size-xxl{font-size:59px}

CofeBazaar Comment Classification

در این پست به بررسی و طبقه بندی کامنت های کافه بازار در  ۹ کلاس می پردازیم. این کلاس ها عبارتند از:
  • حجم زیاد نرم افزار
  • مشکل در پرداخت
  • اعتراض به قیمت
  • درخواست راهنمایی
  • اعتراض به خدمات
  • اشکال فنی
  • درخواست بروزرسانی
  • پیشنهاد نرم افزاری
  • مقایسه با رقبا

پخش اول:‌ آماده سازی دادگان

بعد از بررسی دادگان و بدست آوردن آمار زیر می توان به نامتوازن بودن دادگان پی برد. /*! elementor - v3.17.0 - 08-11-2023 */ .elementor-widget-image{text-align:center}.elementor-widget-image a{display:inline-block}.elementor-widget-image a img[src$=".svg"]{width:48px}.elementor-widget-image img{vertical-align:middle;display:inline-block} برای رفع این مشکل از وزن دهی به کلاس ها استفاده شده. که وزن مورد نظر برای هر کلاس از طریق تقسیم تعداد کل دادگان به دادگان آن کلاس استخراج شده است. بعد از این مرحله نوبت به انتخاب طول کامنت های است. ابتدا توزیع طول کامنت ها به شکل زیر بررسی شدند: که در نهایت ۱۵۰ کاراکتر به عنوان طول کامنت ها انتخاب شد. و برای کامنت ها با طول کمتر هم از روش padding استفاده شد.

بخش دوم:‌  انتخاب مدل

در این مرحله ابتدا با استفاده از AutoKeras یک مدل base line مشخص شد تا میزان بهبود مدل نهایی با استفاده از base line سنجیده شود. در مرحله بعد از مدل HooshvareLab/bert-fa-zwnj-base  به عنوان مدل پایه برای استخراج embedding دادگان ورودی استفاده شد. سپس با بررسی ساختار های متفاوت نظیر MLP, Convolution برای نتیجه گیری نهایی با توجه به عملکرد بهتر MLP ها سه ساختار متفاوت مشتق شده از MLP بررسی شدند که به تفصیل آن ها خواهیم پرداخت.
  • MLP with 1 Dnese Layer
  • MLP with 2 Dense Layers

بخش سوم:‌ نتیجه گیری

با توجه به مدل های بررسی شده و بهبود قابل توجه مدل با ۲ لایه Dense نسبت به مدل base line در نهایت مدل ذکر شده به عنوان مدل نهایی انتخاب شد.