مقدمات تصویر و طبقه بندی نزدیک ترین همسایه

نویسنده: تیم تحریریه

تاریخ انتشار: 15 دی 1402

/*! elementor - v3.17.0 - 08-11-2023 */ .elementor-heading-title{padding:0;margin:0;line-height:1}.elementor-widget-heading .elementor-heading-title[class*=elementor-size-]>a{color:inherit;font-size:inherit;line-height:inherit}.elementor-widget-heading .elementor-heading-title.elementor-size-small{font-size:15px}.elementor-widget-heading .elementor-heading-title.elementor-size-medium{font-size:19px}.elementor-widget-heading .elementor-heading-title.elementor-size-large{font-size:29px}.elementor-widget-heading .elementor-heading-title.elementor-size-xl{font-size:39px}.elementor-widget-heading .elementor-heading-title.elementor-size-xxl{font-size:59px}

تصویر چیست؟

یک تصویر نمایش بصری چیزی است، در حالی که یک تصویر دیجیتال یک نمایش دودویی از داده های بصری است. تصویر دیجیتال یک تصویر است که با استفاده از داده های عددی و رایانه ها ایجاد شده است. یک تصویر دیجیتال از تعدادی تکه های کوچک رنگی تشکیل شده است. این نقاط پیکسل نامیده می شوند. هنگامی که پیکسل ها بر روی مانیتور نمایش داده می شوند، به قدری کوچک هستند که تاثیر جمعی روی چشم انسان یک الگوی پیوسته از رنگ هاست. کامپیوتر ها رنگ یک پیکسل را با استفاده از ترفندی که مدت ها برای هنرمندان شناخته شده بود نشان می دهند: ترکیب رنگ های اصلی و برای هر رنگ عددی بین 0 و 255

لود تصویر از دیسک و ذخیره داده های عددی مربوط به تصویر با استفاده از کتابخانه های مورد نیاز

import matplotlib.pyplot as plt

import numpy as np

data = np.array(plt.imread('./images/sign.jpg'))

ویرایش داده تصویری

data[:, :, 1] = 0

data[:, :, 2] = 0

plt.imshow(data)

plt.show()

/*! elementor - v3.17.0 - 08-11-2023 */ .elementor-widget-image{text-align:center}.elementor-widget-image a{display:inline-block}.elementor-widget-image a img[src$=".svg"]{width:48px}.elementor-widget-image img{vertical-align:middle;display:inline-block}

تصاویر سطح خاکستری

همه پیکسل ها مقداری بین 0 و 255 دارند.

img = plt.imread('./images/t-shirt.jpg')
tshirt = rgb2gray(img)

tshirt[200:400, 300:400]=0
plt.imshow(tshirt, cmap = plt.get_cmap('gray'))
plt.show()

معرفی مجموعه داده هدی و استفاده از الگوریتم های یادگیری ماشین

مجموعه ارقام دستنویس هدی که اولین مجموعه‌ی بزرگ ارقام دستنویس فارسی است، مشتمل بر ۱۰۲۳۵۳ نمونه دستنوشته سیاه سفید است. این مجموعه طی انجام یک پروژه‏ی کارشناسی ارشد درباره بازشناسی فرمهای دستنویس تهیه شده است. داده های این مجموعه از حدود ۱۲۰۰۰ فرم ثبت نام آزمون سراسری کارشناسی ارشد سال ۱۳۸۴ و آزمون کاردانی پیوسته‏ی دانشگاه جامع علمی کاربردی سال ۱۳۸۳ استخراج شده است. این مجموعه داده در قالب فایل mat متلب منتشر شده است. در پایتون میتوانیم آن را با کتابخانه scipy لود کنیم. dataset = io.loadmat('./dataset/Data_hoda_full.mat') در این مجموعه داده 60000 داده تصادفی وجود دارد. برای آزمایشاتمان 1000 داده‌ی اول را برای آموزش و 200 داده‌ی بعدی را برای آزمون انتخاب می‌کنیم. **داده های آزمون نباید قبلا در داده های آموزشی دیده شده باشند.** #test and training set X_train_orginal = np.squeeze(dataset['Data'][:1000]) y_train = np.squeeze(dataset['labels'][:1000]) X_test_original = np.squeeze(dataset['Data'][1000:1200]) y_test = np.squeeze(dataset['labels'][1000:1200]) تغییر اندازه تصاویر مجموعه داده اندازه تصاویر مجموعه داده متفاوت است. تمام تصاویر را به یک اندازه مشخص (5*5) تغییر اندازه می‌دهیم. X_train_5by_5 = [cv2.resize(img, dsize=(5, 5)) for img in X_train_orginal] X_test_5by_5 = [cv2.resize(img, dsize=(5, 5)) for img in X_test_original] image = X_train_5by5[1] plt.imshow(image, cmap='gray') plt.show()

تغییر شکل مجموعه داده

X_train = np.reshape(X_train_5by5, [-1,25])
X_test = np.reshape(X_test_5by_5, [-1,25])

X_train.shape

(1000, 25)

طبقه بندی نزدیکترین همسایه و K نزدیکترین همسایه

الگوریتم K-Nearest Neighbors (KNN) یک الگوریتم یادگیری ماشینی است که برای مسائل دسته‌بندی و پیش‌بینی استفاده می‌شود. این الگوریتم به ازای هر نقطه از داده‌ها، K نزدیک‌ترین نقاط دیگر را پیدا می‌کند و با توجه به برچسب آن‌ها، برچسب نقطه مورد نظر را پیش‌بینی می‌کند. لود کتابخانه‌های مورد استفاده

from sklearn.neighbors import KNeighborsClassifier
import matplotlib.pyplot as plt
import numpy as np
from dataset import load_hoda

ایجاد طبقه بند knn

neigh = KNeighborsClassifier(n_neighbors=3)
neigh.fit(X_train, y_train)

sample = 24
X = [X_test[sample]]
predicted_class = neigh.predict(X)
print ("Sample {} is a {}, and you prediction is: {}.".format(sample, y_test[sample], predicted_class[0]))

Sample 24 is a 9, and you prediction is: 9.

print(neigh.predict_proba(X))

[[0.         0.         0.         0.         0.         0.
  0.33333333 0.         0.         0.66666667]]
با توجه به احتمالات بالا کلاس برنده کلاس هفت خواهد بود.

pred_classes = neigh.predict(X_test)
pred_classes

array([7, 2, 3, 1, 5, 5, 4, 7, 3, 2, 0, 8, 8, 0, 3, 9, 3, 6, 7, 4, 0, 3,
       6, 3, 9, 2, 7, 5, 2, 9, 7, 5, 5, 8, 9, 6, 5, 1, 4, 8, 8, 4, 2, 7,
       1, 2, 7, 9, 0, 3, 7, 4, 7, 5, 2, 9, 8, 2, 9, 8, 8, 6, 6, 6, 7, 6,
       2, 4, 1, 4, 4, 5, 9, 1, 8, 2, 0, 5, 6, 2, 4, 3, 2, 7, 7, 7, 7, 1,
       8, 1, 7, 8, 7, 7, 8, 9, 3, 2, 3, 1, 0, 2, 9, 7, 3, 5, 5, 0, 0, 2,
       6, 7, 9, 3, 9, 9, 8, 7, 9, 2, 5, 2, 5, 5, 9, 6, 9, 2, 0, 3, 7, 6,
       5, 2, 9, 0, 4, 1, 8, 2, 2, 3, 0, 2, 9, 3, 8, 6, 7, 0, 9, 9, 0, 7,
       6, 1, 4, 7, 9, 3, 7, 0, 7, 1, 9, 4, 7, 3, 4, 1, 5, 6, 7, 9, 1, 3,
       5, 4, 5, 7, 4, 1, 3, 3, 1, 2, 5, 3, 8, 9, 6, 7, 7, 2, 3, 0, 1, 4,
       9, 5], dtype=uint8)

ارزیابی

np.mean(pred_classes == y_test)

0.96

acc = neigh.score(X_test, y_test)
print ("Accuracy is %.2f %%" %(acc*100))

Accuracy is 96.00 %

شما اگه به یک بیمارستان بروید و یک آزمایش بالینی انجام بدهید و نتایج این آزمایش را چندین نفر بررسی کنند، برای مثال یک نفر پزشک متخصص، یک نفر پزشک عمومی و یک نفر خدماتی. و مطمئنا هر کدام براساس دانشی که دارد تصمیم متفاوتی می‌تواند بگیرد. حال شما می‌خواهید بدانید که نتیجه آزمایش شما مثبت بود یا منفی؟ اگر بخواهید براساس نظر این سه نفر تصمیم بگیرید که نتیجه آزمایش مثبت بوده یا منفی، به نظر هر کدام از این افراد چه درجه اهمیتی میدهید؟ مطمئنا شما هم به این ترتیب به نظرات درجه اهمیت خواهید داد: پزشک متخصص(بالا)، پزشک عمومی( متوسط) و خدماتی(پایین)

در knn هم باید موقع تصمیم گیری از نظر همسایه ها براساس درجه اهمیتی که دارند استفاده کنیم. به عبارتی باید در ابتدا به تک تک k تا نزدیکترین همسایه براساس فاصله‌ای که به نمونه ی جدید دارند یک وزن بدهیم، هر چقدر نزدیکتر وزن بیشتر، و هر چقدر دورتر وزن کمتر!

به الگوریتمی که به صورت وزندار رای گیری انجام میدهد weighted knn یا به اختصار wknn می گوییم.

سوالات چند گزینه ای اگر بدانیم لیبل واقعی نمونه سفید آبی است مقدار k را چه چیزی در نظر بگیریم؟ الف) 3 ب) 5 ج)تفاوتی ندارد د)هیچ کدام نمی توانند لیبل واقعی را درست بیان کنند.

مهم ترین مشکل طبقه بند knn چیست؟ الف)از نظر همسایه ها به طور یکسان استفاده می کند ب) نسبت به k بسیار است. ج) هر دو مورد. موقعیتی را در نظر بگیرید که تعداد داده های پرت بالاست، کدام یک را مناسب می دانید؟ الف) استفاده از k=1 ب) استفاده از k هایی با مقدار بالاتر تاثیر وزن دهی به نزدیکی نقلط در محاسبه پیش بینی: الف) وزن دهی یکسان به همه نقاط ب) وزن دهی بر اساس فاصله ج) بدون وزن دهی چگونه می توان از مشکل بیش برازش در knn جلوگیری می کنید؟ الف) انتخاب مناسب k ب) استفاده از وزن دهی مناسب ج) هر دو گزینه