آموزش الگوریتم تغییر میانگین در یادگیری ماشین با پایتون
آموزش الگوریتم تغییر میانگین در یادگیری ماشین با پایتون
در این درس از مجموعه آموزش برنامه نویسی سایت سورس باران، به آموزش الگوریتم تغییر میانگین در یادگیری ماشین با پایتون خواهیم پرداخت.
پیشنهاد ویژه : پکیج آموزش پایتون
مقدمه ای بر الگوریتم تغییر میانگین
همانطور که قبلاً بحث شد ، این الگوریتم خوشه بندی قدرتمند دیگری است که در یادگیری بدون نظارت استفاده می شود. برخلاف خوشه بندی K- معنی ، هیچ فرضی نمی دهد. از این رو الگوریتمی غیر پارامتری است.
الگوریتم تغییر میانگین اساساً با انتقال نقاط به سمت بالاترین تراکم نقاط داده یعنی مرکز خوشه ، نقاط داده را به طور تکراری به خوشه ها اختصاص می دهد.
تفاوت الگوریتم K-Means با Mean-Shift این است که بعداً نیازی به تعیین تعداد خوشه ها از قبل نیست زیرا تعداد خوشه ها توسط الگوریتم داده های w.r.t تعیین می شود.
نحوه کار الگوریتم تغییر میانگین
ما می توانیم کار الگوریتم خوشه بندی میانگین تغییر را با کمک مراحل زیر درک کنیم –
مرحله 1 – ابتدا با نقاط داده اختصاص داده شده به یک خوشه شروع کنید.
مرحله 2 – بعد، این الگوریتم سانتروئیدها را محاسبه می کند.
مرحله 3 – در این مرحله، محل سانتروئیدهای جدید به روز می شود.
مرحله 4 – اکنون، روند تکرار می شود و به منطقه با چگالی بالاتر منتقل می شود.
مرحله 5 – سرانجام، هنگامی که سانترویدها به موقعیتی رسیدند که نمی تواند بیشتر حرکت کند ، متوقف می شود.
پیاده سازی در پایتون
این یک مثال ساده برای درک چگونگی عملکرد الگوریتم Mean-Shift است. در این مثال ، ما قصد داریم ابتدا مجموعه داده 2D را که شامل 4 حباب مختلف است تولید کنیم و پس از آن الگوریتم Mean-Shift را برای دیدن نتیجه اعمال خواهیم کرد.
1 2 3 4 5 6 7 8 9 10 11 12 |
%matplotlib inline import numpy as np from sklearn.cluster import MeanShift import matplotlib.pyplot as plt from matplotlib import style style.use("ggplot") from sklearn.datasets.samples_generator import make_blobs centers = [[3,3,3],[4,5,5],[3,10,10]] X, _ = make_blobs(n_samples = 700, centers = centers, cluster_std = 0.5) plt.scatter(X[:,0],X[:,1]) plt.show() |
1 2 3 4 5 6 7 8 9 10 11 12 13 |
ms = MeanShift() ms.fit(X) labels = ms.labels_ cluster_centers = ms.cluster_centers_ print(cluster_centers) n_clusters_ = len(np.unique(labels)) print("Estimated clusters:", n_clusters_) colors = 10*['r.','g.','b.','c.','k.','y.','m.'] for i in range(len(X)): plt.plot(X[i][0], X[i][1], colors[labels[i]], markersize = 3) plt.scatter(cluster_centers[:,0],cluster_centers[:,1], marker=".",color='k', s=20, linewidths = 5, zorder=10) plt.show() |
خروجی
1 2 3 4 |
[[ 2.98462798 9.9733794 10.02629344] [ 3.94758484 4.99122771 4.99349433] [ 3.00788996 3.03851268 2.99183033]] Estimated clusters: 3 |
مزایا و معایب خوشه بندی میانگین
مزایا:
موارد زیر برخی از مزایای الگوریتم خوشه بندی میانگین تغییر است –
- نیازی به فرض هیچ یک از مدلها مانند مخلوط K-means یا Gaussian نیست.
- همچنین می تواند خوشه های پیچیده ای را که شکل غیر محدب دارند ، مدل کند.
- فقط به یک پارامتر به نام پهنای باند نیاز دارد که به طور خودکار تعداد خوشه ها را تعیین کند.
- موضوعی در مورد حداقل های محلی مانند K-means وجود ندارد.
معایب
موارد زیر برخی از معایب الگوریتم خوشه بندی میانگین تغییر است –
- در مواردی که تعداد خوشه ها به طور ناگهانی تغییر می کند ، الگوریتم تغییر میانگین کارایی خوبی ندارد.
- ما هیچ کنترل مستقیمی بر تعداد خوشه ها نداریم اما در بعضی از برنامه ها به تعداد مشخصی از خوشه ها نیاز داریم.
- نمی تواند بین حالت های معنی دار و بی معنی تفاوت قائل شود.
لیست جلسات قبل آموزش یادگیری ماشین با پایتون
- آموزش یادگیری ماشین با پایتون
- مبانی یادگیری ماشین با پایتون
- آموزش اکوسیستم یادگیری ماشین با پایتون
- آموزش متدها در یادگیری ماشین با پایتون
- آموزش بارگیری داده ها برای پروژه های یادگیری ماشین
- آموزش درک داده ها با آمار در یادگیری ماشین
- آموزش آماده سازی داده ها در یادگیری ماشین با پایتون
- آموزش انتخاب ویژگی داده ها در یادگیری ماشین با پایتون
- آموزش طبقه بندی در یادگیری ماشین با پایتون
- آموزش رگرسیون لجستیک در یادگیری ماشین با پایتون
- آموزش ماشین بردار پشتیبان در یادگیری ماشین با پایتون
- آموزش درخت تصمیم در یادگیری ماشین با پایتون
- آموزش Naïve Bayes در یادگیری ماشین با پایتون
- آموزش جنگل تصادفی در یادگیری ماشین با پایتون
- آموزش الگوریتم های رگرسیون در یادگیری ماشین با پایتون
- آموزش الگوریتم های خوشه بندی در یادگیری ماشین با پایتون
- آموزش الگوریتم K-Means در یادگیری ماشین با پایتون
دیدگاه شما