دانلود پایان نامه رشته کامپیوتر

روشها و الگوریتمهای خوشه بندی و خوشه بندی فازی

 
 
چکیده:
امروزه خوشه‌بندی به عنوان یک روش یادگیری بدون ناظر در کاربردهای بسیاری توانسته است ارزش خود را نشان دهد. در این مجموعه سعی شده تا حد امکان مطالب پایه‌ایِ خوشه‌بندی و مسائل مربوط به آن بیان شود. همچنین سعی شده است تا چندین روش و تکنیک مختلف و رایجِ خوشه بندی تشریح شود و ویژگی‌های هر یک بیان گردد. برای ارزیابی، سنجش و اعتبارسنجی خوشه‌های تولید شده که خود یکی از مسائل مهم و قابل گسترش در باب خوشه‌بندی است.
 
 
خوشه بندی یکی از شاخه های یادگیری بدون نظارت می باشد و فرآیند خودکاری است که در طی آن، نمونه ها به دسته هایی که اعضای آن مشابه یکدیگر می با شند تقسیم می شوند که به این دسته ها خوشه  گفته می شود. بنابراین خوشه مجموعه ای از اشیاء می باشد که در آن اشیاء با یکدیگر مشابه بوده و با اشیاء موجود در خوشه های دیگر غیر مشابه می باشند. برای مشابه بودن می توان معیارهای مختلفی را در نظر گرفت مثلا می توان معیار فاصله را برای خوشه بندی مورد استفاده قرار داد و اشیائی را که به یکدیگر نزدیکتر هستند را بعنوان یک خوشه در نظر گرفت که به این نوع خوشه بندی، خوشه بندی مبتنی بر فاصله  نیز گفته می شود.
 
 
 
کلمات کلیدی:

خوشه بندی

خوشه بندی فازی

روشهای خوشه بندی

الگوریتمهای خوشه بندی فازی

 
 
مقدمه:
برای درک بهترخوشه بندی فازی و الگوریتمهای مختلف آن لازم است تا ابتدا با مفهوم مجموعه های فازی و تفاوت آنها با مجموعه های کلاسیک آشنا شویم. در مجموعه های کلاسیک یک عضو از مجموعه مرجع یا عضوی از مجموعه A است یا عضو مجموعه A نیست. مثلا مجموعه مرجع اعداد حقیقی را در نظر بگیرید. عدد 2.5 عضو مجموعه اعداد صحیح نمی باشد حال آنکه عدد 2 عضو این مجموعه است. به زبان دیگر تعلق عدد 2.5 به مجموعه اعداد صحیح 0 است و تعلق عدد 2 به این مجموعه 1 است. در واقع می توان برای هر مجموعه یک تابع تعلق تعریف کرد که مقدار این تابع تعلق برای اعضای مجموعه  1 می باشد و برای بقیه 0. در مجموعه های کلاسیک مقدار این تابع تعلق یا 0 است یا 1.
 
 حال مجموعه انسان های جوان و پیر را در نظر بگیرید. سوالی که در اینجا مطرح می شود این است که آیا فردی با سن 25 جزء این مجموعه است یا خیر؟ سن 30 چطور؟ 35؟ همانطور که حدس زدید نمی توان بطور قطع و یقین مرزی برای انسان های جوان و پیر در نظر گرفت. دلیل آن هم این است که اگر فرضا 35 جوان محسوب شود 36 نیز می تواند جوان باشد و همینطور 37 و 38 و غیره . در واقع در اینجا با مفهوم عدم قطعیت  مواجه هستیم. ما خودمان نیز از عدم قطعیت در زندگی روزمره بارها استفاده کرده ایم مثلا هوای سرد، آب داغ و غیره. در واقع تمامی مثالهای بالا مثالهایی از مجموعه های فازی می باشند. تفاوت اصلی مجموعه های فازی و مجموعه های کلاسیک در این است که تابع تعلق مجموعه های فازی دو مقداری نیست (0 یا 1) بلکه می تواند هر مقداری بین 0 تا 1 را اختیار کند.
 
 حال مجموعه انسانهای جوان و پیر را در نظر بگیرید اگر 25 سال را سن جوانی در نظر بگیریم می توانیم به 25 تعلق 1 بدهیم و مثلا به 30 تعلق 0.8 و به 35 تعلق 0.75 و به 90 تعلق 0.1 را بدهیم. اگر اعضای یک مجموعه فازی تنها دارای تابع تعلق 0 و 1 باشند این مجموعه فازی یک مجموعه کلاسیک خواهد بود. نکته جالب توجه این است که مثلا سن 50 می تواند با تعلق 0.5 عضو مجموعه جوان باشد و با تعلق 0.5 عضو مجموعه پیر یعنی یک عضو مجموعه مرجع می تواند با درجه های تعلق مختلف عضو مجموعه های فازی تعریف شده روی مجموعه مرجع باشد.
 
 
 
فهرست مطالب

فصل اول:خوشه بندی

مقدمه‌ای بر خوشه‌بندی
خوشه‌بندی در مقابل طبقه‌‌بندی

یادگیری با نظارت در مقابل یادگیری بدون نظارت

کاربردها

مسائل درگیر با روش‌های خوشه‌بندی

خوشه‌بندی در مقابل چندی ‌سازی برداری

روش‌های خوشه‌بندی
روشهای خوشه‌بندی سلسله مراتبی
خوشه‌بندی با روش Single-Link
خوشه‌بندی با روش Complete-Link
خوشه‌بندی با روش Average-Link
دیگر روشهای خوشه بندی سلسله مراتبی

الگوریتم خوشه‌بندی پایین به بالای عمومی

روش خوشه‌بندی K-Means
خوشه‌بندی بر اساس چگالی

بررسی روشهای اعتبارسنجی خوشه‌ها

 

فصل دوم:خوشه بندی فازی

خوشه بندی چیست؟ 
شکل 1: خوشه بندی نمونه های ورودی 
شکل 2: خوشه بندی وسایل نقلیه 
هدف از خوشه بندی چیست؟ 

خوشه بندی فازی چیست؟ 

شکل 3: مجموعه داده پروانه ای 
شکل 4: خوشه بندی فازی داده 
الگوریتم خوشه بندی c میانگین: 
شکل 5 : توزیع یک بعدی نمونه ها 
شکل 6: خوشه بندی کلاسیک نمونه های ورودی 
شکل 7: خوشه بندی فازی نمونه ها 
جدول 1: معیارهای تشابه بر اساس توابع فاصله مختلف 
الگوریتم خوشه بندی c  میانگین برای داده های نویزی: 
الگوریتم خوشه بندی c میانگین با استفاده از نمونه های برچسب گذاری شده: 
الگوریتم خوشه بندی c میانگین مبتنی بر آنتروپی: 
الگوریتم خوشه بندی c میانگین مبتنی بر آنتروپی برای داده های نویزی: 
الگوریتم خوشه بندی c میانگین با استفاده از یادگیری وزن ویژگی ها: 
معیارهای کارایی: 
تابع ارزیابی ضریب افراز 
تابع ارزیابی آنتروپی افراز 
تابع Fukuyama and Sugeno 
تابع Xie and Beni 
تابع N.Zahid 
تابع M.Ramze Rezaee 
مراجع: