این نوشتار مبانی نظری و پیشینه تحقیق داده کاوی توزیع شده می باشد. در بخش اول چارچوب و مبانی نظری داده کاوی توزیع شده تشریح می شود و در بخش دوم پیشینه نظری تحقیق داده کاوی توزیع شده در پژوهش های داخلی و خارجی مورد بررسی قرار می گیرد.

 

 

 

 

 

مقدمه مبانی نظری داده کاوی توزیع شده

داده  کاوی توزيع شده عبارت است از کشف نيمه خودکار الگوهای پنهان موجود در داده ها، در حالتی که داده ها و يا مکانيزم‌های استنتاج، به صورت توزيع شده باشند. غيرمتمرکز بودن داده ها بدان معناست که داده‌ها به صورت توزيع شده بين دو يا چند سايت بوده و هزينه انتقال تمام يا بخشی از داده ها به يک سايت مرکزی، قابل صرف‌نظر نباشد. توزيع شده بودن مکانيزم‌های استنتاج، به معنای لزوم لحاظ کردن هزينه ارتباط بين مکانيزم‌های مختلف در حال استخراج دانش می‌باشد. اين توزیع‌شدگی ممکن است به دلايل مختلفی از جمله ارائه شدن مکانيزم استخراج دانش در قالب يک سرويس اينترنتی و يا صرفاً ناشی از توزیع‌شدگی داده ها باشد.

 

 

 

چنين رويکردی به داده کاوی، برخلاف جهت کلی تحقيقات انجام شده است که به طور عمده به تکنيک‌های متمرکز پرداخته و نه فقط بر تمرکز، که بر همگونی و ساختار مسطح (در مقابل ساختار رابطه ای) داده های هدف متکی می باشند. مسائلی نظير استخراج دانش در حالت عدم دسترسی به تمام داده های موجود، برقراری ارتباط موثر و بهينه با ساير مکانيزم‌های در حال استخراج دانش و نيز تبادل دانش يا اطلاعات ميانی به جای اطلاعات خام، فقط تعدادی از مسائل اوليه داده کاوی توزيع شده با توجه به تعريف آن می باشند. بنابراين، داده کاوی توزيع شده در عين حال که به عنوان راه حلی کليدی برای مشکلات اصلی پيش روی داده کاوی مطرح می باشد، خود سرمنشأ چالش‌ها و مسائل متعددی گرديده است؛ حل مؤثر اين مشکلات منجر به استفاده هرچه بيشتر از داده کاوی و ايجاد امکانات جديد و بهره برداری از پتانسيل‌های موجود در قلمروهائی خواهد شد که عليرغم نياز مبرم به داده کاوی، استفاده بسيار محدودی از آن به عمل می آورند. 

 

 

 

بحث داده کاوی توزيع شده به طور کلی از دو جهت قابل بررسی می باشد. اول حالتی که در آن داده ها به صورت همسان بين پايگاه‌های مختلف توزيع شده اند و داده های هر پايگاه تمام خصوصيات را دارا هستند. در این حالت داده ها ممکن است ذاتاً توزيع شده باشند و يا اينکه داده های متمرکز به دلایل امنيتی يا غیره بين پايگاه‌های مختلف تقسيم شده باشند. اصطلاحاً به اين حالت ، تقسيم شده به صورت افقی  نيز گفته می شود.[9] حالت دوم حالتی است که در آن داده های موجود در هر پايگاه داده دارای خصوصيت‌های مختلف می باشند. معمولاً در اين موارد داده ها خود بين پایگاه‌های مختلف تقسيم گرديده اند و ذاتاً توزيع شده نيستند.

 

 

از اينرو به این حالت تقسيم شده عمودی  نيز گفته می شود.[9] برای ايجاد ارتباط بين خصوصيت‌های مختلفی که در پايگاه‌های مختلف نگهداری می شوند اما متعلق به يک داده هستند، معمولاً يک خصوصيت مشترک که به عنوان شناسه مورد استفاده قرار می-گيرد، بين تمام پايگاه‌های مختلف نگهداری می شود که رکوردهای مختلف را بهم ارتباط می دهد. در داده کاوی توزيع شده نيز مسأله کشف و استخراج دانش مشابه داده کاوی عادی در زمينه های خوشه بندی توزيع شده، کشف قواعد وابستگی به صورت توزيع شده و طبقه بندی توزيع شده (که با نام يادگيری توزيع شده طبقه بند هم از آن نام برده می شود) مورد تحقيق و بررسی قرار می‌گیرد. ضمن اينکه در بحث داده کاوی توزيع شده، مسأله مربوط به محرمانگی داده ها  حتماً بايد مدنظر قرار گيرد. برای مطالعه بيشتر در مورد داده کاوی توزيع شده می توانيد به مرجع [9] مراجعه نماييد.

 

 

 

 

 

 

فهرست مطالب

مبانی نظری  در مورد داده کاوی توزیع شده

2-1- مقدمه    7
2-2- داده‌کاوی    7
2-2-1- خوشه‌بندی    8
2-2-1-1- روشهای تقسيمبندی    8
2-2-1-2- روشهای سلسله مراتبی    8
2-2-1-3- روشهای مبتنی بر چگالی    9
2-2-2- طبقه‌بندی    9
2-2-2-1- طبقه‌بندی مبتنی بر قواعد    10
2-2-3- کشف قواعد انجمنی    12
2-2-3-1- تعاریف و مفاهیم اصلی در قواعد انجمنی    12
2-2-3-1-1- تقسیم بندی قواعد انجمنی    14
2-2-3-1-2- استخراج قواعد تک‌سطحی تک بعدی دودویی    14
2-2-3-1-2-1- مرحله پیوست    16
2-2-3-1-2-2- مرحله هرس    17
2-2-3-1-3- محاسبه اطمینان و استخراج قواعد نهایی    17
2-3- داده‌کاوی توزيع شده    17
2-6-1- داده‌کاوی توزيع شده    33
2-6-2- کارهای مهم انجام شده در زمينه داده‌کاوی با استفاده از عامل    36
2-7- جمع‌بندی    

 

پیشینه تحقیق در مورد داده کاوی توزیع شده

 

منابع

 

 

 


توضیحات:
فصل دوم پایان نامه کارشناسی ارشد (پیشینه و مبانی نظری پژوهش)
 
همراه با منبع نویسی درون متنی به شیوه APA جهت استفاده فصل دو پایان نامه
 
توضیحات نظری کامل در مورد متغیر
 
پیشینه داخلی و خارجی در مورد متغیر مربوطه و متغیرهای مشابه
 
رفرنس نویسی و پاورقی دقیق و مناسب
 
منبع :    انگلیسی وفارسی دارد (به شیوه APA)
 
نوع فایل:     WORD و قابل ویرایش با فرمت doc