این نوشتار مبانی نظری و پیشینه تحقیق داده کاوی می باشد. در بخش اول چارچوب و مبانی نظری داده کاوی تشریح می شود و در بخش دوم پیشینه نظری تحقیق داده کاوی در پژوهش های داخلی و خارجی مورد بررسی قرار می گیرد.

 

 

 

مقدمه مبانی نظری داده کاوی

داده کاوی در اواخر دهه 1980 پديدار گشته، در دهه 1990 گام های بلندی در اين شاخه از علم برداشته شده و انتظار می رود در اين قرن به رشد و پيشرفت خود ادامه دهد ]23[. داده کاوی فرآيند یافتن الگوها و دانش مفید از داده می باشد، که اين دانش به صورت ضمنی در پايگاه داده های عظيم، انباره داده  و ديگر مخازن بزرگ اطلاعات، ذخيره شده است. 

 

 

تعاريف مختلفي از داده کاوي ارائه شده است که در اينجا به چند مورد از آنها اشاره مي شود:


1.    داده کاوی در حقیقت، کشف ساختارهای قابل توجه، غیرمنتظره و با ارزش از داخل مجموعه ی وسیعی از داده می باشد و فعالیتی است که اساسا با آمار و تحلیل دقیق داده ها منطبق است ( دیوید هند، 1998).


2.    داده کاوی عبارت است از فرآیند انتخاب، اکتشاف و مدل کردن مقادیر زیادی داده به منظور کشف نظم خاص یا ارتباط ویژه ای که قبلا ناشناخته بوده و حالا نتایج واضح و مفیدی را برای کاربر بانک اطلاعاتی به ارمغان می آورد ( بری و لینوف ، 1997)


3.    داده کاوی فرآیند خودکار کشف اطلاعات مفید از پایگاه داده های بزرگ می باشد. تکنیک های داده-کاوی برای یافتن الگوهای بدیع و مفید به کار می رود که در غیر اینصورت ناشناخته باقی خواهند ماند]24[.

 


واژه های داده کاوی و کشف دانش  در پایگاه داده اغلب به صورت مترادف یکدیگر مورد استفاده قرار می-گیرند. کشف دانش به عنوان يک فرآيند در شکل 2-7 نشان داده شده است. کشف دانش در پایگاه داده، فرآیند شناسایی درست، ساده، مفید، و نهایتا الگوها و مدل های قابل فهم در داده ها می باشد. بنابراین داده کاوی، مرحله ای از فرآیند کشف دانش بوده و شامل الگوریتم های مخصوص داده کاوی است، بطوریکه تحت محدودیت های مؤثر محاسباتی قابل قبول، الگوها و یا مدل ها را در داده کشف می کند ]25[.به عبارتی، داده کاوی گونه ای از تکنیک ها برای شناسایی اطلاعات و یا دانش تصمیم گیری از قطعات داده می باشد، به نحوی که با استخراج آن ها، در حوزه های تصمیم گیری، پیش بینی و تخمین مورد استفاده قرار گیرند. 


 

 

 

 


روش های داده کاوی

روش های داده کاوی را می توان به سه روش کلی تقسیم-بندی نمود.

 

 دسته بندی 
 دسته بندی یکی از متداول ترین روش های داده کاوی است و به ارزشیابی ویژگی های مجموعه ای از داده ها می پردازد و سپس آن ها را به مجموعه ای از گروه های از پیش تعریف شده اختصاص می دهد. در واقع این روش عبارت است از تطبیق بین یک فضای ویژگی و یک فضای برچسب، که ویژگی ها بیانگر خصوصیات عناصر برای دسته بندی و برچسب ها نشان دهنده کلاس ها است. یک مدل دسته بندی کننده می تواند برای پیش بینی برچسب کلاس رکوردهای جدید و ناشناخته استفاده شود. در حالت توصیفی نیز می تواند به عنوان ابزار بیانگری برای تمایز بین اشیاء کلاس های مختلف در نظر گرفته شود. این تکنیک اغلب مناسب برای پیش بینی یا توصیف مجموعه داده های باینری و اسمی  است ]24[. در مدل-سازی پیشگویانه اگر مجموعه مقادیر کلاس هدف گسسته  باشد، به آن دسته بندی و اگر مجموعه مقادیر کلاس هدف پیوسته  باشد به آن رگرسیون  می گویند. از کاربردهای دسته بندی، پیش بینی اقدام به خرید کاربران برخط در یک وب سایت تجارت الکترونیک و از کاربردهای رگرسیون پیش بینی قیمت های آتی سهام های مختلف، می باشد

 

 

 

 

 خوشه بندی 
 خوشه بندی تقسیم یک گروه ناهمگن به چندین زیرگروه یا خوشه همگن است. خوشه بندی به طور خودکار ویژگی های متمایز کننده خوشه ها را تعریف کرده و آن-ها را شکل می دهد، به طوریکه پایگاه داده را به چندین بخش تقسیم کرده و خوشه هایی از رکوردها را به وجود می آورد که نمایانگر یا صاحب صفات خاصی هستند. اعضای درون یک خوشه شباهت های زیادی به یکدیگر داشته ولی اعضای هر خوشه با اعضای موجود در خوشه-های دیگر شباهت کمتری را خواهند داشت. بهترین خوشه بندی زمانی اتفاق می افتد که بیشترین شباهت در داخل هر خوشه و کمترین شباهت بین خوشه ها باشد. کار خوشه بندی بسیار شبیه دسته بندی است. تفاوت آن ها در اینست که کلاس ها در دسته بندی از پیش تعریف و ساخته شده اند، اما در خوشه بندی، خوشه ها در حین تحلیل داده ها بدست می آیند. خوشه بندی داده ها می تواند بخشی / سلسله مراتبی، کاملا جدا / فازی ( هم پوشان ) و یا کامل / ناقص باشد. خوشه بندی کاربردهای فراوانی دارد، مانند تقسیم متن ها بر اساس موضوع ]24[ و تقسیم سرزمین ها بر اساس پوشش گیاهی.

 

 

 

 

 

 

 

 

 

فهرست مطالب

مبانی نظری  در مورد داده کاوی

2-7- داده کاوی    27
      2-7-1- اهداف داده کاوی      29
      2-7-2- روش های داده کاوی   30
   2-7-2-1- دسته بندی  30
   2-7-2-2- خوشه بندی 31
   2-7-2-3- تحلیل وابستگی           31
      2-7-3- فرآیند داده کاوی ( مدل CRISP-DM ) 32 

پیشینه تحقیق در مورد داده کاوی

 

منابع

 

 

 


توضیحات:
فصل دوم پایان نامه کارشناسی ارشد (پیشینه و مبانی نظری پژوهش)
 
همراه با منبع نویسی درون متنی به شیوه APA جهت استفاده فصل دو پایان نامه
 
توضیحات نظری کامل در مورد متغیر
 
پیشینه داخلی و خارجی در مورد متغیر مربوطه و متغیرهای مشابه
 
رفرنس نویسی و پاورقی دقیق و مناسب
 
منبع :    انگلیسی وفارسی دارد (به شیوه APA)
 
نوع فایل:     WORD و قابل ویرایش با فرمت doc