داده کاوی و روشهای آن

داده کاوی و روشهای آن

روشهای داده کاوی
انواع روشهای داده کاوی
روشهای مختلف داده کاوی
مقایسه روشهای داده کاوی
طبقه بندی روشهای داده کاوی
روش های داده کاوی چیست؟
تکنیک های داده کاوی
تکنیک های داده کاوی چیست
انواع تکنیک های داده کاوی
مقایسه تکنیک های داده کاوی
اصول و روش های داده کاوی

رفتن به سایت اصلی

دانلود تحقیق کامپیوتر

داده کاوی و روشهای آن

 

 

 

 

 

 

 

روشهای داده کاوی

 عمده روشهای داده کاوی عبارتند از روشهای توصیف داده ها، روشهای تجزیه و تحلیل وابستگی، روشهای دسته بندی و پیشگویی، روشهای خوشه بندی، روشهای تجزیه و تحلیل نویز. می توان روش های مختلف کاوش داده را در دو گروه روش های پیش بینی و روش های توصیفی طبقه بندی نمود. روش های پیش بینی در متون علمی به عنوان روش های با ناظر  نیزشناخته می شوند. روش های دسته بندی ، رگرسیون  و تشخیص انحراف  از روشهای یادگیری مدل در داده کاوی با ماهیت پیش بینی هستند.

 

 

در الگوریتم های دسته بندی مجموعه داده اولیه به دو مجموعه داده با عنوان مجموعه داده های آموزشی  و مجموعه داده های آزمایشی  تقسیم می شود که با استفاده از مجموعه داده های آموزشی مدل ساخته می شود و از مجموعه داده های آزمایشی برای اعتبار سنجی و محاسبه دقت مدل ساخته شده استفاده می شود. هررکورد شامل یک مجموعه ویژگی است. یکی از ویژگی ها، ویژگی دسته نامیده می شود و در مرحله آموزش براساس مقادیر سایر ویژگی ها برای مقادیر ویژگی دسته، مدل ساخته می شود. روشهای توصیفی الگوهای قابل توصیفی را پیدا میکنند که روابط حاکم بر داده ها را بدون در نظرگرفتن هرگونه برچسب و یا متغیرخروجی تبیین نمایند. درمتون علمی روشهای توصیفی با نام روشهای بدون ناظر   نیز شناخته می شوند ]صنیعی آباده 1391[. 
 

 

 

 

 

 

 

ابزارها و تکنیک های داده کاوی

 

با توجه به تنوع حجم و نوع داده ها، روش های آماری زیادی برای کشف قوانین نهفته در داده ها وجود دارند. این روش ها می توانند با ناظر یا بدون ناظر باشند. [Bolton & Hand 2002]  در روش های با ناظر، نمونه هایی از مواردخسارتی موجود است و مدلی ساخته می شود که براساس آن، خسارتی یا غیر خسارتی بودن نمونه های جدید مشخص می شود. این روش جهت تشخیص انواع خسارت هایی مناسب است که از قبل وجود داشته اند]فولادی نیا و همکاران 1392[ . روش های بدون ناظر، به دنبال کشف نمونه هایی هستند که کمترین شباهت را با نمونه های نرمال دارند. برای انجام فعالیت هایی که در هر فاز داده کاوی باید انجام شود از ابزارها و تکنیک های گوناگونی چون الگوریتمهای پایگاه داده، تکنیکهای هوش مصنوعی، روشهای آماری، ابزارهای گرافیک کامپیوتری و مصور سازی استفاده می شود. هر چند داده کاوی لزوما به حجم داده زیادی بعنوان ورودی نیاز ندارد ولی امکان دارد در یک فرآیند داده کاوی حجم داده زیادی وجود داشته باشد.

 

 

 در اینجاست که از تکنیک ها وابزارهای پایگاه داده ها مثل نرمالسازی، تشخیص و تصحیح خطا و تبدیل داده ها بخصوص در فازهای شناخت داده و آماده سازی داده استفاده می شود. همچنین تقریبا در اکثرفرآیند های داده کاوی از مفاهیم، روشها و تکنیک های آماری مثل روشهای میانگین گیری )ماهیانه، سالیانه و . . . (، روشهای محاسبه واریانس و انحراف معیار و تکنیک های محاسبه احتمال بهره برداری های فراوانی می شود. یکی دیگر از شاخه های علمی که به کمک داده کاوی آمده است هوش مصنوعی می باشد.هدف هوش مصنوعی هوشمند سازی رفتار ماشینها است. می توان گفت تکنیک های هوش مصنوعی بطور گسترده ای در فرآیند داده کاوی به کار می رود بطوریکه بعضی از آماردانها ابزارهای داده کاوی را بعنوان هوش آماری مصنوعی معرفی می کنند. 

 

قابلیت یادگیری بزرگترین فایده هوش مصنوعی است که بطور گسترده ای در داده کاوی استفاده می شود. تکنیک های هوش مصنوعی که در داده کاوی بسیار زیاد مورد استفاده قرار می گیرند عبارتند از شبکه های عصبی، روشهای تشخیص الگوی یادگیری ماشین و الگوریتمهای ژنتیک ونهایتا تکنیک ها و ابزارهای گرافیک کامپیوتری و مصور سازی که  بشدت در داده کاوی بکار گرفته می شوند و به کمک آنها می توان داده های چند بعدی را به گونه ای نمایش داد که تجزیه وتحلیل نتایج برای انسان براحتی امکان پذیر باشد [Gupta 2006]. 
 

 

 

 

 

 

فهرست مطالب

2-1    داده کاوی و یادگیری ماشین    5
2-2    ابزارها و تکنیک های داده کاوی    6
2-3    روشهای داده کاوی    7
2-3-1    روشهای توصیف داده ها    8
2-3-2    روشهای تجزیه و تحلیل وابستگی     8
2-3-3    روشهای دسته بندی و پیشگویی    8
2-3-4    درخت تصمیم    9
2-3-5-شبکه عصبی    10
2-3-6-  استدلال مبتنی بر حافظه    10
2-3-7-ماشین های بردار پشتیبانی    11
2-3-8-روشهای خوشه بندی     11
2-3-9-   روش K-Means    12
2-3-10-شبکه کوهنن    12
2-3-11-روش  دو گام    12
2-3-12-روشهای تجزیه و تحلیل نویز    13
2-4    دسته های نامتعادل]صنیعی آباده 1391[.    13
2-4-1    راهکار مبتنی بر معیار    13
2-4-2-راهکار مبتنی بر نمونه برداری    14
 

منابع

 

 

 

 

 

  • اثرات فساد اداری بر نرخ تورم در کشورهای منطقه خاورمیانه و شمال آفریقا

    اثرات فساد اداری بر نرخ تورم در کشورهای منطقه خاورمیانه و شمال آفریقا مقاله درباره فساد اداری عوامل موثر بر فساد اداری بررسی تأثیر فساد اداری بر نرخ تورم بررسی رابطه نرخ تورم و فساد اداری بررسی تأثیر شاخص ادراک…

  • پیش بینی اثرات زیست محیطی احداث سد

    پیش بینی اثرات زیست محیطی احداث سد اثرات زیست محیطی احداث سد اثرات محیط زیستی احداث سد آسیبهای زیست محیطی سد تاثیر سد سازی بر محیط زیست اثرات ساخت سد بر محیط زیست قانون ارزیابی اثرات زیست محیطی پروژه های…

  • پاورپوینت آشنایی با آبنما در فرهنگ ایرانی

    پاورپوینت آشنایی با آبنما در فرهنگ ایرانی پاورپوینت آشنایی با آبنما در فرهنگ ایرانی پاورپوینت آبنما در فرهنگ ایرانی تحقیق آبنما در فرهنگ ایرانی آبنما آبنما در فرهنگ ایرانی آبنماهای مدرن آب و انعکاس آب و تاثیر آن در کاهش…

  • بررسی کیفیت آب دریاچه سد کرخه با استفاده از شاخص های کیفی آب (W.Q.I) و سامانه GIS

    بررسی کیفیت آب دریاچه سد کرخه با استفاده از شاخص های کیفی آب (W.Q.I) و سامانه GIS سد کرخه پهنه بندی سامانه GIS شاخص کیفیت آب دانلود مقاله بررسی کیفیت آب دریاچه سد کرخه با استفاده از شاخص های کیفی…

  • تحلیل اصلاحات قانونی ماده 1330 ق.م. و شرایط و محدوده اعمال آن

    تحلیل اصلاحات قانونی ماده 1330 ق.م. و شرایط و محدوده اعمال آن تحلیل اصلاحات قانونی ماده 1130 ق م محدوده اعمال ماده 1330 ق م شرایط اعمال ماده 1330 ق م پایان نامه عسر و حرج پایان نامه عسر و…

  • چارچوب نظری و پیشینه پژوهش رابطه فرهنگ سازمانی و مدیریت مشارکتی

    چارچوب نظری و پیشینه پژوهش رابطه فرهنگ سازمانی و مدیریت مشارکتی مبانی نظری فرهنگ سازمانی دانلود مبانی نظری فرهنگ سازمانی پیشینه تحقیق فرهنگ سازمانی مبانی نظری مدیریت مشارکتی دانلود مبانی نظری مدیریت مشارکتی پیشینه تحقیق مدیریت مشارکتی رفتن به سایت…

  • مدل پذیرش فناوری tam در صنعت بانکداری و اصلاح آن با توجه به شرایط ایران

    مدل پذیرش فناوری tam در صنعت بانکداری و اصلاح آن با توجه به شرایط ایران مدل های پذیرش فناوری اطلاعات انواع مدل های پذیرش فناوری مدل پذیرش تکنولوژی tam2 مدلهاي پذيرش تكنولوژي وكاربرد آنها در انتقال فناوري تعریف پذیرش تکنولوژی…

  • بررسی تطبیقی اثرات سطوح مختلف زئولیت و اسید هیومیک در رشد و جذب کادمیم به وسیله گندم

    بررسی تطبیقی اثرات سطوح مختلف زئولیت و اسید هیومیک در رشد و جذب کادمیم به وسیله گندم جذب کادمیم توسط گندم رشد کادمیم توسط گندم اثر اسید هیومیک و زئولیت بر جذب کادمیم تاثیر سطوح مختلف اسید هیومیک در رشد…

  • پرپوزال امکان سنجی پیاده سازی بودجه بندی عملیاتی در موسسات آموزش عالی

    پرپوزال امکان سنجی پیاده سازی بودجه بندی عملیاتی در موسسات آموزش عالی بودجه ریزی عملیاتی اجرای بودجه ریزی عملیاتی در دانشگاه امکان سنجی طراحی بودجه ریزی عملیاتی امکان سنجی استقرار بودجه ریزی عملیاتی امکان سنجی پیاده سازی بودجه ریزی عملیاتی…

  • پایان نامه کارشناسی رشته شیمی با عنوان محاسبات تحقیقی رفتار لختگی در مایع سازی گاز بسترها

    پایان نامه کارشناسی رشته شیمی با عنوان محاسبات تحقیقی رفتار لختگی در مایع سازی گاز بسترها دانلود پایان نامه کارشناسی رشته شیمی با عنوان محاسبات تحقیقی رفتار لختگی در مایع سازی گاز بسترها روشهای کنترل لختگی، مدل و تنظیمات کنترل…