اتوماتای یادگیر تصادفی و الگوریتمهای یادگیر

اتوماتای یادگیر تصادفی و الگوریتمهای یادگیر

آتاماتای یادگیر
یادگیری ماشین
یادگیری تقویتی
سیستمهای یادگیر
اتوماتای یادگیر تصادفی
الگوریتمهای یادگیر
اتوماتای یادگیر تصادفی و الگوریتمهای یادگیر
دانلود پروژه نرم افزار
دانلود پروژه کامپیوتر

رفتن به سایت اصلی

دانلود پروژه مطالعاتی درس یادگیری ماشین رشته مهندسی نرم افزار

اتوماتای یادگیر تصادفی و الگوریتمهای یادگیر

 

مقدمه

فرآیند یادگیری موجودات زنده یكی از موضوعات تحقیقاتی جدید بشمار می‌آید. این تحقیقات به دو دسته كلی تقسیم می‌شوند. دسته نخست به شناخت اصول یادگیری موجودات زنده و مراحل آن می‌پردازند و دسته دوم بدنبال ارائه یك متدولوژی برای قرار دادن این اصول در یك ماشین می‌باشند. یادگیری بصورت تغییرات ایجادشده در كارایی یك سیستم بر اساس تجربه‌های گذشته تعریف می‌شود. یك ویژگی مهم سیستمهای یادگیر، توانایی بهبود كارایی خود با گذشت زمان است. به بیان ریاضی می‌توان اینطور عنوان كرد كه هدف یك سیستم یادگیر بهینه‌سازی وظیفه‌ای است كه كاملا شناخته شده نیست. بنابراین یك رویكرد به این مساله، كاهش اهداف سیستم یادگیر به یك مساله بهینه‌سازی است كه بر روی مجموعه‌ای از پارامترها تعریف می‌شود و هدف آن پیدا كردن مجموعه پارامترهای بهینه می‌باشد. 

 

در بسیاری از مسائل مطرح شده، اطلاعی از پاسخهای صحیح مساله ( كه یادگیری با نظارت  به آنها نیاز دارد) در دست نیست. بهمین علت استفاده از یك روش یادگیری بنام یادگیری تقویتی مورد توجه قرار گرفته است. یادگیری تقویتی نه زیر مجموعه شبكه‌های عصبی است و نه انتخابی بجای آنها محسوب می‌شود. بلكه رویكردی متعامد برای حل مسائل متفاوت و مشكلتر بشمار می‌رود. یادگیری تقویتی، از تركیب برنامه‌نویسی پویا و یادگیری نظارتی برای دستیابی به یك سیستم قدرتمند یادگیری ماشین استفاده می‌كند. در یادگیری تقویتی هدفی برای عامل یادگیر مشخص می‌شود تا به آن دست یابد. آنگاه عامل مذكور یاد می‌گیرد كه چگونه با آزمایشهای صحیح و خطا با محیط خود، به هدف تعیین شده برسد. 

 

در یادگیری تقویتی یك عامل یادگیرنده در طی یادگیری با فعل و انفعالات  مكرر با محیط، به یك سیاست كنترل بهینه می‌رسد. كارایی این فعل و انفعالات با محیط بوسیله بیشینه‌(كمینه) بودن پاداش (جریمه) عددی كه از محیط گرفته می‌شود، ارزیابی می‌گردد. علاوه بر این در روش‌های یادگیری تقویتی، اولا استفاده از یادگیری روش ساده، سیستماتیك و واقعی برای رسیدن به یك جواب تقریبا بهینه را بیان می‌كند.(پیدا كردن این جواب بهینه با استفاده از روشهای سنتی بسیار مشكل است.) ثانیا، دانشی كه در طی فرایند یادگیری بدست می‌آید، در یك مكانیزم نمایش دانش مانند شبكه عصبی یا جدول مراجعه ذخیره می‌شود كه از طریق آن می‌توان با محاسبات اندك و با كارایی بالایی عمل تخصیص كانال را انجام داد. ثالثا، از آنجاییكه این روش یادگیری در محیطی بلادرنگ در حال انجام است، می‌توان آنرا همزمان با فعالیت محیط (مانند شبكه سلولی) انجام داد. كه در این حالت با تمام رخدادهای پیش‌بینی نشده بصورت یك تجربه جدید برخورد می‌شود كه می‌توان از آنها برای بهبود كیفیت یادگیری استفاده كرد.

 

مزیت اصلی یادگیری تقویتی نسبت به سایر روشهای یادگیری عدم نیاز به هیچگونه اطلاعاتی از محیط (بجز سیگنال تقویتی) است. یكی از روشهای یادگیری تقویتی، اتوماتای یادگیر تصادفی است. اتوماتای تصادفی بدون هیچگونه اطلاعاتی درباره اقدام بهینه (یعنی با در نظر گرفتن احتمال یكسان برای تمامی اقدامهای خود در آغاز كار) سعی در یافتن پاسخ مساله دارد. یك اقدام اتوماتا بصورت تصادفی انتخاب می‌شود، در محیط اِعمال می‌گردد. سپس پاسخ محیط دریافت شده و احتمال اقدامها بر طبق الگوریتم یادگیری بِروز می‌شوند و روال فوق تكرار می‌گردد. اتوماتای تصادفی كه بصورت فوق در جهت افزایش كارایی خود عمل كند، یك اتوماتای یادگیر تصادفی گفته می‌شود. در ادامه این مقاله به معرفی اتوماتای یادگیر تصادفی پرداخته می شود.

 

 

 

کلمات کلیدی:

آتاماتای یادگیر

یادگیری ماشین

یادگیری تقویتی

سیستمهای یادگیر

 

 

 

 

فهرست مطالب

1. مقدمه 3

1.1. تاریخچه اتوماتای یادگیر 5

2. اتوماتای یادگیر 6

2.1. اتوماتای تصادفی 7

2.2. محیط 8

2.3. معیار‌های رفتار اتوماتای یادگیر 10

2.4. الگوریتمهای یادگیر 12

2.4.1. الگوریتمهای یادگیر استاندارد 12

2.4.2. الگوریتمهای یادگیری مدل-S 14

2.5. اتوماتای یادگیر با اقدامهای متغیر 16

2.6. اتوماتای یادگیر توزیع شده 17

3. اتوماتای یادگیر واكنشی 18

3.1. اتوماتای یادگیر واكنشی توزیع شده 20

4. کوتاهترین مسیر در گراف های تصادفی با اتوماتای یادگیر توزیع شده 21

5. حل مساله فروشنده دوره‌گرد احتمالی با اتوماتای یادگیر توزیع شده 24

5.1. تابع هدف مساله فروشنده دوره‌گرد احتمالی 24

5.2. الگوریتم پیشنهادی[4] 27

6. مراجع 36

 

 

  • چالش های اقتصادی موجود در بخش نفت

    چالش های اقتصادی موجود در بخش نفت دانلود مقاله رشته نفت و اقتصاد با عنوان چالش های اقتصادی موجود در بخش نفت افزایش مالیات بر نفت در کشورهای صنعتی جهان راههای کاهش زیانهای ناشی از تحولات اخیر بازار نفت و…

  • فمینیسم و جرم‌شناسی

    فمینیسم و جرم‌شناسی فمینیسم جرم شناسی بزهكاری زنان بزه دیدگی زنان سیاست‌ جنایی افتراقی تأثیر فمینیسم بر حقوق زنان فمینیسم و سیاست جنایی افتراقی انواع جرم شناسی فمینیستی پیشینه فمینیسم در جرم شناسی انجام پایان نامه خرید پایان نامه همکاری…

  • بررسی رفتار غیرخطی دیوار برشی بتنی دارای بازشو به روش طراحی بر اساس سطح عملکرد

    بررسی رفتار غیرخطی دیوار برشی بتنی دارای بازشو به روش طراحی بر اساس سطح عملکرد تیر کوپله دیوار کوپله دانلود مقاله دیوار برشی دارای بازشو طراحی بر اساس سطح عملکرد دانلود مقالات کارشناسی ارشد عمران سازه دانلود مقاله بررسی رفتار…

  • پاورپوینت بررسی علم مقاومت مصالح

    پاورپوینت بررسی علم مقاومت مصالح پاورپوینت بررسی علم مقاومت مصالح علم مقاومت مصالح تحقیق علم مقاومت مصالح پروژه علم مقاومت مصالح تعریف تنش انواع بارها انواع تکیه گاه ها عکس العمل تکیه گاه ها اصول برش در علم مقاومت مصالح…

  • بررسی اثر ویسکوزیته یک مایع در یک کانال و تعامل بین مایع و ساختار

    بررسی اثر ویسکوزیته یک مایع در یک کانال و تعامل بین مایع و ساختار عدد نودسن ویسکوزیته تعامل ساختار مایع نانو لوله های کربنی سرعت جریان بحرانی مدل ساختار مایع تعاملی تئوری نظریه زنجیره وابسته به حجم دانلود مقاله کارشناسی…

  • ارزیابی عملکرد 360 درجه مدیران

    ارزیابی عملکرد 360 درجه مدیران معایب ارزیابی 360 درجه شاخص های ارزیابی عملکرد 360 درجه ارزيابي عملكرد 360 درجه مدیران مشکلات بکارگیری ارزیابی 360 درجه مراحل فرآیند بازخورد 360 درجه روشهای ارزیابی در بازخورد 360 درجه پایان نامه ارزیابی عملکرد…

  • مبانی نظری و پیشینه تحقیق سبک های فرزندپروری

    مبانی نظری و پیشینه تحقیق سبک های فرزندپروری مبانی نظری سبک های فرزندپروری دانلود مبانی نظری سبک های فرزندپروری پیشینه تحقیق سبک های فرزندپروری ادبیات نظری سبک های فرزندپروری فصل دوم پایان نامه سبک های فرزندپروری مبانی نظری و پیشینه…

  • ارزیابی شیوع افسردگی در بین جانبازان

    ارزیابی شیوع افسردگی در بین جانبازان افسردگی جانبازان افسردگی جانبازان خفیف افسردگی جانبازان شدید مقایسه میزان افسردگی جانبازان خفیف و شدید ارزیابی شیوع افسردگی در بین جانبازان دانلود پایان نامه افسردگی جانبازان دانلود پایان نامه روانشناسی دانلود پایان نامه رشته…

  • ارزیابی اثرات زیست محیطی؛اثرات،قوانین،مشکلات و راهکارها

    ارزیابی اثرات زیست محیطی؛اثرات،قوانین،مشکلات و راهکارها اثرات زیست محیطی ارزیابی اثرات زیست محیطی ارزیابی محیط زیستی در ایران اهداف ارزیابی زیست محیطی مشکلات ارزیابی زیست محیطی قوانین ارزیابی زیست محیطی اثرات ارزیابی زیست محیطی رفتن به سایت اصلی دانلود مقاله…

  • ارزیابی عملکرد شعب منتخب بانک کشاورزی با DEA

    ارزیابی عملکرد شعب منتخب بانک کشاورزی با DEA ارزیابی عملکرد با DEA ارزیابی عملکرد در بانک ارزیابی عملکرد با استفاده از تحلیل پوششی داده ها شاخص های ارزیابی عملکرد بانکها شاخص های ارزیابی عملکرد شعب بانک پایان نامه ارزیابی عملکرد…