ش | ی | د | س | چ | پ | ج |
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 |
در شکل پایین سلسهمراتب یادگیری ماشین به کمک یک نوع از عروسک های روسی (Russian matryoshka dolls) نمایش داده شده است. ادامه مطلب ...
نام سیستم دستهبند یادگیر کمی عجیب و غریب و گمراه کننده است زیرا الگوریتمهای یادگیری ماشینی بسیاری وجود دارد که دستهبندی را یاد میگیرند مانند درخت تصمیم یا ماشین بردار پشتیبانی اما سیستم دستهبند یادگیر نیستند. ادامه مطلب ...
الگوریتم Bucket Brigade برای حل مسئله تخصیص اعتبار استفاده میشود. این الگوریتم برای حل مسئله کمک می کند اصلاح قدرت دستهبندیها به چه مقدار باشد. با توجه به این الگوریتم:
· دستهبندیهایی که بر پیغام ورودی فعلی منطبق شود، برای انجام عمل مربوطه پیشنهاد میشود که پیشنهاد براساس تناسب قدرت آن می باشد.
· وقتی پاداشی از محیط دریافت میشود یا وقتی یک دوره[1] گذرانده میشود. ادامه مطلب ...
این سیستم با آشکارساز[1] محیط را حس و ورودی سیستم را دریافت و اثرگذار[2] با موتور عمل در ارتباط است. علاوه بر این محیط هر دفعه تقویت عددی را فراهم میکند که در اینجا پاداش نامیده میشود. در اوایل کار هالند ایده اصلی یک سیستم سنجش و یادگیر در یک محیط برای بدست آوردن پاداش ارائه شد.
[P] یا جمعیت شامل مجموعه دستهبندهای فعلی و از الفبای باینری به علاوه نماد # که نشان دهنده "بیتفاوت" می باشد ساخته شده است. پس از دریافت وضعیت محیط از آشکارساز شرط هر دسته بند با آن مقایسه میشود. اگر هر بیت به جز # از شرط دسته بندها در آشکارساز صدق کند، آن دسته بند به مجموعه نظیر یا تطبیق[3] [M] اضافه میشود.
ادامه مطلب ...مالتیپلکسر دستگاهی است که یکی از چند سیگنال دیجیتال یا آنالوگ ورودیهایش را انتخاب کرده و سپس آن ورودی انتخابشده را به یک خط خروجی هدایت میکند. تسهیمکنندهای با n به توان 2 ورودی، nخط انتخاب دارد که این خطوط انتخاب مشخص میکنند که کدام خط ورودی باید به خط خروجی هدایت شود. ادامه مطلب ...
یادگیری تقویتی یکی از گرایشهای یادگیری ماشینی است که از روانشناسی رفتارگرایی الهام میگیرد. این روش بر رفتارهایی تمرکز دارد که ماشین باید برای بیشینه کردن پاداشش انجام دهد. این مسئله، با توجه به گستردگیاش، درزمینههای گوناگونی بررسی میشود. مانند: نظریه بازیها، نظریه کنترل، تحقیق در عملیات، نظریه اطلاعات، سامانه چندعامله، هوش ازدحامی، آمار، الگوریتم ژنتیک، بهینهسازی بر مبنای شبیهسازی. در مبحث تحقیق در عملیات و در ادبیات کنترل، حوزهای که در آن روش یادگیری تقویتی مطالعه میشود برنامهنویسی تخمینی پویای خوانده میشود. این مسئله در تئوری کنترل بهینه نیز مطالعه شده است. البته دغدغه اصلی بیشتر مطالعات در این زمینه، اثبات وجود پاسخ بهینه و یافتن ویژگیهای آن است و به دنبال جزئیات یادگیری یا تخمین نیست. یادگیری تقویتی در اقتصاد و نظریه بازیها بیشتر به بررسی تعادلهای ایجادشده تحت عقلانیت محدود میپردازد.
ادامه مطلب ...