نام سیستم دستهبند یادگیر کمی عجیب و غریب و گمراه کننده است زیرا الگوریتمهای یادگیری ماشینی بسیاری وجود دارد که دستهبندی را یاد میگیرند مانند درخت تصمیم یا ماشین بردار پشتیبانی اما سیستم دستهبند یادگیر نیستند. اصطلاح کمی کلیتر که الگوریتمهای سیستم دستهبند یادگیر را بهتر نشان میدهد یادگیری ماشین مبتنی بر قاعده است. این اصطلاح شامل دو خانواده اصلی الگوریتمهای سیستم دستهبند یادگیر یعنی سبک میشیگان و سبک پیتسبورگ و همچنین سیستم یادگیری قانون و ایمنی مصنوعی است که الگوریتمهای سیستم دستهبند یادگیر نیستند. مفهوم سیستم دستهبند یادگیر توسط جان هالند در دهه 1970 درست و همان زمان توسعه یافت وی آنچه را که امروزه به عنوان الگوریتم ژنتیک شناخته میشود رواج داد. سیستمهای دستهبند یادگیر معمولاً دارای الگوریتم ژنتیک هستند و گاهی اوقات به طور کلی به عنوان یادگیری ماشین مبتنی بر ژنتیک شناخته میشوند. بسته به زمینه کاربرد سه اصطلاح سیستم دستهبند یادگیر، یادگیری ماشین مبتنی بر قاعده و یادگیری ماشین مبتنی بر ژنتیک را میتوان به جای یکدیگر استفاده کرد.
الگوریتمهای سیستم دستهبند یادگیر همه مؤلفه کشف که معمولاً توسط روشهای محاسبات تکاملی مانند الگوریتم ژنتیک هدایت میشوند و مؤلفه یادگیری که ترکیبی از دقت و پیگیری یا تخصیص اعتبار است را به منظور بهبود عملکرد از طریق اکتساب را ترکیب میکنند. تجربه درک اساسی محاسبه تکاملی میتواند پیش نیاز مفیدی برای سیستم دستهبند یادگیر باشد. به طور خلاصه محاسبه تکاملی زمینهای است که الگوریتمهای الهام گرفته از اصول تکامل داروینی را مطالعه میکند.
متمایزترین ویژگی سیستم دستهبند یادگیر و به طور کلی یادگیری ماشین مبتنی بر قاعده این است که "مدل" خروجی توسط سیستم مجموعهای از قوانین است که هر "پوشش" (مربوط به آنها) فقط زیر مجموعهای از ورودیهای ممکن است هر قانون عبارتی اگر: سپس را نشان میدهد که شرایط خاص وضعیت را با یک عمل یا کلاس پیوند میدهد.
به عنوان مثال اگر "قرمز" و "هشت ضلعی" سپس "علامت توقف" ممکن است قانونی برای دستهبندی انواع علائم راهنمایی و رانندگی باشد. توجه داشته باشید که این قانون یک مدل کامل را تشکیل نمیدهد بلکه فقط بخشی از مجموعه قوانین مشترک است که برای دستهبند دقیق و به طور کلی انواع علائم راه بر اساس ویژگیهای موجود مانند رنگ، شکل یا اندازه مورد نیاز است. این ویژگی به الگوریتمهای سیستم دستهبند یادگیر اجازه میدهد تا الگوی تقریباً فراگیر یادگیری ماشین را به چالش بکشند یعنی اینکه یک مدل "بهترین" واحد پیدا میشود.
در عوض الگوریتمهای سیستم دستهبند یادگیر یک "راه حل توزیع شده" یا "نقشهای" از فضای مسئله را نشان میدهند که توسط یک مجموعه قوانین نشان داده شده است که به طور ضمنی مشکلهای پیچیده را به قطعات سادهتری تقسیم میکند. این ویژگی دلیل اصلی این است که چرا الگوریتمهای سیستم دستهبند یادگیر میتوانند
(1) با انعطاف پذیری از دامنههای مسئله بسیار متفاوتی استفاده کنند
(2) با ورودی جدید سازگار شوند
(3) الگوهای پیچیده مانند تعاملات ویژگی غیر خطی و انجمنهای ناهمگن
(4) برای مشکلهای تک مرحلهای یا چند مرحلهای اعمال میشود
علاوه بر این الگوریتمهای سیستم دستهبند یادگیر مزایای زیر را دارند:
الگوریتمهای یادگیری ماشینی "جعبه سیاه" مانند شبکههای عصبی مصنوعی یا جنگلهای تصادفی آنها راه حلهایی تولید میکنند که به طور ضمنی چند هدفه هستند با فشارهای تکاملی حداکثر قوانین دقیق را تحریک میکنند و آنها شبیه گروه هستند.