ش | ی | د | س | چ | پ | ج |
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
یکی از پرکاربردترین الگوریتمها در بین الگوریتمهای دادهکاوی است. درخت تصمیم دقیقاً مانند یک درخت است با این تفاوت که از ریشه به سمت پایین (برگ) رشد کرده است.
در الگوریتم درخت تصمیم نمونهها را دستهبندی میکنیم که درواقع دستهها در انتهای گرههای برگ قرار دارد. درخت تصمیم در مسائلی کاربرد دارد که بتوان آنها را به صورتی مطرح نمود که پاسخ واحدی بهصورت نام یک دسته یا کلاس ارائه دهند.روش طراحی درخت تصمیم
در ابتدا باید موضوع اصلی که میخواهید برای آن تصمیمگیری کنید را مشخص کنید. بعدازآن ایدههایتان را برای تصمیمگیری بر روی کاغذ بیاورید و متغیرهایی که به تصمیم شما وابستهاند را مشخص کنید. جهت فعالیت چه متغیرهایی برای شما اهمیت دارد؟ سپس آنها را به ترتیب اولویت مرتب کنید.
روشهای ساخت درخت تصمیم معمولاً بهصورت بالا به پایین عمل میکنند به این معنی که ابتدا فضای ورودی به فضاهای کوچکتر تقسیم میشود، سپس فرآیند تقسیمبندی برای هر یک از این قسمتها تکرار میشود؛ بهعبارتدیگر در هنگام ساخت درخت، ابتدا ریشه ساخته میشود، سپس هر یک از زیرشاخهها به شاخههای دیگری تقسیم میشود و این فرآیند تکرار میشود.
درخت تصمیم چگونه کار میکند؟
کسانی که بازی بیستسؤالی انجام دادهاند بهسادگی میتوانند درخت تصمیمگیری را درک کنند. در این بازی یک نفر موضوع خاصی را در ذهن خود در نظر میگیرد و شخص دیگری سعی میکند با پرسش تعدادی سؤال که جواب آنها بلی و خیر است موضوع موردنظر شخص اول را شناسایی کند. در درخت تصمیم نیز تعدادی پرسش وجود دارد و با مشخص شدن پاسخ هر سؤال یک سؤال دیگر پرسیده میشود. اگر سؤالها درست و سنجیده پرسیده شوند، تعداد کمی از پرسشها برای پیشبینی رکورد جدید کافی هست.
عملکرد درخت تصمیم به این صورت است که یک گره ریشه در بالای آن قرار دارد و برگهای آن در پایین میباشند. یک رکورد در گره ریشه وارد میشود و در این گره یک تست صورت میگیرد تا معلوم شود که این رکورد به کدامیک از گرههای فرزند (شاخه پایینتر) خواهد رفت.
درخت تصمیم از تعدادی گره و شاخه تشکیلشده است که در آن نمونهها را به نحوی طبقهبندی میکند که از ریشه به سمت پایین رشد میکند و درنهایت به گرههای برگم میرسد. هر گره داخلی یا غیر برگ با یک ویژگی مشخص میشود. این ویژگی سؤالی را در رابطه با مثال ورودی مطرح میکند. در هر گره داخلی به تعداد جوابهای ممکن با این سؤال شاخه وجود دارد که هریک با مقدار آن جواب مشخص میشوند. برگهای این درخت با یک کلاس و یا یک طبقه از جوابها مشخص میشوند.
برخی از الگوریتمهای درخت تصمیم
الگوریتمهای زیادی برای ساخت درخت تصمیم وجود دارند که از آن جمله میتوان به:
ID3:Iterative Dichotomiser
C4.5: Classifier 4.5
CART: Classification And Regression Tree
ID4
ds CART: DempsterShafer Classification And Regression Tree
ID5R
EC4.5:Efficient Classifier 4.5
CHAID: Chi square Automatic Interaction Detection
RF: Random Forest
RT: Random Tree
DS: Decision Stump
QUEST: Quick Unbiased Efficient Statistical Tree
روش کارآمدی به نظر میاد.
حتما ازش استفاده میکنم
ممنون از شما