ش | ی | د | س | چ | پ | ج |
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 |
سیستم پیشنهادی الگوریتم تئوری بیز در دادهکاوی
طبقهبندی کننده تئوری بیز و فیلتر کردن مشارکتی باهم یک سیستم پیشنهادی ایجاد میکنند که با استفاده از یادگیری ماشین و فنهای دادهکاوی اطلاعات نامشهود را فیلتر میکند و پیشبینی میکند آیا کاربر منبع خاصی را میخواهد یا نه.
مزایا و معایب تئوری بیزدر ادامه به مزایا و معایب تئوری بیز پرداخته میشود:
مزایا الگوریتم دستهبندی بیز ساده
مزایا الگوریتم دستهبندی بیز ساده پیشبینی کلاس مجموعه دادههای آزمون آسان و سریع است. همچنین با فرض استقلال ویژگیها در پیشبینیهای چندطبقهای عملکرد خوبی دارد یک طبقهبندی تئوری بیز در مقایسه با سایر مدلها مانند رگرسیون لجستیک عملکرد بهتری دارد و الگوریتم به دادههای آموزشی کمتری نیاز دارد. برای متغیر عددی توزیع نرمال فرض میشود (منحنی زنگوله که یک فرض قوی است).
معایب الگوریتم دستهبندی بیز ساده
معایب الگوریتم دستهبندی بیز ساده این الگوریتم در مورد مقادیر طبقهای بهتر از مقادیر عددی عمل میکند. همچنین، اگر یک متغیر دستهبندی در مجموعه دادههای آزمون، دستهای داشته باشد که در مجموعه دادههای آموزش وجود نداشته باشد، مدل به آن احتمال صفر میدهد و قادر به پیشبینی نخواهد بود. به این مسئله مشکل فرکانس صفر گفته میشود. محدودیت دیگر تئوری بیز فرض پیشبینیهای مستقل است. در زندگی واقعی غیرممکن است که مجموعهای از پیشبینی کنندهها را مستقل به دست آورد.
بیاثر کردن الگوریتم دستهبندی بیز ساده روشی است که توسط اسپمرهای ایمیل استفاده میشود تا سعی در کاهش کارایی فیلترهای هرزنامهها داشته باشد که از قانون Bayes استفاده میکنند. این روش با تبدیل کلماتی که قبلاً به کلمات اسپم در یک پایگاه داده بیزی شناخته میشدهاند به کلماتی که نشانه اسپم بودن را ندارد و یا افزودن کلماتی که احتمالاً در ایمیلهای غیر هرزنامه وجود دارد، این فیلتر را کم اثر کنند. آموزش مجدد فیلتر بهطور مؤثری از انواع حملات جلوگیری میکند. به همین دلیل است که از الگوریتم دستهبندی بیز ساده به همراه اکتشافات خاص مانند لیست سیاه همچنان برای شناسایی هرزنامه استفاده میشود.