IRE: Inductive Rule Extraction

IRE: Inductive Rule Extraction

استخراج قانون استقرائی
IRE: Inductive Rule Extraction

IRE: Inductive Rule Extraction

استخراج قانون استقرائی

مزایا و معایب یادگیری ماشین

میا و معایب یادگیری ماشین

مزایا یادگیری ماشین

۱- شناسایی راحت روندها و الگوها

یادگیری ماشین می‌تواند حجم زیادی از داده‌ها را بررسی کرده و روندها و الگوهای خاصی را که برای انسان‌ها ناشناخته است، کشف کند.  ادامه مطلب ...

الگوریتم‌های دسته‌بندی داده کاوی

الگوریتم‌های دسته بندی در مقابل الگوریتم‌های خوشه‌بندی

در خوشه‌بندی، ایده پیش‌بینی کلاس هدف مانند طبقه‌بندی نیست، بلکه بیش از هر زمان دیگری تلاش می‌شود تا با درنظرگرفتن رضایت‌بخش‌ترین شرایط، چیزهای مشابه را گروه‌بندی کنیم، همه عناصر یک گروه باید مشابه هم باشند و هیچ دو عنصر گروه  نباید تفاوتی باهم داشته باشند

ادامه مطلب ...

الگوریتم اپریوری (Apriori) و کاوش الگوهای مکرر

اغلب الگوریتم‌های یادگیری ماشین در داده‌کاوی با داده‌های عددی کار می‌کنند و در پیاده‌سازی و نحوه کار آن‌ها گرایش به ریاضیات محض وجود دارد. اما، «کاوش قواعد وابستگی» (association rule mining) که از آن با عنوان «کاوش قواعد وابستگی» نیز یاد می‌شود، برای داده‌های دسته‌ای مناسب و محاسبات آن نسبت به بسیاری از دیگر الگوریتم‌ها ساده‌تر است. این روش، یکی از راهکارهای مبتنی بر قواعد (rules)، برای کشف روابط جالب بین متغیرها در پایگاه داده‌های بزرگ محسوب می‌شود. در کاوش قواعد وابستگی، قواعد قوی با استفاده از سنجه جذابیت (interestingness) شناسایی می‌شوند.  ادامه مطلب ...

انبار داده چیست؟

در یک سازمان نرم‌افزارهای مختلفی قرار دارد که هر کدام داده‌هایی را تولید می‌کنند و در فرآیند هوش تجاری بایستی از آن‌ها جهت ایجاد ارزش استفاده کنیم اگر بخواهیم برای هر پرس و جو (Query) که به تحلیل ما کمک کند، به این نرم‌افزارها درخواستی دهیم، احتمالا وقت و زمان خود را هدر داده‌ایم. پس بهتر است داده‌ها را با توجه به موضوعی که می‌خواهیم تحلیل کنیم در یک مکان انبار کنیم. به این مکان انبار داده (Data Warehouse) می‌گویند.  ادامه مطلب ...

پیش پردازش داده‌‌ها

پیش پردازش داده‌‌ها، فرایندی فنی باهدف بهبود مجموعه‌داده‌ها برای قابل‌استفاده شدن آن‌هاست. این فرایند شامل تغییر و گاهی حذف داده‌های ناکامل (Incomplete)، دارای فرمت نادرست، نامربوط و تکراری (Duplicate) است.  ادامه مطلب ...

برازش

بیش برازش (Overfitting)، کم برازش (Underfitting) و برازش مناسب

حال که تفاوت بایاس و واریانس را فهمیدیم، لازم است با دو مفهوم بیش‌ برازش و کم‌ برازش آشنا شویم. پراکندگی (شکل بالا)، کم‌برازش (واریانس کم، بایاس بالا) در سمت چپ و بیش‌برازش (واریانس بالا، بایاس کم) در سمت راست نمایش‌داده‌شده است. 

ادامه مطلب ...