-
بایاس و واریانس
جمعه 11 آذرماه سال 1401 13:34
بایاس (Bias) به فاصله بین مقدار پیشبینی شده با مقدار واقعی اشاره دارد. در حالتی که بایاس زیاد است، به احتمال زیاد، پیشبینیها در یک مسیر دور از مقادیر واقعی، تغییر جهت داده است . واریانس (Variance) توصیف میکند که مقادیر پیشبینی شده چه میزان پراکنده هستند. تفاوت بایاس و واریانس با تحلیل تصویر زیر بهتر درک خواهند...
-
الگوریتم خوشهبندی 7
جمعه 11 آذرماه سال 1401 13:17
الگوریتم KNN سادهترین روش خوشه بندی در یادگیری ماشین، الگوریتم KNN یا k نزدیکترین همسایه (k-NN: k-nearest neighbors) است؛ یک روش یادگیری بانظارت که برای دستهبندی نقاط داده جدید بر اساس نزدیکی با نقاط داده فعلی، استفاده میشود . الگوریتم KNN شبیه به یک سیستم رأیگیری است. این الگوریتم را شبیه به یک بچه تازهوارد به...
-
نحوه کار الگوریتم K-Means
جمعه 11 آذرماه سال 1401 13:13
خوشه بندی k-means چگونه نقاط داده را جدا میکند؟ قدم اول بررسی داده خوشه بندی نشده (Unclustered) بر روی نمودار پراکندگی و انتخاب دستی نقاط مرکزی (Centroids) برای هرکدام از خوشهها است که در ادامه این نقاط مرکزی برای هر خوشه یک epicenter ایجاد میکنند. در ابتدا میتوان نقاط مرکزی را تصادفی انتخاب کرد که به آن معنی...
-
الگوریتم خوشهبندی 6
جمعه 11 آذرماه سال 1401 13:00
الگوریتم Hierarchical الگوریتمهای خوشهبندی سلسله مراتبی (Hierarchical) در 2 دسته: از بالا به پایین یا پایین به بالا قرار میگیرند. الگوریتمهای پایین به بالا هر نقطه داده را در ابتدا به عنوان یک خوشه واحد در نظر میگیرند و سپس به طور پی در پی جفت خوشهها را ادغام میکنند (یا جمع می شوند) تا زمانی که همه خوشهها در...
-
الگوریتم خوشهبندی 5
جمعه 11 آذرماه سال 1401 12:59
الگوریتم خو شهبندی فازی یک الگوریتم خوشهبندی جهت تقسیم دادهها به خوشههایی بیش از یک خوشه است. در این خوشهبندی هر داده به درجه خاصی از هر خوشه متعلق است و با توجه به درجه تعلق حضور یک داده به یک خوشه مشخص میگردد. خوشهبندی فازی سی-مینز (FCM) توسط جی سی دانز در سال ۱۹۷۳ آماده شدو در سال ۱۹۸۱ ارتقا داده شد. در...
-
الگوریتم خوشهبندی 4
جمعه 11 آذرماه سال 1401 12:33
خوشهبندی Expectation–Maximization EM با استفاده ازمدل GMM Gaussian Mixture Models یکی از اشکالات عمده الگوریتم K-Means استفاده ساده از مقدار متوسط برای مرکز خوشه است. با دیدن تصویر زیر میفهمیم که چرا این بهترین روش برای انجام کارها نیست. در سمت چپ برای چشم انسان کاملاً واضح به نظر میرسد که دو خوشه دایرهای با شعاع...
-
الگوریتم خوشهبندی 3
جمعه 11 آذرماه سال 1401 12:19
DBSCAN یک الگوریتم خوشه ای مبتنی بر چگالی است که شبیه به mean-shift است اما دارای دو مزیت قابل توجه است. قبل از شروع نگاهی به تصویر زیر بیاندازید . ۱ - DBSCAN با یک نقطه شروع دلخواه و بازدید نشده شروع می شود . همسایگی این نقطه با استفاده از فاصله اپسیلون ε استخراج می شود کلیه نقاط که در فاصله ε قرار دارند نقاط...
-
الگوریتم خوشهبندی 2
جمعه 11 آذرماه سال 1401 12:12
K-Medians یکی دیگر از الگوریتم های خوشه بندی مربوط به K-Means است با این تفاوت که به جای محاسبه مرکز گروه با استفاده از میانه بردار نقاط جدید را بوجود می آورد. این روش نسبت به نقاط پرت حساسیت کمتری دارد به دلیل استفاده از Median اما برای مجموعه داده های بزرگتر بسیار کندتر است زیرا هنگام محاسبه میانه بردار مرتب...
-
الگوریتم خوشهبندی 1
جمعه 11 آذرماه سال 1401 11:58
خوشهبندی یک تکنیک یادگیری است که شامل گروه بندی نقاط داده میشود. با توجه به مجموعه ای از نقاط داده میتوان از یک الگوریتم خوشهبندی برای طبقهبندی هر نقطه داده به یک گروه خاص استفاده کرد. در تئوری نقاط دادهای که در یک گروه قرار دارند باید دارای خصوصیات و یا ویژگیهای مشابه باشند در حالی که نقاط داده در گروههای...
-
ارزیابی مدل
جمعه 11 آذرماه سال 1401 11:35
هنگامی که یک دستهبندی کننده ساخته میشود، اندازهگیری صحت آن دارای اهمیت زیادی است. برای اندازهگیری صحت یک دستهبندیکننده بهتر است از دادههای تست استفاده شود؛ یعنی پس از ساخت مدل روی دادههای آموزشی، میزان صحت مدل در تعیین برچسب کلاس نمونهها، روی دادههای تست مورد آزمایش قرار گیرد . صحت یک دستهبندی کننده روی...
-
روش طراحی درخت تصمیم
جمعه 11 آذرماه سال 1401 10:50
روشهای ساخت درخت تصمیم معمولاً به صورت بالا به پایین عمل میکنند به این معنی که ابتدا فضای ورودی به فضاهای کوچکتر تقسیم میشود، سپس فرآیند تقسیم بندی برای هر یک از این قسمتها تکرار میشود . الگوریتم درخت تصمیم چگونه است؟ الگوریتم درخت تصمیم به این صورت است که یک گره ریشه در بالای آن قرار دارد و برگهای آن در پایین...
-
الگوریتمها درخت تصمیم
جمعه 11 آذرماه سال 1401 10:47
الگوریتم ID3 این الگوریتم یکی از سادهترین الگوریتمهای درخت تصمیم است. در این الگوریتم درخت تصمیم از بالا به پایین ساخته میشود. این الگوریتم با این سؤال شروع میشود: کدام ویژگی باید در ریشه درخت مورد آزمایش، قرار بگیرد؟ برای یافتن جواب از معیار بهره اطلاعات استفاده میشود . با انتخاب این ویژگی، برای هر یک از مقادیر...
-
درخت تصمیم چیست؟
جمعه 11 آذرماه سال 1401 10:41
یکی از پرکاربردترین الگوریتمها در بین الگوریتمهای دادهکاوی است. درخت تصمیم دقیقاً مانند یک درخت است با این تفاوت که از ریشه به سمت پایین (برگ) رشد کرده است. در الگوریتم درخت تصمیم نمونهها را دستهبندی میکنیم که درواقع دستهها در انتهای گرههای برگ قرار دارد. درخت تصمیم در مسائلی کاربرد دارد که بتوان آنها را به...
-
کتاب استخراج فرآیند برای تنبلها نسخه ویژه
جمعه 20 آبانماه سال 1401 17:39
مقدمهای برای روش اداره تجارت است. در ادامه خواهید آموخت که چگونه میتوانید از این ابزار برای مشاهده و بهبود فرآیندهای متحول کننده استفاده کنید. یاد خواهید گرفت که چگونه کار میکند، چرا اهمیت دارد و چگونه بسیار قدرتمندتر از رویکردهای سنتی بهبود فرآیند است که به این مرحله منجر شده است. این کتاب مراحل رویکرد فرآیند کاوی...
-
6 گام پیش از شروع نوشتن مقاله
پنجشنبه 28 مهرماه سال 1401 10:20
فکر کنید چرا میخواهید مقاله را منتشر کنید (آیا قابلانتشار است)؟ باید در آغاز تحقیق هنگامی که دربارهی فرضیات تحقیق میکنید، فکر کنید که چرا میخواهید کارتان را منتشر کنید. سپس باید بررسی کنید که آیا فرضیات و طرح یا آزمایش قابلانتشار هستند یا خیر از خودتان بپرسید: آیا کار تازه و جذابی انجام دادهام؟ آیا کارم به...
-
7 نکته ضروری برای نوشتن مقاله ISI
پنجشنبه 28 مهرماه سال 1401 09:49
انتخاب موضوع مناسب و تعیین هدف کلی از نگارش مقاله انتخاب موضوع مناسب از جمله مهمترین مراحل نگارش مقاله ISI است که باید به تناسب مسایل روز با دقت بسیار و بهدور از شتابزدگی انجام شود. برای این منظور، در ابتدا میتوانید از بین علاقه مندیها، دغدغهها، مطالعات خود و غیره لیستی از موضوعات موردنظرتان را تهیه کنید و سپس...
-
نکات کلیدی در نوشتن مقاله علمی
پنجشنبه 28 مهرماه سال 1401 09:34
در تألیف یک مقاله علمی باید به چندین نکته پژوهشی دقت شود. با رعایت این 10 نکته میتوان موفقیت تحقیق را تقریبا قطعی دانست. وحدت موضوع مقاله وحدت موضوع مقاله به عدم کثرت موضوعات مورد بحث در متن مقاله اشاره دارد. به عبارت دیگر مقاله باید درباره موضوعی واحد بحث نماید و از زیاد کردن مباحث اجتناب ورزد. مقاله باید حول یک...
-
نوشتن افیلیشن مقاله
پنجشنبه 28 مهرماه سال 1401 09:14
افیلیشن چیست؟ افیلیشن به زبان ساده یعنی وابستگی سازمانی. یعنی شما از سمت کدام مرکز علمی و دانشگاهی مقاله میفرستید. افیلیشن به نوعی به مقاله شما هویت میدهد و هیچ ژورنالی بدون افیلیشن مقاله شما را نخواهد پذیرفت. منظور از افیلیشن وابستگی آکادمیک یا سازمانی هریک از نویسندگان مقاله میباشد. بهترین حالت ممکن این است که در...
-
طراحی مفاهیم و الگوهای سیستم های رویداد محور برای جریان خدمات با آپاچی کافکا
یکشنبه 24 مهرماه سال 1401 21:18
کتاب در پنج بخش تنظیم شده است. بخش اول صحنه را تنظیم میکند، با فصلهایی که کافکا و پردازش جریانی را معرفی میکنند و باید حتی تمرینکنندگان باتجربه یک نمای کلی مفید از مفاهیم پایه ارائه دهند. در بخش دوم نحوه ساختن سیستمهای رویداد محور نحوه ارتباط این گونه سیستمها با پردازش جریان حالت دار و نحوه اعمال الگوهایی...
-
تجزیه و تحلیل شبکه پیچیده در پایتون
شنبه 23 مهرماه سال 1401 11:51
کتاب برای کسانی که می خواهند اصول تحلیل شبکه پیچیده را با تمرکز بر کاربرد بیاموزند عالی است. مطالعات موردی موضوع های مختلفی را پوشش میدهد و کمک میکند مفاهیم را به برنامهها پیوند دهند و تجربهای واضح، ساختار یافته و عملی را در اختیار خوانندگان قراردهند که درک آنها از مفاهیم را بدون نیاز به تجربه برنامهنویسی...
-
سیستم پیشنهادی الگوریتم تئوری بیز در دادهکاوی
جمعه 22 مهرماه سال 1401 17:30
سیستم پیشنهادی الگوریتم تئوری بیز در دادهکاوی طبقهبندی کننده تئوری بیز و فیلتر کردن مشارکتی باهم یک سیستم پیشنهادی ایجاد میکنند که با استفاده از یادگیری ماشین و فنهای دادهکاوی اطلاعات نامشهود را فیلتر میکند و پیشبینی میکند آیا کاربر منبع خاصی را میخواهد یا نه. مزایا و معایب تئوری بیز در ادامه به مزایا و معایب...
-
طبقهبندی و کاربرد تئوری بیز
جمعه 22 مهرماه سال 1401 17:28
انواع طبقهبندی الگوریتم دستهبندی بیز ساده انواع طبقهبندی الگوریتم دستهبندی بیز ساده Naive Bayes: بسته به نوع داده هر ویژگی، روش متفاوتی موردنیاز است. بهطور خاص، دادهها برای تخمین پارامترها از یکی از سه توزیع احتمال استاندارد استفاده میشوند. در مورد متغیرهای طبقهای، مانند تعداد یا برچسبها، میتوان از توزیع...
-
ویژگیهای بارز الگوریتم دستهبندی بیز
جمعه 22 مهرماه سال 1401 17:13
ویژگیهای بارز الگوریتم دستهبندی عبارتاند از: پیشبینی آنی (Real-time prediction): به خاطر پیادهسازی ساده و محاسبات سریع آن میتوان از آن برای پیشبینیهای آنی استفاده کرد. پیشبینی چند کلاسی (Multi-class prediction): از الگوریتم طبقهبندی Naive Bayes میتوان برای پیشبینی احتمال خلفی کلاسهای متعدد متغیر هدف...
-
الگوریتم دستهبندی بیز
جمعه 22 مهرماه سال 1401 16:58
الگوریتم دستهبندی بیز ساده (Naive Bayes Algorithm) روش بیز روشی برای دستهبندی پدیدهها بر اساس احتمال وقوع یا عدم وقوع یک پدیده است. این روش یکی از سادهترین الگوریتمهای پیشبینی در جهان به شمار میرود و نکته مهم در مورد این الگوریتم این است که در عین سادگی دقت قابل قبولی هم دارد که هر دو از مزیتهای آن به شمار...
-
انتخاب ویژگی
شنبه 16 مهرماه سال 1401 11:04
زمانی که در یک سازمان، موسسه یا هر شرکت دیگر، دادههای کلان وارد بانک اطلاعاتی مجموعه میشوند ؛ نرمافزارهای داده کاوی وارد عمل شده و با استفاده از الگوهای مشخصی که از قبل تعریف گردیده است؛ دادههای اولیه را بر اساس ویژگیهای مطلوب شناسایی کرده، دادههای پرت و مزاحم را حذف مینمایند و الگو یا رابطه بین دادههای...
-
پیدایش و انواع شبکه های عصبی
چهارشنبه 13 مهرماه سال 1401 18:17
پیدایش شبکههای عصبی مصنوعی مغر انسان به اذعان بسیاری از دانشمندان پیچیدهترین سیستمی است که تاکنون در کل گیتی مشاهدهشده و موردمطالعه قرارگرفته است؛ اما این سیستم پیچیده نه ابعادی در حد کهکشان دارد و نه تعداد اجزای سازندهاش بیشتر از پردازندههای ابررایانههای امروزی است. پیچیدگی رازآلود این سیستم بینظیر، به...
-
روشها و معیارهای ارزیابی الگوریتم یادگیری ماشین
چهارشنبه 13 مهرماه سال 1401 17:58
معیارهای متنوعی برای ارزیابی کارایی الگوریتمهای یادگیری ماشین، الگوریتمهای دستهبندی و رگرسیون وجود دارد. باید در انتخاب معیارهای ارزیابی کارایی یادگیری ماشینی دقت به خرج داده شود زیرا: چگونگی اندازهگیری و مقایسه کارایی الگوریتمهای یادگیری ماشینی کاملاً به معیارهایی که انتخاب میکنید وابسته است. چگونگی وزن دادن به...
-
کتاب مقدمهای بر اسکرام
چهارشنبه 13 مهرماه سال 1401 16:30
کتاب مقدمهای بر اسکرام نویسندگان: محمدرضا دهقانی محمودآبادی، نجم السادات نبوی زاده چاپ بزودی انتشارات قلم نخبگان فصل 1- مروری بر رویکرد چابک فصل 2- مزیتها و ارزشها فصل 3- اسپرینت و برنامهریزی فصل 4- رویدادها فصل 5- نقشها فصل 6- مصنوعات اسکرام فصل 7- روش اجرای اسپرینت و نمودار پیشرفت فصل 8- داستانهای کاربر و...
-
کلان داده، کاربرد و انواع آن
چهارشنبه 13 مهرماه سال 1401 14:36
کلان داده [1] چیست؟ در دنیای امروز حجم زیادی از اطلاعات باید پردازش شود. این حجم زیاد از داده را کامپیوترها باید ساختاربندی کرده و پردازش کنند. به این حجم از اطلاعات کلان داده میگویند. به معنای میزان عظیمی دادههای ساختاربندی شده و نشده است که پتانسیل کمک به شرکتها را دارد تا عملیاتهای خود را بهبود بخشد و...
-
پنج موضوع بحثبرانگیز که از اسکرام حذف شدند
چهارشنبه 25 اسفندماه سال 1400 11:02
اگر بیشتر از پنج سال باشد که با اسکرام آشنا باشید، منبع متفاوتی برای درک اسکرام داشتهاید که امروز وجود ندارد. موارد زیادی وجود دارد که زمانی بهعنوان بخشی از اسکرام تعریف میشدند، حتی در راهنمای اسکرام ذکرشدهاند، اما در برخی موارد حذف شدند. برخی از موارد بهطورکلی خارج شدند و موارد دیگر با چیز دیگری جایگزین شد....