در مورد cross validation

مقدمه

میخواهیم ببینیم چه مدلی برای مسئله ما مناسب تر است. دیتاست ما مربوط به عده ای از افراد عموم جامعه است که سن و مقدار حقوق دریافتی و همچنین جنسیت آنها مشخص شده است.  میخواهیم پیش بینی کنیم که آیا خرید خواهند کرد یا نه.
در این مسئله دو روش کلاسیفیکیشن را به کار میبریم و سپس با استفاده از cross validation آنها را ارزیابی میکنیم.

تصویر از ویکی پدیا

ایده به سادگی این است که به دفعات مختلف دیتای test را و در نتیجه دیتای train را تغییر بدهیم و هر بار مقدار دقت را اندازه گیری کنیم.

در مورد Knearest

اطلاعات بیشتر در مورد kmeans

KNN works by finding the distances between a query and all the examples in the data, selecting the specified number examples (K) closest to the query, then votes for the most frequent label (in the case of classification) or averages the labels (in the case of regression).

منابع:

1- گیت هاب

2- ویدئو یوتیوب

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.