مقدمه
میخواهیم ببینیم چه مدلی برای مسئله ما مناسب تر است. دیتاست ما مربوط به عده ای از افراد عموم جامعه است که سن و مقدار حقوق دریافتی و همچنین جنسیت آنها مشخص شده است. میخواهیم پیش بینی کنیم که آیا خرید خواهند کرد یا نه.
در این مسئله دو روش کلاسیفیکیشن را به کار میبریم و سپس با استفاده از cross validation آنها را ارزیابی میکنیم.

ایده به سادگی این است که به دفعات مختلف دیتای test را و در نتیجه دیتای train را تغییر بدهیم و هر بار مقدار دقت را اندازه گیری کنیم.
در مورد Knearest
KNN works by finding the distances between a query and all the examples in the data, selecting the specified number examples (K) closest to the query, then votes for the most frequent label (in the case of classification) or averages the labels (in the case of regression).