قسمت پنجم – Feature Selection

در قسمت چهارم در مورد feature Scaling صحبت کردیم. در این قسمت میخواهیم فیچر های مطلوب را انتخاب کنبم.

موارد اولیه

دو مورد زیر از اصلی ترین های این درس هستند. (اطلاعات بیشتر در مورد Lasso و selectfromModel )

from sklearn.linear_model import Lasso
from sklearn.feature_selection import SelectFromModel

ستون های ID و SalePrice را جدا میکنیم.

X_train=dataset.drop(['Id','SalePrice'],axis=1)

با دستور زیر مد ل را روی دیتای خود فیت میکنیم:


feature_sel_model = SelectFromModel(Lasso(alpha=0.005, random_state=0)) # remember to set the seed, the random state in this function
feature_sel_model.fit(X_train, y_train)

با دستور زیر میتوانیم ببینیم که کدام فیچر مناسب است (True ) و کدام مناسب نیست(false)

feature_sel_model.get_support()

حال با کد زیر فیچر ها را انتخاب میکنیم:

selected_feat = X_train.columns[(feature_sel_model.get_support())]

برای اطلاعات بیشتر به گیت هاب این قسمت رجوع شود.

قسمت ششم (حل مسئله و بارگذاری در Kaggle)

منابع:

1- گیت هاب خودم

2- ویدئو کریش مروبط به این قسمت

3- ویدئو کریش مربوط به lasso regression

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.