در قسمت چهارم در مورد feature Scaling صحبت کردیم. در این قسمت میخواهیم فیچر های مطلوب را انتخاب کنبم.
موارد اولیه
دو مورد زیر از اصلی ترین های این درس هستند. (اطلاعات بیشتر در مورد Lasso و selectfromModel )
from sklearn.linear_model import Lasso
from sklearn.feature_selection import SelectFromModel
ستون های ID و SalePrice را جدا میکنیم.
X_train=dataset.drop(['Id','SalePrice'],axis=1)
با دستور زیر مد ل را روی دیتای خود فیت میکنیم:
feature_sel_model = SelectFromModel(Lasso(alpha=0.005, random_state=0)) # remember to set the seed, the random state in this function
feature_sel_model.fit(X_train, y_train)
با دستور زیر میتوانیم ببینیم که کدام فیچر مناسب است (True ) و کدام مناسب نیست(false)
feature_sel_model.get_support()
حال با کد زیر فیچر ها را انتخاب میکنیم:
selected_feat = X_train.columns[(feature_sel_model.get_support())]
برای اطلاعات بیشتر به گیت هاب این قسمت رجوع شود.
قسمت ششم (حل مسئله و بارگذاری در Kaggle)