در این بلاگ در مورد کواریانس صحبت کردیم.
ضریب پیرسون به صورت زیر تعریف میشود. کواریانس x و y تقسیم بر ضرب انحراف استاندارد یا (sd) x و y

در پست مرتبط با کواریانس در مورد مثبت یا منفی بودن وابستگی دو پارامتر صحبت کردیم. حال در مورد اندازه این وابستگی میخواهیم بگوییم.
رنج بدست امده از فرمول ذکر شده بالا همواره بین 1- تا 1 خواهد بود. زیرا کواریانس دو پارامتر را بر ضرب انحراف استاندارد دو مورد تقسیم میکنیم.

دانستن مقدار ضریب پیرسون به چه دردی میخورد؟
در هنگام اجرای feature selection برای ما مفید است. برای مثال زمانی که یک دیتا ست داشته باشیم که x1 , x2 وx3 فیچرهای مستقل آن باشند و y خروجی ما باشد، آنگاه برای مثال اگرضریب پیرسون بین x1 وx2 برابر با یک باشد، تاثیر x1 بر y دقیقا برابر با تاثیرx2 بر y خواهد بود. بنابراین میتوان یکی از دو مورد x1 وx2 را حذف (drop) کرد. که این باعث کاهش بار محاسبات و افزایش سرعت میشود.