اختصاصی logistic regression

مرجع لینک

تشخیص سریع:

زمانی که خروجی ما از نوه باینری (0-1 ) باشد.
آیا باران میبارد یا نه- آیا دانش آموز قبول میشود یا نه. آیا فرد بیمار سرطان دارد یا نه. آیا مسافر تایتانیک زنده میماند یا نه.

مثال: دیابت – دیتاست با سه فیچر- لینک (خط 175)

تفاوت با رگرسیون خطی:

بیان اول:

رگرسیون خطی برای تشخیص یا پیش بینی مقادیر پیوسته خروجی کاربرد دارد. اما logistic regression برای تشخیص یا پیش بینی خروجی در حالت categorical کاربرد دارد. اما هر دو مورد در زیرمجموعه supervised learning قرار میگیرند:

بیان دوم:

در روش رگرسیون، هدف ما عددی(و اکثرا پیوسته) است در صورتیکه در روش لاجستیک جنس هدف ما از نوع باینری (و گسسته)هست (بلی و خیر یا صفر و یک و …)

در نوع Linear حساسیت به outlier بسیار زیاد است.

فرمول زیر مربوط به logistic regression است که به آن Sigmoid گویند:

توضیحات:

تکرار از دروس قبلی:

در حل مسائل به روش رگرسیون لاجستیک از تابع Sigmoid کمک می‌گیریم. رفتار این تابع طوری است که مقادیر در بازه صفر تا یک قرار می‌گیرند.(بالای شکل زیر). همانطور که در شکل مشخص است داده‌هایی که در بازه صفر تا نیم قرار گیرند، صفر تلقی شده و مقادیر بالای نیم را یک در نظر می‌گیریم.

ادامه:

اگر مقدار خروجی با به تابع sigmoid بدهیم، این تابع عدد احتمال مربوطه را که عددی بین 0 تا 1 است را به ما برمیگرداند. اگر عدد زیر نیم باشد، نتیجه No/fail یا مواردی از این قبیل است. اگر خروجی بزرگتر از نیم باشد، خروجی yes یا pass خواهد بود.

If we feed an output value to the sigmoid function, it will return the probability of the outcome between 0 and 1. If the value is below 0.5, then the output is return as No/Fail/Deceased (above example). If the value is above 0.5, then the output is returned as Yes/Pass/Deceased.

فرضیه ها در رگرسیون لاجستیک:

  • Independent variables show a linear relationship with the log of output variables.
    • فیچرها رابطه خطی با لگاریتم خروجی داشته باشند
  • Non-Collinearity between independent variables. That is, independent variables are independent of each other.
    • خود فیچرها نسبت به هم مستقل باشند.
  • Output variable is binary.
    • متغیر خروجی دو حالتی باشد(بله یا خیر، صفر یا یک ، بالا یا پایین)

انتخاب مهمترین فیچر ها

زمانی که تعداد فیچرها زیاد باشد، انتخاب فیچرهای مهم اهمیت زیادی در بهبود دقت سیستم دارد.

در بند 3 از این منبع در مورد نحوه انتخاب مهمترین فیچرها توضیح داده شده است.

آخرین مرور:

14 فروردین 402

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.