جلسه 21

  • ویدئو – لینک
  • در مورد confidence interval که به آن CI هم میگویند.
  • سوال مصاحبه: CI چیست و چرا مهم است؟
  • این سوال در مصاحبه ها زیاد می آید.
  • برای درک مفهوم CI ، ابتدا باید مفهوم point estimate را بدانیم.
  • میدانیم که پیدا کردن مقدارmean یک دیتاست بزرگ کار سختی است. برای مثال همان شوال میانگین اندازه کوسه های تمام اقیانوس ها.
  • اما میتوانیم اندازه mean در sample را به راحتی اندازه بگیریم. که با x_bar نمایش داده میشود.
  • حال با داشتن X-bar سعی میکنیم مقدار میو که میانگین کل جمعیت است را بدست بیاوریم.
  • این x-bar همان point estimate است.
  • همچنین بر اساس central limit theorem میدانیم که از طریق محاسبه x-bar میتوانیم به مقدار میو برسیم.
  • حال CI به ما میگوید که با چه احتمالی مقدار میو در چه بازه ای (lower limit و upper limit) قرار میگیرد.
  • در واقع اگر سوال از ما بپرسد که CI برابر با 95 درصد باشد، در واقع منظورمان بازه نشان داده شده در شکل زیر است. که در واقع همان lower limit و higher limit را نشان میدهد.
  • دو روش برای حل این مسئله وجود دارد:
    • اگر standard deviation داده شده باشد. که در این حالت از z-test استفاده میکنیم.
    • اگر STD را نداشته باشیم. در این حالت از t-test استفاده میکنیم.
  • مسئله ما این است: اندازه متوسط کوسه ها چقدر است؟
  • یک روش حل با CI است
  • یک روش حل با central limit theory است.
  • فرض کنیم که std به ما داده شده و برابر با 100 باشد(sigma=100)
  • همچنین x-bar=500 و n=30 داده شده باشد.
  • فرمول CI به شرح زیر است:
  • C.I=Point Estimate+/- Margin Error
  • یا:

که برابر است با :

حروف کنار z یک دوم آلفا هست که مقدار و چیستی آن را الان توضیح میدهیم .

  • آلفا همان significance value ما می باشد. که در این جمع دو مقدار موجود در tail یعنی 2*2.5 و برابر با 5 درصد یا 0.05 می باشد. (همان چیزی که میگوییم P-value باید کمتر از 0.05 باشد)
  • حال به سادگی با توجه به داده های مسئله جایگذاری میکنیم:
  • n طبق داده مسئله برابر با 30 است.
  • برای پیدا کردن عدد( Z- 0.05/2 ) باید در گوگل عدد z table را سرچ کنیم. لینک

تا دقیقه 8:50

تکرار:

  • روش z-test زمانی به کار میرود که standard deviationجمعیت به ما داده شده باشد.(همان سیگما)
  • اگر این مقدار به ما داده نشده باشد، باید از t-test استفاده کنیم.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.