- ویدئو – لینک
- در مورد confidence interval که به آن CI هم میگویند.
- سوال مصاحبه: CI چیست و چرا مهم است؟
- این سوال در مصاحبه ها زیاد می آید.
- برای درک مفهوم CI ، ابتدا باید مفهوم point estimate را بدانیم.
- میدانیم که پیدا کردن مقدارmean یک دیتاست بزرگ کار سختی است. برای مثال همان شوال میانگین اندازه کوسه های تمام اقیانوس ها.
- اما میتوانیم اندازه mean در sample را به راحتی اندازه بگیریم. که با x_bar نمایش داده میشود.
- حال با داشتن X-bar سعی میکنیم مقدار میو که میانگین کل جمعیت است را بدست بیاوریم.
- این x-bar همان point estimate است.
- همچنین بر اساس central limit theorem میدانیم که از طریق محاسبه x-bar میتوانیم به مقدار میو برسیم.
- حال CI به ما میگوید که با چه احتمالی مقدار میو در چه بازه ای (lower limit و upper limit) قرار میگیرد.
- در واقع اگر سوال از ما بپرسد که CI برابر با 95 درصد باشد، در واقع منظورمان بازه نشان داده شده در شکل زیر است. که در واقع همان lower limit و higher limit را نشان میدهد.

- دو روش برای حل این مسئله وجود دارد:
- اگر standard deviation داده شده باشد. که در این حالت از z-test استفاده میکنیم.
- اگر STD را نداشته باشیم. در این حالت از t-test استفاده میکنیم.
- مسئله ما این است: اندازه متوسط کوسه ها چقدر است؟
- یک روش حل با CI است
- یک روش حل با central limit theory است.
- فرض کنیم که std به ما داده شده و برابر با 100 باشد(sigma=100)
- همچنین x-bar=500 و n=30 داده شده باشد.

- فرمول CI به شرح زیر است:
- C.I=Point Estimate+/- Margin Error
- یا:

که برابر است با :

حروف کنار z یک دوم آلفا هست که مقدار و چیستی آن را الان توضیح میدهیم .
- آلفا همان significance value ما می باشد. که در این جمع دو مقدار موجود در tail یعنی 2*2.5 و برابر با 5 درصد یا 0.05 می باشد. (همان چیزی که میگوییم P-value باید کمتر از 0.05 باشد)
- حال به سادگی با توجه به داده های مسئله جایگذاری میکنیم:

- n طبق داده مسئله برابر با 30 است.
- برای پیدا کردن عدد( Z- 0.05/2 ) باید در گوگل عدد z table را سرچ کنیم. لینک
تا دقیقه 8:50
تکرار:
- روش z-test زمانی به کار میرود که standard deviationجمعیت به ما داده شده باشد.(همان سیگما)
- اگر این مقدار به ما داده نشده باشد، باید از t-test استفاده کنیم.