جلسه 4 –

در این ویدئو-لینک – در مورد موارد زیر صحبت میشود:

  • random variables
    • discrete random variable
    • continuous random variable
  • و در مورد gaussian distribution , و normal distribution

متغیر چیه که variable اون چی باشه؟

زمانی که میخوایم از اندازه ها صحبت کنیم و یه چیزی داشته باشیم که قد افراد رو بذاریم توش، میام و یه متغیر تعریف میکنیم . حالا ممکنه رشته یا string باشه. یا ممکنه صحیح یا integer باشه و یا float یا اعشاری.

تعریف متغیر تصادفی:

متغیری است که مقدار آن از اندازه‌گیری برخی از انواع فرایندهای کاتوره‌ای بدست می‌آید. به زبان ساده همان 1000 نفری که از بین یک میلیون نفر انتخاب میشوند را random variable میگوییم. در ادامه میخواهیم در مورد احتمالات مربوط به اینکه این مقادیر رندوم چه رفتاری دارند صحبت کنیم.

gaussian distribution

ابتدا به موارد زیر دقت کنید:

  • میو میانگین داده هاست.
  • واریانس برابر با میانگین مربعات اختلاف نمونه ها از مقدار میانگین است(فرمول دوم زیر)

سیگما برابر جذر واریانس است:

توزیع گوسی زمانی است که bell shape متقارن و متعادلی داشته باشیم و وسط برابر با میانگین و با قدم ها سیگما به راست و چپ میتوان درصدهای تشکیل دهنده داده با توزیع نرمال را مشخص نمود. سیگما همان انحراف استاندارد یا SD است. میو برابر با میاگین کل جامعه است.

قوانین emprical در توزیع گوسی:

قانون تجربیempirical rule می‌گوید، اگر از هر طرف دو انحراف استاندارد را پیش ببریم، احتمال 95 درصد وجود دارد که sample در آن محدوده باشد.

قوانین Empirical

اگر دیتا از توزیع نرمال برخوردار باشد: (از دوره آمار کورسرا)

  • 2/3 یا حدود 68 درصد کل دیتاها بین میانگین داده ها +- انحراف معیار قرار میگیرند.
  • 95 درصد آن بین میانگین +- 2 برابر انحراف معیار قرار میگیرند.
  • 99.7 درصد آن بین میانگین +- 3 انحراف معیار استاندارد قرار میگیرند.
  • مثال اگر میانگین قد افراد68.3 اینچ باشد وانحراف از معیار برابر 1.8 اینچ باشد، آنگاه95 درصد تمام افراد قدی بین64.7 اینچ و 71.9 خواهد بود. ویدئو:

قوانین empirical روی نمودار توزیع نرمال :

توضیح کریش:

یعنی(اگر توزیع نرمال باشد) احتمال اینکه یک x انتخاب کنید و آن عدد در بازه زیر قرار بگیرد، 68 درصد است.

یا 68 درصد sample تست انتخاب شده از میان جامعه بزرگ در بازه زیر قرار میگیرد.

و 95 درصد در بازه زیر قرار میگیرند:

و 99.7 درصد داده ها در بازه زیر:

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.