انحراف استاندارد

از ویکی‌کد، دانشنامهٔ برنامه‌نویسی
پرش به ناوبری پرش به جستجو
Main Page Tutorial
Python-menu.png
موارد آموزشی
مدیریت فایل
یادگیری ماشین
۱شروع کار
۲میانگین، میانه، مُد
۳انحراف استاندارد
۴صدک
۵توزیع داده
۶توزیع داده نرمال
۷نمودار پراکندگی
۸رگرسیون خطی
۹رگرسیون چند جمله‌ای
۱۰رگرسیون چندگانه
۱۱مقیاس
۱۲آموزش / تست
۱۳درخت تصمیم
MySQL در پایتون
MongoDB در پایتون
مرجع پایتون
مرجع ماژول
چگونه در پایتون؟
مثال‌های پایتون

انحراف استاندارد چیست؟

انحراف استاندارد عددی است که میزان پراکندگی اعداد را توصیف می‌کند.[۱]

انحراف استاندارد کم یعمی اکثر اعداد به مقدار متوسط (میانگین) نزدیک هستند.

انحراف استاندارد زیاد یعنی مقدارهای در محدوده بیشتری پراکنده شده‌اند.

مثال: این بار سرعت ۷ ماشین را ثبت کرده‌ایم:

speed = [86,87,88,86,87,85,86]

انحراف استاندارد برابر است با:

0.9

یعنی اکثر مقدارها داخل محدوده ۰٫۹ از مقدار میانگین هستند که برابر با ۸۶٫۴ است.

می‌خواهیم همین کار با محدودهٔ گسترده تری از اعداد انجام دهیم:

speed = [32,111,138,28,59,77,97]

انحراف استاندارد برابر است با:

37.85

یعنی اکثر مقدارها داخل محدوده ۳۷٫۸۵ از مقدار میانگین هستند که برابر با ۷۷٫۴ است

همانطور که می‌بینید، نحراف استاندارد بیشتر نشان دهندهٔ این است که مقادیر در محدوده گسترده تری پراکنده شده‌اند.

ماژول NumPy متدی برای محاسبه انحراف استاندارد دارد:

مثال

از متد std() در NumPy برای به دست آوردن انحراف استاندارد استفاده می‌کند:

1 import numpy
2 
3 speed = [86,87,88,86,87,85,86]
4 
5 x = numpy.std(speed)
6 
7 print(x)


مشاهدهٔ نتیجه


مثال

1 import numpy
2 
3 speed = [32,111,138,28,59,77,97]
4 
5 x = numpy.std(speed)
6 
7 print(x)


مشاهدهٔ نتیجه


واریانس

واریانس عدد دیگری است که میزان پراکندگی مقادیر را نشان می‌دهد.

در واقع اگر جذر واریانس را محاسبه کنید، به انحراف استاندارد می‌رسید!

یا راه دیگر، اگر انحراف استاندارد را در خودش ضرب کنید، واریانس به دست می‌آید!

برای محاسبه واریانس، باید مراحل زیر را انجام دهید:

۱. یافتن میانگین:

(32+111+138+28+59+77+97) / 7 = 77.4

۲. برای هر مقدار: اختلاف آن با میانگین را محاسبه کنید:

 32 - 77.4 = -45.4
111 - 77.4 =  33.6
138 - 77.4 =  60.6
 28 - 77.4 = -49.4
 59 - 77.4 = -18.4
 77 - 77.4 = - 0.4
 97 - 77.4 =  19.6

۳. برای هر اختلاف: مقدار مربع آن را محاسبه کنید:

(-45.4)2 = 2061.16
 (33.6)2 = 1128.96
 (60.6)2 = 3672.36
(-49.4)2 = 2440.36
(-18.4)2 =  338.56
(- 0.4)2 =    0.16
 (19.6)2 =  384.16

۴. واریانس مقدار میانگین مربع اختلاف‌ها است:

(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16) / 7 = 1432.2

خوشبختانه، NumPy متدی برای محاسبه واریانس دارد:

مثال

از متد var() در NumPy برای یافتن واریانس استفاده می‌شود:

1 import numpy
2 
3 speed = [32,111,138,28,59,77,97]
4 
5 x = numpy.var(speed)
6 
7 print(x)


مشاهدهٔ نتیجه


انحراف استاندارد

همانطور که آموختیم، فرمول یافتن انحراف استاندارد، جذر واریانس است:

1432.25 = 37.85

یا مانند مثال قبلی، از NumPy برای یافتن انحراف استاندارد استفاده کنید:

مثال

از متد std() در NumPy برای یافتن نحراف استاندارد استفاده می‌کند:

1 import numpy
2 
3 speed = [32,111,138,28,59,77,97]
4 
5 x = numpy.std(speed)
6 
7 print(x)


مشاهدهٔ نتیجه


نمادها

اغلب انحراف استاندارد با نماد سیگما نمایش داده می‌شود: σ

اغلب واریانس با نماد مربع سیگما نمایش داده می‌شود: σ2

خلاصه بخش

انحراف استاندارد و واریانس عبارت‌هایی هستند که اغلب در یادگیری ماشین استفاده می‌شوند، بنابراین درک نحوه به دست آوردن آنها و مفهوم پشت آنها حائز اهمیت است.


منابع آموزشی