میانگین میانه مُد
با نگاه به گروهی از دادهها چه چیزی میتوان آموخت؟[۱]
در یادگیری ماشین (و ریاضیات) اغلب یه مقدار وجود دارد که برای ما جالب است:
- میانگین (به انگلیسی: Mean) - مقدار میانگین (معدل)
- میانه (به انگلیسی: Median) - مقدار نقطه میانی
- مُد (به انگلیسی: Mod) - رایجترین مقدار
مثال: سرعت ۱۳ ماشین را ثبت کردهایم:
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
مقدار سرعت میانگین، میانه و رایجترین چیست؟
محتویات
میانگین
مقدار متوسط، مقدار میانگین است.
برای محاسبه مقدار متوسط، جمع همهٔ مقادیر را بر تعداد آنها تقسیم میکنیم:
(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77
ماژول numPy متدی برای اینکار دارد:
مثال
از متد mean()
در NumPy برای یافتن سرعت متوسط استفاده میکند:
1 import numpy
2
3 speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
4
5 x = numpy.mean(speed)
6
7 print(x)
میانه
پس از اینکه همهٔ مقادیر را ذخیره کردید، مقدار میانه، مقدار وسطی است:
77, 78, 85, 86, 86, 86, 87, 87, 88, 94, 99, 103, 111
ماژول NumPy متدی برای یافتن میانه دارد:
مثال
از متد median()
در NumPy برای یافتن مقدار میانه استفاده میکند:
1 import numpy
2
3 speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
4
5 x = numpy.median(speed)
6
7 print(x)
77, 78, 85, 86, 86, 86, 87, 87, 94, 98, 99, 103
(86 + 87) / 2 = 86.5
مثال
با استفاده از ماژول NumPy:
1 import numpy
2
3 speed = [99,86,87,88,86,103,87,94,78,77,85,86]
4
5 x = numpy.median(speed)
6
7 print(x)
مُد
مقدار مُد مقداری است که بیشترین تکرار را در میان اعداد دارد:
99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86 = 86
ماژول SciPy برای اینکار یک متد دارد:
مثال
از متد mode()
در SciPy برای یافتن عددی که بیشترین تکرار را دارد استفاده میکند:
1 from scipy import stats
2
3 speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
4
5 x = stats.mode(speed)
6
7 print(x)
خلاصه بخش
میانگین، میانه و مُد تکنیکهایی هستند که اغلب در یادگیری ماشین استفاده میشوند، بنابراین درک مفهوم پشت آنها بسیار مهم است.
منابع آموزشی