یادگیری ماشین
یادگیری ماشین
یادگیری ماشین سبب میشود کامپیوتر از طریق مطالعه دادهها و آمارها یاد بگیرد.[۱]
یادگیری ماشین قدمی به سوی هوش مصنوعی (AI) است.
یادگیری ماشین برنامهای است که دادهها را تحلیل میکند و یادمیگیرد نتیجه را پیشبینی کند.
از کجا شروع کنیم؟
در این آموزش به ریاضیات و مطالعه آمار و نحوهٔ محاسبه اعداد مهم بر اساس مجموعههای داده را بر میگردیم.
همچنین نحوه استفاده از ماژولهای مختلف پایتون برای به دست آوردن جوابهای مورد نیاز را میآموزیم.
و در مورد نحوه ایجاد توابعی که میتوانند نتیجه را براساس آنچه آموختهایم پیش بینی کنند یادمیگیریم.
مجموعه داده (به انگلیسی: Data Set)
در ذهن کامپیوتر، یک مجموعه داده، هر مجموعه ای (به انگلیسی: Collection) از داده هاست. میتواند هرچیزی از یک آرایه گرفته تا پایگاه داده کامل باشد.
مثالی از یک آرایه:
[99,86,87,88,111,86,103,87,94,78,77,85,86]
مثالی از پایگاه داده:
Carname | Color | Age | Speed | AutoPass |
---|---|---|---|---|
BMW | red | 5 | 99 | Y |
Volvo | black | 7 | 86 | Y |
VW | gray | 8 | 87 | N |
VW | white | 7 | 88 | Y |
Ford | white | 2 | 111 | Y |
VW | white | 17 | 86 | Y |
Tesla | red | 2 | 103 | Y |
BMW | black | 9 | 87 | Y |
Volvo | gray | 4 | 94 | N |
Ford | white | 11 | 78 | N |
Toyota | gray | 12 | 77 | N |
VW | white | 9 | 85 | N |
Toyota | blue | 6 | 86 | Y |
با نگاهی به آرایه میتوان حدس زد که مقدار متوسط احتمالاً در حدود ۸۰ یا ۹۰ است و ما نیز قادر به تعیین بالاترین مقدار و کمترین مقدار هستیم، اما چه کار دیگری میتوانیم انجام دهیم؟
و با نگاهی به پایگاه داده میتوانیم ببینیم که محبوبترین رنگ سفید است و قدیمیترین اتومبیل ۱۷ ساله است اما اگر با یک نگاه به مقادیر دیگر میتوانستیم پیش بینی کنیم که آیا یک اتومبیل دارای یک AutoPass است یا نه؟
یادگیری ماشین برای همین است! تحلیل دادهها و پیش بینی خروجی!
انواع داده
برای تحلیل دادهها، مهم است که بدانیم با چنوع دادهای سروکار داریم.
میتوانیم انواع داده را به سه دسته اصلی تقسیم کنیم:
- Numerical
- Categorical
- Ordinal
دادههای عددی، همان اعداد هستند و میتوان آنها را به دو دسته عددی تقسیم کرد:
- دادههای گسسته
- - عددهایی که محدود به integerها (اعداد صحیح) هستند. مثال: تعداد ماشینهایی که میگذرند.
- دادههای پیوسته
- - اعدادی که مقدارهای نامتناهی دارند. مثال: قیمت یک آیتم یا اندازه یک آیتم
داده های Categorical مقدارهایی هستند که نمیتوان نسبت به یکدیگر مقایسه کرد. مثال: یک مقدار رنگ، یا هر مقدار yes/no.
داده های Ordinal مانند دادههای categorical هستند اما میتوان آنها را نسبت به هم مقایسه کرد. مثال: نمرات مدرسه که A بهتر از B است و به همین ترتیب.
با دانستن نوع دادهای منبع داده، میتوان دریافت از چه نوع تکنیکی برای تحلیل آنها استفاده کرد.
در مورد آمار و تحلیل دادهها در بخشهای بعدی بیشتر خواهید آموخت.
منابع آموزشی