یادگیری ماشین

از ویکی‌کد
پرش به ناوبری پرش به جستجو
Main Page Tutorial
Python-menu.png
موارد آموزشی
مدیریت فایل
یادگیری ماشین
۱شروع کار
۲میانگین، میانه، مُد
۳انحراف استاندارد
۴صدک
۵توزیع داده
۶توزیع داده نرمال
۷نمودار پراکندگی
۸رگرسیون خطی
۹رگرسیون چند جمله‌ای
۱۰رگرسیون چندگانه
۱۱مقیاس
۱۲آموزش / تست
۱۳درخت تصمیم
MySQL در پایتون
MongoDB در پایتون
مرجع پایتون
مرجع ماژول
چگونه در پایتون؟
مثال‌های پایتون

یادگیری ماشین

یادگیری ماشین سبب می‌شود کامپیوتر از طریق مطالعه داده‌ها و آمارها یاد بگیرد.[۱]

یادگیری ماشین قدمی به سوی هوش مصنوعی (AI) است.

یادگیری ماشین برنامه‌ای است که داده‌ها را تحلیل می‌کند و یادمی‌گیرد نتیجه را پیش‌بینی کند.

از کجا شروع کنیم؟

در این آموزش به ریاضیات و مطالعه آمار و نحوهٔ محاسبه اعداد مهم بر اساس مجموعه‌های داده را بر می‌گردیم.

همچنین نحوه استفاده از ماژول‌های مختلف پایتون برای به دست آوردن جواب‌های مورد نیاز را می‌آموزیم.

و در مورد نحوه ایجاد توابعی که می‌توانند نتیجه را براساس آنچه آموخته‌ایم پیش بینی کنند یادمی‌گیریم.

مجموعه داده (به انگلیسی: Data Set)

در ذهن کامپیوتر، یک مجموعه داده، هر مجموعه ای (به انگلیسی: Collection) از داده هاست. می‌تواند هرچیزی از یک آرایه گرفته تا پایگاه داده کامل باشد.

مثالی از یک آرایه:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

مثالی از پایگاه داده:

Carname Color Age Speed AutoPass
BMW red 5 99 Y
Volvo black 7 86 Y
VW gray 8 87 N
VW white 7 88 Y
Ford white 2 111 Y
VW white 17 86 Y
Tesla red 2 103 Y
BMW black 9 87 Y
Volvo gray 4 94 N
Ford white 11 78 N
Toyota gray 12 77 N
VW white 9 85 N
Toyota blue 6 86 Y

با نگاهی به آرایه می‌توان حدس زد که مقدار متوسط احتمالاً در حدود ۸۰ یا ۹۰ است و ما نیز قادر به تعیین بالاترین مقدار و کمترین مقدار هستیم، اما چه کار دیگری می‌توانیم انجام دهیم؟

و با نگاهی به پایگاه داده می‌توانیم ببینیم که محبوب‌ترین رنگ سفید است و قدیمی‌ترین اتومبیل ۱۷ ساله است اما اگر با یک نگاه به مقادیر دیگر می‌توانستیم پیش بینی کنیم که آیا یک اتومبیل دارای یک AutoPass است یا نه؟

یادگیری ماشین برای همین است! تحلیل داده‌ها و پیش بینی خروجی!

در یادگیری ماشین کار با مجموعه داده‌های بسیار بزرگ رایج است. در این آموزش سعی خواهیم کرد تا درک ساده‌تر مفاهیم مختلف یادگیری ماشینی را در حد امکان انجام دهیم و با مجموعه داده‌های کوچک و قابل فهم کار خواهیم کرد.

انواع داده

برای تحلیل داده‌ها، مهم است که بدانیم با چنوع داده‌ای سروکار داریم.

می‌توانیم انواع داده را به سه دسته اصلی تقسیم کنیم:

  • Numerical
  • Categorical
  • Ordinal

داده‌های عددی، همان اعداد هستند و می‌توان آنها را به دو دسته عددی تقسیم کرد:

  • داده‌های گسسته
- عددهایی که محدود به integerها (اعداد صحیح) هستند. مثال: تعداد ماشین‌هایی که می‌گذرند.
  • داده‌های پیوسته
- اعدادی که مقدارهای نامتناهی دارند. مثال: قیمت یک آیتم یا اندازه یک آیتم

داده های Categorical مقدارهایی هستند که نمی‌توان نسبت به یکدیگر مقایسه کرد. مثال: یک مقدار رنگ، یا هر مقدار yes/no.

داده های Ordinal مانند داده‌های categorical هستند اما می‌توان آنها را نسبت به هم مقایسه کرد. مثال: نمرات مدرسه که A بهتر از B است و به همین ترتیب.

با دانستن نوع داده‌ای منبع داده، می‌توان دریافت از چه نوع تکنیکی برای تحلیل آنها استفاده کرد.

در مورد آمار و تحلیل داده‌ها در بخش‌های بعدی بیشتر خواهید آموخت.


منابع آموزشی