در طول سالیان گذشته، اصطلاح یادگیری ماشینی (ML) که ترجمه عبارت Machine Learning است زیاد به گوش دوستداران حوزه هوش مصنوعی خورده است. یادگیری ماشینی فناوری پایهای هوش مصنوعی است و آشنایی با آن میتواند بینش ما را نسبت به فناوری هوش مصنوعی گسترش دهد.
در این مطلب میخواهیم آموزش یادگیری ماشین را به طور مختصر مرور کرده و به شما بگوییم یادگیری ماشینی چیست، چطور کار میکند و انواع یادگیری ماشین چیست.
یادگیری ماشینی چیست؟
یادگیری ماشینی (ML) رشتهای از هوش مصنوعی (AI) است که به ماشینها توانایی یادگیری خودکار از دادهها و تجربیات گذشته را میدهد و در عین حال الگوهایی را برای پیشبینی با کمترین مداخله انسانی شناسایی میکند.
روشهای یادگیری ماشینی، کامپیوترها را قادر میسازد تا بدون برنامهنویسی صریح به طور مستقل کار کنند. اپلیکیشنهای یادگیری ماشینی با دادههای جدید تغذیه میشوند و میتوانند به طور مستقل یاد بگیرند، رشد کنند، توسعه و تطبیق دهند.
یادگیری ماشینی با استفاده از الگوریتمها، برای شناسایی الگوها و یادگیری در یک فرایند تکراری، اطلاعات بینشبخش را از حجم زیادی از دادهها به دست میآورد. الگوریتمهای یادگیری ماشین از روشهای محاسباتی برای یادگیری مستقیم از دادهها به جای تکیه بر هر معادله از پیش تعیینشدهای که ممکن است به عنوان یک مدل باشد، استفاده میکنند.
عملکرد الگوریتمهای یادگیری ماشین به طور تطبیقی با افزایش تعداد نمونههای موجود در طول فرایندهای “یادگیری” بهبود مییابد.
برای مثال، یادگیری عمیق زیرمجموعهای از یادگیری ماشینی است که کامپیوترها را برای تقلید از ویژگیهای طبیعی انسان مانند یادگیری از مثالها آموزش و پارامترهای عملکرد بهتری نسبت به الگوریتمهای یادگیری ماشینی معمولی ارائه میدهد.
در حالی که یادگیری ماشین مفهوم جدیدی نیست –قدمت آن به جنگ جهانی دوم برمیگردد، زمانی که Enigma Machine مورد استفاده قرار گرفت – توانایی اعمال محاسبات پیچیده ریاضی به طور خودکار برای حجم و انواع دادههای موجود در حال رشد یا مثلا یادگیری ماشین با پایتون، یک پیشرفت نسبتا جدید است.
شاید این مطلب هم برایتان جالب باشد: هوش مصنوعی گوگل (جمینی)
امروزه با ظهور کلانداده، اینترنت اشیا و محاسبات فراگیر، یادگیری ماشین برای حل مشکلات در بسیاری از زمینهها ضروری است:
- مالی محاسباتی (امتیاز اعتبار، معاملات الگوریتمی)
- بینایی کامپیوتری (تشخیص چهره، ردیابی حرکت، تشخیص اشیا)
- زیستشناسی محاسباتی (توالییابی DNA، تشخیص تومور مغزی، کشف دارو)
- خودروسازی، هوافضا و تولید (تعمیر و نگهداری پیشبینی شده)
- پردازش زبان طبیعی (تشخیص صدا)
یادگیری ماشینی چطور کار میکند؟
الگوریتمهای یادگیری ماشین بر روی یک مجموعه داده آموزشی برای ایجاد یک مدل قالبگیری میشوند. همانطور که دادههای ورودی جدید به الگوریتم یادگیری ماشینی آموزشدیده معرفی میشود، از مدل توسعهیافته نیز برای پیشبینی استفاده میکند.
علاوه بر این، صحت پیشبینی نیز مورد بررسی قرار میگیرد. بر اساس دقت آن، الگوریتم ML یا مستقر میشود یا به طور مکرر با مجموعه داده آموزشی تقویت شده آموزش داده میشود تا زمانی که دقت مورد نظر به دست آید.
انواع یادگیری ماشینی
آموزش یادگیری ماشینی به روشهای مختلفی انجام میشود که هر روشی مزایا و معایب خود را دارد. بر اساس این روشها و روشهای یادگیری، یادگیری ماشین به طور کلی به چهار نوع اصلی طبقه بندی میشود:
- یادگیری ماشینی نظارتشده
این نوع از یادگیری ماشینی شامل نظارت است، جایی که ماشینها بر روی مجموعه دادههای برچسبگذاری شده آموزش میبینند و قادر به پیشبینی خروجیها بر اساس آموزش ارائهشده هستند.
مجموعه داده برچسبگذاری شده مشخص میکند که برخی از پارامترهای ورودی و خروجی قبلا نقشهبرداری شدهاند. از این رو، ماشین با ورودی و خروجی مربوطه آموزش داده میشود. دستگاهی برای پیشبینی نتیجه با استفاده از مجموعه داده آزمایشی در مراحل بعدی ساخته شده است.
به عنوان مثال، مجموعه داده ورودی از تصاویر طوطی و کلاغ را در نظر بگیرید. در ابتدا، دستگاه برای درک تصاویر، از جمله رنگ، چشم، شکل و اندازه طوطی و کلاغ آموزش دیده است. پس از آموزش، یک عکس ورودی از یک طوطی ارائه میشود و انتظار میرود که دستگاه شیء را شناسایی، و خروجی را پیشبینی کند.
ماشین آموزشدیده ویژگیهای مختلف جسم مانند رنگ، چشمها، شکل و غیره را در تصویر ورودی بررسی میکند تا پیشبینی نهایی را انجام دهد. این فرایند شناسایی شیء در یادگیری ماشینی نظارتشده است.
- یادگیری ماشینی بینظارت
یادگیری بدون نظارت به یک تکنیک یادگیری اشاره دارد که بدون نظارت انجام میشود. در اینجا، ماشین با استفاده از یک مجموعه داده بدون برچسب آموزش داده میشود و قادر است خروجی را بدون هیچ نظارتی پیشبینی کند.
هدف یک الگوریتم یادگیری بدون نظارت، گروهبندی مجموعه داده مرتبنشده بر اساس شباهتها، تفاوتها و الگوهای ورودی است.
به عنوان مثال، یک مجموعه داده ورودی از تصاویر یک ظرف پر از میوه را در نظر بگیرید. در اینجا، تصاویر برای مدل یادگیری ماشینی شناخته شده نیستند. هنگامی که مجموعه داده را در مدل یادگیری ماشینی وارد میکنیم، وظیفه مدل شناسایی الگوی اشیا، مانند رنگ، شکل یا تفاوتهایی است که در تصاویر ورودی مشاهده میشود و آنها را دستهبندی میکند. پس از طبقهبندی، دستگاه سپس خروجی را پیشبینی میکند که با یک مجموعه داده آزمایشی آزمایش میشود.
- یادگیری نیمهنظارتی
یادگیری نیمه نظارتشده شامل ویژگیهای یادگیری ماشین تحت نظارت و بدون نظارت است. از ترکیب مجموعه دادههای برچسبدار و بدون برچسب برای آموزش الگوریتمهای خود استفاده میکند. با استفاده از هر دو نوع مجموعه داده، یادگیری نیمه نظارتی بر اشکالات گزینههای ذکر شده در بالا غلبه میکند.
- یادگیری تقویتشده
یادگیری تقویتی یک فرایند مبتنی بر بازخورد است. در اینجا مولفه هوش مصنوعی به طور خودکار با روش آمارگیری و آزمایشی، محیط اطراف خود را بررسی، اقدام میکند، از تجربیات میآموزد و عملکرد را بهبود میبخشد. جزء برای هر عمل خوب پاداش و برای هر حرکت اشتباه جریمه میشود. بنابراین مولفه یادگیری تقویتی با انجام اقدامات خوب، پاداش را به حداکثر میرساند.
برخلاف یادگیری تحت نظارت، یادگیری تقویتی فاقد دادههای برچسبگذاری شده است و عوامل فقط از طریق تجربیات یاد میگیرند. بازیهای ویدیویی را در نظر بگیرید. یادگیری تقویتشده در اینجا بازی محیط و هر حرکت عامل تقویتکننده وضعیت آن را مشخص میکند.
عامل بازی حق دارد از طریق تنبیه و پاداش بازخورد دریافت کند و در نتیجه بر امتیاز کلی بازی تاثیر بگذارد. هدف نهایی نماینده دستیابی به امتیاز بالا است.
یادگیری ماشینی و هوش مصنوعی فارسی
یکی از مهمترین کاربردهای یادگیری ماشینی، استفاده از آن برای ساخت چتباتها و انواع هوش مصنوعی زاینده (مولد) بود.
هوشهای مصنوعی زاینده مثل زیگپ میتوانند انواع محتوا و تصویر را با پشتیبانی از زبان فارسی و فرمان صوتی تولید کنند و عملا یک دستیار هوشمند باشند.