یادگیری ماشین روشی برای تحلیل داده ها است که ساخت مدل تحلیلی را به صورت خودکار در می آورد. در واقع یادگیری ماشین شاخه ای از هوش مصنوعی است که مبتنی بر این ایده است که سیستم ها می توانند با حداقل دخالت های انسانی از داده ها بیاموزند، الگو ها را شناسایی کرده و تصمیم بگیرند.
تکامل یادگیری ماشین
به دلیل فناوری های جدید محاسباتی، امروزه یادگیری ماشین مانند گذشته نیست. این مسئله از شناخت الگو و این تئوری متولد شده است که کامپیوتر ها می توانند بدون برنامه ریزی برای انجام کار های خاص، یاد بگیرند. محققان علاقه مند به هوش مصنوعی می خواستند ببینند آیا کامپیوتر ها می توانند از داده ها یاد بگیرند یا خیر.
جنبه تکراری machine learning مهم است زیرا وقتی مدل ها در معرض داده های جدید قرار می گیرند، می توانند به طور مستقل با آن ها سازگار شوند. آن ها از محاسبات قبلی یاد می گیرند تا تصمیمات و نتایج قابل اعتماد و قابل تکرار تولید کنند. این علمی است که جدید نیست، اما جنبش تازه ای پیدا کرده است.
در حالی که بسیاری از الگوریتم های یادگیری ماشین برای مدت طولانی وجود داشته است، توانایی اعمال خودکار محاسبات ریاضی پیچیده در داده های بزرگ (big data)، بار ها و بار ها، سریع تر انجام شده که این یکی از پیشرفت های اخیر است. در اینجا چند نمونه از برنامه های یادگیری ماشین را که ممکن است با آن ها آشنایی داشته باشید به طور گسترده تبلیغ شده است، آورده ایم:
- اتومبیل هیجان انگیز خودران گوگل: ماهیت یادگیری ماشین.
- پیشنهادات آنلاین پلتفرم هایی مانند آمازون و نتفلیکس: برنامه های یادگیری ماشین برای زندگی روزمره.
- دانستن اینکه مشتریان در توییتر در مورد شما چه می گویند: یادگیری ماشینی همراه با ایجاد قانون زبان شناسی.
- تشخیص کلاه برداری: یکی از بارز ترین و مهم ترین موارد استفاده از یادگیری ماشین در دنیای امروز.
چرا یادگیری ماشینی مهم است؟
علاقه مفرط افراد به یادگیری ماشین به همان عواملی وابسته است که باعث محبوبیت داده کاوی (data mining) و تجزیه و تحلیل بیزی بیشتر از هر زمان دیگر شده است. مواردی مانند افزایش حجم و انواع داده های موجود، پردازش محاسباتی ارزان و قدرتمند تر و ذخیره سازی مقرون به صرفه و موارد دیگر بر محبوبیت یادگیری ماشین می افزاید.
همه این موارد به معنای تولید سریع و خودکار مدل هایی است که بتوانند داده های بزرگ تر و پیچیده تری را تجزیه و تحلیل کنند و نتایج سریع تر و دقیق تری را حتی در مقیاس بسیار بزرگ ارائه دهند. با ساختن مدل های دقیق، یک سازمان، شانس بیشتری در شناسایی فرصت های سود آور یا جلوگیری از خطرات ناشناخته دارد.
چه چیزی برای ایجاد سیستم های یادگیری ماشین خوب لازم است؟
- قابلیت های آماده سازی داده ها
- الگوریتم های اساسی و پیشرفته
- اتوماسیون و فرایند های تکراری
- مقیاس پذیری
- مدل سازی کلی
آیا می دانستید که…
- در یادگیری ماشین، به هدف، برچسب (label) گفته می شود
- در آمار، هدف را متغیر وابسته می نامند
- متغیر ها در آمار، در واقع همان ویژگی ها در یادگیری ماشین هستند
- تحول در آمار را ایجاد ویژگی در یادگیری ماشین می نامند
چه کسانی از یادگیری ماشین استفاده می کند؟
اکثر صنایعی که با داده های زیادی کار می کنند ارزش فناوری یادگیری ماشین را تشخیص داده اند. با جمع آوری بینش از این داده ها، غالباً در زمان واقعی (real time)، سازمان ها قادر به کار موثر تر هستند و نسبت به رقبا برتری دارند.
1. خدمات مالی
بانک ها و سایر مشاغل صنعت مالی از فناوری machine learning برای دو هدف اساسی استفاده می کنند: شناسایی بینش مهم در داده ها و جلوگیری از تقلب. بینش ها می توانند فرصت های سرمایه گذاری را شناسایی کنند یا به سرمایه گذاران کمک کنند تا بدانند چه موقع باید تجارت کنند. داده کاوی همچنین می تواند مشتریانی را که دارای سوابق پر خطر هستند شناسایی کند و یا برای تعیین دقیق علائم هشدار دهنده کلاهبرداری از نظارت بر امنیت سایبری استفاده کند.
2. دولت
آژانس های دولتی مانند امنیت عمومی و در کل خدمات عمومی نیاز ویژه ای به یادگیری ماشین دارند زیرا منابع مختلفی از داده ها را می توان برای بینش بدست آورد. برای مثال تجزیه و تحلیل داده های حسگر، روش هایی را برای افزایش کارایی و صرفه جویی در هزینه شناسایی می کند. machine learning همچنین می تواند به کشف تقلب و به حداقل رساندن سرقت هویت کمک کند.
3. خدمات بهداشتی
یادگیری ماشین به لطف ظهور دستگاه های پوشیدنی و حسگر هایی که می توانند از داده ها برای ارزیابی سلامت بیمار در زمان واقعی استفاده کنند، در صنعت مراقبت های بهداشتی روند در حال رشد بسیار سریعی است. این فناوری همچنین می تواند به متخصصان پزشکی در تجزیه و تحلیل داده ها برای شناسایی ترند ها یا علائم مشخص بیمار کمک کند که ممکن است منجر به بهبود تشخیص ها و درمان شود.
4. صنعت نفت و گاز
یافتن منابع انرژی جدید، تجزیه و تحلیل مواد معدنی موجود در زمین، پیش بینی خرابی سنسور پالایشگاه، ساده سازی توزیع روغن برای کارآمد و مقرون به صرفه بودن آن و… تعداد موارد استفاده از یادگیری ماشین برای این صنعت بسیار زیاد است و هنوز در حال گسترش است.
5. خرده فروشی
وب سایت هایی که مواردی را که ممکن است دوست داشته باشید براساس خرید های قبلی توصیه می کنند، از روش یادگیری ماشین برای تجزیه و تحلیل سابقه خرید شما استفاده می کنند. خرده فروشان به یادگیری ماشین برای گرفتن داده ها، تجزیه و تحلیل آن ها و استفاده از آن ها برای شخصی سازی یک تجربه خرید، پیاده سازی یک کمپین بازاریابی، بهینه سازی قیمت، برنامه ریزی عرضه کالا و بینش مشتری اعتماد می کنند.
6. حمل و نقل
تجزیه و تحلیل داده ها برای شناسایی الگو ها و روند ها در صنعت حمل و نقل مهم است که به کارآیی بیشتر مسیر ها و پیش بینی مشکلات احتمالی برای افزایش سودآوری متکی است. تجزیه و تحلیل داده ها و مدل سازی جنبه های یادگیری ماشین ابزار مهمی برای شرکت های تحویل دهنده، حمل و نقل عمومی و سایر سازمان های حمل و نقل است.
چند متد محبوب یادگیری ماشین چیست؟
دو مورد از متداول ترین متد های یادگیری ماشین، یادگیری تحت نظارت و یادگیری بدون نظارت است، اما متد های دیگری نیز برای یادگیری ماشین وجود دارد. در اینجا مروری بر محبوب ترین انواع آن وجود دارد.
1. یادگیری نظارت شده (Supervised learning)
الگوریتم های یادگیری نظارت شده با استفاده از مثال های دارای برچسب آموزش می بینند، مانند ورودی که خروجی مشخصی دارد. به عنوان مثال یک قطعه از تجهیزات می تواند دارای نقاط داده باشد که دارای برچسب “F” (خراب) یا “R” (درست) هستند. الگوریتم یادگیری مجموعه ای از ورودی ها را به همراه خروجی های صحیح مربوطه دریافت می کند و الگوریتم با مقایسه خروجی واقعی خود با خروجی های صحیح، برای یافتن خطا می آموزد.
سپس مدل را متناسب با آن اصلاح می کند. یادگیری نظارت شده از طریق روش هایی مانند طبقه بندی، رگرسیون، پیش بینی و افزایش شیب از الگو هایی برای پیش بینی مقادیر برچسب روی داده ها استفاده می کند. یادگیری نظارت شده معمولاً در برنامه هایی که داده های تاریخی وقایع احتمالی آینده را پیش بینی می کنند، استفاده می شود. به عنوان مثال این متر می تواند پیش بینی کند که معاملات کارت اعتباری جعلی است یا خیر.
2. یادگیری بدون نظارت (Unsupervised learning)
یادگیری بدون نظارت در برابر داده هایی استفاده می شود که هیچ برچسب تاریخی ندارند. “پاسخ درست” به سیستم گفته نمی شود. الگوریتم باید آنچه را نشان داده شده کشف کند. هدف کاوش داده ها و یافتن برخی ساختار ها در داخل است.
یادگیری بدون نظارت روی داده های معاملاتی به خوبی کار می کند. به عنوان مثال می تواند گروه هایی از مشتری را با ویژگی های مشابه شناسایی کند که پس از آن می توان در بحث های بازاریابی با آن ها رفتار مشابهی داشت. همچنین می تواند ویژگی های اصلی پیدا کند که گروه های مشتری را از یکدیگر جدا می کند.
تکنیک های معروف شامل نقشه های خود سازماندهی شده، نقشه برداری از نزدیک ترین همسایه، خوشه بندی k-means و تجزیه ارزش واحد است. این الگوریتم ها همچنین برای تقسیم بندی مباحث متنی، توصیه موارد و شناسایی داده های دور افتاده استفاده می شوند.
3. یادگیری تقویتی (Reinforcement learning)
یادگیری تقویتی اغلب برای رباتیک، بازی و تعیین مسیر استفاده می شود. در یادگیری تقویتی الگوریتم از طریق آزمون و خطا متوجه می شود که کدام عملکرد ها بیشترین پاداش را دارند. این نوع یادگیری دارای سه مولفه اصلی است: عامل (یادگیرنده یا تصمیم گیرنده)، محیط (هر چیزی که عامل با آن ارتباط برقرار می کند) و اقدامات (کاری که نماینده می تواند انجام دهد).
هدف این است که نماینده اقداماتی را انتخاب کند که پاداش مورد انتظار را برای مدت زمان مشخصی به حداکثر برساند. نماینده با پیروی از یک سیاست خوب خیلی سریع تر به هدف خواهد رسید. بنابراین هدف در یادگیری تقویتی، یادگیری بهترین سیاست است.
انسان ها به طور معمول می توانند یک یا دو مدل خوب در هفته ایجاد کنند. یادگیری ماشین می تواند هزاران مدل در هفته ایجاد کند.
Thomas H. Davenport
امیدواریم این مقاله برای شما مفید واقع شده باشد و به مطالب مرتبط با این مقاله در آینده نیز رجوع کنید و آموزش های جامعی در رابطه یادگیری ماشین در سایت ما کسب کنید.
منبع: sas.com