زمان تخمینی مطالعه: 18 دقیقه
امروزه شاهد تحولات عظیمی در حوزه هوش مصنوعی و یادگیری ماشین هستیم. یکی از این تحولات، ظهور روشی نوین به نام AutoML یا یادگیری ماشین خودکار است. این روش، فرآیند ساخت مدلهای یادگیری ماشین را به طور خودکار یا مکانیزه انجام میدهد. با ظهور AutoML، این نگرانی به وجود آمده است که این روش جایگزین دانشمندان داده شده و آنها را از کار بیکار کند، اما اینگونه نیست و شرکتها همچنان نیازمند حضور نیروهای متخصص در این زمینه هستند.
تحولی سریع در حوزه هوش مصنوعی
مدلهای هوشمندی که گوگل، OpenAI و غیره به بازار عرضه کردهاند، به عنوان گامی مهم در مسیر هوش مصنوعی خود – ارتقا دهنده (Self-Improving AI)، توجه بسیاری را به خود جلب کرده است. این موضوع، بحثهایی را پیرامون آینده مشاغل مرتبط با هوش مصنوعی، مانند دانشمندان داده و مهندسین یادگیری ماشین، به وجود آورده است. برخی افراد با مشاهده پیشرفتهای هوش مصنوعی، معتقدند که این فناوری به زودی جایگزین انسان در حل مسایل پیچیده خواهد شد و نیازی به دخالت انسان در این زمینه باقی نخواهد ماند. در مقابل، متخصصان حوزه یادگیری ماشین، ضمن اذعان به قدرت و کارایی هوش مصنوعی خودکار، معتقدند که این فناوری هنوز توان رقابت با انسان را در تمام زمینهها ندارد.
یادگیری ماشین چیست؟
یادگیری ماشین یکی از شاخههای هوش مصنوعی است که به سیستمها اجازه میدهد بدون برنامهریزی صریح، از دادهها یاد بگیرند و پیشرفت کنند. به عبارت دیگر، سیستمهای یادگیری ماشین به جای اینکه با دستورات دقیق برنامهریزی شوند، با استفاده از دادهها آموزش میبینند و میتوانند به طور خودکار وظایف مختلف را انجام دهند. برخی از کاربردهای رایج یادگیری ماشین به شرح زیر است:
طبقهبندی: تشخیص چهره، دستهبندی ایمیلها، و تشخیص نوع سرطان.
پیشبینی: پیشبینی قیمت سهام، پیشبینی تقاضا برای محصولات، و پیشبینی آب و هوا.
رگرسیون: پیشبینی قیمت مسکن، پیشبینی میزان بارندگی، و پیشبینی نرخ بیکاری.
یادگیری ماشین شامل یکسری مراحل مشخص است. اولین قدم برای ساخت یک مدل یادگیری ماشین، جمعآوری دادههای مربوط به موضوع مورد نظر است. دادههای جمعآوری شده باید قبل از استفاده برای آموزش مدل، آمادهسازی شوند. این کار شامل تمیز کردن دادهها، حذف مقادیر از دست رفته و تبدیل دادهها به فرمت مناسب است. الگوریتمهای مختلفی برای یادگیری ماشین وجود دارد که هر کدام برای نوع خاصی از وظایف مناسب هستند. انتخاب الگوریتم مناسب به نوع دادهها و وظیفهای که میخواهید انجام دهید بستگی دارد. در این مرحله، الگوریتم یادگیری ماشین با استفاده از دادههای آموزش دیده، نحوه انجام وظیفه مورد نظر را یاد میگیرد. پس از آموزش مدل، باید عملکرد آن با استفاده از دادههای تست ارزیابی شود. یادگیری ماشین یک حوزه بسیار پویا و در حال رشد است و به طور مداوم در حال پیشرفت است. با افزایش حجم دادهها و قدرت محاسباتی، کاربردهای یادگیری ماشین نیز به طور فزایندهای در حال گسترش است.
فرآیند ساخت مدل یادگیری ماشین
در این بخش، به مراحل ساخت یک مدل یادگیری ماشین به طور گام به گام میپردازیم. هدف از این کار، فراهم کردن مقدمات لازم برای بحث در مورد خودکارسازی این مراحل در AutoML است. به طور کلی، مراحل ساخت مدل یادگیری ماشین به شرح زیر است:
شناسایی مساله در کسبوکار: اولین قدم، شناسایی یک مشکل یا چالش در کسبوکار است که میتوان با استفاده از یادگیری ماشین آن را حل کرد.
ترجمه مساله به زبان علم داده: پس از شناسایی مسئله، باید آن را به زبان علم داده ترجمه کرد. به عبارت دیگر، باید متغیرهای مرتبط با مسئله و نوع داده آنها را مشخص کرد.
جمعآوری داده: در این مرحله، دادههای مورد نیاز برای آموزش مدل جمعآوری میشود. این دادهها میتوانند از منابع مختلف مانند دیتابیسهای داخلی، وبسایتها و حسگرها جمعآوری شوند.
تعریف هدف و معیار: باید هدف از ساخت مدل و معیارهای سنجش عملکرد آن را مشخص کرد. این معیارها باید به گونهای باشند که قابلیت سنجش داشته باشند و ارتباط مستقیمی با مساله کسبوکار داشته باشند.
کاوش در داده: قبل از آموزش مدل، باید ویژگیهای موجود در دادهها را مورد بررسی قرار داد. این کار به شناسایی ویژگیهای مهم و حذف ویژگیهای نامربوط کمک میکند.
ساخت و آموزش مدل: در این مرحله، مدل یادگیری ماشین با استفاده از دادههای جمعآوری شده آموزش داده میشود. این فرآیند شامل انتخاب الگوریتم مناسب، مهندسی ویژگی، انتخاب ویژگی و تنظیم پارامترها است.
ارزیابی مدل: پس از آموزش مدل، باید عملکرد آن با استفاده از دادههای تست ارزیابی شود. اگر عملکرد مدل رضایتبخش نباشد، باید به مراحل قبل بازگشت و تنظیمات مدل را تغییر داد.
استقرار مدل: پس از تایید عملکرد مدل، باید آن را در محیط واقعی مستقر کرد. این کار میتواند شامل ایجاد API یا انتشار مدل در یک پلتفرم باشد.
تجاریسازی مدل: پس از استقرار مدل، میتوان از آن در سایر کاربردهای تجاری نیز استفاده کرد.
استفاده و بهکارگیری مدل: در نهایت، باید مدل به طور مداوم رصد شود و عملکرد آن به طور دورهای ارزیابی شود. در صورت نیاز، باید مدل دوباره آموزش داده شود یا تنظیمات آن تغییر داده شود.
یکی از نکات مهمی که باید در این زمینه به آن دقت کنید تعریف ابرپارامترها است. ابرپارامترها، پارامترهایی هستند که قبل از آموزش مدل تنظیم میشوند. برخلاف پارامترها که در حین آموزش مدل توسط الگوریتم یادگیری ماشین تنظیم میشوند، ابرپارامترها توسط کاربر تنظیم میشوند. برخی از نمونههای ابرپارامترها عبارتند از:
نرخ یادگیری: این پارامتر سرعت یادگیری مدل را کنترل میکند.
تعداد دورهها: این پارامتر تعداد دفعاتی که مدل روی دادهها آموزش داده میشود را مشخص میکند.
اندازه دسته: این پارامتر تعداد نمونههایی که در هر بار آموزش مدل استفاده میشوند را مشخص میکند.
انتخاب مقادیر مناسب برای ابرپارامترها میتواند تاثیر زیادی بر عملکرد مدل داشته باشد. اکنون وقت آن رسیده تا به طور مفصل به موضوع AutoML و نحوه خودکارسازی مراحل ساخت مدل یادگیری ماشین بپردازیم.
AutoML چیست؟
AutoML یا Automated Machine Learning، به مجموعهای از رویکردها، الگوریتمها و ابزارها گفته میشود که هدف آنها خودکارسازی فرآیند طراحی، آموزش و بهینهسازی مدلهای یادگیری ماشین است. AutoML سعی میکند فرآیند توسعه مدلهای یادگیری ماشین را سادهتر کند و به محققان و توسعهدهندگانی که تخصص کافی در حوزه یادگیری ماشین ندارند، امکان استفاده از این تکنیکها را بدهد. با استفاده از AutoML، مراحل مختلفی از طراحی مدلهای یادگیری ماشین، از جمله انتخاب ویژگیها، انتخاب مدل، تنظیم پارامترها و بهینهسازی مدل، به صورت خودکار انجام میشود. به عبارت دیگر، AutoML تلاش میکند به صورت خودکار و بهینهترین روشها را برای مسایل یادگیری ماشین پیدا کند و مدلهای بهتر و عملکرد بالاتری ایجاد کند.
AutoML یکسری مزایای کلیدی در اختیار ما قرار میدهد. اولین مورد کاهش نیاز به تخصص عمیق در حوزه یادگیری ماشین است. با استفاده از AutoML، افرادی که اطلاعات اولیه کمی در ارتباط با یادگیری ماشین دارند قادر به استفاده از آن هستند. از آنجایی که بسیاری از مراحل زمانبر در طراحی مدلهای یادگیری ماشین به صورت خودکار انجام میشوند، زمان مورد نیاز برای توسعه مدل کاهش مییابد. AutoML با استفاده از الگوریتمها و روشهای خاص خود، سعی در پیدا کردن بهترین ترکیب و تنظیمات برای مدلهای یادگیری ماشین دارد که عملکرد آنها را بهبود میبخشد. به از ابزارها و سرویسهای AutoML میتوان به Google AutoML، Microsoft Azure AutoML و AutoKeras اشاره کرد. AutoML به طور خلاصه، فرآیند ساخت مدلهای یادگیری ماشین را بدون نیاز به دانش تخصصی و کدنویسی، خودکار میکند. این روش، وظایف مختلفی مانند آمادهسازی دادهها، انتخاب الگوریتم مناسب، تنظیم پارامترها و ارزیابی مدل را به طور خودکار انجام میدهد.
روشهای پیادهسازی AutoML
همانگونه که اشاره کردیم، AutoML یا یادگیری ماشین خودکار، به مجموعهای از ابزارها و تکنیکهایی اشاره دارد که مراحل ساخت مدلهای یادگیری ماشین را خودکارسازی میکنند. این روشها میتوانند به تسریع فرآیند توسعه و کاهش نیاز به دانش تخصصی در این زمینه کمک کنند. برخی از روشهای رایج پیادهسازی AutoML به شرح زیر هستند:
جستوجوی خودکار: در این روش، فضای جستجو برای یافتن بهترین الگوریتم و پارامترها برای مدل یادگیری ماشین به طور خودکار بررسی میشود. این کار میتواند با استفاده از الگوریتمهای جستجوی تصادفی مانند جستوجوی تصادفی یا جستجوی بیزی انجام شود.
انتقال یادگیری: در این روش، از مدلهای از پیش آموزشدیده برای آموزش مدلهای جدید استفاده میشود. این کار میتواند به کاهش زمان و منابع مورد نیاز برای آموزش مدلهای جدید کمک کند.
مهندسی ویژگی خودکار: در این روش، ویژگیهای جدید به طور خودکار از دادهها استخراج میشود. این کار میتواند به افزایش دقت و کارایی مدلهای یادگیری ماشین کمک کند.
پشتهسازی: در این روش، چندین مدل یادگیری ماشین با هم ترکیب میشوند تا مدل نهایی را ایجاد کنند. این کار میتواند به افزایش دقت و کارایی مدل نهایی کمک کند.
تجمیع: در این روش، نتایج چند مدل یادگیری ماشین با هم ترکیب میشوند تا پیشبینی نهایی را ایجاد کنند. این کار میتواند به افزایش دقت و کارایی پیشبینی نهایی کمک کند.
انتخاب روش مناسب برای پیادهسازی AutoML به عوامل مختلفی مانند نوع داده، نوع مساله و منابع موجود بستگی دارد. برخی از ابزارهای محبوب که در زمینه خودکارسازی یادگیری ماشین قابل استفاده هستند به شرح زیر است:
Google Cloud AutoML: این ابزار به شما امکان میدهد تا بدون نیاز به دانش تخصصی، مدلهای یادگیری ماشین را برای وظایف مختلفی مانند طبقهبندی تصویر، تشخیص اشیا و پیشبینی قیمت ایجاد کنید.
Amazon SageMaker: این ابزار به شما امکان میدهد تا مدلهای یادگیری ماشین را برای وظایف مختلفی مانند طبقهبندی متن، پیشبینی تقاضا و تشخیص تقلب ایجاد کنید.
Microsoft Azure Machine Learning Studio: این ابزار به شما امکان میدهد تا مدلهای یادگیری ماشین را برای وظایف مختلفی مانند طبقهبندی تصویر، تشخیص اشیا و پیشبینی قیمت ایجاد کنید.
ابرپارامتر در یادگیری ماشین به چه معناست؟
در یادگیری ماشین، ابرپارامترها (Hyperparameters) مقادیر قابل تنظیمی هستند که تعیین کننده رفتار و عملکرد مدل یادگیری ماشین هستند. این پارامترها نیستند که توسط خود مدل یادگیری ماشین یاد گرفته میشوند، بلکه توسط توسعهدهنده مدل یا مهندس داده تعیین میشوند. به بیان دقیقتر، ابرپارامترها مقادیری هستند که تنظیمات مدل را مشخص میکنند و تاثیر مستقیم بر عملکرد و عملکرد بهینه مدل دارند. از مثالهایی در ارتباط با ابرپارامترها باید به نرخ یادگیری (learning rate) در الگوریتمهای گرادیان کاهشی، تعداد لایهها و نرونها در شبکه عصبی، تعداد درختان تصمیم در یک روش ماشین بردار پشتیبان (SVM) و غیره. تنظیم ابرپارامترها بهطور کامل براساس تجربه و آزمون و خطا انجام میشود. تغییر این پارامترها ممکن است تاثیر عمدهای بر عملکرد و دقت مدل داشته باشد. بنابراین، بهینهسازی ابرپارامترها یکی از مراحل مهم در فرآیند ساخت و بهبود مدل یادگیری ماشین است. ابزارهای AutoML همچنین میتوانند برای پیدا کردن بهترین مقادیر ابرپارامترها به صورت خودکار و بهینه استفاده شوند.
بهینه سازی ابرپارامتر چیست؟
بهینهسازی ابرپارامتر (Hyperparameter Optimization) فرایندی است که در آن مقادیر بهینه برای ابرپارامترهای یک مدل یادگیری ماشین تعیین میشوند. هدف از بهینهسازی ابرپارامترها، یافتن تنظیماتی است که عملکرد مدل یادگیری ماشین را بهتر میکند. همانگونه که پیشتر اشاره کردیم، در فرآیند ساخت مدل یادگیری ماشین، ابرپارامترها مقادیری قابل تنظیم هستند که تعیین کننده رفتار و عملکرد مدل هستند، اما انتخاب مقادیر بهینه برای این پارامترها چالش بزرگی است. توسعهدهندگان مدل معمولا نیاز دارند برای یافتن بهترین تنظیمات ابرپارامترها را به شکل آزمون و خطا مورد بررسی قرار دهند که ممکن است زمانبر و پُر هزینه باشد.
بههسازی ابرپارامترها به منظور اتوماسیون و بهبود فرآیند انتخاب آنها صورت میگیرد. این فرآیند میتواند شامل روشهای مختلفی مانند جستوجوی خطی، جستجوی تصادفی، بهینهسازی گروهی، الگوریتمهای بهینهسازی مانند الگوریتمهای تکاملی و بهینهسازی گسسته و همچنین روشهای هوش مصنوعی مانند جستوجوی مبتنی بر اجتماع (PSO) و الگوریتم ژنتیکی باشد.
بهینهسازی ابرپارامترها به صورت مکرر و تکراری انجام میشود تا مقادیر بهتری برای این پارامترها پیدا شود و عملکرد مدل یادگیری ماشین به حداکثر برسد. با استفاده از ابزارهای AutoML و الگوریتمهای بهینهسازی، این فرآیند میتواند به صورت خودکار و موثرتر انجام شود و زمان و تلاش مورد نیاز برای تنظیم ابرپارامترها را کاهش دهد.
چالشهای AutoML چه هستند؟
AutoML یا یادگیری ماشین خودکار، مجموعهای از فناوریها و راهکارهایی است که هدف آن سادهسازی و تسریع فرآیند ساخت مدلهای یادگیری ماشین است. با این حال، یادگیری ماشین خودکار نیز چالشهای خاص خود را دارد. یکی از چالشهای اساسی آن این است که چگونه میتوان به نتایج حاصل از AutoML اعتماد کرد و آیا مدل حاصل واقعا بهترین مدل ممکن است؟ بنابراین، بسیاری از فناوریها و راهکارهای AutoML به کاربران امکان تنظیم برخی از ابرپارامترها را میدهند. این رویکرد به کاربران اجازه میدهد چند مدل مختلف را ایجاد کرده و آنها را با یکدیگر مقایسه کنند. اما این امکان ممکن است باعث از بین رفتن برتریهای اصلی یادگیری ماشین خودکار، یعنی سادگی و سرعت، شود.
چالش دوم AutoML این است که هنوز هم به دانش فنی وابسته است. به عبارت دیگر، AutoML بیشتر نیاز به یک دانشمند داده دارد تا مدل ساخته شده را بررسی کرده و بهترین مدل یا مدلها را برای استفاده تجاری انتخاب کند. اگر در مرحله ارزیابی چند مدل با راندمان مناسب وجود داشته باشد، ممکن است دانشمند داده از فناوریهای دیگری برای ساخت مدل نهایی واقعی استفاده کند. این موضوع باعث از بین رفتن برتریهای AutoML در زمینه سادهسازی و تسریع فرآیند یادگیری ماشین است. به منظور غلبه بر این مشکل، راهکارهایی مانند پیادهسازی AutoML در سطوح مختلف مورد استفاده قرار میگیرد.
سطوح مختلف AutoML: گامی به سوی خودکارسازی کامل یادگیری ماشین
برخی از متخصصان AutoML را به سطوح مختلف تقسیم میکنند. این سطوح بر اساس میزان خودکارسازی وظایف مختلف در فرآیند ساخت مدل یادگیری ماشین تعیین میشوند.
سطح صفر: بدون خودکارسازی، در این سطح، کاربر تمام مراحل ساخت مدل را به طور دستی انجام میدهد. این کار شامل انتخاب الگوریتم، تنظیم پارامترها، مهندسی ویژگی و ارزیابی مدل میشود.
سطح یک: استفاده از ابزارهای موجود؛ در این سطح، کاربر از ابزارها و کتابخانههای موجود مانند Scikit-learn، Keras و Pandas برای انجام برخی از وظایف ساخت مدل به طور خودکار استفاده میکند.
سطح دو: تنظیم خودکار ابرپارامترها؛ در این سطح، ابزارهای AutoML برای تنظیم خودکار ابرپارامترها مانند نرخ یادگیری و تعداد دورهها استفاده میشوند.
سطح سه: مهندسی و انتخاب ویژگی خودکار؛ در این سطح، ابزارهای AutoML برای مهندسی ویژگی و انتخاب ویژگی به طور خودکار استفاده میشوند.
سطح چهار: خودکارسازی کامل؛ در این سطح، تمام مراحل ساخت مدل به طور خودکار انجام میشود. این سطح هنوز به طور کامل تحقق نیافته است، اما تحقیقات در این زمینه در حال پیشرفت است.
AutoML یکسری مزایای شاخص به شرح زیر در اختیار ما قرار میدهد:
تسریع فرآیند توسعه: AutoML میتواند به کاهش زمان مورد نیاز برای ساخت مدلهای یادگیری ماشین کمک کند.
کاهش نیاز به دانش تخصصی: AutoML میتواند به افراد بدون دانش تخصصی در زمینه یادگیری ماشین اجازه دهد تا مدلهای خود را بسازند.
افزایش دقت و کارایی: AutoML میتواند به افزایش دقت و کارایی مدلهای یادگیری ماشین کمک کند.
AutoML یک ابزار قدرتمند است که میتواند به تسریع فرآیند توسعه و کاهش نیاز به دانش تخصصی در زمینه یادگیری ماشین کمک کند. AutoML دارای سطوح مختلفی است که هر کدام مزایا و معایب خاص خود را دارند. انتخاب سطح مناسب AutoML به نوع پروژه، میزان دانش تخصصی و منابع موجود بستگی دارد.
یادگیری ماشین در برابر AutoML: تفاوتی ظریف با تاثیری بزرگ
یادگیری ماشین و AutoML هر دو به ساخت مدلهای یادگیری ماشین میپردازند، اما رویکردهای آنها متفاوت است. در یادگیری ماشین سنتی، کاربر وظایف مختلفی را در فرآیند ساخت مدل به طور دستی انجام میدهد. این وظایف شامل انتخاب الگوریتم، تنظیم پارامترها، مهندسی ویژگی و ارزیابی مدل میشود. AutoML یا یادگیری ماشین خودکار، به مجموعهای از ابزارها و تکنیکها اشاره دارد که مراحل ساخت مدلهای یادگیری ماشین را به طور خودکار انجام میدهد. این روشها میتوانند به تسریع فرآیند توسعه و کاهش نیاز به دانش تخصصی در این زمینه کمک کنند.
تفاوت کلیدی بین یادگیری ماشین سنتی و AutoML در میزان خودکارسازی وظایف مختلف در فرآیند ساخت مدل است. در یادگیری ماشین سنتی، کاربر کنترل کاملی بر تمام مراحل فرآیند دارد، کاربر باید دانش تخصصی در زمینه یادگیری ماشین داشته باشد و فرآیند ساخت مدل میتواند زمانبر و دشوار باشد.
در AutoML، بسیاری از وظایف به طور خودکار انجام میشود، کاربر به دانش تخصصی کمتری در زمینه یادگیری ماشین نیاز دارد و فرآیند ساخت مدل میتواند سریعتر و آسانتر باشد.
AutoML در سادهترین حالت، میتواند جستوجوی فراگیری بر ابرپارامترها و مدلهای ممکن انجام دهد. این کار شامل آزمایش ترکیبات مختلف از پارامترها و مدلها برای یافتن بهترین مدل برای مساله مورد نظر است. جستوجوی فراگیر یکسری مزایای شاخص در اختیار ما قرار میدهد که از مهمترین آنها به موارد زیر باید اشاره کرد:
قابلیت یافتن بهترین مدل ممکن: جستوجوی فراگیر میتواند بهترین مدل ممکن را برای مساله مورد نظر پیدا کند.
کاهش نیاز به دانش تخصصی: جستوجوی فراگیر به کاربر با دانش تخصصی کمتری در زمینه یادگیری ماشین اجازه میدهد تا مدلهای با کیفیتی بسازد.
تسریع فرآیند توسعه: جستوجوی فراگیر میتواند فرآیند توسعه مدل را سریعتر کند.
از معایب جستوجوی فراگیر به موارد زیر اشاره کرد:
هزینه بالا: جستوجوی فراگیر میتواند هزینه بالایی داشته باشد، زیرا نیاز به اجرای آزمایشهای متعددی دارد.
زمانبر بودن: جستوجوی فراگیر میتواند زمانبر باشد، به خصوص برای مسایل پیچیده.
نکتهای که باید در این زمینه به آن اشاره داشته باشیم، روشهای نوین در حال توسعه در ارتباط با AutoML هستند که برخی از معایب جستوجوی فراگیر را برطرف خواهند کرد. این روشها شامل انتقال یادگیری، مهندسی ویژگی خودکار و پشتهسازی میشود.
انتقال یادگیری از مدلهای از پیش آموزشدیده برای آموزش مدلهای جدید استفاده میکند. این کار میتواند به کاهش زمان و منابع مورد نیاز برای آموزش مدلهای جدید کمک کند. مهندسی ویژگی خودکار ویژگیهای جدید را به طور خودکار از دادهها استخراج میکند. این کار میتواند به افزایش دقت و کارایی مدلهای یادگیری ماشین کمک کند. پشتهسازی چندین مدل یادگیری ماشین را با هم ترکیب میکند تا مدل نهایی را ایجاد کند. این کار میتواند به افزایش دقت و کارایی مدل نهایی کمک کند.
آیا AutoML جایگزین دانشمندان داده خواهد شد؟
با توجه به قدرت و کارایی AutoML، این سوال مطرح میشود که آیا این فناوری جایگزین دانشمندان داده خواهد شد؟ پاسخ به این سوال پیچیده است. از یک سو، AutoML میتواند وظایف تکراری و زمانبر را به طور خودکار انجام دهد و دانشمندان داده را از این وظایف آزاد کند. این کار به دانشمندان داده فرصت میدهد تا بر وظایف پیچیدهتر و خلاقانهتر مانند مهندسی ویژگی، انتخاب الگوریتم و ارزیابی مدل تمرکز کنند. از سوی دیگر، AutoML هنوز در مراحل ابتدایی توسعه است و نمیتواند تمام وظایف دانشمندان داده را انجام دهد. AutoML به دادههای با کیفیت و مهندسی ویژگی مناسب نیاز دارد تا به طور موثر کار کند. دانشمندان داده نقش مهمی در تهیه دادههای با کیفیت و طراحی مهندسی ویژگی مناسب دارند.
علاوه بر این، AutoML میتواند مسایل اخلاقی را به وجود آورد. مدلهای یادگیری ماشین ساخته شده با AutoML ممکن است تبعیضآمیز یا غیرقابل تعبیر باشند. دانشمندان داده باید بر عملکرد مدلهای یادگیری ماشین نظارت کنند و مسایل اخلاقی را شناسایی و حل کنند. در نهایت، AutoML ابزاری قدرتمند است که میتواند به دانشمندان داده کمک کند تا وظایف خود را به طور موثرتر انجام دهند. AutoML جایگزین دانشمندان داده نخواهد شد، اما نقش آنها را در فرآیند ساخت مدلهای یادگیری ماشین تغییر خواهد داد. در آینده، دانشمندان داده به مهارتهای جدیدی مانند مهندسی ویژگی پیشرفته، انتخاب الگوریتم و ارزیابی مدل نیاز خواهند داشت. همچنین، دانشمندان داده باید بر مسایل اخلاقی مرتبط با هوش مصنوعی تسلط داشته باشند. برخی از وظایف که دانشمندان داده در آینده بر روی آنها تمرکز خواهند کرد به شرح زیر هستند:
مهندسی پیشرفته ویژگیها:
استخراج ویژگیهای جدید از دادهها
انتخاب بهترین ویژگیها برای مدل
انتخاب الگوریتم:
انتخاب الگوریتم مناسب برای مساله مورد نظر
تنظیم پارامترهای الگوریتم
ارزیابی مدل:
سنجش عملکرد مدل
شناسایی و حل مسایل مربوط به مدل
نظارت بر مدل:
نظارت بر عملکرد مدل در طول زمان
شناسایی و حل مسایل مربوط به تبعیض و تعبیرپذیری
به طور کلی، AutoML فرصتی پیشروی دانشمندان داده قرار میدهد تا وظایف خود را به طور موثرتر انجام دهند و مدلهای یادگیری ماشین را به طور کارآمدتر بسازند. با توسعه AutoML، نقش دانشمندان داده در فرآیند ساخت مدلهای یادگیری ماشین تغییر خواهد کرد، اما اهمیت آنها کاهش نخواهد یافت.
بخوانید: FaaS یا تابع به عنوان سرویس چیست؟
بدون دیدگاه