ببخشید سوالی که چند وقته منو درگیر کرده اینه که ایا اونی که میخواد ماشین لرنینگ کاربکنه باید بصری سازی و کارکردن با کتابخانه هایی مثل matplotlib,seaborn ,pandas,... خیلی بلد باشه؟یا صرفا در حد مقدماتی اوکیه؟
سلام.
سوال بسیار خوبی پرسیدید. پاسخ به این سوال بستگی به نقش و عمق فعالیت شما در حوزهی یادگیری ماشین دارد، اما به طور کلی:
۱. برای شروع و کارهای معمولی (حداقل نیاز): - بصریسازی (Visualization): آشنایی مقدماتی با `matplotlib` و `seaborn` کافی است. مثلاً بتوانید نمودارهای خطی، هیستوگرام، scatter plot و boxplot بسازید. - پانداس (Pandas): باید بتوانید دادهها را بخوانید (`read_csv`)، تمیز کنید (حذف مقادیر NaN، تغییر نوع داده)، و عملیات ساده مانند فیلتر کردن و گروهبندی انجام دهید. - نیاز به تخصص عمیق؟ خیر. برای اکثر پروژههای ابتدایی و حتی بعضی مدلهای متوسط، همین سطح کفایت میکند.
---
۲. برای سطح پیشرفتهتر یا صنعتی: - طتحلیل اکتشافی داده (EDA): اگر میخواهید دادهکاوی حرفهای انجام دهید یا در تیمهای داده کار کنید، باید بتوانید بصریسازیهای پیچیدهتر و گزارشهای تحلیلی ایجاد کنید. - بهینهسازی و تنظیم مدل: گاهی با بصریسازی میتوانید رفتار مدل (مثل خطای آموزش/ارزیابی) را بهتر تحلیل کنید. - ارتباط نتایج: اگر نیاز به ارائهی نتایج به افراد غیرفنی دارید (مثل مدیران)، داشتن نمودارهای حرفهای بسیار کمککننده است.
---
۳. اگر فقط میخواهید مدل بسازید (مثلاً با scikit-learn یا TensorFlow): - میتوانید از کدهای ازپیشساختهشده برای بصریسازی استفاده کنید (مثلاً کتابخانههایی مثل `yellowbrick` مخصوص ML). - حتی بعضی ابزارهای AutoML (مثل PyCaret) بسیاری از تحلیلها را خودکار انجام میدهند.
---
جمعبندی: - برای شروع: یادگیری مقدماتی Pandas و matplotlib/seaborn کافی است. - برای حرفهایتر شدن: باید بتوانید دادهها را عمیقتر تحلیل و نتایج را به زیبایی نمایش دهید. - توصیه: اگر عجله دارید، روی مباحث مدلسازی تمرکز کنید، اما بهمرور مهارتهای بصریسازی را تقویت کنید.