Saturday، ۱۵ Amordaad ۱۴۰۱
اون چیزی که این روزها نظارهگرش هستیم این هست که حوزه تحلیل داده و مشاغل مرتبط با اون به شغلهای پرطرفدار تبدیل شدهاند. نکته حائز اهمیت ورود بسیاری از متقاضیان به این حوزه از رشتههای غیرمرتبط هست! به طوری که در دورههای تحلیل داده در مراکز آموزشی مختلف میبینیم که شرکتکنندگان از رشتههایی به غیر از IT و مهندس نرم افزار یا صنایع با توجه به تقاضا و ظرفیت بازار کار این حوزه داوطلب حضور در این دورهها شدند. اما کسانی که در دورههای مختلف مربوط به حوزه تحلیل داده شرکت میکنند در آینده چه عناوین شغلی در انتظار اونهاست؟
خب اگر بخواهیم طیفهای شغلی مرتبط با حوزه علم داده جستوجو کنیم احتمالا به عناوین شغلی زیر برخورد میکنیم:
اما جایگاه و ارتباط هر کدوم از این شغلها به چه ترتیبی هست؟
اول اینکه مرز این عناوین شغلی در خیلی موارد با هم همپوشانی دارند و بسته به ابعاد و نوع کسب و کار شرکتها ممکن هست که این شغلها باهم ادغام یا حتی یکی هم بشن! اما برای ایجاد یک تصویر برای مخاطبان این پُست این موضوع را در قالب فرایند جریان داده زیر نمایش میدم:
همانطور که احتمالا میدونید (اگر نمیدونید با یک سرچ ساده در گوگل درباره ETL بیشتر دستگیرهاتون میشه) این یک شمای کلی و بدون جزئیات از فرایند (Extract, Transform & Load) ETL هست و جالب اینجاست که تمامی مشاغلی که در بالا ذکر شد بخشی از این زنجیره رو پوشش میدهند. برای مثال اگر از سمت چپ نمودار که اول داستان هم هست شروع کنیم، به موضوع منابع دادهای میرسیم یعنی جایی که باید دادهها وجود داشته باشه! نکته ای که هست اینه که قبل از اینکه دادهها ایجاد شوند باید یک ساختار بانک اطلاعاتی یا دیتابیسی وجود داشته باشه تا دادهها در اون شکل بگیرن و این موضوع مرتبط میشه با حوزه مشاغل طراحی دیتابیس که کارهای طراحی و پیادهسازی دیتابیسهارو به عهده داره (دیتابیسها میتونن خیلی ساده از Excel تا SQL یا زیرساخت بانک اطلاعاتی حرفهای دیگری باشه)، کنار اون ادمین دیتابیس هم کارهای مربوط به حوزه خودش رو در این بخش نمودار انجام میده. کمی جلوتر که بریم وقتی به فاز Extract و Transform میرسیم که در واقع میشه همون فاز جمعآوری، آمادهسازی و پاکسازی دیتا (Data Cleansing) که اساس کار یک مهندس داده یا Data Engineer هست. از فرایند Load که میتونه لزوما به توسعه انبار داده هم ختم نشه مربوط میشه به کارشناسان حوزه انبار داده یا Data Warehouse Developer، بعد از این نوبت به مرحله Analyze میرسه که خوب مسلما شغل تحلیلگر داده یا Data Analyst بیشتر از هر کسی درگیر این مرحله میشه و نهایتا بعد از فرایند تحلیل داده نوبت به مصورسازی میرسه که تخصص کسانی هستند که در حوزه طراحی و توسعه داشبوردها و Data Visualization فعالیت دارند. خیلی مواقع هم کسی که BI Developer هست مجموعه وظایفی از مرحله Extract تا انتهای ماجرا را برعهده خواهد داشت. دانشمند داده یا همون Data Scientist کسی است که حوزه مسئولیتها و اختیاراتش بیشتر از همه عناوین شغلی قبلی هست، درگیر کل زنجیره و فرایند ETL از ابتدا تا انتهاست.
نکته قابل توجه اینجاست که هر چی به سمت راست و چپ ماجرا حرکت میکنیم به شغلهای تحلیلگر سیستم (System Analyst)، تحلیلگر کسب و کار (Business Analyst) و تحلیلگر فرایندهای کسب و کار (Business Process Analyst) که به عنوان شغل مکمل حوزه تحلیل داده شناخته میشن نیاز پیدا میشه! پس در واقع یه فاز عقبتر یعنی قبل شروع داستان فاز Business Analysis هست که براساس اون تازه سیستمها، فرایندها و دیتابیسها شکل میگیرن تا دادهها در اونها قرار بگیرن! جالبیش اینجاست که ته ماجرا هم با Business Analyst هست چون در واقع تحلیلگر کسب و کار هست که میاد براساس دادههای تحلیل و مصورسازی شده، استراتژی و مسیر کسب و کار رو تعیین میکنه! پس شما به عنوان کسی که در حوزه داده فعالیت میکنه باید با مجموعه وظایف مشاغل مربوط به حوزه داده آشنا باشه و همینطور بتونه با تحلیلگران سیستم و کسب و کار و البته کارشناسان زیرساخت و شبکه، نرمافزار و Application به خوبی ارتباط بگیره!
خب حالا کسانی که توو این حوزه هستند یا ورود میکنند چه دانش و تخصصی باید داشته باشند؟ دانش در حوزه داده و آمار و احتمالات و تحقیق در عملیات شاید علوم پایه این حوزه محسوب باشه و کسانی هم که با این علوم آگاه نیستند شاید بتونند توو این مسیر موفق بشن! اما طیف ابزار مربوط به این حوزه مثل عناوین شغلی مرتبط با اون گسترده است و با توجه به زیرساختهای که در شرکتها وجود داره تووی هر فاز از زنجیره بالا ابزارهای متنوعی ممکنه وجود داشته باشه! برای مثال شاید در حوزه مصورسازی داده یک شرکت با ابزار Tableau استفاده کنه و یه شرکت دیگه از Qlikview در صورتی که متداولترین و رایجترین ابزار توو این حوزه در حال حاضر Power BI هست! پس آیا شما باید همه این موارد باید بلد باشید؟ خب باید بگم که هر چی بیشتر بلد باشید بهتره! اگر شما فقط در حوزه مصورسازی داده کار میکنید بهتره که اطلاعاتی درباره هر سه این نرمافزارها داشته باشید اما اگه نه باید چیکار کرد؟ خب باید زیرساختها و نرم افزارهایی رو در هر یک از فازهای زنجیره بالا یاد گرفت که بیشتر در بازار کار تقاضا براش هست! مثلا در مثال بالا با توجه به این که تقاضای بیشتری برای Power BI هست بهتره تا تمرکز رو روی این ابزار بگذارید!
خب حالا متداولترین و رایجترین و یا به قول معروف پر تقاضاترین نرمافزارها توو هر مرحله کدوما هستن!؟ جواب این سوال هم یکم سلیقهای و ممکنه وابسته به فاکتورهای دیگه مثل فرهنگ و جغرافیا باشه، اما من با نظر یکی فعالهای این حوزه که مسیر یادگیری زیر رو طی کرده موافقم:
البته باز لازمه تاکید کنم که توو این مسیر هیچ پیشنیازی و پسنیازی برای یادگیری ابزارها وجود نداره! مثلا شما حتما و حتما لازم نیست که اول SQL بلد باشید و بعد Power BI یا برعکس!
حالا ما چیکار میکنیم؟ ما در BAPractices قصد داریم تا دانش، تخصص و تجربهای که در هر یک از حوزههای فوق از ابتدای ماجرا یعنی Business Analysis تا انتها Business Analytics کسب میکنیم رو در قالب راهکارها و Practiceهای کاربردی با شما به اشتراک بگذاریم.
در انتها باید بگم که این حوزه یه حوزه بیانتها و مرز بین بخشهای مختلف اون براحتی قابل تفکیک نیست و کسب دانش و تجربه در تمام بخشها نیازمند زمان بسیار زیاد هست؛ پس صحبت کردن به صورت کلی راجب این حوزه نمیتونه واقعا بدون نقص باشه!
جهت دسترسی یکجا و رایگان به مجموعه کتابهای مرجع و دیتابیسهای آموزشی در حوزه تحلیل داده به صفحه محصولات اینجا و اینجا کلیک کنید.
نوشته شده توسط سیدعطا سیدرضازاد