نگاهی بر دانش، تخصص و مشاغل حوزه تحلیل داده

Saturday، ۱۵ Amordaad ۱۴۰۱

اون چیزی که این روزها نظاره‌گرش هستیم این هست که حوزه تحلیل داده و مشاغل مرتبط با اون به شغل‌های پرطرفدار تبدیل شده‌اند. نکته حائز اهمیت ورود بسیاری از متقاضیان به این حوزه از رشته‌های غیرمرتبط هست! به طوری که در دوره‌های تحلیل داده در مراکز آموزشی مختلف می‌بینیم که شرکت‌کنندگان از رشته‌هایی به غیر از IT و مهندس نرم افزار یا صنایع با توجه به تقاضا و ظرفیت بازار کار این حوزه داوطلب حضور در این دوره‌ها شدند. اما کسانی که در دوره‌های مختلف مربوط به حوزه تحلیل داده شرکت می‌کنند در آینده چه عناوین شغلی در انتظار اونهاست؟

خب اگر بخواهیم طیف‌های شغلی مرتبط با حوزه علم داده جست‌وجو کنیم احتمالا به عناوین شغلی زیر برخورد می‌کنیم:

  • تحلیل‌گر داده یا Data Analyst
  • مهندس داده یا Data Engineer
  • کارشناس انبارداده یا DW Expert
  • توسعه دهنده هوش تجاری یا BI Developer
  • طراح دیتابیس یا Database Designer
  • ادمین دیتابیس یا Database admin
  • دانشمند علم داده یا Data Scientist
  • کارشناس مصورسازی داده یا Data Visulizer

اما جایگاه و ارتباط هر کدوم از این شغل‌ها به چه ترتیبی هست؟

اول اینکه مرز این عناوین شغلی در خیلی موارد با هم همپوشانی دارند و بسته به ابعاد و نوع کسب و کار شرکت‌ها ممکن هست که این شغل‌ها باهم ادغام یا حتی یکی هم بشن! اما برای ایجاد یک تصویر برای مخاطبان این پُست این موضوع را در قالب فرایند جریان داده زیر نمایش میدم:

همانطور که احتمالا می‌دونید (اگر نمی‌دونید با یک سرچ ساده در گوگل درباره ETL بیشتر دستگیره‌اتون میشه) این یک شمای کلی و بدون جزئیات از فرایند (Extract, Transform & Load) ETL هست و جالب اینجاست که تمامی مشاغلی که در بالا ذکر شد بخشی از این زنجیره رو پوشش می‌دهند. برای مثال اگر از سمت چپ نمودار که اول داستان هم هست شروع کنیم، به موضوع منابع داده‌ای می‌رسیم یعنی جایی که باید داده‌ها وجود داشته باشه! نکته ای که هست اینه که قبل از اینکه داده‌ها ایجاد شوند باید یک ساختار بانک اطلاعاتی یا دیتابیسی وجود داشته باشه تا داده‌ها در اون شکل بگیرن و این موضوع مرتبط میشه با حوزه مشاغل طراحی دیتابیس که کارهای طراحی و پیاده‌سازی دیتابیس‌هارو به عهده داره (دیتابیس‌ها میتونن خیلی ساده از Excel تا SQL یا زیرساخت بانک اطلاعاتی حرفه‌ای دیگری باشه)، کنار اون ادمین دیتابیس هم کارهای مربوط به حوزه خودش رو در این بخش نمودار انجام میده. کمی جلوتر که بریم وقتی به فاز Extract و Transform می‌رسیم که در واقع میشه همون فاز جمع‌آوری، آماده‌سازی و پاکسازی دیتا (Data Cleansing) که اساس کار یک مهندس داده یا Data Engineer هست. از فرایند Load که میتونه لزوما به توسعه انبار داده هم ختم نشه مربوط میشه به کارشناسان حوزه انبار داده یا Data Warehouse Developer، بعد از این نوبت به مرحله Analyze میرسه که خوب مسلما شغل تحلیل‌گر داده یا Data Analyst بیشتر از هر کسی درگیر این مرحله میشه و نهایتا بعد از فرایند تحلیل داده نوبت به مصورسازی میرسه که تخصص کسانی هستند که در حوزه طراحی و توسعه داشبوردها و Data Visualization فعالیت دارند. خیلی مواقع هم کسی که BI Developer هست مجموعه وظایفی از مرحله Extract تا انتهای ماجرا را برعهده خواهد داشت. دانشمند داده یا همون Data Scientist کسی است که حوزه مسئولیت‌ها و اختیاراتش بیشتر از همه عناوین شغلی قبلی هست، درگیر کل زنجیره و فرایند ETL از ابتدا تا انتهاست.

نکته قابل توجه اینجاست که هر چی به سمت راست و چپ ماجرا حرکت می‌کنیم به شغل‌های تحلیل‌گر سیستم (System Analyst)، تحلیل‌گر کسب و کار (Business Analyst) و تحلیل‌گر فرایندهای کسب و کار (Business Process Analyst) که به عنوان شغل مکمل حوزه تحلیل داده شناخته میشن نیاز پیدا میشه! پس در واقع یه فاز عقب‌تر یعنی قبل شروع داستان فاز Business Analysis هست که براساس اون تازه سیستم‌ها، فرایندها و دیتابیس‌ها شکل میگیرن تا داده‌ها در اون‌ها قرار بگیرن! جالبیش اینجاست که ته ماجرا هم با Business Analyst هست چون در واقع تحلیل‌گر کسب و کار هست که میاد براساس داده‌های تحلیل و مصورسازی شده، استراتژی و مسیر کسب و کار رو تعیین میکنه! پس شما به عنوان کسی که در حوزه داده فعالیت میکنه باید با مجموعه وظایف مشاغل مربوط به حوزه داده آشنا باشه و همینطور بتونه با تحلیل‌گران سیستم و کسب و کار و البته کارشناسان زیرساخت و شبکه، نرم‌افزار و Application به خوبی ارتباط بگیره!

خب حالا کسانی که توو این حوزه هستند یا ورود میکنند چه دانش و تخصصی باید داشته باشند؟ دانش در حوزه داده و آمار و احتمالات و تحقیق در عملیات شاید علوم پایه این حوزه محسوب باشه و کسانی هم که با این علوم آگاه نیستند شاید بتونند توو این مسیر موفق بشن! اما طیف ابزار مربوط به این حوزه مثل عناوین شغلی مرتبط با اون گسترده‌ است و با توجه به زیرساخت‌های که در شرکت‌ها وجود داره تووی هر فاز از زنجیره بالا ابزارهای متنوعی ممکنه وجود داشته باشه! برای مثال شاید در حوزه مصورسازی داده یک شرکت با ابزار Tableau استفاده کنه و یه شرکت دیگه از Qlikview در صورتی که متداول‌ترین و رایج‌ترین ابزار توو این حوزه در حال حاضر Power BI هست! پس آیا شما باید همه این موارد باید بلد باشید؟ خب باید بگم که هر چی بیشتر بلد باشید بهتره! اگر شما فقط در حوزه مصورسازی داده کار میکنید بهتره که اطلاعاتی درباره هر سه این نرم‌افزارها داشته باشید اما اگه نه باید چیکار کرد؟ خب باید زیرساخت‌ها و نرم افزارهایی رو در هر یک از فاز‌های زنجیره بالا یاد گرفت که بیشتر در بازار کار تقاضا براش هست! مثلا در مثال بالا با توجه به این که تقاضای بیشتری برای Power BI هست بهتره تا تمرکز رو روی این ابزار بگذارید!

خب حالا متداول‌ترین و رایج‌ترین و یا به قول معروف پر تقاضاترین نرم‌افزارها توو هر مرحله کدوما هستن!؟ جواب این سوال هم یکم سلیقه‌ای و ممکنه وابسته به فاکتورهای دیگه مثل فرهنگ و جغرافیا باشه، اما من با نظر یکی فعال‌های این حوزه که مسیر یادگیری زیر رو طی کرده موافقم:

البته باز لازمه تاکید کنم که توو این مسیر هیچ پیش‌نیازی و پس‌نیازی برای یادگیری ابزارها وجود نداره! مثلا شما حتما و حتما لازم نیست که اول SQL بلد باشید و بعد Power BI یا برعکس!

حالا ما چیکار می‌کنیم؟ ما در BAPractices قصد داریم تا دانش، تخصص و تجربه‌ای که در هر یک از حوزه‌های فوق از ابتدای ماجرا یعنی Business Analysis تا انتها Business Analytics کسب میکنیم رو در قالب راهکارها و Practiceهای کاربردی با شما به اشتراک بگذاریم.

در انتها باید بگم که این حوزه یه حوزه بی‌انتها و مرز بین بخش‌های مختلف اون براحتی قابل تفکیک نیست و کسب دانش و تجربه در تمام بخش‌ها نیازمند زمان بسیار زیاد هست؛ پس صحبت کردن به صورت کلی راجب این حوزه نمیتونه واقعا بدون نقص باشه!

جهت دسترسی یکجا و رایگان به مجموعه کتاب‌های مرجع و دیتابیس‌های آموزشی در حوزه تحلیل داده به صفحه محصولات اینجا و اینجا کلیک کنید.

نوشته شده توسط سیدعطا سیدرضازاد