نقشه راه حوزه تحلیل داده همراه با جزئیات

Saturday، ۲۶ Shahrivar ۱۴۰۱

داشتن یه نقشه راه برای هر کسی توو حوزه تخصصی خودش واجبه و برای کسانی که به تازگی میخوان توو یه حوزه تخصصی فعالیت کنند دید خوبی بهشون میده تا بتونن اول از همه تشخیص بدن که کجای راهن و دوم بتونن برای خودشون برنامه‌ریزی کنن و نقاط ضعفشون رو بهبود بدن. یکی از حوزه‌هایی که نقشه راه شاید براش واجب‌تره حوزه تحلیل داده است! چون هم موضوعی هست که هنوز برای خیلی‌ها جدیده و هم ابزارهای مختلفی داره که ممکنه باعث سردرگمی اولویت یادگیری اونها رو به خصوص برای کسانی که تازه میخوان شروع کنن داشته باشه. پس با هم بریم نقشه راه پیشنهادی برای فعالیت تخصصی در حوزه تحلیل داده رو بررسی کنیم. 🏁

خب قبل از ادامه این مبحث برای این که یه دید کلی خوبی از این حوزه داشته باشید بهتون پیشنهاد می‌کنم که حتما پست قبلی که در ارتباط با مشاغل حوزه تحلیل داده بوده رو از این لینک مطالعه کنید.

همونطور که توو پست قبل هم توضیح دادیم، ابزارهای تحلیل داده متنوع هستند مثل اکسل، اکسس، SQL، Power BI، R، پایتون و خیلی نرم‌افزارهای دیگه!

قبل از رفتن به سراغ نقشه راه هم چند تا نکته کلیدی هست که باید نسبت بهش آگاه باشیم:

  • فرض کنید شما در حوزه‌هایی به غیر از تحلیل داده فعالیت می‌کنید مثل منابع انسانی، مدیریت پروژه یا سایر رشته‌های سازمانی دیگه! آیا برای من طی مسیر زیر پیشنهاد میشه؟ ببینید هر کسی در سازمان به هر حال با داده‌هایی سر و کار داره و شما برای اینکه توانایی خودتون رو در سازمانتون نشون بدید باید بتونین از داده‌هایی که در اختیار دارید نهایت استفاده رو بکنید و گزارش‌های تحلیلی مناسبی به مدیریت ارائه بدید. پس بهتون پیشنهاد که به فکر استفاده از بحث تحلیل داده در حوزه تخصصی خودتون باشید. برای مثال تحلیل داده‌های مالی، تحلیل داده‌های منابع انسانی (آموزش، جذب و پرسنل) یا تحلیل دادهای سبد پروژه‌ها؛ اما نکته‌ای که وجود داره شاید لازم باشه برای کسانی که تخصص اصلی خودشون تحلیل داده نیست مسیر زیر رو در زمان طولانی‌تری طی کنند یا لزوما کل مسیر رو طی نکنند!

  • هر کدوم از این نرم‌افزارها رقیبانی دارند که میتونن جایگزین این ها باشند اما چرا ما این‌ها رو توو نقشه راهمون میاریم؟ پاسخ این هست که این‌ها رایج‌ترین در بازار کار هستند. برای مثال نرم‌افزار SQL یک بانک اطلاعاتی رابطه‌ای هست و Oracleهم همینطور، چه بسا اوراکل بهتر از SQL هم باشه اما چرا ما به SQL در نقشه راهمون پرداختیم؟ خوب چون SQL توو بازار کار بیشتر تقاضا داره و یادگیریش سهل‌الوصل‌تره! اما شما می‌تونید به فراخور نیاز خودتون مثلا یک نرم‌افزار بانک اطلاعاتی رابطه‌ای دیگه‌ای رو یاد بگیرید.

  • این ابزارها لزوما پیش‌نیاز یا پس‌نیاز هم دیگه نیستند! یعنی چی؟ یعنی اینکه ممکنه کسی باشه که توو حوزه تحلیل داده با پایتون متخصصه اما چیز زیادی از SQL یا اکسل ندونه! اشکالی داره؟ نه! ولی پیشنهاد می‌شه که مسیر زیر طی بشه تا شما توانایی این رو داشته باشید که مثلا یه عملیات تحلیل داده رو از روش‌های مختلف انجام بدین! اینجوری شما جای مانور بیشتری خواهید داشت، گستره دانش و تخصصتون بیشتر میشه و برای شغل‌های مختلفی که زیرساخت‌های متنوعی ممکنه داشته باشند راحت‌تر می‌تونید اپلای کنین و مهمتر از همه مسیر یادگیریتون اصولی‌تره!

  • ما گفتیم که لزوما این ابزارها پیش‌نیاز یا پس‌نیاز هم دیگه نیستند پس در ابتدای نقشه راه با کدوم ابزارها باید شروع کنیم و چرا؟ اکسل، اکسس و Power BI – پاسخ این هست که چون این ابزارها دم‌دست‌تر و پرتقاضاتر و فرایند یادگیریشون راحت‌تره و با همین نرم‌افزارها یا حتی فقط خود اکسل، میتونید خروجی کارتون رو ببینید و لذت ببرید. ضمن اینکه این ابزارها پایه مبحث هوش تجاری و تحلیل داده هم محسوب می‌شن پس شاید وقتی در ادامه راه SQL یا پایتون رو یاد گرفتید چون قبلا با اکسل توانایی تحلیل داده رو داشتید، باعث میشه که ابزارهای سخت‌تری مثل SQL و پایتون رو راحت‌تر یاد بگیرید و فرایند یادگیری این ابزارها هم براتون جذاب‌تر بشه! چون خیلی اتفاق می‌افته که دانشجوها سر کلاس SQL میشینن بدون اینکه اکسل یا Access کار کرده باشند. این باعث میشه که SQL رو سخت یاد بگیرن و از کلاس آموزشی اونطور که باید استفاده نکنن و پولشون دور ریخته بشه یا حتی شاید کلا نسبت به حوزه تحلیل داده حسشون منفی بشه!!! پس پیشنهاد ما این هست که از ابزارهای دم‌دست‌تر و رایج‌تر شروع کنید تا یادگیری مفاهیم مثل خون در رگ‌هاتون جاری بشه 😊 و کل فرایند یادگیری‌تون اثربخش‌تر بشه!

خب بریم به سراغ نقشه راه:

1 – نرم‌افزار اکسل

در مرحله اول میریم سراغ نرم‌افزار خارق‌العاده اکسل که این روزها بیشتر از قبل طرفدار پیدا کرده و یکی از دلایلش هم همین راحتی کار با اون برای امور تحلیل داده هست. کمتر تحلیلگر داده حرفه‌ای هست که اکسل بلد نیست یا باهاش کار نمیکنه! پس حتما در مرحله اول باید وقت بگذارید و اکسل رو یاد بگیرید ولی فراموش نکنید که این نرم‌افزار رو با رویکرد تحلیل داده یاد بگیرید!

خیلیا از من پرسیدن که من VBA یاد بگیرم؟ ببینید همانطور که خودتونم میدونید دنیای نرم‌افزار و ابزارها داره میره به سمت Low Coding یا حتی Zero Coding، برای همین به نظر من بهتره که سعی کنید تا امور کاری خودتون رو بدون کدنویسی پیش ببرید. ضمن اینکه توابع اکسل انقدر زیاد و متنوع شدن که خیلی از کارهایی که قبلا فقط با VBA امکانپذیر بود، الان با استفاده از توابع جدید براحتی قابل انجام هستند. خب پس یاد نگیریم؟ بهترین جواب این هست که هر جا فکر کردید که کارتون فقط با VBA حل میشه برید سراغش و مشکلتون رو رفع کنید. چون یادگیری VBA زمان‌بر هست و اگه باهاش به صورت پیوسته کار نکنید فراموش میشه. البته یه نکته‌ای که وجود داره باید از قابلیت‌های VBA و محیط و ویژگی‌های اون و از همه مهم‌تر کار با ماکرو به صورت معمولی رو در این مرحله یاد بگیرید.

مواردی که در رابطه با اکسل توو این مرحله باید یاد بگیریم چه چیزهایی هست؟ خب به طور مفصل در دوره اکسل با رویکرد تحلیل داده شرح دادیم اما مواردی از قبیل کار با جداول، کاندیشنال فورمتینگ، Data Validation، Pivot Tableها و همچنین همه توابعی که برای تحلیل داده کاربردی هستند مثل Aggregate Functionها و توابعی نظیر match، index، offset، Len، Look Upها، Let، Mid و سایر توابع پرکاربرد دیگه!

در کنار اکسل آیا Spread Sheet دیگه‌ای هم وجود داره که خوب باشه توو این مرحله یاد بگیریم؟ بله؛ Google Sheet که تقریبا شبیه به اکسل هست اما با برخی ویژگی‌های متفاوت.

2 – نرم‌افزار Power BI

بعد از اینکه در اکسل مهارت کافی رو بدست آوردید و تونستید دیتاست‌ها و دیتابیس‌ها رو ایجاد کنید و داده‌هاتون رو با تکنیک‌های مختلف تحلیل کنید و اون‌هارو روی داشبورد و نمودارهای اکسلی ببرید زمان خوبی هست که با نرم‌افزار power BI آشنا بشید. این نرم‌افزار کارهای تحلیل و مصورسازی داده رو به صورت حرفه‌ای‌تر انجام میده و برای داشبوردسازی محشره!!! یک نکته‌ای که در رابطه با این نرم‌افزار وجود داره این هست که شرایط انجام تحلیل داده با زبان DAX که شما میتونید خیلی از تحلیل‌های پیچیده رو با استفاده از این زبان در Power BI انجام بدید و اینجاست که متوجه تفاوت اکسل و Power BI می‌شید (تحلیل داده پیچیده با DAX و داشبوردسازی حرفه‌ای‌تر)!

آیا مرحله دو یادگیری همینجا تموم میشه؟ نه! نرم‌افزار Power BI مجموعه‌ای از نرم افزارهاست که توو این لینک کامل توضیحشون دادم! شما باید بتونید با Power BI Report Server و power BI Mobile هم در این مرحله آشنا بشید!

3 – نرم‌افزار Access

هیچ‌کدوم از نرم‌افزارهای مراحل 1 و 2 از نوع بانک اطلاعاتی رابطه‌ای یا RDBMS (Relational Database Management System) نبودند! کسی که تحلیل‌گر داده است حتما و حتما باید درباره بانک‌های اطلاعاتی رابطه‌ای و انواع روابط بین جداول و همچین انواع کوئری‌های متداول آشنا باشه! با اینکه نرم‌افزار SQL یکی از پیشرفته‌ترین نرم‌افزارهای این حوزه است اما پیشنهاد میکنم قبلش این مفاهیم رو توو اکسس که خودش هم یک RDBMS مینیمال هست یاد بگیرید و تجربه کنید.

تووی این مرحله شما باید بتونید جداول در اکسس ایجاد کنید (به Data Type‌ها توجه کنید تا بتونید اونهارو در SQL مقایسه کنید)، بین جداول رابطه ایجاد کنید و انواع کوئری‌های رو اجرا کنید.

توو حوزه تحلیل داده بعضی اوقات لازم میشه که شما از طریق طراحی فرم، داده‌ها را از کاربران جمع‌آوری کنید و در واقع نیاز به طراحی فرم هم هست، موضوعی که در SQL ممکن نیست ولی در اکسس به راحتی شدنیه! با یادگیری اکسس شما میتونید برای دیتابیس‌های کوچیک‌تر نیازهای خودتون رو برطرف کنید. وقتی که اکسس یاد گرفته باشید و بعد SQL یاد بگیرید، ایده‌هایی هم از نحوه تعامل این دو نرم‌افزار برای حل مشکلات سازمانیتون به ذهنتون میرسه، مثل وصل کردن فرم اکسس به دیتابیس SQL که توو این آموزش بهش پرداختیم.

4- نرم‌‌افزار SQL

وقتی اکسس و اکسل بلد باشی میفهمی SQL چقدر بزرگ و حرفه‌ایه و البته میتونی راحت‌تر یادش بگیری! هر موضوعی رو که توو SQL یادمیگیری اکثرا مشابهش رو در اکسل یا اکسس دیدی اما اینجا با انعطاف‌پذیری بالاتری قابل اجراست و این باعث میشه که ضمن یادگیری توو ذهینت شبیه‌سازی کنی و خوب SQL را یادبگیری! این نرم‌افزار جزئیات زیاد داره و یادگیریش هم زمان‌بر خواهد بود.

بیشترین مهارتی که یک تحلیل گر داده از SQL باید داشته باشه این هست که بتونه به صورت حرفه‌ای کوئری بنویسه و به نوعی میشه گفت Select زنه قحاری باشه! :دی

SQL سرویس‌های دیگری هم داره که توو حوزه تحلیل داده خیلی کاربردی هستند:

الف – SQL SEVER Integration Services (SSIS): از این سرویس برای انتقال و یکپارچه‌سازی داده‌ها استفاده میشه و به کمک اون می‌تونید انبار داده توسعه بدید. بر فرض مثال فرض کنید در سازمان بخشی از دیتا در اکسل هست، بخش دیگری در Access و بخش دیگری هم در SQL که شما می‌خواهید همه این داده‌ها رو کنار هم داشته باشید تا بتونید تحلیل‌هایی رو روی اونها پیاده‌سازی کنید. با استفاده از سرویس SSIS میتونید همه اونهارو به صورت خودکار کنار هم داشته باشید.

ب – SQL Server Analysis Servcies (SSAS): این سرویس یکی از سرویس های SQL هست که به صور خاص عملیات تحلیل داده رو به صورت پیشرفته‌تر انجام میده! شما میتونید در این نرم افزار Cubeها و Data Martها رو ایجاد کنید و تحلیل‌های داده‌کاوی روی دیتاست خودتون انجام بدید.

ج-SSRS: از این نرم‌افزار برای تهیه گزارش‌هایی که نیاز به پرینت شدن دارند استفاده میشه (گزارش‌های چاپی)

5- نرم‌افزار پایتون

بعد از اینکه موارد بالارو یاد گرفتید و در الگوریتم‌های تحلیل داده خودتون از تکنیک‌های بالا استفاده کردید پیشنهاد میکنم زبان برنامه‌نویسی پایتون رو یاد بگیرد. این فاز از یادگیری شما دو مرحله داره: مرحله اول آشنایی با مباحث و دستورات پایه‌ای برنامه‌نویسی و همچنین رویکرد شیءگرایی پایتون و در مرحله دوم یادگیری و استفاده از تکنیک‌های تحلیل داده با پایتون که نیاز هست از کتابخانه‌هایی مثل pandas ،Matplotlib و سایر موارد دیگه استفاده کنید.

پلتفرم نرم‌افزاری پایتون با سرعت زیادی در حال توسعه و برای کاربری‌های مختلف تحلیل داده کتابخانه‌های تخصصی‌تری هر روز در حال توسعه است. شما از طریق پایتون میتونید به SQL Server وصل شید یا حتی از خود دیتابیس پیش‌فرض پایتون بهنام SQlite استفاده کنید.

********************

در کنار موارد فوق چه مواردی باعث یادگیری موثرتر و حرفه‎‌‌‌ای‌تره حوزه تحلیل داده میشه؟

همانطور که در این لینک اشاره کردیم حوزه تحلیل سیستم و فرایند کسب و کار از مواردی هستند که به عنوان مکمل شغل تحلیل داده محسوب میشن و حضور در این دوره‌ها باعث میشه که تحلیل داده با یک دید کسب و کار و سیستم انجام بشه که به شدت برای سازمان‌ها و مدیران ارشد از درجه اهمیت بالایی برخورداره!

در رابطه با این موضوع لازم به یاداوری این نکته کلیدی است که در یک کسب و کار، اقدامات صورت می‌گیره، از دل اقدامات فرایندها ایجاد میشن و از فرایندها سیستم و بعد از این‌هاست که داده‌ها شکل میگیرن!

ما در تیم BAPractices با برگزاری دوره‌های آموزشی، تهیه محتوای غنی و با کیفیت برای آموزش تکنیک‌های تحلیل داده در کنار شما خواهیم بود 😊