به گزارش «رساگفت»: این بار، مبحث تحلیل دادهها که در بین سازمانها و دانشگاهها از اهمیت ویژهای برخوردار است، مورد توجه پژوهشگران دانشگاه توسعه اجتماعی رسالت قرار گرفت. دستاورد این پژوهش، شناسایی کارهای غیرقانونی و تخلفات، طبق سیاستهای موجود است. محمد حسین نقوی، فارغالتحصیل دکتری سیاستگذاری علم و فناوری دانشگاه تهران و پژوهشگر دانشگاه توسعه اجتماعی رسالت، ارائه این مبحث را برعهده داشت که در ادامه به آن میپردازیم. وی ارائه این جلسه را به سه بخش کلی تقسیم کرده و به توضیح هر کدام از آنها پرداخت و گفت:
در شروع این جلسه، مروری بر بحث تحلیل دادهها و روندهایی که در سازمانها و دانشگاههای مختلف وجود دارد خواهیم داشت، سپس در مورد جایگاه تحلیل دادهها در سازمانها، بحث خواهیم کرد و بهطور خاص، فرآیندی که در دانشگاه توسعه اجتماعی رسالت طی میشود را بیان میکنیم و در آخر، نمونهای از تحلیل دادهها را بهعنوان پروژه نمونه، مورد بررسی قرار میدهیم. بحث خود را با یک مثال شروع میکنم. در مقالهای، محققان دانشگاه کلمبیا پرسشی را مطرح کردند که علائم پیشبینی کننده سرطان لوزالمعده چیست؟ ایده آنها بررسی جستجوهای اینترنتی افراد بود. کاربرانی را شناسایی میکردند که جمله “سرطان لوزالمعده چه علائمی دارد؟” و یا مشابهش را مورد جستجو قرار میدادند. پس از شناسایی این کاربران، جستجوی اینترنتی چند ماه گذشته این افراد مورد بررسی قرار میگرفت که آنها در چند ماه گذشته چه علائمی را جستجو میکردند.
نقوی در ادامه، مثالی دیگر از این موضوع را عنوان نمود و گفت:
به مثالی دیگر میپردازیم. سه اقتصاددان از دانشگاه پرنستون، سؤالی جدی داشتند که “وامگیرندگان، چقدر احتمال دارد که وامشان را پس بدهند؟” این سه اقتصاددان از اطلاعات یک سایت وامدهی استفاده کردند که در این سایت وامدهی، از افراد سؤال میشد که چرا به وام احتیاج دارند؟ حجم زیادی از دادهها را مورد بررسی قرار دادند و به این نتیجه رسیدند که عمدتاً افرادی که از این کلمات استفاده میکنند: نداشتن بدهی، نرخ بهره کمتر، بعد از کسر مالیات، حداقل دستمزد، فارغالتحصیل؛ این افراد معمولا افراد خوشحسابتری هستند و افرادی که این کلمات را به کار بردند: قول، پرداخت خواهم کرد، متشکرم، بیمارستان؛ این افراد، معمولا افراد بدحسابتری هستند. یعنی با تحلیل دادههایی که از کلمات، به دست آوردند و متنی که افراد مینویسند، توانستند رفتار آینده افراد را پیشبینی کنند.
انقلاب صنعتی چهارم
ایشان به بیان نکاتی از این دادهها پرداخت و گفت:
دو نکته این است که همه چیز میتواند به صورت داده باشد؛ یعنی تصاویر، کلمات، تراکنش، لحن افراد و خیلی چیزهای دیگر. کوچکترین رفتاری که از افراد ثبت شود، میتواند تبدیل به یک داده شود و در حجمی بزرگ، قابل تحلیل است. حرکت به سوی تحلیل داده در دنیا، انقلاب صنعتی چهارم برشمرده میشود. یعنی انقلاب صنعتی سوم، ظهور فناوری اطلاعات بوده است. به همین دلیل، سازمانها ناچارند که در این عصرِ طغیان اطلاعات، به سمت رویکردهای نوین در تحلیل داده بروند. براساس گزارشی که مرکز علوم و داده آمریکا منتشر کرده، بیشتر از نود درصد شرکتهای مجله فورچون 500 که سرمایهدارترین شرکتهای دنیا هستند، ادعا کردند که حداقل چند پروژه تحلیل داده بزرگِ در حال اجرا دارند. دانشگاهها به مراکزی تبدیل شدهاند که سازمانها به طور رایگان، دادههایشان را در اختیارشان قرار میدهند و از آن طرف، دانشگاهی مانند دانشگاه هاروارد، دسترسی به بعضی از تحلیلها و نتایج تحقیقاتش را برای این سازمانها باز میکند.
کاربرد تحلیل دادهها
این پژوهشگر دانشگاه توسعه اجتماعی رسالت ادامه ارائه خود را با پرسشی تحت عنوان “تحلیل دادهها چیست و چه کاربردی دارد؟” شروع کرد و گفت:
مهمترین استفاده از تحلیل دادهها برای کمک به تصمیمگیری است. به طور مثال، تحلیلها به سازمانها بینشهایی میدهد که برای بستهبندیهایشان، قیمتگذاری محصولاتشان، تحلیل شبکه روابطشان، محصولات خدماتشان و حتی در تحلیل منابع انسانی، بینشهای متفاوتی میدهد. مهمترین نقشها در تیم تحلیل داده، سه نقش اصلی است. یک نقش، نقش تحلیلگر یا analytics است؛ یکی دانشمند داده یا Data Scientist است و یکی مهندس داده یا Data Engineer؛ مهمترین نقش این تیم را چه نقشی ایفا میکند؟ تحلیلگر. چرا که او به فضای کسبوکار، بستر، محیط و دادههایی که در آن فضای محیط کسبوکار وجود دارد، آشنایی بیشتری دارد و بیش از اینکه بخش فنی را بشناسد، کسبوکار را میشناسد و تصمیمهای اساسی در آن کسب و کار و مسائل مهم آن سازمان را میداند. به همین دلیل، دو نکته مهم وجود دارد که معمولا مورد غفلت واقع میشود. اگر قرار باشد تحلیل دادهها به تصمیمگیری کمک کند، پس بهترین جایی که تیم تحلیل داده باید شکل بگیرد، نزدیک تصمیمگیرندگان اصلی سازمان است. دومین نکته این است که تحلیل داده بیش از آن که یک فعالیت فنی و تکنولوژیک باشد، یک فرآیند پژوهشی است و نیاز به خلاقیتی در تبیین مسألهها به سناریوهای تحلیل داده دارد.
وظیفه تیمهای تحلیل داده
وی در ادامه به بررسی تیم تحلیل داده پرداخت و آن را تشریح نمود و گفت:
اما تیمهای تحلیل داده چه کاری انجام میدهند؟ فرآیندی که ما در دانشگاه توسعه اجتماعی رسالت برای تحلیل دادهها تعریف کردیم، شامل چند مرحله است. در مرحله اول، با توجه به مسائل، تصمیم گرفته میشود که یک سری دادهها جمعآوری شوند. دادهها از منابع متعددی جمعآوری میشود که مرتبط با آن مسأله مشخص است. بعد از آن، الگوریتمها و سناریوهای تحلیل، طراحی میشود که ما بر اساس این دادهها چه تحلیلهایی انجام دهیم که ناظر به مسألهمان باشد و با توجه به مسائل مهم سازمان، تعریف شود؟ آیا نیاز به تحلیلهای پیشگویانه داریم یا تحلیلهای توصیفی و یا روابط بین افراد و یا هر چیز دیگری؟ این دادهها میتوانند برای ما شهود و بینشی را ایجاد کنند که قبل از آن نداشتند. سپس تحلیل و پردازش دادهها شکل میگیرد و گزارش و نمایش دادهها و در نهایت، نتیجههای به دست آمده به متولیاش، در آن سازمان خاص که باید تصمیمگیری و بررسی و اقدام کند، داده میشود.
نقوی سپس به بررسی یک پروژه نمونه پرداخت و گفت:
یک پروژه نمونه داریم که موضوع آن، تجزیه و تحلیل اطلاعات مرتبط با معرفی وام است و هدف از انجام آن، این بود که ما نمونههایی که رفتارهای خاصی دارند را شناسایی کنیم. ممکن است یک نفر در کانون خود یک رفتار همیاریِ اجتماعی بارزی داشته باشد و شناسایی آن بتواند به ما بینشهایی بدهد که بتواند در یک سری از سیاستگذاریها مورد استفاده قرار گیرد. اتفاقی که در معرفی وام میافتد، این است که فرد الف، فرد ب را برای دریافت وام، معرفی میکند. پس ما از گراف ارتباطی برای نمایش دادهها و تحلیل دادهها استفاده میکنیم. به طور مثال میتوانیم موردی را بررسی کنیم. دایرههای مشکیِ پررنگ، شخصیتهایی هستند که وام معرفی کردند و خاکستریها کسانی میباشند که گیرنده هستند. مثلا اینجا مشخص است که شخصیت حقوقی به تمام اعضای خودش، وام معرفی کرده است. اما موضوع جالبی که در اینجا بیشتر قابل بررسی است، شخصی است که چندین و چند شرکت به آن، وام معرفی کرده است. پس این مورد، میتواند قابل بررسی باشد.
ایشان در بخش پایانی ارائه خود به گستردگی بینش به دست آمده از تحلیل دادهها اشاره کرد و گفت: بسیاری از رفتارها را میتوانیم شناسایی کنیم که تا قبل از بررسی دادههای کلان، حدسش را هم نمیزدیم. اما الان میتوانیم رفتارهای متفاوتی را شناسایی کنیم و بینشهای مختلفی را که تعدادی زیادی از آنها مثبت است، بخشی که قابل چشمپوشی و یا حتی منحصر به تخلف باشد را دریابیم.