بکارگیری داده کاوی در تحلیل فرایندها و استراتژی های کسب و کار
برمبنای الگوی پیکره دانش تحلیل کسب و کار (BABOK)
حسین نوریان، میلاد شهریاری
هدف از داده کاوی:
این روش به منظور بهبود تصمیم گیری، از طریق یافتن الگوها، نگرش و بینش های مفید با توجه به تحلیل داده ها، انجام می شود.
توصیف داده کاوی:
فرآیندی تحلیلی است که داده های فراوان را از زاویه های مختلف مورد بررسی قرار داده و آنها را به گونه ای خلاصه میکند که الگوها و روابط مفید بین آنها، کشف گردد.به طور کلی، نتایج حاصل از تکنیک های داده کاوی، مدل های ریاضی یا معادله هایی هستند که الگوها و روابط زیربنایی را توصیف می کنند.
می توان از راه گزارشدهی داشبوردی (بصری)، این مدلها را در تصمیم گیری انسانی مورد استفاده قرار داد، یا از راه سیستم های مدیریتی کسب و کار یا توسعه درونی پایگاه داده، از آنها در سیستم های تصمیم گیری اتوماتیک در حوزه فرایندهای کسب و کار یا استراتژی ها بهره برد.داده کاوی را میتوان هم در بررسیهای تحت نظارت و هم در موارد بدون نظارت مورد استفاده قرار داد. در یک بررسی تحت نظارت، کاربران میتوانند سوالی طرح کرده و انتظار پاسخی داشته باشند که بر تصمیم گیری آنها تاثیرگذار خواهد بود. بررسی بدون نظارت، یک تمرین کشف الگو است که در آن الگوهایی پیشنهاد شده و به منظور کاربرد در تصمیم گیری های کسب و کار، مورد توجه قرار میگیرند.داده کاوی واژه ای کلی است که شامل تکنیک های توصیفی، تشخیصی و پیش بینی می گردد:
- توصیفی: (مانند خوشه بندی) مشاهده الگوهای درون مجموعه¬ای از داده ها مثل شباهت¬های بین مشتریان، را آسان می کند.
- تشخیصی: (مانند تقسیم بندی یا درخت تصمیم گیری) نشان می دهد که چرا یک الگوی خاص (مثلاً ویژگی های سودده ترین مشتریان یک سازمان) وجود دارد.
- پیش بینی: ( مانند رگرسیون و شبکه های عصبی) احتمال وقوع چیزی در آینده را نشان می دهد (مثلاً پیش بینی احتمال اینکه ادعایی خاص خلاف واقع است).در تمامی موارد، مهم آن است که به هدف داده کاوی توجه کرده و آمادگی داشته باشیم تا در خصوص کسب اطمینان از نوع، حجم و کیفیت مناسب داده هایی که قرار است با آنها کار کنیم، تلاش لازم را به عمل آوریم.
عناصر داده کاوی
استخراج نیازمندی ها
هدف گذاری داده کاوی یا با توجه به ملزومات تصمیمگیری در رابطه با یک تصمیم شناسایی شده مهم در خصوص کسب و کار، صورت می گیرد و یا در رابطه با یک حوزه کاربردی که در آن، داده های مربوط، به منظور کشف الگوهای مختص آن حوزه خاص، مورد کاوش قرار می گیرند. استراتژی از بالا به پایین در مقابل استراتژی کاوش پایین به بالا، به تحلیلگران اجازه میدهد مجموعه مناسبی از تکنیک های داده کاوی را برگزینند
.تکنیک های فرمی مدل سازی تصمیم گیری (نگاه کنید به تکنیک مدل سازی تصمیم) به منظور تعریف ملزومات شیوه های داده کاوی بالا به پایین مورد استفاده قرار می گیرد. برای شیوه های کشف الگوی پایین به بالا، مطلوب آن است که دانش کشف شده را در مدل های تصمیمگیری موجود جای داده و امکان کاربرد سریع و توسعه آن را فراهم نمود.هنگامی که فعالیتهای داده کاوی در محیطی چابک تحت مدیریت قرار گیرند، سازنده بوده و با فراهم آوری کنترلهای پروژه، تکرار، تایید و توسعه سریع را ممکن می کنند.
آماده سازی داده:
مجموعه داده های تحلیلیابزارهای داده کاوی در رابطه با مجموعه داده های تحلیلی به کار می روند. به طور کلی، این کار از طریق ادغام داده ها از منابع مختلف در قالب مجموعه ای گسترده از داده ها صورت می گیرد. گروه های تکراری معمولاً به مجموعهای از چندین زمینه تبدیل می شوند. ممکن است داده ها به صورت یک فایل حقیقی فیزیکی یا یک فایل مجازی در پایگاه داده یا انبار داده، استخراج گشته و مورد تحلیل قرار بگیرند. مجموعه داده های تحلیلی در سه دسته مجموعهای مورد استفاده برای تحلیل، مجموعه ای کاملا مستقل برای کسب اطمینان از اینکه مدل ارائه شده در مورد دادههای دیگر نیز صادق است و مجموعهای برای اعتبارسنجی در تایید نهایی، تقسیم بندی می شود. حجم داده ها ممکن است خیلی بالا بوده و گاه منجر به نیاز به کار با نمونه ها یا کار درون انبار داده شود، تا نیاز به جابجایی داده ها وجود نداشته باشد.
تحلیل داده ها:
پس از فراهم کردن داده ها، نوبت تحلیل آنها فرا می رسد. معمولاً با به کار بردن انواع گوناگونی از شیوه های آماری و ابزارهای تصویرسازی، نحوه توزیع ارزش داده ها، داده های غایب و شیوه عمل ویژگی های محاسبه شده گوناگون مشخص می گردد. این مرحله معمولاً طولانی ترین و پیچیده ترین مرحله در داده کاوی است و تمرکز اتوماسیون به نحو فزاینده ای بر آن قرار دارد. قدرت داده کاوی بیشتر به شناسایی ویژگیهای مفید داده ها بستگی دارد. برای مثال، یکی از ویژگیها ممکن است شمار دفعاتی باشد که یک مشتری در ۸۰روز گذشته از فروشگاه بازدید کرده است. تعیین این که در نظر گرفتن تعداد ۸۰ روز، مفیدتر از ۷۰ یا ۹۰ روز گذشته است، کلیدی خواهد بود.
تکنیک های مدل سازی:
انواع گوناگونی از تکنیکهای دادهکاوی وجود دارد.مثال هایی از این تکنیک ها عبارتند از:درختهای تقسیم بندی و رگرسیون (CART) ، c5 و دیگر تکنیک های تصمیم گیری شاخه ای،رگرسیون خطی و لجستیک،شبکه های عصبی،دستگاه های بخش پشتیبانی،ارزیابی پیش بینانه (افزودنی).مجموعه داده های تحلیلی و ویژگی های محاسبه شده آنها در این الگوریتم ها که یا به صورت نظارت نشده (کاربر نمیداند الگوریتم ها به دنبال چه هستند) هستند یا نظارت شده (کاربر تلاش میکند چیز مشخصی را دریافته یا پیشبینی کند)، قرار میگیرند. اغلب چندین تکنیک به کار می رود تا در نهایت، مشخص گردد کدام یک موثرتر است. برخی داده ها خارج از مدل نگاه داشته شده و از آنها به منظور تایید اینکه نتایج را می توان با داده هایی که از ابتدا در ساخت آن به کار نرفته نیز همانند سازی نمود، استفاده می شود.
راه اندازی:
پس از ساخت یک مدل، باید آن را به منظور کسب فایده، راه اندازی نمود. مدلهای داده کاوی را میتوان به شیوههای مختلف به کار انداخت و از آنها برای پشتیبانی تصمیم گیری انسانی یا سیستمهای تصمیم گیری خودکار استفاده نمود. برای کاربران انسانی، نتایج داده کاوی را می توان به کمک استعاره های تصویری یا فیلدهای داده ای ساده، ارائه کرد. بسیاری از تکنیکهای داده کاوی، قواعد بالقوه کسب و کار را که می توان با کمک یک سیستم مدیریت قواعد کسب و کار به کار انداخت، شناسایی می کنند. اینگونه قواعد کسب وکار قابل اجرا را میتوان با یک مدل تصمیم گیری و در کنار قواعد کارشناسانه لازم، هماهنگ نمود. برخی تکنیک های داده کاوی (مخصوصاً آنهایی که تحت عنوان تکنیکهای تحلیلی پیش بینی، توصیف می شوند)، فرمولهای ریاضی به دست می دهند. اینها را نیز میتوان به عنوان قواعد قابل اجرای کسب و کار، به کار گرفت، و نیز می توان از آنها در تولید SQL یا کدهای راه اندازی استفاده کرد. وجود طیفی گسترده و رو به رشد از گزینه های راه اندازی در پایگاه داده، به این مدل¬ها امکان میدهد که در زیر ساخت داده ای یک سازمان، ترکیب گردند.
ملاحظات کاربردی در داده کاوی
نقاط قوت
- الگوهای پنهان را نمایان کرده و در طول تحلیل، بینشی مفید فراهم می آورد که به کمک آن میتوان تعیین نمود کدام داده ها مفیدند، یا چه تعداد افراد تحت تاثیر طرح های خاص قرار می گیرند.
- می توان آن را در طراحی یک سیستم به کار برد و دقت داده ها را افزایش داد.
- میتوان برای کاهش یا حذف جانب داری های انسانی از آنها استفاده نمود تا از این طریق، داده ها تعیینکننده حقایق باشند.
محدودیت ها
- کاربرد برخی تکنیکها بدون درک نحوه عمل آنها می تواند منجر به همبسته سازی های اشتباه و بینش نادرست گردد.
- دسترسی به داده های فراوان و نرم افزارها و مجموعه ابزارهای پیچیده داده کاوی می تواند منجر به سوء استفاده تصادفی گردد.
- کار با بسیاری از تکنیک ها و ابزارها نیازمند دانش تخصصی است
- برخی تکنیکها در پیش زمینه از ریاضیات پیشرفته بهره میگیرند و ذینفعان ممکن است نسبت به نتایج، آگاهی مستقیم نداشته باشند. این عدم شفافیت میتواند منجر به مقاومت از سوی ذینفعان گردد.
- در صورتی که شیوه تصمیم گیری که قرار است تحت تاثیر قرار گیرد به خوبی درک نشده باشد، به کارگیری نتایج داده کاوی می تواند دشوار باشد.
استفاده از مطالب فوق با ذکر منبع مجاز است
جهت دریافت اطلاعات بیشتر یا مشاوره مدیریت فرایندهای کسب و کار، با ایمیل
hossein.nourian@gmail.com
تماس حاصل فرمایید.