در این وبگاه مطالب مختلفی در ارتباط با رشته مدیریت قرار گرفته است. همچنین سعی شده است مقالات فارسی و لاتین، کتاب های مدیریتی، حکایات زیبا (بعنوان Case Study) و تجارب در زمینه تحصیلات تکمیلی و به طور کل در مورد موضوعات مختلف و گرایش های مدیریت مطالب مفیدی قرار گیرد.
از آنجايي که استقبال در آزمون کارشناسي ارشد مديریت زياد است سعي شده است از منابع، تست ها و بهترين تجارب خود و اساتيد جهت کمک به داوطلبان استفاده شود.
دوستان دانشکده مديريت تهران مرکز مي توانند از کانال اين وبگاه دیدگاه های خود را به به یکدیگر و حتي اساتيد محترم برسانند. جهت بهره گيری بهتر از اين وبگاه از موضوعات زير استفاده کرده و به علت وجود تعدد موضوعات از جستجو در سايت استفاده کنيد. منتظر راهنمایی ها و نظرات سازنده شما هستیم.
با تشکر از حضور شما
تاريخچه داده کاوي
در دهه شصت و پيش از آن زمينه هايي براي ايجاد سيستم ها ي جمع آوري و مديريت داده ها ايجاد شد و تحقيقاتي در اين زمينه انجام پذيرفت که منجر به معرفي و ايجاد سيستم هاي مديريت پايگاه داده ها گرديد .
ايجاد و توسعه مدلهاي داده اي براي پايگاه سلسله مراتبي ، شبکه اي و بخصوص رابطه اي در دهه هفتاد ، منجر به معرفي مفاهيمي همچون شاخص گذاري و سازماندهي داده ها و در نهايت ايجاد زبان پرسش SQL در اوايل دهه هشتاد گرديد تا کاربران بتوانند گزارشات و فرمهاي اطلاعاتي مورد نظر خود را ، از اين طريق ايجاد نمايند .
توسعه سيستم هاي پايگاهي پيشرفته در دهه هشتاد و ايجاد پايگاه هاي شي گرا ، کاربرد گرا[1] و فعال[2] باعث توسعه همه جانبه و کاربردي شدن اين سيستم ها در سراسر جهان گرديد . بدين ترتيب DBMS هايي همچون DB2 ، Oracle ، Sybase ، ... ايجاد شدند و حجم زيادي از اطلاعات با استفاده از اين سيستم ها مورد پردازش قرار گرفتند . شايد بتوان مهمترين جنبه در معرفي داده کاوي را مبحث کشف دانش از پايگاه داده ها ([3]KDD) دانست بطوري که در بسياري موارد DM و KDD بصورت مترادف مورد استفاده قرار مي گيرند .
برخي از کاربردهاي داده کاوي در محيطهاي واقعي عبارتند از :
1. خرده فروشي
2. بانکداري
3. بيمه
4. تجزيه و تحليل دعاوي
5.
مراحل فرايند کشف دانش از پايگاه داده ها
فرايند کشف دانش از پايگاه داده ها شامل پنج مرحله است که عبارتند از :
1. انبارش داده ها[4]
2. انتخاب داده ها
3. تبديل داده ها
4. کاوش در داده ها
5. تفسير نتيجه
همانگونه که مشاهده مي شود داده کاوي يکي از مراحل اين فرايند است که به عنوان بخش چهارم آن نقش مهمي در کشف دانش از داده ها ايفا مي کند .
· انبارش داده ها
وجود اطلاعات صحيح و منسجم يکي از ملزوماتي است که در داده کاوي به آن نيازمنديم . اشتباه و عدم وجود اطلاعات صحيح باعث نتيجه گيري غلط و در نتيجه اخذ تصميمات ناصحيح در سازمانها مي گردد و منتج به نتايج خطرناکي خواهد گرديد که نمونه هاي آن کم نيستند .
انبار داده ها ، مجموعه اي است موضوعي[5] ، مجتمع[6] ، متغير در زمان[7] و پايدار[8] از داده ها که به منظور پشتيباني از فرايند مديريت تصميم گيري مورد استفاده قرار مي گيرد .
· انتخاب داده ها
انبار داده ها شامل انواع مختلف و گوناگوني از داده ها است که همه آنها در داده کاوي مورد نياز نيستند . براي فرايند داده کاوي بايد داده ها ي مورد نياز انتخاب شوند . به عنوان مثال در يک پايگاه داده هاي مربوط به سيستم فروشگاهي ، اطلاعاتي در مورد خريد مشتريان ، خصوصيات آماري آنها ، تامين کنندگان ، خريد ، حسابداري و ... وجود دارند . براي تعيين نحوه چيدن قفسه ها تنها به داده ها يي در مورد خريد مشتريان و خصوصيات آماري آنها نياز است . حتي در مواردي نياز به کاوش در تمام محتويات پايگاه نيست بلکه ممکن است به منظور کاهش هزينه عمليات ، نمونه هايي از عناصر انتخاب و کاوش شوند .
· تبديل داده ها
هنگامي که داده هاي مورد نياز انتخاب شدند و داده ها ي مورد کاوش مشخص گرديدند ، معملا به تبديلات خاصي روي داده ها نياز است . نوع تبديل به عمليات و تکنيک داده کاوي مورد استفاده بستگي دارد : تبديلاتي ساده همچون تبديل نوع داده اي به نوع ديگر تا تبديلات پيچيده تر همچون تعريف صفات جديد با انجام عملياتهاي رياضي و منطقي روي صفات موجود .
· کاوش در داده ها
داده هاي تبديل شده با استفاده از تکنيکها و عملياتهاي داده کاوي مورد کاوش قرار مي گيرند تا الگوهاي مورد نظر کشف شوند .
· تفسير نتيجه
اطلاعات استخراج شده با توجه به هدف کاربر تجزيه و تحليل و بهترين نتايج معين مي گردند . هدف از اين مرحله تنها ارائه نتيجه (بصورت منطقي و يا نموداري) نيست ، بلکه پالايش اطلاعات ارايه شده به کاربر نيز از اهداف مهم اين مرحله است .
عملياتهاي داده کاوي
|
نام عمليات |
تکنيک هاي داده کاوي |
|
مدلسازي پيشگويي کننده |
رده بندي ، پيشگويي مقدار |
|
تقطيع پايگاه داده ها |
خوشه بندي آماري ، خوشه بندي |
|
تحليل پيوند |
کشف بستگي ، کشف الگوهاي متوالي ، کشف دنباله هاي زماني مشابه |
|
تشخيص انحراف |
آمار ، تجسم مدل |
عملياتها و تکنيکهاي داده کاوي
قابليتهاي DataMining:
بايد توجه داشته باشيد كه داده كاوي يك ابزار جادويي نيست كه بتواند در پايگاه داده شما به دنبال الگوهاي جالب بگردد و اگر به الگويي جديدي برخورد كرد آن را به شما اعلام كند بلكه صرفا الگوها و روابط بين داده ها را به شما اعلام مي كند بدون توجه به ارزش آنها. بنابراين الگوهايي كه به اين وسيله كشف مي شوند بايد با جهان واقع تطابق داشته باشند. به عنوان مثال داده كاوي مي تواند با تعيين نرخ در آمدهايي كه بطور مثال بين 50/000$ و 65/000$ است كه براي خريد روزنامه خاصي در ميان فروشندگان است تعيين كند كه اكثر كالاهاي مورد نياز مردم چه رنجي از قيمت بوده وكدام ها هستند؟
به اين ترتيب شما مي توانيد از هدف خريد مردم بدون اينكه فاكتورهايي براي خريد كالاهاي خود در نظر بگيريد مطلع شويد؟
داده كاوي و انبار داده ها :
اغلب داده اي كه مورد كاوش قرار مي گيرد ابتدا از يك انبار داده آماده شده به داخل يك پايگاه داده كاوي سرازير مي شود. اين كار مزاياي زيادي دارد. پايگاه داده كاوي مي تواند به جاي يك انبار فيزيكي داده يك انبار منطقي از داده ها باشد. به شرط آنكه انبار دادهDBMS بتواند دامنه هاي منابع اضافي از داده كاوي را نيز پوشش دهد. روند شرح داده شده در شكل زير آمده است:
|
Data Sources |
Data MiningData Mart |
GeographicData Mart |
DataWarehouse
|
AnalysisData Mart |
داده كاوي و OLAP:
يكي از سوالهاي رايج در ميان متخصصان پردازش داده در مورد تفاوت ميان داده كاوي وOLAP(پردازش آناليزي on-line) .
Olap قسمتي از قالب ابزارهاي تصميم گيري است. پرس وجو هاي سنتي و ابزارهاي گزارش گيري كه چه چيزي در داخل يك پايگاه داده است.olap از اين فراتر ميرود و براي جواب دادن به علت درستي برخي موارد استفاده دارد.
داده كاوي , آمار و يادگيري ماشين
داده كاوي فوايدي از پيشرفتهاي رشته هوش مصنوعي را در خود جاي داده است كه هم شامل قواعدي براي مسائل تشخيص الگو و طبقه بندي مي باشد وهم ارتباطاتي كه از طريق كاربرد شبكه هاي عصبي و درختهاي تصميم گيري براي فهم مسائل صورت مي گيرد مي باشد.
داده كاوي در اين زمينه داراي الگوريتم هاي نسبتا جديدي مانند شبكه عصبي و درخت تصميم ورهيافت هاي جديدي براي الگوريتم هاي قديميتر مانند الگوريتم هاي تفكيك كننده دارد.
نكته مهم آنكه داده كاوي كاربرد اين تكنيكها را براي مسائل تجاري مشابه بالا به طريقي كه اين تكنيكها را براي كاربر خبره دانش و آمارگير متخصص قابل دسترس سازد استفاده مي شود.
داده كاوي موفق:
دو نكته براي موفق بودن يك داده كاوي وجود دارد. اول اينكه يك فرموله سازي دقيق از مساله اي است كه شما بايد حل كنيد. دومين نكته استفاده از داده صحيح است. پس از انتخاب داده اي كه در دسترس شماست يا شايد خريد داده خارجي شما ممكن است نيازمند شويد آن را به روشهايي انتقال داده يا دسته بندي كنيد.
تحليل ارتباطات:
تحليل ارتباط يک رهيافت توصيفي براي اکتشاف داده است که مي تواند به مشخص سازي ارتباطات ميان مقادير در پايگاه داده کمک نمايد.دو رهيافت عام براي رسيدن به تحليل ارتباطي اکتشاف ارتباطي و اکتشاف توالي مي باشد.اکتشاف ارتباطات قوانيني را در مورد مواردي را که بايد با هم در يک رويداد ظاهرشوند مانند تراکنش خريد را مي ِابد.تحليل سبد عرضه يک نمونه شناخته شده از کشف ارتباط مي باشد.کشف توالي بسيبار شبيه کشف ارتباط است با توجه به اين نکته که در اينجا توالي يک ارتباط است که در طول يک بازه زماني صورت مي گيرد.
ارتباطات به صورت A=>B نوشته مي شود که به A مقدم يا طرف سمت چپ و به B تالي يا طرف سمت راست مي گويند.براي مثال در قانون ارتباطي "اگر مردم يک چکش بخرند آنگاه مي توانند ميخ بخرند" جمله مقدم "خريد چکش" و جمله تالي "خريد ميخ" مي باشد.
روشهاي گرافيكي مي توانند در نمايش ساختار ارتباطات نقش داشته باشند. در شكل زير هر يك از دواير يك مقدار يا يك رويداد را نمايش مي دهد. خطوط ارتباطي ميان اين دايره ها يك ارتباط را نشان مي دهند. خطوط كلفت تر ارتباطات قوي تر و فراوان تري را نمايش مي دهند.
سلسله مراتبي از انتخاب ها
هدف داده كاوي توليد دانش جديدي است كه كاربر بتواند بر اساس آن كار خود را جلو برد. اين كار بوسيله ساختن مدلي از جهان واقعي بر پايه داده هايي كه از منابع گوناگون بدست مي آيد صورت گيرد كه اين منابع مي تواند شامل تراكنشهاي هماهنگ, تاريخ مربوط به هر مشتري, اطلاعات نمايش گرافيكي, داده كنترل فرآيند و پايگاه داده هاي مرتبط خارجي مانند اطلاعات اعتبار اداري و ... باشد. نتيجه مدل سازي يك سري توضيحات در مورد الگوها و ارتباطات داده اي كه مي تواند به صورت مطمئني جهت پيش بيني آينده مورد استفاده قرار گيرد.
براي جلوگيري از سرگرداني در مراحل مختلف داده كاوي ايجاد تصويري از سلسله مراتبي از انتخابات و تصميم ها كه نياز مند آن هستيد در ذهن قبل از شروع كار به شما كمك خواهد كرد:
- هدف كار
- نوع پيش بيني
- نوع مدل انتخابي
- الگوريتم
- محصول
مدلها و الگوريتمهاي داده كاوي
اغلب محصولات از انواع گوناگوني از الگوريتمها كه در علم كامپيوتر يا مقالات آماري ارائه شده به همراه پياده سازي خاص آنها كه جهت رسيدن به هدف فروشنده مي باشد استفاده مي نمايند. براي مثال بسياري از فروشندگان نسخه هايي از درختهاي تصميم CART يا CHAID را به همراه امكاناتي براي كار بر روي كامپيوترهاي موازي مي فروشند. برخي از فروشندگان الگوريتمهاي مختص خود دارند كه گرچه ممكن است وابستگي ها يا امكانات اضافي نداشته باشد اما مي تواند خوب كار كند.
شبكه هاي عصبي
شبكه هاي عصبي به طور خاصي مورد استفاده اند چرا كه آنها ابزاري موثر براي مدلسازي مسائل بزرگ و پيچيده كه ممكن است در آنها صدها متغير پيش بيني كننده كه فعل و انفعالات زيادي دارند وجود داشته باشد.(شبكه هاي عصبي زيستي بطور غير قابل مقايسه اي پيچيده تر هستند.)شبكه هاي عصبي مي توانند در مسائل طبقه بندي يا حدسهاي بازگشتي(كه در آنها متغير خروجي پيوسته است) استفاده شوند.
يك شبكه عصبي با يك لايه داخلي شروع مي شود كه در آن هر گره به يك متغير پيشگو منسوب مي گردد. اين گره هاي ورودي به يك تعداد از گره ها در لايه پنهان متصل مي شوند.گره ها در لايه پنهان مي توانند به گره هايي در يك لايه پنهان ديگر يا به يك لايه خروجي متصل شود. لايه خروجي خود شامل يك يا بيشتر متغيرهاي جواب مي باشد.
يك شبكه عصبي با يك لايه پنهان
درخت هاي انتخاب
درخت هاي انتخاب راهي براي نمايش يك سري از قوانين كه به يك كلاس يا مقدار منجر مي شود مي باشند. براي مثال شما ممكن است بخواهيد درخواستهاي وام را برحسب ريسك اعتبار خوب يا بد طبقه بندي كنيد. شكل بعد يك مدل ساده از يك درخت انتخاب به همراه توضيح در مورد تمام بسته هاي پايه آن يعني گره انتخاب, شاخه ها و برگهاي آن كه اين مساله را حل مي كند نشان مي دهد.
اولين بسته گره بالايي تصميم يا ريشه مي باشد كه يك بررسي جهت برقراري شرط خاصي مي نمايد. گره ريشه در اين مثال “Income>$40,000” مي باشد. نتايج اين بررسي منجر مي شود كه درخت به دوشاخه تقسيم گرددكه هر يك نشان دهنده جوابهاي ممكن است.در اين مورد بررسي شرط مذكور مي تواند داراي جواب خير يا بله باشد در نتيجه دو شاخه داريم.
براساس نوع الگوريتم هر گره مي تواند دو يا تعداد بيشتري شاخه داشته باشد. براي مثال CART درختهايي با تنها دوشاخه در هر گره توليد مي كند.چنين درختي يك درخت دودويي مي باشد.
مدلهاي مختلف درخت تصميم بطور عمومي در داده كاوي براي كاوش داده و براي استنتاج درخت و قوانين آن كه براي پيش بيني مورد استفاده قرار مي گيرد استفاده مي شوند. يك تعداد از الگوريتمهاي مختلف مي توانند براي ساخت درختهاي تصميم شامل CHAID, CART,Quest و C5.0 بكار روند.
اندازه درخت مي تواند از طريق قوانين متوقف شونده كه رشد درخت را محدود مي كنند كنترل شود.
فرآيند داده كاوي
مدلهاي فرآيند
با توجه به اينكه يك فرآيند سيستماتيك براي داده كاوي موفق ضروري است بسياري از فروشندگان و همفكران مشاور آنها يك مدل فرآيند براي راهنمايي كاربر خود كه از طريق يك سري مراحل مشخص او را به نتايج خوبي هدايت خواهد كرد طراحي كردند. براي مثال SPSS از مراحل پنجگانه تشخيص دسترسي تحليل عمل و اتوماسيون و SAS از مراحل نمونه گيري, جستجو, تغيير و بهبود, مدل سازي و تعيين استفاده مي نمايد.
اخيرا ائتلاف فروشندگان وكاربران شامل سيستمهاي مهندسي NCR كپنهاك, راه حلهاي جامعSPSS و بانك OHRA در حال ساختن يك فرآيند خاص كه به فرآيند استاندارد صنعتي داده كاوي (CRISP-DM) موسوم است مي باشند. اين فرآيند براي پردازش مدلهاي شركتهاي ديگر كه يك كاره يا دو كاره هستند يكسان مي باشد. اين فرآيند شروع خوبي براي كمك به مردم جهت فهم مراحل ضروري در داده كاوي موفق مي باشد.
مدل فرآيند دو سويه
مدل فرآيند دو سويه كه در زير توضيح داده شده است برخي از موارد پيش بيني را از مدل CRISP-DM به ارث مي برد.
گامهاي اصلي داده كاوي جهت كشف دانش عبارتند از:
1- تعريف مساله
2- ساختن پايگاه داده مربوط به داده كاوي
3- جستجوي داده
4- آماده ساختن داده براي مدل سازي
5- ساختن مدل
6- ارزيابي مدل
7- ساخت مدل ونتايج
به سراغ اين گامها مي رويم تا فرآيند كشف دانش را بهتر متوجه شويم.
تعريف مساله
در ابتداي امر پيش زمينه كشف دانش فهم درست داده و مساله مي باشد. بدون اين فهم درست هيچ الگوريتمي صرف نظر از خبره بودن آن نمي تواند نتيجه مطمئني براي شما حاصل نمايد و همچنين شما قادر نخواهيد بود كه مسائلي را كه سعي در حل آن داريد تعريف كرده و همچنين داده را جهت كاوش آماده نموده و يا نتايج را به طور صحيح تفسير نمائيد. براي استفاده بهتر از داده كاوي شما بايد يك بيان واضح از هدف خود داشته باشيد.
ساختن يك پايگاه داده داده كاوي
اين گام به همراه دو گام بعدي هسته آماده سازي داده را تشكيل مي دهند. در مجموع گامهاي گفته شده وقت و كار بيشتري از ساير گامها مي برند. ممكن است شما گامهاي تكراري در آماده سازي داده و ساختن مدل داشته باشيد چرا كه در هر مرحله ممكن است به نكته اي برسيد كه شما را بر آن دارد داده خود را بهبود بخشيد. اين گامهاي آماده سازي داده مي تواند 50% تا 90% وقت و كار از تمام فرآيند كشف دانش را به خود اختصاص دهد.
مراحل لازم براي ساخت يك پايگاه داده داده كاوي به شكل زير مي باشد:
1- جمع آوري داده ها
2- توضيح داده ها
3- انتخاب داده ها
4- تعيين كيفيت داده ها و پاك كردن آن
5- تثبيت و يكپارچگي
6- ساختن فوق داده (داده هايي كه خود بيانگر توضيحي در مورد داده هاي موجود مي باشند.)
7- باركردن پايگاه داده مربوط به داده كاوي
8- نگهداري پايگاه داده مربوط به داده كاوي
اين كارها ممكن است لزوما به همين ترتيب گفته شده انجام نگردند.
جستجوي داده
به بخش توضيح داده براي داده كاوي كه توضيح مختصري راجع به اشكال, تجزيه و تحليل ارتباط و ديگر وسايل جستجوي داده مي باشد نگاهي بياندازيد.
هدف شناسايي مهمترين فيلدها در پيش بيني نتيجه و تعيين اينكه كدام يك از داده هاي بدست آمده مفيد مي باشد است.
در يك مجموعه داده اي با صدها يا حتي هزاران ستون جستجوي داده مي تواند كار و زمان بر باشد. يك واسط مناسب و جواب كامپيوتر سريع در اين فاز مهم و حياتي مي باشند زيرا هنگامي كه شما براي دريافت پاسخ برخي گراف ها مجبور باشيد 20 دقيقه صبر كنيد ماهيت جستجوي شما به كلي تغيير خواهد كرد.
آماده سازي داده براي مدل سازي
اين آخرين گام آماده سازي داده قبل از ساخت مدلهاست. چهار قسمت مهم در اين مرحله وجود دارد:
1- انتخاب متغيرها
2- انتخاب سطرها
3- ساختن متغيرهاي جديد
4- تغيير شكل متغيرها
ساختن مدل داده كاوي
مهمترين مساله براي يادآوري در مورد ساخت مدل آن است كه اين كار يك فرآيند تكراري است. شما براي جستجو به مدلهاي جايگزين جهت يافتن سودمندترين آنها جهت حل مسائلتان نياز داريد. آنچه كه شما در جستجوي يك مدل مناسب ياد مي گيريد مي تواند شما را به بازگشتن به عقب و انجام برخي تغييرات در داده مورد استفاده خود و حتي بهبود بيان ساله راهنمايي كند.
هنگامي كه شما در مورد نوع پيش بيني كه مي خواهيد انجام دهيد تصميم گرفتيد بايد يك نوع مدل براي ساخت تصميم خود انتخاب كنيد.
آماده سازي و آزمايش مدل داده كاوي احتياج به اين دارد كه داده به حداقل دو گروه شكسته شود: يكي براي آماده كردن مدل و ديگري جهت تست مدل مربوطه. اگر شما از آماده سازي و تست متفاوتي استفاده ننمائيد دقت مدل خواهد بود.
تائيد اعتبارساده
پايه اي ترين روش تست داده تاييد اعتبار ساده مي باشد. براي انجام اين كار چون درصدي از پايگاه داده را به عنوان يك تست پايگاه داده كنار بگذاريد و به هر صورت از آن در برآورد و ساخت مدل استفاده ننمائيد. اين درصد معمولا بين 5 تا 33 مي باشد.
ارزيابي و تفسير
تاييد اعتبار مدل
بعد از ساخت يك مدل شما بايد نتايج آن را ارزيابي نموده و همچنين اهميت آن را نيز توضيح دهيد.
ماتريسهاي پيچيدگي
براي مسائل طبقه بندي يك ماتريس پيچيدگي ابزار مفيدي براي فهم نتايج مي باشد. يك ماتريس پيچيدگي تعداد مقادير كلاس (گروه)مجازي را در مقايسه با تعداد مقادير كلاس(گروه) پيش بيني شده نشان مي دهد. نه تنها چگونگي پيش بيني مدل توسط اين ماتريس نشان داده مي شود بلكه نشان دهنده جزئياتي است كه براي نشان دادن موارد اشتباه ضروري است. ستونها كلاسهاي مجازي و سطرها كلاسهاي پيش بيني شده را نشان مي دهند. بنابراين قطرهاي اين ماتريس بيانگر تمام پيش بيني هاي درست مي باشند. در ماتريس پيچيدگي مي بينيد كه مدل ما 38 تا از 46 تا كلاس B را به درستي پيش بيني كرده است اما 8 تا از آنها اشتباها كلاس بندي شده اند. 2 تا به عنوان كلاسA و6 تا به عنوان كلاس C مي باشند.
در حالات خاص اگر قيمت هاي گوناگون با اشتباهات مختلفي در ارتباط باشند يك مدل با دقت كمتر ممكن است بر يك مدل با دقت بيشتر و در ضمن قيمت بيشتر به خاطر انواع اشتباهاتي كه ايجاد مي كند ترجيح داده شود. براي مثال فرض كنيد در ماتريس بالا هر جواب درست قيمتي معادل 10 دلار و هر جواب نادرست براي كلاس A 5 دلار , براي كلاس B 10 دلار و براي كلاس C 20 دلار داشته باشد. بنابراين هزينه شبكه اي ماتريس معادل:
خواهد داشت.
اما ماتريس شكل بعد را در نظر بگيريد. دقت تا 79% كاهش پيدا كرده است هنگامي كه همان قيمتهاي قبلي را بر روي اين ماتريس اعمال كنيم هزينه كل برابر:
بنابراين اگر بخواهيد مقدار ارزشي مدل را بيشينه كنيد بهتر است كه مدلي با دقت كمتر ولي در عوض با ارزش شبكه اي بيشتر انتخاب نمائيد.
ايجاد معماري مدل
هنگامي كه يك مدل ساخته و تاييد اعتبار مي شود مي تواند در دو راه اصلي مورد استفاده قرار گيرد. راه اول براي تحليل گر است كه اعمالي را بر اساس ديد ساده از مدل و نتايج آن معرفي مي كند. راه دوم بكاربردن مدلها در مجموعه داده اي مختلف است. اين مدل مي تواند براي مشخص نمودن ركوردها بر اساس گروه بنديشان و يا مقدار دهي يك امتياز مثلا احتمال انجام يك عمل استفاده گردد.
نتيجه گيري :
هنگام به دست آوردن يك كاربرد پيچيده داده كاوي اغلب اگر چه بخش بحراني اما كوچك پروژه نهايي به حساب مي آيد. براي مثال دانشي كه از داده كاوي كشف مي شود مي تواند با دانش متخصصان داده و تراكنشهاي ورودي تركيب شود. در يك سيستم تشخيص فرآيند الگوهاي موجود فرآيند مي توانند با الگوهاي كشف شده تلفيق شوند. هنگامي كه موارد مفروض اين فرآيند براي ارزيابي به بررسي كنندگان فرستاده مي شوند بررسي كنندگان ممكن است نياز داشته باشند كه به ركوردهايي در پايگاه داده كه مربوط به قسمتهاي ادعا شده توسط يك سازنده است دسترسي پيدا كنند.
به طور كلي مراحلي كه توضيح داده شد براي انجام هر فرآيند داده كاوي لازم به نظر مي رسد.
منابع و مراجع:
[1] Introduction to Data Mining and Knowledge Discovery By Two Crows Corporation
[2] Jeffery W. Seifert , Analyst in information science and Technology Policy, ‘ Data Mining : An Overview ‘ December 2004.
[3] David J. HAND , Data Mining: Statistics and More? , December 2002.
[4] Eamonn Keogh , Stefano Lonardi , Chotirat Ann Ratanamahatana , ‘Towards Parameter-Free Data Mining ‘ Semtember 2005.
[1] Application Oriented
[2] Active DBMS
[3] Knowledge Discovery From Database
[4] Data Warehousing
[5] Subject Oriented
[6] Integrated
[7] Time Variant
[8] NonVolatile







