วันพฤหัสบดีที่ 20 มกราคม พ.ศ. 2554

Week9 : Data Warehouse& Business Intelligence


                ปัจจุบันการใช้สารสนเทศมีมากกว่าการใช้เพียงแค่การดำเนินงานประจำวัน โดยเป็นสิ่งที่ผู้บริหารต้องทำความเข้าใจและใช้งานให้เกิดประสิทธิภาพ โดยเฉพาะอย่างยิ่งในด้านงานด้านวิเคราะห์ที่ถูกพัฒนาขึ้นเพื่อช่วยลดแรงงานและลดเวลาที่ใช้ผ่านระบบสารสนเทศ เช่น data warehouse
ลักษณะของ Data  warehouse
1.       Organization – มีการเก็บข้อมูลอย่างเป็นระเบียบตาม subject ต่างๆ เพื่อให้สะดวกต่อจากดึงข้อมูลมาใช้งาน
2.       Consistency – มีความแน่นอนในการบันทึกข้อมูล ทั้งรูปแบบและการอัพเดทความเป็นปัจจุบันของข้อมูล
3.       Time oriented – มีการบันทึกเป็นช่วงระยะเวลาต่อเนื่องไป เพื่อช่วยให้นำข้อมูลเหล่านั้นมาวิเคราะห์ต่อได้ เช่น การเปรียบเทียบระหว่างผลิตภัณฑ์ เปียบเทียบศักยภาพขององค์กร หรือหาแนวโน้มของตลาด เป็นต้น
ประโยชน์จาก Data warehouse
1.       เข้าถึงข้อมูลได้อย่างรวดเร็ว
2.       สามารถเข้าถึง end-user ได้อย่างสะดวกผ่านการใช้งาน web browser
Data Warehouse Process
1.       Operational Data (transactional)  + External Data - ในขั้นตอนนี้จะเป็นการรวบรวมข้อมูลทั้งจากภายในและภายนอกองค์กรทั้งหมดก่อนนำมาเข้าสู่กระบวนการคัดแยกและจัดเก็บข้อมูล
2.       Extract Clean Transform Load (ECTL) – เป็นขั้นตอนที่แบ่งย่อยได้ 4 ขั้นตอน
a.       การคัดแยกข้อมูลที่เห็นว่ามีความจำเป็นต่อการวิเคราะห์วางกลยุทธ์ต่างๆของผู้ใช้งานภายในองค์กร
b.       การ cleansing ข้อมูลเพื่อให้มีความถูกต้อง และมีมาตรฐานในการนำไปใช้งานให้เข้าใจไปในทิศทางเดียวกัน เช่น วิธีการจัดเก็บข้อมูลประเภทที่ขัดแย้งหรือข้อมูลที่สูญหาย
c.       การเปลี่ยนรูปข้อมูลเป็นกลุ่มต่างๆ เพื่อให้สะดวกต่อการวิเคราะห์และตีความ เช่น การจัดกลุ่ม และการแบ่งเป็นช่วงข้อมูลต่างๆ
d.       การนำเข้าไปยังฐานข้อมูลในขั้นต่อไป
3.       Data Cube – เป็นการระบุมิติของข้อมูล (Slice&Dice)  เพื่อให้สามารถมองภาพได้จากหลายด้านพร้อมกันเมื่อต้องการวิเคราะห์ใช้งาน เช่น เพศ ปีเกิด ภูมิลำเนา แผนก เป็นต้น
4.       Data Warehouse – เป็นแหล่งที่ใช้เก็บข้อมูลที่ทำการจัดแบ่งและเก็บไว้เรียบร้อยแล้วเพื่อให้สะดวกต่อการที่ผู้บริหารในระดับต่างๆจะดึงมาใช้งาน
5.       Business View – นำข้อมูลที่อยู่ภายใน Data Warehouse เพื่อมาใช้งานด้านวิเคราะห์ เช่น SWOT
6.       Data Mart – เป็น Data Warehouse ขนาดเล็ก ซึ่งมีข้อมูลจำนวนน้อยกว่าเพื่อให้ business unit สามารถตอบสนองต่อเหตุการณ์ต่างๆได้อย่างรวดเร็วและ ตรวจสอบสิ่งต่างๆได้ง่ายกว่า Data Warehouse ที่มีปริมาณข้อมูลมาก

Business Intelligence - ประกอบไปด้วย Dashboard และ Scorecard ร่วมกัน โดยการใช้ Dashboard เพื่อให้สามารถนำข้อมูลให้เข้าใจง่าย โดยข้อมูลที่นำเสนอ คือ Balanced Scorecard ที่เป็นสิ่งวัด Performance 4 ด้านขององค์กร คือ การเงิน ลูกค้า กระบวนการภายใน และ การเรียนรู้  ซึ่งการวัดผลนี้จะทำตั้งแต่ระดับ Operation ไปจนถึง Strategic
Online Analytical Process (OLTP)
·        Software ที่ช่วยให้ได้ insight data อย่าง fast, consistency และinteractive
·        ช่วยให้เจาะดูรายละอียดของความผิดปกติต่างๆในกิจการง่ายขึ้น เช่นการที่ยอดขายของบางสาขาตกต่ำอาจเป็นเพราะสาขานั้นไม่ได้ขายสินค้าที่เป็นที่นิยมเป็นต้น ไม่ได้เกิดมาจากศักยภาพในการขายที่ต่ำ
Data Mining
·        ช่วยค้นหาในจุดที่ไม่รู้หรือถูกมองข้ามไปในการวิเคราะห์การดำเนินงาน  โดยใช้ extract ข้อมูลประเภท unknown, comprehensible, actionable information ได้
·        ใช้คาดการณ์ trend ที่จะเกิดขึ้น และค้นหา unknown pattern ได้
Mining Process
1.       Data Warehouse + Other data source
2.       ECTL
3.       Data Mining (software)
4.       Output
5.       Interpret result
6.       Knowledge
ประเภทของ Data Mining
1.       Clustering – เป็นการดูควาสัมพันธ์กันของข้อมูล โดยไม่ใช้ทฤษฎีมาแบ่งแยกประเภทข้อมูลก่อน
2.       Classification – ใช้ทฤษฎีหรือสมมติฐานในการจัดแบ่งข้อมูล
3.       Association – พิจารณาถึงผลสืบเนื่องที่เกียวข้องกัน เช่น การที่ลูกค้าเปิดบัญชีออมทรัพย์แล้วจะมีโอกาสกระจายไปยังธุรกิจอื่นๆของธนาคาร เช่น บัตรเครดิต หรือเงินฝากประจำหรือไม่
4.       Sequence Discovery- ผลลัพธ์ของสิ่งที่เป็นสิ่งต่อเนื่องกัน
5.       Prediction  - การทำนายเหตุการณ์ล่วงหน้าจากข้อมูลที่มี เช่น ลักษณะพฤติกรรมที่มีแนวโน้มว่าจะเป็นการหลอกลวงหรือปลอมแปลง
Text Mining
                ถูกใช้เพื่อค้นหาข้อมูลหรือตรวจสอบข้อมูลที่เป็นตัวอักษรเช่นการ Spamming หรือ phishing
·        Numeric – เป็นข้อมูลประเภทที่ใช้ตัวเลขในการคำนวณและประมวลผลข้อมูล
·        Alphabetic – ตัวอักษร หรือ ตัวเลขที่ไม่ได้ใช้ในการคำนวณ
ทั้งนี้ข้อมูลส่วนใหญ่ในองค์มีลักษณะเป็น structure data ซึ่งสามารถ mining ได้ง่าย แต่ปัจจุบันแนวโน้มการใช้ข้อมูลประเภท unstructured data กำลังถูกริเริ่มให้ความสำคัญขึ้นมาด้วย เช่น ข้อมูลประเภทการวิจารณ์ของลูกค้า ก็จำเป็นต้องใช้ Text Mining เพื่อหาจุดร่วมกันในคำวิจารณ์ของลูกค้าแต่ละคน

ธารินทร์ ธนเรืองศักดิ์
5202112867

ไม่มีความคิดเห็น:

แสดงความคิดเห็น