ปัจจุบันการใช้สารสนเทศมีมากกว่าการใช้เพียงแค่การดำเนินงานประจำวัน โดยเป็นสิ่งที่ผู้บริหารต้องทำความเข้าใจและใช้งานให้เกิดประสิทธิภาพ โดยเฉพาะอย่างยิ่งในด้านงานด้านวิเคราะห์ที่ถูกพัฒนาขึ้นเพื่อช่วยลดแรงงานและลดเวลาที่ใช้ผ่านระบบสารสนเทศ เช่น data warehouse
ลักษณะของ Data warehouse
1. Organization – มีการเก็บข้อมูลอย่างเป็นระเบียบตาม subject ต่างๆ เพื่อให้สะดวกต่อจากดึงข้อมูลมาใช้งาน
2. Consistency – มีความแน่นอนในการบันทึกข้อมูล ทั้งรูปแบบและการอัพเดทความเป็นปัจจุบันของข้อมูล
3. Time oriented – มีการบันทึกเป็นช่วงระยะเวลาต่อเนื่องไป เพื่อช่วยให้นำข้อมูลเหล่านั้นมาวิเคราะห์ต่อได้ เช่น การเปรียบเทียบระหว่างผลิตภัณฑ์ เปียบเทียบศักยภาพขององค์กร หรือหาแนวโน้มของตลาด เป็นต้น
ประโยชน์จาก Data warehouse
1. เข้าถึงข้อมูลได้อย่างรวดเร็ว
2. สามารถเข้าถึง end-user ได้อย่างสะดวกผ่านการใช้งาน web browser
Data Warehouse Process
1. Operational Data (transactional) + External Data - ในขั้นตอนนี้จะเป็นการรวบรวมข้อมูลทั้งจากภายในและภายนอกองค์กรทั้งหมดก่อนนำมาเข้าสู่กระบวนการคัดแยกและจัดเก็บข้อมูล
2. Extract Clean Transform Load (ECTL) – เป็นขั้นตอนที่แบ่งย่อยได้ 4 ขั้นตอน
a. การคัดแยกข้อมูลที่เห็นว่ามีความจำเป็นต่อการวิเคราะห์วางกลยุทธ์ต่างๆของผู้ใช้งานภายในองค์กร
b. การ cleansing ข้อมูลเพื่อให้มีความถูกต้อง และมีมาตรฐานในการนำไปใช้งานให้เข้าใจไปในทิศทางเดียวกัน เช่น วิธีการจัดเก็บข้อมูลประเภทที่ขัดแย้งหรือข้อมูลที่สูญหาย
c. การเปลี่ยนรูปข้อมูลเป็นกลุ่มต่างๆ เพื่อให้สะดวกต่อการวิเคราะห์และตีความ เช่น การจัดกลุ่ม และการแบ่งเป็นช่วงข้อมูลต่างๆ
d. การนำเข้าไปยังฐานข้อมูลในขั้นต่อไป
3. Data Cube – เป็นการระบุมิติของข้อมูล (Slice&Dice) เพื่อให้สามารถมองภาพได้จากหลายด้านพร้อมกันเมื่อต้องการวิเคราะห์ใช้งาน เช่น เพศ ปีเกิด ภูมิลำเนา แผนก เป็นต้น
4. Data Warehouse – เป็นแหล่งที่ใช้เก็บข้อมูลที่ทำการจัดแบ่งและเก็บไว้เรียบร้อยแล้วเพื่อให้สะดวกต่อการที่ผู้บริหารในระดับต่างๆจะดึงมาใช้งาน
5. Business View – นำข้อมูลที่อยู่ภายใน Data Warehouse เพื่อมาใช้งานด้านวิเคราะห์ เช่น SWOT
6. Data Mart – เป็น Data Warehouse ขนาดเล็ก ซึ่งมีข้อมูลจำนวนน้อยกว่าเพื่อให้ business unit สามารถตอบสนองต่อเหตุการณ์ต่างๆได้อย่างรวดเร็วและ ตรวจสอบสิ่งต่างๆได้ง่ายกว่า Data Warehouse ที่มีปริมาณข้อมูลมาก
Business Intelligence - ประกอบไปด้วย Dashboard และ Scorecard ร่วมกัน โดยการใช้ Dashboard เพื่อให้สามารถนำข้อมูลให้เข้าใจง่าย โดยข้อมูลที่นำเสนอ คือ Balanced Scorecard ที่เป็นสิ่งวัด Performance 4 ด้านขององค์กร คือ การเงิน ลูกค้า กระบวนการภายใน และ การเรียนรู้ ซึ่งการวัดผลนี้จะทำตั้งแต่ระดับ Operation ไปจนถึง Strategic
Online Analytical Process (OLTP)
· Software ที่ช่วยให้ได้ insight data อย่าง fast, consistency และinteractive
· ช่วยให้เจาะดูรายละอียดของความผิดปกติต่างๆในกิจการง่ายขึ้น เช่นการที่ยอดขายของบางสาขาตกต่ำอาจเป็นเพราะสาขานั้นไม่ได้ขายสินค้าที่เป็นที่นิยมเป็นต้น ไม่ได้เกิดมาจากศักยภาพในการขายที่ต่ำ
Data Mining
· ช่วยค้นหาในจุดที่ไม่รู้หรือถูกมองข้ามไปในการวิเคราะห์การดำเนินงาน โดยใช้ extract ข้อมูลประเภท unknown, comprehensible, actionable information ได้
· ใช้คาดการณ์ trend ที่จะเกิดขึ้น และค้นหา unknown pattern ได้
Mining Process
1. Data Warehouse + Other data source
2. ECTL
3. Data Mining (software)
4. Output
5. Interpret result
6. Knowledge
ประเภทของ Data Mining
1. Clustering – เป็นการดูควาสัมพันธ์กันของข้อมูล โดยไม่ใช้ทฤษฎีมาแบ่งแยกประเภทข้อมูลก่อน
2. Classification – ใช้ทฤษฎีหรือสมมติฐานในการจัดแบ่งข้อมูล
3. Association – พิจารณาถึงผลสืบเนื่องที่เกียวข้องกัน เช่น การที่ลูกค้าเปิดบัญชีออมทรัพย์แล้วจะมีโอกาสกระจายไปยังธุรกิจอื่นๆของธนาคาร เช่น บัตรเครดิต หรือเงินฝากประจำหรือไม่
4. Sequence Discovery- ผลลัพธ์ของสิ่งที่เป็นสิ่งต่อเนื่องกัน
5. Prediction - การทำนายเหตุการณ์ล่วงหน้าจากข้อมูลที่มี เช่น ลักษณะพฤติกรรมที่มีแนวโน้มว่าจะเป็นการหลอกลวงหรือปลอมแปลง
Text Mining
ถูกใช้เพื่อค้นหาข้อมูลหรือตรวจสอบข้อมูลที่เป็นตัวอักษรเช่นการ Spamming หรือ phishing
· Numeric – เป็นข้อมูลประเภทที่ใช้ตัวเลขในการคำนวณและประมวลผลข้อมูล
· Alphabetic – ตัวอักษร หรือ ตัวเลขที่ไม่ได้ใช้ในการคำนวณ
ทั้งนี้ข้อมูลส่วนใหญ่ในองค์มีลักษณะเป็น structure data ซึ่งสามารถ mining ได้ง่าย แต่ปัจจุบันแนวโน้มการใช้ข้อมูลประเภท unstructured data กำลังถูกริเริ่มให้ความสำคัญขึ้นมาด้วย เช่น ข้อมูลประเภทการวิจารณ์ของลูกค้า ก็จำเป็นต้องใช้ Text Mining เพื่อหาจุดร่วมกันในคำวิจารณ์ของลูกค้าแต่ละคน
ธารินทร์ ธนเรืองศักดิ์
5202112867
ไม่มีความคิดเห็น:
แสดงความคิดเห็น