การออกแบบคลังข้อมูล สามารถจัดทำเป็นขั้นตอน ดังต่อไปนี้
4.1 กำหนดความต้องการ
ซึ่งประกอบด้วยความต้องการของผู้ใช้ข้อมูล และความต้องการทางเทคนิค กําหนดขอบเขตงาน และกําหนดแหล่งที่มาของข้อมูลที่ต้องใช้ โดยศึกษาจากงานที่ใช้อยู่เดิม ความต้องการและรูปแบบของรายงานที่ใช้สําหรับวิเคราะห์
1. ตารางข้อเท็จจริง
(Fact Table) เป็นตารางหลักที่เก็บข้อมูลและสามารถตอบคําถามที่ต้องการได้เพียงพอ เช้น การเก็บข้อมูลด้านการขาย มีคอลัมน์ของรหัสสินค้า รหัสกลุ่มสินค้า เป็นต้น
การออกแบบตารางข้อเท็จจริงจะเลือกเฉพาะคอลัมน์ที่ต้องการใช้งานเท่านั้น
และพยายามลดขนาดของคอลัมน์ที่มีความยาวมากเกินไปโดยไม่จําเป็น ข้อมูลจะไม่มีการแก้ไขหรือเปลี่ยนแปลง ยกเว้นแต่การเพิ่มข้อมูลใหม่เข้าไปในตาราง
2. ตารางมิติ (Dimension
Table) เป็นตารางที่เก็บความหมายของรหัสที่ใช้ในตารางข้อเท็จจริง มีประโยชน์เพื่อ ช่วยให้การสอบถามแสดงคําอธิบายได้ชัดเจนขึ้นกว่าการแสดงแบบรหัสอย่างเดียว เช่น ประเภทของสินค้า จะมีตารางมิติเป็น Product Group เก็บรหัสกลุ่มสินค้า ชื่อ
และรายละเอียดรหัสกลุ่มสินค้า เป็นต้น นอกจากนี้
มิติยังอาจจัดข้อมูลเป็นหลายระดับ คือ มีระดับใหญ่และระดับรองได้
เช่น ถ้าเลือกมิติของเวลา สามารถจัดให้ระดับมิติใหญ่สุดคือปี ระดับต่อมาคือไตรมาส และระดับถัดไปคือเดือน ดังนั้น ในการดูข้อมูลของมิติเวลา จะเลือกดูได้ตั้งแต่ระดับปี ไตรมาส และเดือน ซึ่งทําได้โดยใช้เครื่องมือโอแล็ปเพื่อทําการเจาะลง หรือ
เจาะขึ้น ไปที่มิตินั้นๆได้
4.3 เลือกชนิดของข้อมูลที่เป็นตัวเลขสําหรับวิเคราะห์ ในทางคลังข้อมูล จะเรียกว่าตัววัด (Measure) ได้แก่ การเลือกคอลัมน์ที่มีชนิดข้อมูลเป็นตัวเลข เช่น จํานวนสถานประกอบ การ จํานวนคนทํางาน เป็นต้น
4.4 การเตรียมข้อมูล เป็นการนําข้อมูลที่ผ่านขบวนการตรวจสอบความถูกต้องของชุดข้อมูลมาผ่านการ ETL (Extraction, Transformation and Loading) ซึ่งเทคนิคการโหลด ข้อมูลเข้าสู่คลังข้อมูล เป็นวิธีที่เร็วง่ายและคุ้มกับค่าใช้จ่ายที่ต้องเสียไป ซึ่งอาจมีประโยชน์สําหรับโครงการต่างๆ ที่ต้องการข้อมูลสําหรับตัดสินใจ หรือการทํางานอย่างรวดเร็ว
4.5 ออกแบบการเพิ่ม หรือปรับปรุงข้อมูลในคลังข้อมูล การเพิ่มข้อมูลในคลังข้อมูลเป็นสิ่งปกติและสําคัญ เนื่องจากจะต้องมีการนําข้อมูลจากระบบ OLTP (Online Transaction Processing) มาเพิ่มที่คลังข้อมูลเพื่อให้มีข้อมูลทันสมัย นอกจากนี้
ยังอาจจะมีการปรับเปลี่ยนโครงสร้างที่เก็บข้อมูลเพราะเปลี่ยนแนวความคิดหรือเพิ่มวิธีในการวิเคราะห์ข้อมูล เป็นต้น การเพิ่มและปรับปรุงข้อมูลทําได้ 3 วิธี คือ
1. การเพิ่มข้อมูลต่อท้ายข้อมูลที่มีอยู่เดิม
(Incremental Update) โดยไม่ได้เปลี่ยนแปลง
โครงสร้างของข้อมูลและ ข้อมูลส่วนนี้ยังไม้เคยนําเข้าในคลังข้อมูล
2. การทําให้ข้อมูลทั้งหมดมีความถูกต้องทันสมัย (Refresh
Data) โดยทําการประมวลผลข้อมูลใหม่อาจมีผลกระทบกับการเปลี่ยนแปลงโครงสร้างของฐานข้อมูลในคลังข้อมูล
3. การปรับปรุงโครงสร้างที่ใช้สําหรับการวิเคราะห์
(Rebuild the Dimension Structure)เช่น การเพิ่มมิติ การเพิ่ม ตัววัด
4.6 การบํารุงรักษาฐานข้อมูล การเตรียมแผนและสำรองข้อมูลจากระบบคลังข้อมูล อย่างสม่ำเสมอ รวมทั้งการทดสอบและวางแผนการกู้ระบบเมื่อมีความเสียหายเกิดขึ้นด้วย
ไม่มีความคิดเห็น:
แสดงความคิดเห็น