วันพฤหัสบดีที่ 14 กรกฎาคม พ.ศ. 2559

การออกแบบฐานข้อมูลสำหรับคลังข้อมูล

4    การออกแบบฐานข้อมูลสำหรับคลังข้อมูล

การออกแบบคลังข้อมูล สามารถจัดทำเป็นขั้นตอน ดังต่อไปนี้

4.1 กำหนดความต้องการ ซึ่งประกอบดวยความตองการของผูใชข้อมูล และความตองการทางเทคนิค กําหนดขอบเขตงาน และกําหนดแหลงที่มาของขอมูลที่ตองใช้ โดยศึกษาจากงานที่ใช้อยูเดิม ความตองการและรูปแบบของรายงานที่ใช้สําหรับวิเคราะห

4.2 ออกแบบและสรางฐานข้อมูล โครงสรางของฐานข้อมูลสําหรับงานคลังขอมูลจะแตกตาง จากการออกแบบงานที่เปนฐานข้อมูลเชิงสัมพันธ์ สําหรับคลังขอมูลนั้น เนน การออกแบบใหดีนอร์มัลไลซ์มากที่สุด คือไมจําเปนตองเปน ไปตามกฎของนอร์มัลไลซ์ เพื่อให้สอบถามข้อมูลแลว ได้ผลเร็วที่สุด จึงยอมใหเกิดการซ้ำซ้ำอนของขอมูลในแตละตารางไดถ้าจําเป็นโดยในการออกแบบฐานข้อมูลของคลังขอมูล ประกอบดวยตารางหลัก 2 อย่างคือ
          1.  ตารางข้อเท็จจริง (Fact Table) เปนตารางหลักที่เก็บขอมูลและสามารถตอบคําถามที่ต้องการไดเพียงพอ เช้น การเก็บขอมูลด้านการขาย มีคอลัมนของรหัสสินค้า รหัสกลุ่มสินค้า เป็นต้น การออกแบบตารางข้อเท็จจริงจะเลือกเฉพาะคอลัมนที่ต้องการใชงานเทานั้น และพยายามลดขนาดของคอลัมน์ที่มีความยาวมากเกินไปโดยไมจําเปน ข้อมูลจะไมมีการแกไขหรือเปลี่ยนแปลง ยกเวนแตการเพิ่มข้อมูลใหม่เขาไปในตาราง
          2.  ตารางมิติ (Dimension Table) เป็นตารางที่เก็บความหมายของรหัสที่ใช้ในตารางข้อเท็จจริง มีประโยชนเพื่อ ช่วยใหการสอบถามแสดงคําอธิบายไดชัดเจนขึ้นกวาการแสดงแบบรหัสอยางเดียว เชน ประเภทของสินค้า จะมีตารางมิติเป Product Group เก็บรหัสกลุ่มสินค้า ชื่อ และรายละเอียดรหัสกลุ่มสินค้า เป็นตน นอกจากนี้ มิติยังอาจจัดขอมูลเปนหลายระดับ คือ มีระดับใหญและระดับรองได  เช่น ถ้าเลือกมิติของเวลา สามารถจัดใหระดับมิติใหญสุดคือประดับตอมาคือไตรมาส และระดับถัดไปคือเดือน ดังนั้น ในการดูขอมูลของมิติเวลา จะเลือกดูไดตั้งแต่ระดับปไตรมาส และเดือน ซึ่งทําไดโดยใช้เครื่องมือโอแล็ปเพื่อทําการเจาะลง หรือ เจาะขึ้น ไปที่มิตินั้นๆได

4.3  เลือกชนิดของขอมูลที่เปนตัวเลขสําหรับวิเคราะห ในทางคลังขอมูล จะเรียกวาตัววัด (Measure) ไดแก่ การเลือกคอลัมนที่มีชนิดขอมูลเปนตัวเลข เชน จํานวนสถานประกอบ การ จํานวนคนทํางาน เปนต

4.4  การเตรียมขอมูล เปนการนําขอมูลที่ผานขบวนการตรวจสอบความถูกตองของชุดข้อมูลมาผ่านการ ETL (Extraction, Transformation and Loading) ซึ่งเทคนิคการโหลด ขอมูลเข้าสูคลังขอมูล เปนวิธีที่เร็วงายและคุมกับคาใช้ายที่ต้องเสียไป ซึ่งอาจมีประโยชนสําหรับโครงการตางๆ ที่ต้องการขอมูลสําหรับตัดสินใจ หรือการทํางานอยางรวดเร็ว
4.5  ออกแบบการเพิ่ม หรือปรับปรุงขอมูลในคลังขอมูล การเพิ่มขอมูลในคลังขอมูลเป็นสิ่งปกติและสําคัญ เนื่องจากจะตองมีการนําขอมูลจากระบบ OLTP (Online Transaction Processing) มาเพิ่มที่คลังข้อมูลเพื่อใหมีขอมูลทันสมัย นอกจากนี้ ยังอาจจะมีการปรับเปลี่ยนโครงสรางที่เก็บขอมูลเพราะเปลี่ยนแนวความคิดหรือเพิ่มวิธีในการวิเคราะหข้อมูล เป็นต้น การเพิ่มและปรับปรุงขอมูลทําได้ 3 วิธี คือ
1.       การเพิ่มขอมูลตอท้ายขอมูลที่มีอยูเดิม (Incremental Update) โดยไมได้เปลี่ยนแปลง
โครงสรางของขอมูลและ ขอมูลสวนนี้ยังไมเคยนําเขาในคลังขอมูล
2.       การทําใหข้อมูลทั้งหมดมีความถูกตองทันสมัย (Refresh Data) โดยทําการประมวลผลข้อมูลใหม่อาจมีผลกระทบกับการเปลี่ยนแปลงโครงสรางของฐานข้อมูลในคลังขอมูล
3.       การปรับปรุงโครงสรางที่ใชสําหรับการวิเคราะห์ (Rebuild the Dimension Structure)เช่น การเพิ่มมิติ การเพิ่ม ตัววัด

4.6  การบํารุงรักษาฐานข้อมูล การเตรียมแผนและสำรองข้อมูลจากระบบคลังขอมูล อย่างสม่ำเสมอ รวมทั้งการทดสอบและวางแผนการกูระบบเมื่อมีความเสียหายเกิดขึ้นดวย

ไม่มีความคิดเห็น:

แสดงความคิดเห็น