![]() |
|
![]() |
|
![]() |
วัตถุประสงค์ในการทำให้เป็นรูปแบบที่เป็นบรรทัดฐานการทำให้เป็นรูปแบบที่เป็นบรรทัดฐาน (normalization process) เป็นกระบวนการออกแบบฐาน ข้อมูลที่นำเค้าร่างของรีเลชันมาตรวจสอบและแก้ไขปัญหาเกี่ยวกับความซ้ำซ้อนกันของข้อมูล (data anomaly) ซึ่งผลงานดังกล่าวได้รับการคิดค้นและพัฒนาโดย อี.เอฟ.คอดด์ (E.F.Codd) ประมาณปี ค.ศ. 1968 เพื่อให้เข้าใจปัญหาที่เกิดจากความซ้ำซ้อนของข้อมูลได้ชัดเจนยิ่งขึ้น ในที่นี้ขอนำตัวอย่างมาประกอบดังนี้
ภาพที่ 4.8รีเลชันที่มีปัญหาเรื่องความซ้ำซ้อนของข้อมูลจากข้างต้นจะพบว่า รีเลชันมีข้อมูลซ้ำซ้อนกันจำนวนมาก หากต้องการปรับปรุงข้อมูล (update anomaly) ใด ๆ จะต้องทำซ้ำหลายแห่ง ทำให้สิ้นเปลืองเวลาในการแก้ไขข้อมูล รวมทั้งอาจมีการแก้ไขข้อมูลได้ไม่ครบถ้วนและถูกต้องทุกรายการก็ได้ ตัวอย่างเช่น การแก้ไขชื่อของอาจารย์ที่ปรึกษาจาก ศิริภัทรา เหมือนมาลัย เป็น ณัชชา มาลัย การเพิ่มเติมข้อมูล (insert anomaly) ในรีเลชันข้างต้นไม่สามารถทำได้ในทันที เนื่องจากยังไม่มี การกำหนดคีย์หลักของรีเลชัน และหากกำหนดให้รหัสนักศึกษาและรหัสชุดวิชาเป็นคีย์หลักของรีเลชันก็อาจไม่สามารถเพิ่มเติมข้อมูลลงในรีเลชันได้ ตัวอย่างเช่น หากมีการเปิดสอนขุดวิชาใหม่ 729105 การจัดการทรัพยากรมนุษย์ จะไม่สามารถเพิ่มเติมข้อมูลเข้ามาในรีเลชันนี้ได้ เนื่องจากยังไม่ปรากฏข้อมูลการลงทะเบียนของนักศึกษามาก่อน ค่าของรหัสนักศึกษาจึงเป็นค่าว่าง ทำให้ไม่อาจเพิ่มเติมข้อมูลลงในรีเลชันได้ เพราะ แอททริบิวต์ที่เป็นส่วนของคีย์หลักจะมีค่าว่างไม่ได้ นอกจากนี้ การลบข้อมูล (delete anomaly) ออกจากรีเลชันอาจทำให้ข้อมูลที่ต้องการใช้ใน การทำงานหรืออ้างอิงสูญหายไป หากผู้ที่มีรหัสนักศึกษา 41013327 มัทนา พินิจไพฑูรย์ ลาออก ข้อมูลที่เกี่ยวข้องกับนักศึกษาจะถูกลบไปทั้งทูเพิล ดังนั้น ข้อมูลเกี่ยวกับชุดวิชา 729103 การจัดการการตลาด ซึ่งมีเพียงแห่งเดียวในฐานข้อมูลก็จะสูญหายไปด้วย การที่ต้องมีกระบวนการทำให้เป็นรูปแบบที่เป็นบรรทัดฐาน เนื่องจากขั้นตอนการออกแบบฐาน ข้อมูลในระดับแนวคิดด้วยอี-อาร์โมเดล (E-R model) ทำการวิเคราะห์ความสัมพันธ์ของข้อมูลในระดับ เอ็นทิตีเท่านั้น หากทว่ายังขาดการวิเคราะห์ความสัมพันธ์ระหว่างแอททริบิวต์ในแต่ละรีเลชันจึงจำเป็นต้องมีกระบวนการทำให้เป็นรูปแบบที่เป็นบรรทัดฐานอีกขั้นหนึ่ง เพื่อทำการวิเคราะห์ความสัมพันธ์ของข้อมูลในระดับแอททริบิวต์ของแต่ละรีเลชัน เพื่อให้ความซ้ำซ้อนของข้อมูลในแต่ละรีเลชันลดลง การทำให้เป็นรูปแบบที่เป็นบรรทัดฐาน เป็นกระบวนการที่เกิดขึ้นในระหว่างการออกแบบฐานข้อมูลเชิงสัมพันธ์ โดยการใช้เทคนิคที่เรียกว่า Decomposition ทำการวิเคราะห์ความสัมพันธ์ระหว่างแอททริบิวต์ในแต่ละรีเลชัน ด้วยการจำแนกรีเลชันที่ได้จากอี-อาร์โมเดล (entity relationship model : E-R model) ซึ่งเป็นเครื่องมือในการออกแบบฐานข้อมูลในระดับแนวคิด ให้เป็นรีเลชันย่อยในโครงสร้างแบบต่าง ๆ ที่เรียกว่า รูปแบบที่เป็นบรรทัดฐาน (normal form) โดยมีขั้นตอนในการจัดทำที่ชัดเจน ทั้งนี้ เพื่อขจัดความซ้ำซ้อนของข้อมูลในแต่ละรีเลชันให้เหลือน้อยที่สุดหรือแทบไม่มีความซ้ำซ้อนหลงเหลืออยู่เลย การทำให้เป็นรูปแบบที่เป็นบรรทัดฐานเป็นการดำเนินงานตามลำดับอย่างเป็นขั้นตอน เพื่อให้รีเลชันมีคุณสมบัติอยู่ในรูปแบบที่เป็นบรรทัดฐานขั้นต่าง ๆ ดังนี้คือ 1. รูปแบบที่เป็นบรรทัดฐานขั้นที่ 1 (First Normal Form : 1NF) 2. รูปแบบที่เป็นบรรทัดฐานขั้นที่ 2 (Second Normal Form : 2NF) 3. รูปแบบที่เป็นบรรทัดฐานขั้นที่ 3 (Third Normal Form : 3NF) 4. รูปแบบที่เป็นบรรทัดฐานของบอยส์และคอดด์ (Boyce/Codd Normal Form : BCNF) 5. รูปแบบที่เป็นบรรทัดฐานขั้นที่ 4 (Fourth Normal Form : 4NF) 6. รูปแบบที่เป็นบรรทัดฐานขั้นที่ 5 (Fifth Normal Form : 5NF) ทั้งนี้ รีเลชันจะอยู่ในรูปแบบที่เป็นบรรทัดฐานขั้นใดก็ขึ้นอยู่กับคุณสมบัติของรีเลชันในขณะนั้น ตัวอย่างเช่น หากรีเลชันที่ปรึกษามีคุณสมบัติตรงตามรูปแบบที่เป็นบรรทัดฐานขั้นที่ 3 ก็ถือว่า รีเลชันนั้นอยู่ในรูปแบบที่เป็นบรรทัดฐานขั้นที่ 3 โดยรีเลชันจะยิ่งมีคุณภาพมากขึ้น หากอยู่ในรูปแบบที่เป็นบรรทัดฐาน สูงขึ้น เนื่องจากรีเลชันนั้นจะมีข้อมูลซ้ำซ้อนลดน้อยลงหรือแทบไม่มีความซ้ำซ้อนปรากฏอยู่เลย แม้ว่าการทำให้เป็นรูปแบบที่เป็นบรรทัดฐานจะมีขั้นตอนที่แน่นอนตามลำดับ แต่ก็ไม่จำเป็นต้อง เริ่มต้นจากรูปแบบที่เป็นบรรทัดฐานขั้นที่ 1 เสมอไป ทั้งนี้ ขึ้นอยู่กับคุณสมบัติของรีเลชันว่าอยู่ในรูปแบบที่เป็นบรรทัดฐานขั้นใด ก็ให้เริ่มดำเนินการทำให้เป็นรูปแบบที่เป็นบรรทัดฐานจากขั้นนั้นเป็นต้นไป โดยจะไปยุติที่รูปแบบที่เป็นบรรทัดฐานขั้นที่ 5 เสมอ เนื่องจากรีเลชันที่อยู่ในรูปแบบที่เป็นบรรทัดฐานขั้นที่ 5 จะ ไม่ปรากฏความซ้ำซ้อนของข้อมูลหลงเหลืออยู่แล้ว หากขาดกระบวนการทำให้เป็นรูปแบบที่เป็นบรรทัดฐานผู้ออกแบบฐานข้อมูลอาจต้องใช้ ประสบการณ์ในการวิเคราะห์ความสัมพันธ์ระหว่างแอททริบิวต์ในแต่ละรีเลชัน เพื่อให้ความซ้ำซ้อนของข้อมูลในแต่ละรีเลชันลดลง โดยขาดหลักการที่เป็นระบบและขั้นตอนที่ชัดเจน ซึ่งการลองผิดลองถูกในการออกแบบ ดังกล่าวอาจทำให้เกิดผลกระทบต่อการทำงานภายในองค์กรได้ รวมทั้งยังขาดมาตรฐานในการประเมิน การออกแบบอีกด้วย การทำให้เป็นรูปแบบที่เป็นบรรทัดฐานจึงมีประโยชน์อย่างยิ่งต่อการออกแบบฐานข้อมูล หากผู้ออกแบบฐานข้อมูลทำตามขั้นตอนที่กำหนดย่อมจะได้ฐานข้อมูลที่ถูกต้องและมีโครงสร้างที่ดี ทำให้มีข้อมูลซ้ำซ้อนกันน้อยมากหรือแทบไม่มีเลย ซึ่งจะไม่ทำให้เกิดปัญหาหากต้องการปรับปรุง เพิ่มเติม หรือลบข้อมูลในแต่ละรีเลชัน ดังนั้น วัตถุประสงค์หลักของการทำให้เป็นรูปแบบที่เป็นบรรทัดฐานก็คือ การลดความซ้ำซ้อนของข้อมูลที่จัดเก็บในแต่ละรีเลชัน ซึ่งผลจากการลดความซ้ำซ้อนของข้อมูลดังกล่าว ทำให้เกิดประโยชน์ในเรื่องต่าง ๆ ดังนี้คือ
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|