Back to Home

DataBase System

Lesson1234567101112131415

Lesson 9 : Physical Data Management



Lesson Plan
Section No.
Section 1
Section 2
Section 3
Test
PDF file
PPT File


<<Prev pageCourse MapNext page>>

Print content of this page
Save content of this page

 

ชนิดและคุณสมบัติของหน่วยเก็บข้อมูลสำรอง

อุปกรณ์บันทึกข้อมูล (storage device) ได้แก่สื่อข้อมูล และกลไกการบันทึกและเรียกใช้ข้อมูลที่บันทึกบนสื่อซึ่งมีไว้สำหรับการอ่านหรือบันทึกข้อมูลในสื่อข้อมูล

1 สื่อข้อมูล

คือวัตถุทางกายภาพที่ใช้เก็บบันทึกข้อมูลในรูปรหัสแทนข้อมูลมี 2 ชนิดคือ

1. Volatile ข้อมูลที่บันทึกจะหายไปเมื่อไม่มีกระแสไฟฟ้าผ่าน เช่น RAM ของหน่วยความจำหลัก

2. Nonvolatile ข้อมูลถูกบันทึกอย่างถาวรลบทิ้งไม่ได้ เมื่อไม่มีกระแสไฟฟ้า เช่น ROM บัตรเจาะรู และสื่อข้อมูลที่สามารถเก็บข้อมูลไว้ใช้นานๆได้

ผู้ที่จะสร้างแฟ้มข้อมูลหรือฐานข้อมูลจะต้องรู้จักเลือกสื่อบันทึกที่เหมาะสมและต้องคำนึงถึงระบบแฟ้มข้อมูลที่จะใช้อุปกรณ์บันทึกข้อมูลเพียงใด เช่นเทปแม่เหล็กเข้าถึงข้อมูลได้เฉพาะแบบลำดับ ในขณะที่จานแม่เหล็กเป็นอุปกรณ์บันทึกข้อมูลที่เข้าถึงโดยตรงหรืออย่างสุ่มได้สื่อข้อมูลที่เข้าถึงแบบลำดับนั้นทำได้ดี เฉพาะการหาระเบียนที่ถัดไปที่จะทำได้ดี ในขณะที่สื่อข้อมูลเข้าถึงแบบสุ่มนั้น สามารถใช้ตำแหน่งฮารด์แวรในการกำหนดตำแหน่งให้แก่กลไกลการเข้าถึง และแต่ละส่วนของสื่อบันทึกสามารถกำหนดตำแหน่งได้

คุณสมบัติอุปกรณ์บันทึกข้อมูลภายนอก

1. เวลาเข้าถึงข้อมูล (access time) จะต้องเร็วพอที่จะทำให้การประมวลผลข้อมูลเสร็จสิ้นภายในเวลาพอสมควร

2. ความจุของที่เก็บข้อมูล (storage capacity) ต้องมีความจุมากพอสมควรสำหรับการเก็บข้อมูลที่ต้องการใช้ในการประมวลผลได้อย่างเพียงพอ

3. ความปลอดภัย (security) สื่อบันทึกข้อมูลต้องมีความทนทาน และปลอดภัยจากความเสียหายที่เกิดขึ้น เช่น ความร้อน ความชื้น

4. อัตราการถ่ายทอดข้อมูล (transfer rate) เวลาที่ใช้ในการถ่ายทอดข้อมูลจาก/ไประหว่างหน่วยความจำกับอุปกรณ์และสื่อบันทึกข้อมูลภายนอก ต้องรวดเร็ว

5. ราคา (cost) ถ้าราคาแพงก็ควรจะมีความเร็วสูงในการเข้าถึงข้อมูล โดยที่ราคาต่อหน่วยต้องต่ำเพียงพอที่จะประหยัดค่าใช้จ่ายของงานทั้งระบบ

6. มาตรฐาน (standardization) ควรเลือกซื้ออุปกรณ์บันทึกข้อมูลที่เป็นมาตรฐาน ใช้ได้กับเครื่องคอมพิวเตอร์หลายยี่ห้อ

7. วิธีการเข้าถึงข้อมูล (access mode) ควรจะทำได้ทั้งการเข้าถึงข้อมูลแบบตรง (direct access) และแบบลำดับ (sequential access)

8. พกติดตัวได้สะดวก (portability) มีขนาดกระทัดรัด นำติดตัวได้สะดวก เช่น เทปแม่เหล็ก จานแม่เหล็กที่สามารถอดจากตัวเครื่องคอมพิวเตอร์ได้

2 เทปแม่เหล็ก (magnetic tape)

เป็นสื่อบันทึกข้อมูลที่ใช้กันอย่างกว้างขวางสำหรับแฟ้มข้อมูลขนาดใหญ่ และประมวลผลแบบแบทช์ (batch processing) เทปแม่เหล็กเป็นอุปกรณ์บันทึกข้อมูลที่เข้าถึงข้อมูลแบบลำดับสำคัญชนิดหนึ่ง เทปแม่เหล็กทำด้วยสารพลาสติกฉาบสารแม่เหล็ก โดยทั่วไปกว้าง 0.5 นิ้ว ยาวประมาณ 2400-3600 ฟุต

การแทนค่าข้อมูลในเทปแม่เหล็กมี 2 ระบบ คือ

1. ระบบ 7 แถบ (7-track tape) ใช้กับรหัสข้อมูลแบบบีซีดี (BCD)

2. ระบบ 9 แถบ (8-track tape) ใช้กับรหัสข้อมูลแบบเอบซิดิก (EBCDIC) หรือ แอสกี (ASCII)

Parity Check Bit เป็นบิตที่เพิ่มจากบิตของรหัสข้อมูลเดิม ในขณะบันทึกข้อมูลลงเทป ใช้สำหรับตรวจสอบความถูกต้องของข้อมูลระหว่างการอ่านข้อมูลบนเทป เวลาที่เครื่องขับเทปอ่าน/บันทึกข้อมูลบนเทป จะต้องรอให้เครื่องมีความเร็วพอเหมาะ หัวอ่าน/บันทึก (read/write head) จึงจะทำงานได้ ดังนั้นจากเครื่องเทปที่อยู่ในสภาพนิ่งจนกระทั่งได้ความเร็วพอเหมาะนั้นเลื่อนผ่านเนื้อเทปไปส่วนหนึ่ง เพื่อป้องกันมิให้ข้อมูลบางส่วนขาดหายไป จึงต้องเผื่อที่ว่างระหว่างข้อมูลแต่ละระเบียนเราเรียกว่า Inter Record Gap (IRG) ซึ่งมีขนาดยาวประมาณ 0.5 นิ้ว ถึง 0.75 นิ้ว ในเทปม้วนหนึ่งๆส่วนที่เป็น IRG มีสูงถึง 90% ของเนื้อเทป ดังนั้นถ้าจำนวน IRG ยิ่งมากความจุของเนื้อเทปก็จะยิ่งน้อย ดังนั้นจึงนิยมใช้วิธีการบล็อก (block) คือการรวมระเบียนต่างๆเข้าด้วยกันเป็นกลุ่มเพื่อจะได้เพิ่มเนื้อที่บรรจุระเบียนให้มากขึ้น แทนที่จะต้องมี IRG คั่นทุกระเบียนเมื่อใช้วิธีการบล็อกแล้วจะมี IRG คั่นระหว่างแต่ละบล็อก

การรวมระเบียนต่างๆเข้าด้วยกันเป็นบล็อกนั้น ช่วยลดจำนวนครั้งของการถ่ายทอดข้อมูล จึงเป็นการเพิ่มความเร็วในการทำงานของคอมพิวเตอร์ ในขณะเดียวกันได้เพิ่มประสิทธิภาพของการใช้เนื้อเทป ทำให้เทปเก็บข้อมูลได้มากขึ้น ตัวเลขที่แสดงจำนวนระเบียนในแต่ละบล็อกเรียกว่า blocking factor มีค่ายิ่งมาก การใช้เทปจะยิ่งมีประสิทธิภาพ อย่างไรก็ตามขนาดของบล็อกจะต้องไม่เกินขนาดของบัฟเฟอร์ในหน่วยความจำ

ข้อดีและข้อจำกัดในการใช้เทปแม่เหล็ก

ข้อดี

1. ไม่จำกัดความยาวของระเบียนไม่ว่าระเบียนนั้นจะมีความยาวกี่ตัวอักษรก็ตาม สามารถบันทึกลงในเทปได้สะดวก

2. ประหยัดเนื้อที่ในการจัดเก็บเพราะอัตราความหนาแน่นในการบันทึกสูง

3. ราคาต่อหน่วยถูก

4. ความเร็วในการถ่ายทอดข้อมูลของเครื่องเทปประมาณ 40,000 ตัวอักษรต่อวินาที

5. ใช้เป็นแฟ้มข้อมูลสำรอง (backup file)

ข้อจำกัด

1. ไม่สามารถอ่านข้อมูลได้ด้วยตาเปล่า ต้องใช้เครื่องอ่าน

2. ไม่สามารเข้าถึงข้อมูลที่บรรจุอยู่ภายในได้โดยตรง ต้องอ่านตั้งแต้ต้นไปเรื่อยๆ

3. ประมวลผลข้อมูลทำได้เฉพาะแบบลำดับ (sequential processing)

4. ปัจจัยทางด้านสภาพแวดล้อม ความร้อน ความชื้น อุณหภูมิมีผลต่อข้อมูลที่บันทึกในเทป

5. สามารถเข้าถึงข้อมูลได้เพียงครั้งละ 1 คนเท่านั้น

3 จานแม่เหล็ก (magnetic disk)

เป็นอุปกรณ์บันทึกข้อมูลที่สามารถเข้าถึงข้อมูลได้โดยตรง (direct access storage device) ชนิดหนึ่งที่นิยมใช้กันอย่างกว้างขวาง เพราะทำให้ผู้วิเคราะห์ระบบงานมีความคล่องตัวในการออกแบบงาน มีทางเลือกมากขึ้น ไม่ว่าจะเป็นงานออนไลน์, การสอบถาม หรือการประมวลผลแบบแบทช์

ลักษณะทางกายภาพ

แผ่นจานแม่เหล็กฉาบด้วยสารแม่เหล็กที่ผิวมีหลายๆวงซึ่งเรียกว่าแทรค (track) ประมาณ 200-800 แทรคต่อผิวจาน กำหนดหมายเลขที่อยู่ให้แทรควงนอกสุดเท่ากับ 0 แทรคถัดไปเท่ากับ 1 ตามลำดับไปเรื่อยๆ และวงในสุดมีหมายเลขที่อยู่เท่ากับ 199 (สำหรับแผ่นจานที่มี 200 แทรค) สำหรับบางระบบ อาจแบ่งแต่ละแทรคออกเป็นหน่วยที่เล็กลงไปอีกเรียก เซกเตอร์ (sector) ซึ่งเป็นหน่วยเก็บข้อมูลที่เล็กที่สุดบนจานที่สามารถกำหนดตำแหน่งที่อยู่ได้ โดยปกติความจุของแต่ละเซกเตอร์ขึ้นอยู่กับบริษัทผู้ผลิตอาจมี 128 ไบต์ หรือ 256 ไบต์ต่อเซกเตอร์

จานแม่เหล็กหลายๆแผ่นวางซ้อนกันเรียกว่าชุดจานแม่เหล็ก โดยที่แผ่นจานทุกๆด้านจะมีจำนวนแทรคเท่ากัน และมีหมายเลขที่อยู่เหมือนกัน เราสามารถบันทึกข้อมูลบนด้านทั้งสองของแผ่นจาน ยกเว้นด้านบนสุดและด้านล่างสุดของชุดจานแม่เหล็ก เพราะเป็นส่วนที่ถูกทำลายได้ง่าย สมมติว่าแผ่นจานของชุดจานแม่เหล็กมีอยู่ 10 แผ่น จะบันทึกข้อมูลได้เพียง 18 ด้านเท่านั้น

Cylinder คือกลุ่มของแทรคหมายเลขเดียวกัน ชุดจานแม่เหล็กแต่ละชุดมีจำนวน cylinder เท่ากับจำนวนแทรค แต่ละ cylinder จะมีจำนวนแทรคเท่ากับจำนวนด้านที่ใช้บันทึกข้อมูล การบันทึกข้อมูลตาม cylinder ใช้เวลาถ่ายทอดข้อมูลน้อยกว่า เนื่องจากไม่ต้องเสียเวลาเลื่อนหัวอ่าน/บันทึกข้อมูล

เครื่องขับจานแม่เหล็กมีหลายชนิด ดังนี้

1. เครื่องขับจานแบบหัวอ่านอยู่กับที่ (fixed head disk drive) เป็นชนิดที่มีแผ่นจานติดอยู่กับตัวเครื่อง และมีหัวอ่าน/บันทึกทุกๆแทรค ไม่มี seek time ดังนั้นจึงมีความเร็วในการถ่ายทอดข้อมูลสูงมาก เหมาะสำหรับเก็บซอฟต์แวร์ระบบงานที่ต้องการความรวดเร็ว

2. เครื่องขับจานแบบหัวอ่านเคลื่อนที่ (moving head disk drive) ชนิดนี้มีหัวอ่าน/บันทึก 1 ชุดต่อผิวจาน 1 ด้าน ราคาถูกกว่าแบบแรก เราสามารถเอาแผ่นจานแม่เหล็กออกจากตัวเครื่องได้ เหมาะสำหรับเก็บซอฟต์แวร์ประยุกต์และข้อมูลทั่วไป

3. เครื่องขับจานแบบวินเชสเตอร์ (winchester disk drive) ได้ใช้เทคโนโลยีใหม่ๆ ทำให้จานแม่เหล็กมีความจุเพิ่มขึ้นอีก 6-10 เท่าและความเร็วในการทำงานเพิ่มขึ้น จานแม่เหล็กที่ใช้เทคโนโลยีจะถูกเก็บมิดอยู่ภายในตัวเครื่องเอาออกมาไม่ได้เพื่อรักษาให้สะอาดอยู่ตลอดเวลา แผ่นจานทำด้วยอะลูมิเนียมฉาบด้วยสาร ferric oxide

เนื่องจากความหนาแน่นในการบันทึกข้อมูลจานแม่เหล็กขึ้นอยู่กับระยะห่างระหว่างหัวอ่าน/บันทึกกับผิวจาน ถ้าระยะห่างยิ่งน้อยความจุจะยิ่งมาก นอกจากนี้การใช้จานแม่เหล็กทั่วไป เรามักจะประสบปัญหาหัวอ่าน/บันทึกกระแทกผิวจาน ทำให้ข้อมูลบางส่วนสูญหายไปหรือทำให้แผ่นจานใช้ไม่ได้ แต่เครื่องแบบนี้ใช้หัวอ่าน/บันทึกที่มีน้ำหนักเบา

เวลาที่ใช้ในการอ่าน/บันทึกข้อมูล (access time) บนจานแม่เหล็กขึ้นอยู่กับ

1. เวลาเสาะหา (seek time) คือเวลาที่ head assembly เร่งความเร็วสู่ความเร็วปกติผ่าน cylinder ต่างๆไปยัง cylinder ที่ต้องการ แล้วลดความเร็วลงจนหยุดปกติ เวลาเสาะหานี้ขึ้นอยู่กับระยะระหว่างตำแหน่งปัจจุบันของหัวอ่าน/บันทึกกับตำแหน่งของ cylinder ที่ต้องการ

2. การเลือกหัวอ่าน/บันทึก (R/W head selection) เมื่อ head assembly ไปยัง cylinder ที่ต้องการแล้ว ต้องมาเลือกหัวอ่าน/บันทึกบนแทรคที่ต้องการซึ่งใช้เวลาเลือกน้อยมาก ในกรณีที่มีแผ่นจานเพียงแผ่นเดียว ไม่ต้องเสียเวลาในการเลือก

3. ความล่าช้าของการหมุน (rotation delay) เวลาที่ข้อมูลที่ต้องการเวียนมาอยู่ในตำแหน่งของหัวอ่าน/บันทึก เวลาโดยเฉลี่ยเท่ากับครึ่งหนึ่งของเวลาหมุน 1 รอบ

4. อัตราการถ่ายทอดข้อมูล (transfer rate) เวลาถ่ายทอดข้อมูลจากแผ่นจานแม่เหล็กไปยังหน่วยความจำขึ้นอยู่กับความหนาแน่นของการบันทึกข้อมูล, ความเร็วในการหมุนและความยาวของระเบียน

เวลาการเข้าถึงของจานแม่เหล็กสามารถคำนวณได้ดังนี้

access time = เวลาเสาะหา (seek time) + เวลาที่ใช้ในการเลือกหัวอ่าน/บันทึก (R/W head selection time) + เวลาของความล่าช้าของการหมุน (rotation delay time) + เวลาในการถ่ายทอดข้อมูล (transfer time)

ตัวอย่าง การคำนวณเวลาที่ใช้ในการอ่าน/บันทึก ข้อมูล กำหนดให้ seek time 60.0 ms. Rotation time 12.5 ms. Transfer rate 250 ตัวอักษร/ms.

ถ้าข้อมูลที่จะอ่านยาว 1000 ตัวอักษร เวลาที่จะใช้เท่ากับ

seek time 60.0 ms.

Rotation time 12.5 ms.

Read 4.0 ms. (คำนวณจาก transfer rate 1000/250 = 4 ms.)

เวลาที่ใช้ในการอ่านทั้งหมด 76.5 ms.

ถ้าเป็นการ update ใช้เวลาในการบันทึกสู่ตำแหน่งเดิมเท่ากับ

seek time 0.0 ms. (ไม่ต้องเสาะหา cylinder)

Rotation time 12.5 ms.

Read 4.0 ms. (คำนวณจาก transfer rate 1000/250 = 4 ms.)

เวลาที่ใช้ในการ update 16.5 ms.

เวลาทั้งหมดในการ update = 76.5 + 16.5 = 93.0 ms.

ข้อดีและข้อเสียของการใช้จานแม่เหล็ก

ข้อดี

1. อัตราความเร็วในการถ่ายทอดข้อมูลสูงกว่าเทปแม่เหล็ก

2. สามารถเข้าถึงข้อมูลได้ทั้งแบบลำดับ และโดยตรงหรือแบบสุ่ม

3. การจัดระบบแฟ้มข้อมูลทำได้หลายรูปแบบเช่น แฟ้มสุ่มและแฟ้มลำดับเชิงดัชนี

4. ผู้ใช้หลายคนสามารถเข้าถึงข้อมูลพร้อมกันได้

5. ข้อมูลที่เก็บทันสมัย

6. ทำการประมวลผลแบบออนไลน์ได้

ข้อเสีย

1. ถ้านำมาใช้เป็น offline storage หรือแฟ้มข้อมูลสำรองแล้วจะมีค่าใช้จ่ายมี่มากกว่าเทปแม่เหล็ก

2. ข้อมูลหลังการปรับปรุงจะหายไป ทำให้ระบบการสำรองความปลอดภัยของข้อมูลทำได้ยาก

 

 

Last Updated: 12/13/2001 11:21:54 AM
© โครงการเครือข่ายสารสนเทศเพื่อพัฒนาการศึกษา ทบวงมหาวิทยาลัย