การกำหนดฟังก์ชันของค่าใช้จ่าย
ค่าใช้จ่ายในการประมวลผลสอบถามจะมีค่าใช้จ่ายที่เกิดขึ้นดังนี้
- ค่าใช้จ่ายที่เกิดขึ้นจากการเข้าถึงข้อมูลในฐานข้อมูลที่เก็บอยู่ในดิสค์ซึ่งเป็นหน่วยเก็บข้อมูลสำรอง
ค่าใช้จ่ายที่เกิดขึ้นจากการเข้าถึงข้อมูลนั้นประกอบด้วย
การค้นหา การอ่าน
และการเขียนข้อมูลลงในดิสค์
ค่าใช้จ่ายในการค้นหาข้อมูลขึ้นอยู่กับการจัดโครงสร้างของการจัดเก็บแฟ้มข้อมูลเชิงกายภาพในฐานข้อมูลว่าเป็นอย่างไร
เช่น
แฟ้มข้อมูลแบบเรียงลำดับ,
แฟ้มข้อมูลแบบเข้าถึงโดยตรง,
โครงสร้างของตัวดัชนีและตัวดัชนีรอง
ในฐานข้อมูลขนาดใหญ่
การประมวลผลสอบถามจะต้องพยายามลดค่าใช้จ่ายของการเข้าถึงข้อมูลให้มีค่าใช้จ่ายน้อยที่สุด
ซึ่งขี้นอยู่กับว่าแผนหรือกลยุทธ์ในการประมวลผลอันไหนที่จะทำให้ค่าใช้จ่ายนี้เกิดขึ้นน้อยที่สุด
- ค่าใช้จ่ายที่เกิดจากแฟ้มข้อมูลชั่วคราว
(intermediate file)
ที่ต้องเก็บอยู่ในดิสค์
แฟ้มข้อมูลชั่วคราวจะถูกสร้างขึ้นโดยกลยุทธ์การประมวลผลของการประมวลผลสอบถาม
- ค่าใช้จ่ายที่เกิดจากการคำนวณของการค้นหาข้อมูล
การเรียงลำดับของระเบียนข้อมูล
การนำข้อมูลมารวมกัน
และการคำนวณค่าต่างของข้อมูลที่เป็นตัวเลขในแต่ละเขตข้อมูล(field)
ซึ่งเกิดขึ้นในหน่วยความจำหลักในระหว่างการทำการประมวลผลสอบถาม
ในฐานข้อมูลขนาดเล็กข้อมูลส่วนใหญ่ในฐานข้อมูลจะถูกนำมาประมวลผลในหน่วยความจำทั้งหมด
ดังนั้นจึงคำนึงการลดค่าใช้จ่ายในการคำนวณในหน่วยความจำ
สำหรับฐานข้อมูลขนาดเล็ก
- ค่าใช้จ่ายที่เกิดจากการส่งภาษาสอบถาม
(query)
บนฐานข้อมูลที่อยู่ในที่หนึ่งไปยังฐานข้อมูลที่อยู่อีกที่หนึ่งเพื่อทำการประมวลผลสอบถาม
และต้องส่งผลลัพธ์ที่เกิดจากการประมวลผลสอบถามจากฐานข้อมูลนั้นกลับไปยังฐานข้อมูลที่ภาษาสอบถามนั้นส่งมา
ในฐานข้อมูลแบบกระจาย (distributed
databases)
เมื่อฐานข้อมูลแต่ละฐานข้อมูลตั้งอยู่กระจายในหลายๆที่ที่ห่างกันออกไป
การส่งข้อมูลไปประมวลผลผ่านระบบเครือข่ายจึงต้องมีค่าใช้จ่ายเกิดขึ้น
ดังนั้นในระบบฐานข้อมูลแบบกระจาย
การประมวลผลสอบถามจึงต้องคำนึงถึงค่าใช้จ่ายในส่วนนี้ให้เกิดน้อยที่สุด