ตัวอย่างหลัก (Master Sample) เทคนิคการวิเคราะห์สถิติ
ที่มีบทบาทสำคัญในการเก็บข้อมูลทำวิจัย
รศ.ดร.พาชิตชนัต ศิริพานิช หลักสูตรสถิติประยุกต์ คณะสถิติประยุกต์ สถาบันบัณฑิตพัฒนบริหารศาสตร์ พามาทำความรู้จัก การวิเคราะห์สถิติเบื้องต้นที่ใช้กันทั่วไป โดยเฉพาะอย่างยิ่งการวิเคราะห์ข้อมูลเชิงสถิติที่ใช้ Statistical Software เป็นเครื่องมือช่วยในการคำนวณ มักเป็นการวิเคราะห์ข้อมูลภายใต้ข้อสมมุติ (Assumption) ว่าข้อมูลมาจากตัวอย่างสุ่ม (Random Sample) ซึ่งหมายความว่าตัวอย่างได้มาด้วยวิธีการเลือกตัวอย่างสุ่มแบบง่าย (Simple Random Sampling, SRS) และเป็นการเลือกตัวอย่างแบบใส่คืน (Sampling with Replacement) ทำให้ค่าสังเกต (Observation) X1, X2, …, Xn เป็นอิสระกัน (Independent) มีการแจกแจงเดียวกันและมีค่าพารามิเตอร์ (Parameter) เท่ากัน สมบัติ (Property) ดังกล่าวนี้ในภาษาสถิติเรียกว่า i.i.d. (Independent Identically Distribution)
วิธีการเลือกตัวอย่างสุ่มแบบง่าย (SRS) นี้เป็นวิธีที่ “ง่าย” ต่อการทำความเข้าใจสำหรับบุคคลทั่วไปสมชื่อเพราะมีลักษณะเหมือนการจับฉลากหรือออกรางวัลล็อตเตอรี่ที่คนส่วนมากคุ้นเคย แต่การจับฉลากส่วนใหญ่จะเป็นการเลือกฉลากสุ่มแบบไม่ใส่คืน (Sampling without Replacement) ทำให้ไม่ได้ฉลากซ้ำแต่การออกรางวัลล็อตเตอรี่อาจมีเลขซ้ำได้ทั้งในแต่ละรางวัลและระหว่างรางวัลต่าง ๆ ด้วย ในการเลือกตัวอย่างแบบ SRS มีข้อจำกัดว่าต้องมีกรอบตัวอย่าง (Sampling Frame) สมบูรณ์ เช่น การเลือกตัวอย่างผู้สูงอายุในหมู่บ้านแห่งหนึ่งซึ่งผู้ใหญ่บ้านมีรายชื่อผู้สูงอายุทุกคนในหมู่บ้านและยังทราบว่าแต่ละคนอยู่อาศัย ณ ที่ใด ดังนั้นการเลือกตัวอย่างสุ่มแบบ SRS จึงดำเนินการได้โดยง่ายด้วยวิธีจับฉลากรายชื่อหรือใช้คอมพิวเตอร์ช่วยในการสุ่ม อย่างไรก็ตามในการเก็บรวบรวมข้อมูลจากประชากรที่มีขนาดใหญ่ การเลือกตัวอย่างสุ่มแบบ SRS ย่อมเป็นไปโดยยาก เช่น การเลือกตัวอย่างผู้สูงอายุในประเทศไทย แม้จะมีชื่อที่อยู่ตามทะเบียนราษฎร์แต่นักวิจัยทั่วไปไม่อาจเข้าถึงฐานข้อมูลนั้นได้ สิ่งที่พอจะหาได้คือจำนวนรวมของผู้สูงอายุจำแนกตามเพศ อายุ และพื้นที่อยู่อาศัย (หมู่บ้าน ตำบล/แขวง อำเภอ/เขต จังหวัด) ตามทะเบียนราษฎร์เท่านั้น ซึ่งไม่ใช่กรอบตัวอย่างที่จะสามารถใช้ในการสุ่มตัวอย่างได้ รายชื่อและที่อยู่ของผู้สูงอายุในเขตพื้นที่เล็ก ๆ เช่น หมู่บ้านหรือตำบล (อบต.) อาจพอหาได้บ้าง ดังนั้นถ้าต้องการกรอบตัวอย่างของทั้งประเทศก็จำเป็นต้องสร้างขึ้นเอง การสร้างกรอบตัวอย่างสมบูรณ์สำหรับประชากรขนาดใหญ่มีค่าใช้จ่ายสูงมาก มีเพียงบางองค์กรเท่านั้นที่จำเป็นต้องทำและทำได้ เช่น สำนักงานสถิติแห่งชาติ อย่างไรก็ตาม ในกรณีที่ไม่มีกรอบตัวอย่างสมบูรณ์นักวิจัยอาจใช้แผนการเลือกตัวอย่างทางสถิติที่ไม่จำเป็นต้องมีกรอบตัวอย่างสมบูรณ์ เช่น การเลือกตัวอย่างหลายขั้น (Multi-stage Sampling)
ในที่นี้ขอนำเสนอเทคนิคทางสถิติที่เรียกว่าตัวอย่างหลัก (Master Sample, MS) ซึ่งเหมาะสำหรับกรณีที่มีการสำรวจตัวอย่าง (Sample Survey) จากประชากร (Population) เดิมหลายครั้งหรือหลายรอบ เช่น การสำรวจครัวเรือน (Household Survey) ทั่วประเทศเป็นประจำทุก 1 – 2 ปี หรือการสำรวจความคิดเห็นของสาธารณชน (Public Opinion Poll) การสร้างตัวอย่างหลัก ไว้ใช้เสมือนเป็นกรอบตัวอย่างในการเลือกตัวอย่างย่อย (Subsample) ที่เป็นตัวอย่างสุ่มสำหรับการศึกษาแต่ละครั้ง
องค์การสหประชาชาติ (United Nations, 1986) ให้นิยามตัวอย่างหลักไว้ว่า “A master sample is a sample from which subsamples can be selected to serve the needs of more than one survey or survey round” เห็นได้ว่า การสร้างตัวอย่างสุ่มขนาดใหญ่ (ตัวอย่างหลัก) เป็นประโยชน์แก่นักวิจัยที่ต้องการสำรวจตัวอย่างหลายครั้งจากประชากรเดียวกัน เช่น สำนักงานสถิติแห่งชาติของหลายประเทศมักมีตัวอย่างหลักไว้ใช้ในการสำรวจเรื่องต่าง ๆ อันเป็นผลมาจากการทำสำมะโนประชากรและการเคหะ (Population and Housing Census) ที่ต้องสร้างกรอบตัวอย่างในรูปของแผนที่ของครัวเรือน (Household) บนพื้นที่ต่าง ๆ ครอบคลุมทั้งประเทศเพื่อให้พนักงานสัมภาษณ์เข้าไปเก็บรวบรวมข้อมูลได้ทั่วถึงและครบถ้วน หลังจากทำสำมะโนประชากรฯ แล้วจะเก็บบางส่วนของแผนที่ครัวเรือนนั้นไว้ โดยปรับปรุง แก้ไข และ update สม่ำเสมอ เพื่อใช้เป็นตัวอย่างหลัก (กรอบตัวอย่าง) สำหรับการสำรวจเรื่องอื่น ๆ ที่ประชากรของการสำรวจคือครัวเรือนของทั้งประเทศหรือบางส่วน เช่น การสำรวจภาวะเศรษฐกิจและสังคมของครัวเรือน (Household Socio-Economic Survey, HSES) ดังนั้นแทนที่จะใช้จ่ายเงินในการสร้างกรอบตัวอย่างใหม่สำหรับการสำรวจแต่ละครั้ง ก็ใช้ตัวอย่างหลักเดิมที่มีการ update ข้อมูลให้เป็นปัจจุบันแล้ว ค่าใช้จ่ายในการ update ก็เฉลี่ยกันไประหว่างการสำรวจหลายครั้ง การทำสำมะโนประชากรฯ นี้เป็นคำแนะนำ (Recommends) ขององค์การสหประชาชาติ (United Nations) ให้แต่ละประเทศดำเนินการทุก 10 ปีเป็นอย่างน้อย หรือบางประเทศที่มีศักยภาพมากพออาจดำเนินการทุก 5 ปี ดังนั้นการเก็บแผนที่ครัวเรือนบางส่วนไว้เป็นตัวอย่างหลักก็ช่วยลดค่าใช้จ่ายและเวลาในการทำกรอบตัวอย่างสมบูรณ์สำหรับการสำรวจสำมะโนครั้งต่อไปได้พอสมควรด้วย
การสร้างตัวอย่างหลักที่ดีต้องเป็นตัวอย่างที่เลือกมาแบบสุ่ม (Random Selection) มีขนาดใหญ่ที่นับว่าเป็นตัวแทนของประชากร (Population Representative) มีข้อมูลเบื้องต้นเพื่อใช้ประกอบการเลือกตัวอย่างย่อย (Subsample) โดยข้อมูลดังกล่าวต้องมีการ Update และตรวจสอบ Validity สม่ำเสมอ
นอกจากตัวอย่างหลักช่วยให้สามารถเลือกตัวอย่างสุ่มสำหรับการวิจัยได้แล้ว ยังมีข้อดีอีกมากมายตั้งแต่ความคุ้มค่าในการสร้างกรอบตัวอย่างที่ใช้ได้กับการสำรวจหลายครั้งหรือหลายรอบ ซึ่งทำให้ค่าใช้จ่ายเฉลี่ยกันไประหว่างการสำรวจหลายครั้ง ลดเวลาในขั้นตอนการเตรียมกรอบตัวอย่างสำหรับการสำรวจ ลดความยุ่งยากในการดำเนินการสำรวจ การมีข้อมูลเบื้องต้น (ลักษณะทั่วไปของหน่วยตัวอย่าง) ก็ช่วยลดเวลาและค่าใช้จ่ายในการเก็บรวบรวมข้อมูลด้วย รวมทั้งมีข้อดีอื่น ๆ เฉพาะด้านเป็นรายกรณี แต่ในทางตรงกันข้าม ตัวอย่างหลักก็มีข้อเสียหลายประการด้วยกัน กล่าวคือตัวอย่างหลักหนึ่ง ๆ มีข้อจำกัดที่ไม่เหมาะสมสำหรับการสำรวจบางอย่าง เช่น ตัวอย่างหลักของนิด้าโพลก็เหมาะสมสำหรับการเก็บรวบรวมข้อมูลแบบใช้การสัมภาษณ์ทางโทรศัพท์ (Telephone Survey) ที่มีข้อถามไม่มากนักแบบโพลสาธารณะที่ดำเนินการอยู่ แต่ไม่เหมาะกับเทคนิคการเก็บรวบรวมข้อมูลแบบอื่น และยังอาจทำให้เกิดความเอนเอียง (Bias) ในการเลือกตัวอย่างในบางกรณี นอกจากนี้การสร้าง การรักษาปรับปรุง เพิ่มเติม (ขยายขนาด) และ update ตัวอย่างหลักมีค่าใช้จ่ายค่อนข้างสูง แต่ถ้ามีการใช้ตัวอย่างหลักเพื่อการสำรวจหลายครั้งค่าใช้จ่ายก็จะยิ่งเฉลี่ยกันออกไป เห็นได้ว่าโดยมากแล้วนักวิจัยคนใดคนหนึ่งอาจไม่สามารถสร้างตัวอย่างหลักได้ จำเป็นต้องเกิดกับองค์กรหรือกลุ่มนักวิจัยที่ช่วยกันสร้าง ช่วยกันใช้ และช่วยกันดูแลรักษาปรับปรุง อย่างไรก็ตามองค์กรที่สร้างตัวอย่างหลักบางแห่งก็ให้บริการเลือกตัวอย่าง (Sampling Selection) หรือเก็บรวบรวมข้อมูลโดยใช้ตัวอย่างหลักที่มีภายใต้ข้อกำหนดบางประการ เช่น สำนักงานสถิติแห่งชาติ (NSO) และนิด้าโพล
เอกสารอ้างอิง
Eurostat: Statistics Explained (n.d.) Population and housing census 2021 – overview Retrieved from https://ec.europa.eu/eurostat/ statistics-explained/index.php?title=Population_and_housing_census_2021_%E2%80%_93_over view on June 22, 2024.
Hans Pettersson (n.d.) Design of master sampling frames and master samples for household surveys in developing countries, Chapter V. Retrieved from https://unstats.un.org>hhsurveys>pdf>Chapter5 on June 22, 2024.
Population and housing censuses by country (last edited on 15 June 2024). Wikipedia. Retrieved from https://en.wiki pedia.org/wiki/Population_and_housing_censuses_by_country on June 25, 2024.
United Nations (1986). National Household Survey Capability Programme: Sampling Frames and Sample Designs for Integrated Household Survey Programmes (Preliminary Version). DP/UN/INT-84-014/5E, New York.