เนื้อหา
ความคลาดเคลื่อนคือค่าในชุดข้อมูลที่อยู่ไกลจากค่าอื่น ๆ ความคลาดเคลื่อนอาจเกิดจากข้อผิดพลาดในการทดลองหรือการวัดผล ในกรณีแรกอาจเป็นที่พึงปรารถนาที่จะระบุค่าผิดปกติและลบออกจากข้อมูลอื่น ๆ ก่อนที่จะทำการวิเคราะห์ทางสถิติเพื่อหลีกเลี่ยงผลกระทบต่อผลลัพธ์เนื่องจากไม่ได้แสดงถึงประชากรตัวอย่างอย่างซื่อสัตย์ วิธีที่ง่ายที่สุดในการระบุความคลาดเคลื่อนคือการใช้วิธีควอร์ไทล์
ขั้นตอนที่ 1
แสดงรายการข้อมูลจากน้อยไปมาก พิจารณาชุดข้อมูล {4, 5, 2, 3, 15, 3, 3, 5} เรียงลำดับตัวอย่างชุดข้อมูลคือ: {2, 3, 3, 3, 4, 5, 5, 15}
ขั้นตอนที่ 2
หาค่ามัธยฐาน นี่คือเลขกลางซึ่งแบ่งครึ่งหลักจากครึ่งรอง หากมีข้อมูลจำนวนคู่ควรคำนวณค่าเฉลี่ยของทั้งสอง ตัวอย่างเช่นในชุดข้อมูลที่อ้างถึงจุดกึ่งกลางคือ 3 และ 4 ดังนั้นค่ามัธยฐานคือ (3 + 4) / 2 = 3.5
ขั้นตอนที่ 3
ค้นหาควอร์ไทล์บน Q2 จุดข้อมูลที่แบ่งกลุ่มระหว่างกลุ่มที่เล็กที่สุด 75% และใหญ่ที่สุด 25% หากชุดข้อมูลเท่ากันให้เฉลี่ยสองจุดรอบควอไทล์ ในตัวอย่างก่อนหน้า: (5 + 5) / 2 = 5.
ขั้นตอนที่ 4
ค้นหาควอไทล์ต่ำสุด Q1 จุดข้อมูลที่แยก 25% ที่เล็กที่สุดจาก 75% ที่ใหญ่ที่สุด หากชุดข้อมูลเท่ากันให้เฉลี่ยสองจุดรอบควอไทล์ ในตัวอย่าง: (3 + 3) / 2 = 3.
ขั้นตอนที่ 5
ลบควอไทล์ล่างออกจากควอไทล์บนเพื่อให้ได้ค่าพิสัยระหว่างควอไทล์ IQ ในตัวอย่าง: Q2 - Q1 = 5 - 3 = 2
ขั้นตอนที่ 6
คูณช่วงระหว่างควอไทล์ด้วย 1.5 เพิ่มควอไทล์บนลงในผลลัพธ์และลบควอร์ไทล์ล่าง จุดข้อมูลใด ๆ ที่อยู่นอกค่าเหล่านี้มีความคลาดเคลื่อนเล็กน้อย สำหรับตัวอย่างที่กำหนด: 1.5 x 2 = 3. 3 - 3 = 0 และ 5 +3 = 8 ดังนั้นค่าใด ๆ ที่น้อยกว่า 0 หรือมากกว่า 8 จะมีความคลาดเคลื่อนเล็กน้อย ซึ่งหมายความว่า 15 มีคุณสมบัติเป็นความคลาดเคลื่อนเล็กน้อย
ขั้นตอนที่ 7
คูณช่วงอินเตอร์ควอไทล์ด้วย 3 บวกกับควอไทล์บนแล้วลบควอไทล์ล่าง จุดข้อมูลใด ๆ ที่อยู่นอกค่าเหล่านี้ถือเป็นความคลาดเคลื่อนอย่างมาก สำหรับตัวอย่างที่กำหนด 3 x 2 = 6. 3-6 = -3 และ 5 + 6 = 11 ดังนั้นค่าใด ๆ ที่น้อยกว่า -3 หรือมากกว่า 11 จึงเป็นความคลาดเคลื่อนอย่างมาก ซึ่งหมายความว่า 15 มีคุณสมบัติเป็นความคลาดเคลื่อนอย่างมาก