Các số đặc trưng đo độ phân tán cho mẫu số liệu không ghép nhóm

1. Khoảng biến thiên và tứ phân vị

  • Các số đặc trưng đo độ phân tán là các số cho ta biết thông tin về sự biến động mẫu số liệu. Các số này càng lớn thì số liệu biến động càng nhiều hay càng phân tán.
  • Khoảng biến thiên, kí hiệu là R, là hiệu số giữa giá trị lớn nhất và  giá trị nhỏ nhất trong mẫu số liệu.
  • Khoảng tứ phân vị, kí hiệu là \Delta_Q, là hiệu số tứ phân vị thứ ba và tứ phân vị thứ nhất, tức là: \Delta_Q=Q_3-Q_1. Khoảng tứ phân vị đo độ phân tán của 50% số liệu ở giữa của dãy số liệu đã được sắp xếp.
  • Trong mẫu số liệu có khi gặp những giá trị quá lớn hoặc quá nhỏ với đa số các giá trị khác, chúng được gọi là các giá trị bất thường.
  • Để xác định giá trị bất thường, ta sử dụng quy tắc: Các giá trị lớn hơn Q_3+1,5.\Delta_Q hoặc bé hơn Q_3-1,5.\Delta_Q là giá trị bất thường.

Ví dụ: Cho dãy số liệu 10;7;9;1;4;3;2;25;3

a) Hãy tính khoảng biến thiên của dãy số liệu.

b) Tính khoảng tứ phân vị của dãy số liệu.

c) Dãy số liệu có giá trị bất thường là bao nhiêu?

Hướng dẫn giải

Sắp xếp dãy số liệu theo thứ tự không giảm: 1;2;3;3;4;7;9;10;25.

a) Khoảng biến thiên: R=25-1=24.

b) Cỡ mẫu là n=9 (lẻ) nên tứ phân vị thứ hai chính là số chính giữa của dãy: Q_2=4.

Tứ phân vị thứ nhất là trung vị của dãy: 1;2;3;3. Do đó Q_1=\frac{2+3}2=2,5.

Tứ phân vị thứ ba là trung vị của dãy: 7;9;10;25. Do đó Q_2=\frac{9+10}2=9,5.

Khoảng tứ phân vị là: \Delta_Q=Q_3-Q_1=9,5-2,5=7.

c) Ta có:

Q_3+1,5.\Delta_Q=9,5+1,5.7=20.

Q_3+1,5.\Delta_Q=9,5-1,5.7=-1.

Do đó, các giá trị lớn hơn 20 và nhỏ hơn -1 là các giá trị bất thường.

Vậy giá trị bất thường của dãy trên là 25.

2. Phương sai và độ lệch chuẩn

Giả sử ta có một mẫu số liệu là x_1,x_2,...,x_n.

Phương sai của mẫu số liệu này, kí hiệu là s^2, được tính bởi công thức:

s^2=\frac1n[(x_1-\overline x)^2+(x_2-\overline x)^2+...+(x_n-\overline x)^2].

Trong đó \overline x là số trung bình của mẫu số liệu.

Căn bậc hai của phương sai được gọi là độ lệch chuẩn. Kí hiệu là s.

Ta có: s=\sqrt{s^2}.

Ý nghĩa: Phương sai và độ lệch chuẩn được dùng để đo mức độ phân tán của các số liệu trong mẫu quanh số trung bình. Phương sai và độ lệch chuẩn càng lớn thì các giá trị của mẫu càng cách xa nhau.

Ví dụ: Điểm kiểm tra môn Toán của bạn An trong năm 2022 được ghi lại như sau: 6;4;7;8;9;10;5;3;4;8;2;6. Tìm phương sai và độ lệch chuẩn của dãy số liệu này.

Hướng dẫn giải

Dãy số liệu trên có cỡ mẫu n=12.

Số trung bình của dãy số liệu trên là:

\overline x=\frac{6+4+7+8+9+10+5+3+4+8+2+6}{12}=6

Phương sai của dãy số liệu trên là:

s^2=\frac1n[(x_1-\overline x)^2+(x_2-\overline x)^2+...+(x_n-\overline x)^2]

Thay các số 6;4;7;8;9;10;5;3;4;8;2;6 vào các vị trí x_1;x_2;...;x_{12} và thay \overline x=6 vào công thức trên cùng với n=12. Ta có: s^2=\frac{17}3.

Độ lệch chuẩn s=\sqrt{s^2}=\frac{\sqrt{51}}3.

 

  • 7 lượt xem
Sắp xếp theo