Định nghĩa
Số trung bình (số trung bình cộng) của mẫu số liệu kí hiệu là , được tính bằng công thức:
Chú ý
Trong trường hợp mẫu số liệu cho dưới dạng bảng tần số thì số trung bình được tính theo công thức:
Trong đó là tần số của giá trị và
Số trung bình của mẫu số liệu được dùng làm đại diện cho các số liệu của mẫu. Nó là một số đo xu thế trung tâm của mẫu đó.
Số trung bình là giá trị trung bình cộng của các số trong mẫu số liệu, nó cho biết vị trí trung tâm của mẫu số liệu và có thể dùng để đại diện cho mẫu số liệu.
Định nghĩa
Sắp xếp các giá trị trong mẫu số liệu theo thứ tự không giảm.
Trung vị của mẫu, kí hiệu là , là giá trị chính giữa dãy , cụ thể:
Nếu số giá trị của mẫu số liệu là số lẻ thì giá trị chính giữa của mẫu là trung vị.
Nếu là số chẵn thì trung vị là số trung bình cộng của hai giá trị chính giữa của mẫu.
Trung vị là giá trị chia đôi mẫu số liệu, nghĩa là trong mẫu số liệu được sắp xếp theo thứ tự không giảm thì giá trị trung vị ở vị trí chính giữa.
Trung vị không bị ảnh hưởng bởi giá trị bất thường trong khi số trung bình bị ảnh hưởng bởi giá trị bất thường.
Định nghĩa
Sắp xếp các giá trị trong mẫu số liệu theo thứ tự không giảm.
Tứ phân vị của một mẫu số liệu gồm ba giá trị, gọi là tứ phân vị thứ nhất, tứ phân vị thứ hai và tứ phân vị thứ ba (kí hiệu lần lượt là ). Ba giá trị này chia tập hợp dữ liệu đã sắp xếp thành bốn phần đều nhau. Cụ thế:
Chú ý
Các điểm chia mẫu số liệu đã sắp xếp theo thứ tự từ nhỏ đến lớn thành bốn phần, mỗi phần đều chứa khoảng 25% tổng số số liệu đã thu thập được.
Ví dụ: Hàm lượng Kali (đơn vị mg) có trong 100g phân bón hóa học được cho như sau:
0 |
340 |
70 |
140 |
200 |
180 |
210 |
150 |
100 |
130 |
140 |
180 |
190 |
160 |
290 |
50 |
220 |
180 |
200 |
210 |
Hãy tìm tứ phân vị. Các tứ phân vị này cho ta thông tin gì?
Hướng dẫn giải
Sắp xếp các giá trị này theo thứ tự không giảm ta được:
0 |
50 |
70 |
100 |
130 |
140 |
140 |
150 |
160 |
180 |
180 |
180 |
190 |
200 |
200 |
210 |
210 |
220 |
290 |
340 |
|
|
|
|
|
|
|
|
|
Hai số chính giữa |
|
|
|
|
|
|
|
|
|
Vì n = 20 là số chẵn nên là số trung bình cộng của hai giá trị chính giữa.
Ta tìm là trung vị của nửa số liệu bên trái
0 |
50 |
70 |
100 |
130 |
140 |
140 |
150 |
160 |
180 |
|
|
|
|
Hai số chính giữa |
|
|
|
|
Ta tìm là trung vị của nửa số liệu bên phải
180 |
180 |
190 |
200 |
200 |
210 |
210 |
220 |
290 |
340 |
|
|
|
|
Hai số chính giữa |
|
|
|
|
Nhận xét: Các tứ phân vị cho ta hình ảnh phân bố của mẫu số liệu. Khoảng cách từ đến là 45 trong khi khoảng cách từ đến là 25.
Điều này cho thấy mẫu số liệu tập trung mật độ cao ở bên phải và mật độ thấp ở bên trái .
Định nghĩa
Mốt của mẫu số liệu là giá trị xuất hiện với tần số lớn nhất.
Chú ý
Một mẫu số liệu có thể có nhiều mốt. Khi tất cả các giá trị trong mẫu số liệu có tần số xuất hiện bằng nhau thì mẫu số liệu đó không có mốt.
Có thể dùng mốt để đo xu thế trung tâm của mẫu số liệu khi mẫu số liệu có nhiều giá trị trùng nhau.
Ví dụ: Tìm số trung bình, trung vị, mốt và tứ phân vị của mỗi mẫu số liệu sau đây:
a) Giá của một số loại giày (đơn vị nghìn đồng):
350 |
300 |
650 |
300 |
450 |
500 |
300 |
250 |
b) Số kênh được chiếu của một số hãng truyền hình cáp:
36 |
38 |
33 |
34 |
32 |
30 |
34 |
35 |
Hướng dẫn giải
a) Số trung bình là:
Sắp xếp số liệu theo thứ tự không giảm
30 |
32 |
33 |
34 |
34 |
35 |
36 |
38 |
|
|
|
Hai số chính giữa |
|
|
|
Trung vị là
Mốt là 34
Tứ phân vị
b) Số trung bình là:
Sắp xếp số liệu theo thứ tự không giảm
250 |
300 |
300 |
300 |
350 |
450 |
500 |
650 |
|
|
|
Hai số chính giữa |
|
|
|
Trung vị là
Mốt là 300
Tứ phân vị