Nội dung lý thuyết
Khi thực hiện điều tra thống kê (theo mục đích đã định trước), cần xác định tập hợp các đơn vị điều tra, dấu hiệu điều tra và thu thập các số liệu.
Ví dụ 1: Khi điều tra "Năng suất lúa hè thu năm 1998" của 31 tỉnh, người ta thu thập được các số liệu ghi trong bảng 1 sau:
30 30 25 25 35 45 40 40 35 45 25 45 30 30 30 40 30 25 45 45 35 35 30 40 40 40 35 35 35 35 35 |
- Tập hợp các đơn vị điều tra là tập hợp 31 tỉnh, mỗi một tỉnh là một đơn vị điều tra.
- Dấu hiệu điều tra là Năng suất lúa hè thu năm 1998 ở mỗi tỉnh.
- Các số liệu trong bảng 1 là các số liệu thống kê, còn gọi là các giá trị của dấu hiệu.
Trong \(31\) số liệu thống kê ở trên, ta thấy có 5 giá trị khác nhau là:
\(x_1=25\) ; \(x_2=30\) ; \(x_3=35\) ; \(x_4=40\) ; \(x_5=45\)
Giá trị \(x_1=25\) xuất hiện \(4\) lần, ta gọi \(n_1=4\) là tần số của giá trị \(x_1\).
Tương tự: \(n_2=7\), \(n_3=9\), \(n_4=6\), \(n_5=5\) lần lượt là tần số của các giá trị \(x_2,x_3,x_4,x_5\).
Trong \(31\) số liệu thống kê ở bảng 1, giá trị \(x_1\) có tần số là \(4\), do đó nó chiếm tỉ lệ là \(\dfrac{4}{31}\approx12,9\%\).
Tỉ số \(\dfrac{4}{31}\) hay \(12,9\%\) được gọi là tần suất của giá trị \(x_1\).
Tương tự: +) Tần suất của giá trị \(x_2\) là \(\dfrac{7}{31}\approx22,6\%\) ;
+) Tần suất của giá trị \(x_3\) là \(\dfrac{9}{31}\approx29,0\%\) ;
+) Tần suất của giá trị \(x_4\) là \(\dfrac{6}{31}\approx19,4\%\) ;
+) Tần suất của giá trị \(x_5\) là \(\dfrac{5}{31}\approx16,1\%\) .
Từ đó ta lập được bảng phân bố tần số và tần suất như sau:
Năng suất lúa (tạ/ha) | Tần số | Tần suất (%) |
\(25\) \(30\) \(35\) \(40\) \(45\) | \(4\) \(7\) \(9\) \(6\) \(5\) | \(12,9\) \(22,6\) \(29,0\) \(19,4\) \(16,1\) |
Cộng | \(31\) | \(100\)(%) |
Ví dụ: Điều tra về thời gian làm bài tập về nhà môn Toán mỗi buổi tối (tính theo phút) của 20 học sinh ta được bảng số liệu:
30 45 60 40 30 60 45 40 30 45 30 60 40 45 45 45 40 30 30 60 |
Nhận xét về bảng số liệu trên ta có:
+) Tập hợp các đơn vị điều tra là tập hợp 20 học sinh ;
+) Dấu hiệu điều tra là Thời gian làm bài tập về nhà môn Toán mỗi buổi tối (tính theo phút) của mỗi học sinh ;
+) Các giá trị của dấu hiệu gồm: \(x_1=30\), \(x_2=40\), \(x_3=45\), \(x_4=60\)
+) Tần số tương ứng của mỗi giá trị là: \(n_1=6\), \(n_2=4\), \(n_3=6\), \(n_4=4\)
+) Tần suất tương ứng của mỗi giá trị là: \(f_1=\dfrac{6}{20}=30\%\) ; \(f_2=\dfrac{4}{20}=20\%\) ;
\(f_3=\dfrac{6}{20}=30\%\) ; \(f_4=\dfrac{4}{20}=20\%\).
Từ đó ta lập được bảng phân bố tần số và tần suất như sau:
Thời gian làm bài tập (phút) | Tần số | Tần suất (%) |
30 40 45 60 | 6 4 6 4 | 30 20 30 20 |
Cộng | 20 | 100(%) |
Ví dụ 2: Để chuẩn bị may đồng phục cho học sinh, người ta đo chiều cao của \(36\) học sinh trong một lớp học và thu được các số liệu thống kê như sau:
Chiều cao của \(36\) học sinh (đơn vị: cm)
158 152 156 158 168 160 170 166 161 160 172 173 150 167 165 163 158 162 169 159 163 164 161 160 164 159 163 155 163 165 154 161 164 151 164 152 |
Để xác định hợp lí số lượng quần áo, cần may cho mỗi "kích cỡ" ta phân lớp các số liệu như sau:
Lớp 1 gồm những số đo chiều cao từ \(150cm\) đến dưới \(156cm\), kí hiệu là \([150;156)\) ;
Lớp 2 gồm những số đo chiều cao từ \(156cm\) đến dưới \(162cm\), kí hiệu là \([156;162)\) ;
Lớp 3 gồm những số đo chiều cao từ \(162cm\) đến dưới \(168cm\), kí hiệu là \([162;168)\) ;
Lớp 4 gồm những số đo chiều cao từ \(168cm\) đến \(174cm\), kí hiệu là \([168;174]\).
Ta thấy có \(6\) số liệu thuộc vào lớp 1, ta nói \(n_1=6\) là tần số của lớp 1.
Tương tự: \(n_2=12\) là tần số của lớp 2 ; \(n_3=13\) là tần số của lớp 3 ; \(n_4=5\) là tần số của lớp 4.
Ta cũng có thể tính được tần suất của các lớp:
Tần suất của lớp 1 là \(f_1=\dfrac{6}{36}\approx16,7\%\) ;
Tần suất của lớp 2 là \(f_2=\dfrac{12}{36}\approx33,3\%\) ;
Tần suất của lớp 3 là \(f_3=\dfrac{13}{36}\approx36,1\%\) ;
Tần suất của lớp 4 là \(f_4=\dfrac{5}{36}\approx13,9\%\).
Các kết quả trên được thu gọn trong bảng sau:
Chiều cao của 36 học sinh (đơn vị: cm)
Lớp số đo chiều cao (cm) | Tần số | Tần suất (%) |
\([150;156)\) \([156;162)\) \([162;168)\) \([168;174)\) | 6 12 13 5 | 16,7 33,3 36,1 13,9 |
Cộng | 36 | 100(%) |
Bảng trên được gọi là bảng tần số và tần suất ghép lớp. Nếu trong bảng đó bỏ đi cột tần số thì sẽ được bảng phân bố tần suất ghép lớp, nếu bỏ đi cột tần suất thì sẽ được bảng phân bố tần số ghép lớp.