§1. Bảng phân bố tần số và tần suất

Nội dung lý thuyết

I. ÔN TẬP

1. Số liệu thống kê

Khi thực hiện điều tra thống kê (theo mục đích đã định trước), cần xác định tập hợp các đơn vị điều tra, dấu hiệu điều tra và thu thập các số liệu.

Ví dụ 1: Khi điều tra "Năng suất lúa hè thu năm 1998" của 31 tỉnh, người ta thu thập được các số liệu ghi trong bảng 1 sau:

30       30       25      25       35      45       40       40       35       45

25       45       30      30       30      40       30       25       45       45

35       35       30      40       40      40       35       35       35        35     35  

- Tập hợp các đơn vị điều tra là tập hợp 31 tỉnh, mỗi một tỉnh là một đơn vị điều tra.

- Dấu hiệu điều tra là Năng suất lúa hè thu năm 1998 ở mỗi tỉnh.

- Các số liệu trong bảng 1 là các số liệu thống kê, còn gọi là các giá trị của dấu hiệu.

 

@72157@

2. Tần số

Trong \(31\) số liệu thống kê ở trên, ta thấy có 5 giá trị khác nhau là:

   \(x_1=25\) ; \(x_2=30\) ; \(x_3=35\) ; \(x_4=40\) ; \(x_5=45\)

Giá trị \(x_1=25\) xuất hiện \(4\) lần, ta gọi \(n_1=4\) là tần số của giá trị \(x_1\).

Tương tự: \(n_2=7\)\(n_3=9\)\(n_4=6\)\(n_5=5\) lần lượt là tần số của các giá trị \(x_2,x_3,x_4,x_5\).

II. TẦN SUẤT

Trong \(31\) số liệu thống kê ở bảng 1, giá trị \(x_1\) có tần số là \(4\), do đó nó chiếm tỉ lệ là \(\dfrac{4}{31}\approx12,9\%\).

Tỉ số \(\dfrac{4}{31}\) hay \(12,9\%\) được gọi là tần suất của giá trị \(x_1\).

Tương tự: +) Tần suất của giá trị \(x_2\) là \(\dfrac{7}{31}\approx22,6\%\)  ;

                 +) Tần suất của giá trị \(x_3\) là \(\dfrac{9}{31}\approx29,0\%\)  ;

                 +) Tần suất của giá trị \(x_4\) là \(\dfrac{6}{31}\approx19,4\%\)  ;

                 +) Tần suất của giá trị \(x_5\) là \(\dfrac{5}{31}\approx16,1\%\) .

Từ đó ta lập được bảng phân bố tần số và tần suất như sau:

Năng suất lúa

(tạ/ha)

Tần sốTần suất (%)

\(25\)

\(30\)

\(35\)

\(40\)

\(45\)

\(4\)

\(7\)

\(9\)

\(6\)

\(5\)

\(12,9\)

\(22,6\)

\(29,0\)

\(19,4\)

\(16,1\)

Cộng\(31\)\(100\)(%)

Ví dụ: Điều tra về thời gian làm bài tập về nhà môn Toán mỗi buổi tối (tính theo phút) của 20 học sinh ta được bảng số liệu:  

30        45        60        40       30       60       45       40       30        45  

30        60        40        45       45       45       40       30       30        60  

Nhận xét về bảng số liệu trên ta có:

       +) Tập hợp các đơn vị điều tra là tập hợp 20 học sinh ;

       +) Dấu hiệu điều tra là Thời gian làm bài tập về nhà môn Toán mỗi buổi tối (tính theo phút) của mỗi học sinh ;

       +) Các giá trị của dấu hiệu gồm: \(x_1=30\)\(x_2=40\)\(x_3=45\)\(x_4=60\)

       +) Tần số tương ứng của mỗi giá trị là: \(n_1=6\)\(n_2=4\)\(n_3=6\)\(n_4=4\)

       +) Tần suất tương ứng của mỗi giá trị là: \(f_1=\dfrac{6}{20}=30\%\) ; \(f_2=\dfrac{4}{20}=20\%\) ;

\(f_3=\dfrac{6}{20}=30\%\)  ; \(f_4=\dfrac{4}{20}=20\%\).

Từ đó ta lập được bảng phân bố tần số và tần suất như sau:

Thời gian làm bài tập 

(phút)

Tần số

Tần suất

(%)

30

40

45

60

6

4

6

4

30

20

30

20

Cộng20100(%)

 

@1900308@

III. BẢNG PHÂN BỐ TẦN SỐ VÀ TẦN SUẤT GHÉP LỚP

Ví dụ 2: Để chuẩn bị may đồng phục cho học sinh, người ta đo chiều cao của \(36\) học sinh trong một lớp học và thu được các số liệu thống kê như sau:

Chiều cao của \(36\) học sinh (đơn vị: cm)

158    152    156    158    168    160    170    166    161    160    172    173

150    167    165    163    158    162    169    159    163    164    161    160

164    159    163    155    163    165    154    161    164    151    164    152

Để xác định hợp lí số lượng quần áo, cần may cho mỗi "kích cỡ" ta phân lớp các số liệu như sau:

     Lớp 1 gồm những số đo chiều cao từ \(150cm\) đến dưới \(156cm\), kí hiệu là \([150;156)\) ;

     Lớp 2 gồm những số đo chiều cao từ \(156cm\) đến dưới \(162cm\), kí hiệu là \([156;162)\) ;

     Lớp 3 gồm những số đo chiều cao từ \(162cm\) đến dưới \(168cm\), kí hiệu là \([162;168)\) ;

     Lớp 4 gồm những số đo chiều cao từ \(168cm\) đến \(174cm\), kí hiệu là \([168;174]\).

Ta thấy có \(6\) số liệu thuộc vào lớp 1, ta nói \(n_1=6\) là tần số của lớp 1.

Tương tự: \(n_2=12\) là tần số của lớp 2 ; \(n_3=13\) là tần số của lớp 3 ; \(n_4=5\) là tần số của lớp 4.

Ta cũng có thể tính được tần suất của các lớp:

          Tần suất của lớp 1 là \(f_1=\dfrac{6}{36}\approx16,7\%\) ;

          Tần suất của lớp 2 là \(f_2=\dfrac{12}{36}\approx33,3\%\) ;

          Tần suất của lớp 3 là \(f_3=\dfrac{13}{36}\approx36,1\%\) ;

          Tần suất của lớp 4 là \(f_4=\dfrac{5}{36}\approx13,9\%\).

Các kết quả trên được thu gọn trong bảng sau:

Chiều cao của 36 học sinh (đơn vị: cm)

Lớp số đo chiều cao 

(cm)

Tần sốTần suất (%)

\([150;156)\)

\([156;162)\)

\([162;168)\)

\([168;174)\)

6

12

13

5

16,7

33,3

36,1

13,9

Cộng36100(%)

Bảng trên được gọi là bảng tần số và tần suất ghép lớp. Nếu trong bảng đó bỏ đi cột tần số thì sẽ được bảng phân bố tần suất ghép lớp, nếu bỏ đi cột tần suất thì sẽ được bảng phân bố tần số ghép lớp.

 

@1900399@