Ôn tập chương V

Nội dung lý thuyết

Các phiên bản khác

1. Bảng phân bố tần số và tần suất

Ví dụ: Khi điều tra "Năng suất lúa hè thu năm 1998" của 31 tỉnh người ta thu thập được bảng số liệu:

Năng suất lúa hè thu (tạ/ha) năm 1998 của 31 tỉnh

30      30      25      25      35      45      40      40      35      45

25      45      30      30      30      40      25      45      30      45

35      35      30      40      40      40      35      35      35      35      35

Tập hợp các đơn vị điều tra là tập hợp 31 tỉnh, mỗi một tỉnh là một đơn vị điều tra.

Dấu hiệu điều tra là năng suất lúa hè thu năm 1998 ở mỗi tỉnh ;

Các số liệu trong bảng trên là các số liệu thống kê, còn gọi là các giá trị của dấu hiệu.

- Số lần xuất hiện của mỗi số liệu thống kê gọi là tần số của nó.

Ví dụ: Giá trị \(x_1=25\) xuất hiện 4 lần, ta gọi \(n_1=4\) là tần số của giá trị \(x_1=25\)

Tương tự như vậy tần số của các giá trị \(x_1=30,x_2=35,x_3=40,x_4=45\) lần lượt là \(n_2=7\)\(n_3=9,n_4=6,n_5=5\).

- Tần suất của một số liệu thống kê (hay một giá trị của dấu hiệu) là tỉ số phần trăm tần số của nó so với kích thước mẫu.

Ví dụ: Tần suất của giá trị \(x_1=25\) là \(f_1=\dfrac{4}{31}\approx12,9\%\) ;

          Tần suất của các giá trị \(x_1=30,x_2=35,x_3=40,x_4=45\) lần lượt là \(f_2=\dfrac{7}{31}\approx22,6\%\)\(f_3=\dfrac{9}{31}\approx29,0\%\)\(f_4=\dfrac{6}{31}\approx19,4\%\)\(f_5=\dfrac{5}{31}\approx16,1\%\).

Từ đó ta có bảng phân bố tần số và tần suất sau:

Năng suất lúa hè thu (tạ/ha) năm 1998 của 31 tỉnh

Năng suất lúa

(tạ/ha)

Tần sốTần suất (%)

25

30

35

40

45

4

7

9

6

5

12,9%

22,6%

29,0%

19,4%

16,1%

Cộng31100%

Nếu bỏ cột tần số ta được bảng phân bố tần suất, bỏ cột tần suất ta được bảng phân bố tần số.

- Ngoài ra ta còn có thể phân các số liệu thống kê thành các lớp và xét tần số, tần suất, lập bảng phân bố và tần suất ghép lớp.

Ví dụ: Bảng phân bố tần số và tần suất ghép lớp:

Chiều cao của 36 học sinh

Lớp số đo chiều cao

(cm)

Tần sốTần suất (%)

\([150;156)\)

\([156;162)\)

\([162;168)\)

\(\left[168;174\right]\)

6

12

13

5

16,7

33,3

36,1

13,9

Cộng36100(%)

Nếu bảng phân bố tần số và tần suất ghép lớp trên bỏ đi cột tần số thì được bảng phân bố tần suất ghép lớp, bỏ đi cột tần suất thì được bảng phân bố tần số ghép lớp.

 

@1909206@

2. Biểu đồ

Ta có thể mô tả một cách trực quan các bảng phân bố tần suất (hoặc tần số), bảng phân bố tần suất (hoặc tần số) ghép lớp bằng biểu đồ hình cột hoặc đường gập khúc.

Người ta còn dùng biểu đồ hình quạt để mô tả bảng cơ cấu.

3. Số trung bình cộng. Trung vị. Mốt

- Ta có thể tính số trung bình cộng của các số liệu thống kê theo các công thức:

Trường hợp bảng phân bố tần số, tần suất

         \(\overline{x}=\dfrac{1}{n}\left(n_1x_1+n_2x_2+...+n_kx_k\right)=f_1x_1+f_2x_2+...+f_kx_k\)

      Trong đó \(n_i,f_i\) lần lượt là tần số, tần suất của giá trị \(x_i\)\(n\) là số các số liệu thống kê (\(n_1+n_2+...+n_k=n\)).

Trường hợp bảng phân bố tần số, tần suất ghép lớp

          \(\overline{x}=\dfrac{1}{n}\left(n_1c_1+n_2c_2+...+n_kc_k\right)=f_1c_1+f_2c_2+...+f_kc_k\)

       Trong đó \(c_i,n_i,f_i\) lần lượt là giá trị đại diện, tần số, tần suất của lớp giá trị thứ \(i\)\(n\) là số các số liệu thống kê (\(n_1+n_2+...+n_k=n\)).

Ví dụ: Khi xét bảng phân bố tần số và tần suất ghép lớp "Chiều cao của 36 học sinh" trên, ta tính được số trung bình là:

          \(\overline{x}\approx\dfrac{16,7}{100}.153+\dfrac{33,3}{100}.159+\dfrac{36,1}{100}.165+\dfrac{13,9}{100}.171\approx162\left(cm\right)\)

hoặc  \(\overline{x}=\dfrac{1}{36}\left(6.153+12.159+13.165+5.171\right)\approx162\left(cm\right)\)

- Sắp thứ tự các số liệu thống kê thành dãy không giảm (hoặc không tăng). Số trung vị (của các số liệu thống kê đã cho) kí hiệu \(M_e\) là số đứng giữa dãy nếu số phần tử là lẻ và là trung bình cộng của hai số đứng giữa dãy nếu số phần tử là chẵn.

Ví dụ: Khi xét dãy số liệu (1; 1; 3; 6; 7; 8; 8; 9; 10), ta thấy số trung vị là \(M_e=7\)

- Mốt của một bảng phân bố tần số là giá trị có tần số lớn nhất và được kí hiệu là \(M_O\).

 

@1906981@

4. Phương sai và độ lệch chuẩn

- Khi hai dãy số liệu thống kê có cùng đơn vị đo và có số trung bình cộng bằng nhau hoặc xấp xỉ nhau, nếu phương sai càng nhỏ thì mức độ phân tán (so với số trung bình cộng) của các số liệu thống kê càng bé.

- Có thể tính phương sai theo các công thức:

Trường hợp bảng phân bố tần số, tần suất

     \(s^2=\dfrac{1}{n}\left[n_1\left(x_1-\overline{x}\right)^2+n_2\left(x_2-\overline{x}\right)^2+...+n_k\left(x_k-\overline{x}\right)^2\right]\)

         \(=f_1\left(x_1-\overline{x}\right)^2+f_2\left(x_2-\overline{x}\right)^2+...+f_k\left(x_k-\overline{x}\right)^2\)

      Trong đó \(n_i,f_i\) lần lượt là tần số, tần suất của giá trị \(x_i\)\(n\) là số các số liệu thống kê (\(n_1+n_2+...+n_k=n\)), \(\overline{x}\) là số trung bình cộng của các số liệu đã cho.

Trường hợp bảng phân bố tần số, tần suất ghép lớp

      \(s^2=\dfrac{1}{n}\left[n_1\left(c_1-\overline{x}\right)^2+n_2\left(c_2-\overline{x}\right)^2+...+n_k\left(c_k-\overline{x}\right)^2\right]\)

          \(=f_1\left(c_1-\overline{x}\right)^2+f_2\left(c_2-\overline{x}\right)^2+...+f_k\left(c_k-\overline{x}\right)^2\)

       Trong đó \(c_i,n_i,f_i\) lần lượt là giá trị đại diện, tần số, tần suất của lớp giá trị thứ \(i\)\(n\) là số các số liệu thống kê (\(n_1+n_2+...+n_k=n\)), \(\overline{x}\) là số trung bình cộng của các số liệu đã cho.

Ngoài ra người ta cũng chứng minh được công thức: \(s^2=\overline{x^2}-\left(\overline{x}\right)^2\)

  Trong đó \(\overline{x^2}\) là trung bình cộng của các bình phương số liệu thống kê, tức là   

             \(\overline{x^2}=\dfrac{1}{n}\left(n_1x_1^2+n_2x_x^2+...+n_kx_k^2\right)=f_1x_1^2+f_2x_2^2+...+f_kx_k^2\) 

 (đối với bảng phân số tần số và tần suất)

  hoặc   \(\overline{x^2}=\dfrac{1}{n}\left(n_1c_1^2+n_2c_x^2+...+n_kc_k^2\right)=f_1c_1^2+f_2c_2^2+...+f_kc_k^2\)

 (đối với bảng phân số tần số và tần suất ghép lớp)

- Độ lệch chuẩn là căn bậc hai của phương sai, kí hiệu là \(s\).

- Phương sai \(s^2\) và độ lệch chuẩn \(s\) đều được dùng để đánh giá mức độ phân tán của các số liệu thống kê (so với số trung bình cộng). Nhưng khi cần chú ý đến đơn vị đo thì ta dùng \(s\), vì \(s\) có cùng đơn vị đo với dấu hiệu được nghiên cứu.

 

@1907198@