Trong tình huống mở đầu, gọi y1, y2, …, y30 là nhiệt độ cao nhất trong ngày của 30 ngày tháng Sáu năm 2022 (mẫu số liệu gốc).
a) Có thể tính chính xác khoảng tứ phân vị của mẫu số liệu gốc hay không?
b) Tìm tứ phân vị thứ nhất Q1 và tứ phân vị thứ ba Q3 cho mẫu số liệu ghép nhóm.
c) Hãy đưa ra một giá trị xấp xỉ cho khoảng tứ phân vị của mẫu số liệu gốc.
a) Không thể tính chính xác khoảng tứ phân vị của mẫu số liệu gốc.
b) Cỡ mẫu \(n = 30\). Giả sử \({y_1},{y_2},...,{y_{30}}\) là nhiệt độ cao nhất trong ngày của 30 ngày tháng Sáu năm 2022 và giả sử dãy số liệu gốc này đã được sắp xếp theo thứ tự tăng dần.
Vì \(\frac{n}{4} = \frac{{30}}{4} = 7,5\) và \(2 + 3 < 7,5 < 2 + 3 + 4\) nên nhóm chứa tứ phân vị thứ nhất là nhóm \(\left[ {32;34} \right)\) và tứ phân vị thứ nhất là: \({Q_1} = 32 + \frac{{\frac{{30}}{4} - \left( {2 + 3} \right)}}{4}.\left( {34 - 32} \right) = 33,25\)
Vì \(\frac{{3n}}{4} = \frac{{3.30}}{4} = 22,5\) và \(2 + 3 + 4 + 11 < 22,5 < 2 + 3 + 4 + 11 + 8\) nên nhóm chứa tứ phân vị thứ ba là nhóm \(\left[ {36;38} \right)\) và tứ phân vị thứ ba là: \({Q_3} = 36 + \frac{{\frac{{3.30}}{4} - \left( {2 + 3 + 4 + 11} \right)}}{8}.\left( {38 - 36} \right) = 36,625\)
c) Một giá trị xấp xỉ cho khoảng tứ phân vị của mẫu số liệu gốc là: \(36,625 - 33,25 = 3,375\)