Bài 1. Thu thập và phân loại dữ liệu

Nội dung lý thuyết

1. Thu thập dữ liệu

Những thông tin thu thập được như: số, chữ, hình ảnh, ... được gọi là dữ liệu. Dữ liệu dưới dạng số được gọi là số liệu.

Có nhiều cách để thu thập dữ liệu như quan sát, lập phiếu điều tra (phiếu hỏi), ... hoặc thu thập từ những nguồn có sẵn như sách, báo, trang web , ...

Ví dụ 1. Điều tra về các môn thể thao yêu thích của một số bạn lớp 6B, ta được bảng dưới đây: 

Môn thể thaoKiểm đếmSố bạn yêu thích
Bóng đá8
Bóng bàn5
Đá cầu4
Cầu lông10

Trong bảng trên, dữ liệu bao gồm danh sách các môn thể thao: bóng đá, bóng bàn, đá cầu, cầu lông, ...

2. Phân loại dữ liệu

Thông tin rất đa dạng và phong phú. Việc sắp xếp thông tin theo những tiêu chí nhất định được gọi là phân loại dữ liệu.

Ví dụ 2. Xếp loại hạnh kiểm của một số học sinh lớp 6A được cho trong bảng sau:

TênXếp loại
LinhTốt
HoàngTốt
VânTốt
LongKhá
ĐứcKhá
TuấnTốt
MaiKhá
MinhTốt
ThảoTốt
TuệTrung bình
AnTốt
HuyềnTốt
ViệtKhá
PhươngTốt
HuyTrung bình
LanTốt
DungTốt
NhànTốt
DũngTốt
HảiKhá

Phân loại số học sinh đạt hạnh kiểm Tốt, hạnh kiểm Khá, hạnh kiểm Trung bình trong bảng trên.

Giải:

  • Có 13 học sinh đạt hạnh kiểm Tốt.
  • Có 5 học sinh đạt hạnh kiểm Khá.
  • Có 2 học sinh đạt hạnh kiểm Trung bình.

3. Tính hợp lí của dữ liệu

Để đánh giá tính hợp lí của dữ liệu, ta cần đưa ra các tiêu chí đánh giá, chẳng hạn như dữ liệu phải:

  • Đúng định dạng.
  • Nằm trong phạm vi dự kiến.

Ví dụ 1. 

Lớp trưởng lớp 6D thu thập về ngày sinh của một số bạn trong lớp và ghi lại kết quả như sau: