Bài 28. Thực hành trải nghiệm trích rút thông tin và tri thức

datcoder

Có thể hiểu phân tích dữ liệu là việc trích rút thông tin hữu ích giúp tạo ra tri thức mới từ dữ liệu đã thu thập được. Trong thực tế, công việc này thường gắn với việc xử lí để biến đổi dữ liệu về dạng thuận tiện, phù hợp với yêu cầu phân tích. Hãy trao đổi và cho biết, nếu dữ liệu dạng file Excel có 2 cột: Số tuổi và Thu nhập, trong trường hợp muốn tổng hợp kết quả thu nhập theo độ tuổi thì cần bổ sung thêm cột dữ liệu nào? Dữ liệu cột đó có thể lấy từ đâu và bằng cách nào?

Người Già
10 tháng 5 lúc 21:44

Để tổng hợp kết quả thu nhập theo độ tuổi từ dữ liệu dạng file Excel có 2 cột: Số tuổi và Thu nhập, bạn cần bổ sung thêm một cột dữ liệu mới là Nhóm độ tuổi. Cách tạo cột này như sau:

- Thêm cột Nhóm độ tuổi:

+ Tạo một cột mới trong bảng tính và đặt tên là "Nhóm độ tuổi".

+ Sử dụng công thức để phân loại tuổi vào các nhóm (ví dụ: 18-24, 25-34, 35-44, v.v.). Một ví dụ công thức có thể là:

=INT((B2-1)/5)*5+1&"-"&(INT((B2-1)/5)+1)*5

Trong đó, B2 là ô chứa số tuổi của mỗi người. Công thức này sẽ tạo ra các nhóm tuổi như "18-24", "25-34",…

- Lấy dữ liệu từ nguồn khác:

+ Nếu em không có dữ liệu về nhóm độ tuổi, bạn có thể tìm kiếm dữ liệu thống kê về thu nhập theo độ tuổi từ các nguồn đáng tin cậy như cơ quan thống kê, báo cáo nghiên cứu, hoặc dữ liệu từ tổ chức chính phủ.

+ Sau khi có dữ liệu, em có thể nhập vào cột "Nhóm độ tuổi" tương ứng với từng số tuổi.

- Tính tổng hợp thu nhập:

+ Sử dụng Pivot Table để tổng hợp thu nhập theo nhóm độ tuổi. Nhóm thu nhập nào có tỉ lệ phần trăm khách hàng có khả năng tín dụng mức Tốt cao nhất?