Nội dung lý thuyết
Khái quát vai trò của máy tính trong Khoa học dữ liệu:
Trong Khoa học dữ liệu, quy trình thường bao gồm: thu thập, xử lí, khám phá tri thức từ dữ liệu, kiểm thử, phân tích, đánh giá, triển khai và báo cáo kết quả.
Máy tính hỗ trợ hiệu quả ở hầu hết các giai đoạn, đặc biệt khi khối lượng dữ liệu lớn.
Vai trò cụ thể của máy tính trong các giai đoạn:
Xử lí và lưu trữ dữ liệu: giúp xử lí khối lượng lớn dữ liệu nhanh chóng, lưu trữ an toàn và dễ truy cập.
Phân tích và khai thác dữ liệu: dùng các công cụ máy tính hiện đại để phát hiện tri thức ẩn, đưa ra các mô hình dự đoán.
Mô phỏng và thực nghiệm: mô phỏng hệ thống tự nhiên phức tạp, hỗ trợ thiết kế và đánh giá giải pháp.
Trực quan hóa dữ liệu: trình bày dữ liệu dễ hiểu, phục vụ ra quyết định.
Hợp tác nghiên cứu: chia sẻ dữ liệu dễ dàng, làm việc nhóm hiệu quả.
Một số công nghệ hỗ trợ tiêu biểu
Siêu máy tính: tốc độ xử lí cực nhanh, phân tích dữ liệu lớn.
Điện toán đám mây: cung cấp tài nguyên tính toán linh hoạt.

Hợp tác và truyền thông: hỗ trợ cộng tác nhóm, chia sẻ dữ liệu trong nghiên cứu.
Bối cảnh ứng dụng:
Ví dụ điển hình: Dự án giải mã bộ gene người (HGP) với dữ liệu cực lớn và độ chính xác cao.

Tính ưu việt của máy tính và thuật toán
Tốc độ và hiệu quả: xử lí nhanh, chính xác dữ liệu di truyền khổng lồ.
Độ chính xác: giảm thiểu sai sót khi phân tích gene.
Xử lí dữ liệu lớn: máy tính giúp thu thập, lưu trữ và truy cập dữ liệu gene hiệu quả.
Tích hợp dữ liệu: kết nối dữ liệu từ nhiều nguồn để phân tích toàn diện.
Giải thích dữ liệu: tìm ra mối liên hệ giữa gene và biểu hiện bệnh lý.
Phân tích thời gian thực: đưa ra quyết định kịp thời trong nghiên cứu.
Lưu trữ hiệu quả: dùng kĩ thuật toán học để nén, lưu trữ và truy xuất nhanh.
Mở rộng quy mô: xử lí được khối lượng lớn dữ liệu như trong HGP.