Bài 1. Giới thiệu về học máy

Khởi động (SGK Cánh Diều - Trang 126)

Hướng dẫn giải

1) Đối với con người:

- Dễ dàng:
+ Hình ảnh có độ phân giải cao, các đối tượng được phân biệt rõ ràng.
+ Các hình dạng cơ bản (vuông, tròn, tam giác) dễ nhận biết.
+ Nhiệm vụ chỉ yêu cầu gán nhãn đúng cho từng đối tượng.
2) Đối với máy tính:

- Có thể:

+ Sử dụng các thuật toán học máy, cụ thể là phân loại hình ảnh, để tự động gán nhãn cho các đối tượng.
+ Các mô hình học máy đã được huấn luyện trên tập dữ liệu ảnh lớn có thể nhận diện các hình dạng cơ bản với độ chính xác cao.
Lập trình:

- Khó:
+ Yêu cầu kiến thức chuyên môn về học máy, xử lý ảnh và lập trình.
+ Cần thu thập và chuẩn bị tập dữ liệu huấn luyện phù hợp.
+ Lựa chọn và điều chỉnh mô hình học máy phù hợp với nhiệm vụ.
- Tuy nhiên:

+ Việc lập trình sẽ dễ dàng hơn nếu sử dụng các thư viện và công cụ học máy có sẵn.
+ Có nhiều mô hình học máy được phát triển sẵn có thể áp dụng cho bài toán phân loại hình ảnh

(Trả lời bởi Người Già)
Thảo luận (1)

Hoạt động 1 (SGK Cánh Diều - Trang 128)

Hướng dẫn giải

- Cả ba bài toán đều là bài toán phân loại:

+ Phân loại email thành "Spam" và "no spam".
+ Phân loại khách hàng thành "tốt", "bình thường" và "xấu".
+ Phân loại hình ảnh thành "vuông", "tròn" và "tam giác".
- Cả ba bài toán đều sử dụng thuật toán học máy để phân loại dữ liệu.

- Cả ba bài toán đều cần thu thập và chuẩn bị tập dữ liệu huấn luyện phù hợp.

(Trả lời bởi Người Già)
Thảo luận (1)

Hoạt động 2 (SGK Cánh Diều - Trang 129)

Hướng dẫn giải

Hiện nay, với sự phát triển của công nghệ học máy, đặc biệt là mạng nơ-ron nhân tạo, máy tính có thể đạt được độ chính xác cao trong việc phân loại quả.

(Trả lời bởi Người Già)
Thảo luận (1)

Luyện tập (SGK Cánh Diều - Trang 132)

Hướng dẫn giải

a) Học không giám sát sử dụng dữ liệu huấn luyện không có nhãn.

Đúng. Học không giám sát sử dụng dữ liệu huấn luyện không có nhãn, nghĩa là không có thông tin về kết quả mong muốn cho mỗi ví dụ. Mô hình học máy sẽ tự tìm ra các cấu trúc và mối tương quan trong dữ liệu.

b) Học có giám sát sử dụng dữ liệu kiểm tra để đánh giá kết quả huấn luyện.

Đúng. Học có giám sát sử dụng dữ liệu kiểm tra để đánh giá kết quả huấn luyện. Dữ liệu kiểm tra không được sử dụng trong quá trình huấn luyện để đảm bảo tính khách quan khi đánh giá hiệu suất của mô hình.
c) Học có giám sát dành cho huấn luyện máy tính phân cụm.

Sai. Học có giám sát không dành cho huấn luyện máy tính phân cụm. Máy tính phân cụm là một kỹ thuật học không giám sát được sử dụng để nhóm các dữ liệu tương tự nhau lại với nhau.

d) Học có giám sát và không giám sát đều giúp máy tính giải quyết cùng một bài toán như nhau.

Sai. Học có giám sát và không giám sát giúp máy tính giải quyết các bài toán khác nhau. Học có giám sát được sử dụng cho các bài toán phân loại, dự đoán, trong khi học không giám sát được sử dụng cho các bài toán phân cụm, giảm chiều, phát hiện điểm bất thường.

(Trả lời bởi Người Già)
Thảo luận (1)

Vận dụng (SGK Cánh Diều - Trang 132)

Hướng dẫn giải

Học máy đóng góp to lớn vào sự phát triển của ChatGPT bằng cách:

- Huấn luyện ChatGPT trên một lượng lớn dữ liệu.
- Giúp ChatGPT học cách nhận biết các mẫu trong dữ liệu và sử dụng các mẫu đó để thực hiện các nhiệm vụ khác nhau.
- Cải thiện hiệu suất của ChatGPT theo thời gian.

(Trả lời bởi Người Già)
Thảo luận (1)

Câu hỏi tự kiểm tra 1 (SGK Cánh Diều - Trang 132)

Hướng dẫn giải

- Học máy là một nhánh của trí tuệ nhân tạo (AI) cho phép máy tính học hỏi từ dữ liệu và tự cải thiện hiệu suất theo thời gian mà không cần được lập trình rõ ràng.

- Phân biệt học có giám sát và học không giám sát

+ Học có giám sát:

Sử dụng dữ liệu có nhãn, nghĩa là mỗi ví dụ dữ liệu được gắn với kết quả mong muốn.
Ví dụ: Dữ liệu huấn luyện cho hệ thống phân loại ảnh mèo và chó có thể bao gồm hình ảnh của mèo và chó được gắn nhãn "mèo" hoặc "chó".
Mục tiêu: Học cách dự đoán chính xác kết quả cho dữ liệu mới.
+ Học không giám sát:
Sử dụng dữ liệu không có nhãn.
Ví dụ: Dữ liệu huấn luyện cho hệ thống phân cụm khách hàng có thể bao gồm thông tin về hành vi mua hàng của khách hàng.
Mục tiêu: Tìm ra các cấu trúc và mối tương quan ẩn trong dữ liệu.

(Trả lời bởi Người Già)
Thảo luận (1)

Câu hỏi tự kiểm tra 2 (SGK Cánh Diều - Trang 132)

Hướng dẫn giải

Ví dụ cụ thể:

- Google Photos: Google Photos sử dụng học máy để phân loại ảnh theo khuôn mặt, địa điểm và các đối tượng trong ảnh.
- Netflix: Netflix sử dụng học máy để đề xuất phim và chương trình truyền hình cho người dùng dựa trên lịch sử xem phim của họ.
- Amazon: Amazon sử dụng học máy để đề xuất sản phẩm cho khách hàng dựa trên lịch sử mua hàng của họ.

(Trả lời bởi Người Già)
Thảo luận (1)