- Học bán giám sát (Supervised Learning):
+ Trong học bán giám sát, mô hình được đào tạo trên dữ liệu có nhãn (gần nhãn) và không có nhãn (không gắn nhãn).
+ Dữ liệu gần nhân là những ví dụ mà chúng ta biết kết quả mong muốn (ví dụ: hình ảnh của mèo hoặc chó đã được gắn nhãn là “mèo" hoặc "chó").
+ Mục tiêu là học cách dự đoán đúng kết quả cho các ví dụ mới chưa gặp trước đó.
+ Học bán giám sát thường được sử dụng trong xử lý ngôn ngữ tự nhiên, phân loại hình ảnh, và nhiều ứng dụng khác.
- Học tăng cường (Reinforcement Learning):
+ Trong học tăng cường, tác nhân (agent) tương tác với môi trường và nhận phần thưởng (hoặc hình phạt) dựa trên hành động của nó.
+ Mục tiêu là học cách thực hiện các hành động để tối đa hóa phần thưởng trong môi trường.
+ Học tăng cường thường được sử dụng trong chế tạo robot, chơi trò chơi, và các tác vụ tối ưu hóa.