












Học có giám sát giống như có một “thầy giáo” nghiêm khắc đứng bên cạnh, luôn sửa sai khi bạn làm bài tập. Nhưng khi “thầy” đi vắng (gặp dữ liệu mới), bạn phải tự tin áp dụng những gì đã học!
Học có giám sát (Supervised Learning) là một kiểu học máy (machine learning) mà mô hình được huấn luyện trên một bộ dữ liệu có nhãn (labeled data). Nghĩa là, bạn cho máy một đống ví dụ, mỗi ví dụ đi kèm với câu trả lời đúng (giống như đưa cho học sinh bài tập có đáp án sẵn). Máy sẽ “học” cách tìm ra mối quan hệ giữa dữ liệu đầu vào (input) và đầu ra (output) để sau này dự đoán chính xác khi gặp dữ liệu mới.
Hãy tưởng tượng bạn dạy một chú cún robot nhận diện mèo và chó. Bạn đưa cho nó 1000 bức ảnh: 500 ảnh mèo, 500 ảnh chó, mỗi ảnh đều ghi rõ “mèo” hay “chó”. Chú robot sẽ phân tích đặc điểm (tai nhọn, đuôi dài, mắt tròn, v.v.) để học cách phân biệt. Sau đó, bạn đưa ảnh mới không nhãn, nó sẽ tự đoán: “Hừm, tai nhọn, chắc là mèo!”
Công thức đơn giản: Dữ liệu có nhãn → Học → Dự đoán.
Ví dụ thực tế:
- Dự đoán giá nhà dựa trên diện tích, vị trí (input) và giá thực tế (output).
- Phân loại email là spam hay không spam.
- Nhận diện chữ viết tay từ hình ảnh.