










🧠 Trong học máy, khả năng khái quát hóa (generalization) là năng lực của mô hình dự đoán chính xác trên dữ liệu chưa từng thấy — không chỉ “học thuộc lòng” dữ liệu huấn luyện mà còn hiểu được quy luật bên trong để áp dụng cho các tình huống mới.
🚀 Vì sao khả năng khái quát hóa quan trọng?
- Nếu mô hình chỉ giỏi trên dữ liệu huấn luyện nhưng “ngơ ngác” trước dữ liệu mới → gọi là overfitting (quá khớp).
- Nếu mô hình quá đơn giản, không học được quy luật → gọi là underfitting (chưa khớp).
- Mục tiêu là đạt được mức khái quát hóa tối ưu: vừa đủ phức tạp để học quy luật, vừa đủ đơn giản để không bị nhiễu.
🧪 Ví dụ
Huấn luyện mô hình nhận diện mèo 🐱:
- Nếu mô hình chỉ nhận ra đúng mèo nhà bạn → overfitting.
- Nếu mô hình nhận ra mọi con mèo từ mèo Anh lông ngắn đến mèo Ai Cập → khái quát hóa tốt!