Skip to content

I.8c Ví dụ về quá khớp, chưa khớp


📊 Ví dụ minh họa

1. Quá khớp (Overfitting)

  • Bài toán: Dự đoán giá nhà dựa trên diện tích.
  • Dữ liệu thực tế: Giá nhà tăng gần tuyến tính theo diện tích.
  • Mô hình: Hồi quy đa thức bậc 10 (rất phức tạp).
  • Kết quả:
    • Mô hình vẽ đường cong uốn lượn, đi qua hầu hết các điểm dữ liệu huấn luyện.
    • Dự đoán trên tập huấn luyện rất chính xác.
    • Nhưng khi gặp dữ liệu mới, mô hình dự đoán sai lệch lớn vì nó đã “học cả nhiễu” trong dữ liệu huấn luyện.

👉 Ví dụ thực tế: Một mô hình phân loại ảnh mèo/chó được huấn luyện quá lâu trên một tập nhỏ. Nó học thuộc chi tiết như màu nền, góc chụp… nên khi gặp ảnh mèo mới với nền khác, nó dự đoán sai.


2. Chưa khớp (Underfitting)

  • Bài toán: Dự đoán giá nhà dựa trên diện tích và số phòng.
  • Dữ liệu thực tế: Giá nhà phụ thuộc cả diện tích và số phòng.
  • Mô hình: Hồi quy tuyến tính đơn giản chỉ dùng diện tích.
  • Kết quả:
    • Mô hình không nắm bắt được ảnh hưởng của số phòng.
    • Sai số cao ngay cả trên tập huấn luyện.
    • Khi áp dụng cho dữ liệu mới, kết quả cũng kém.

👉 Ví dụ thực tế: Dùng một mô hình tuyến tính để dự đoán điểm thi dựa trên số giờ học, trong khi thực tế còn phụ thuộc vào nhiều yếu tố khác (chất lượng giảng dạy, khả năng tự học…). Mô hình quá đơn giản nên không phản ánh đúng.


3. So sánh trực quan

  • Quá khớp: Giống như học sinh học thuộc lòng đáp án của đề cũ → làm bài kiểm tra mới thì sai.
  • Chưa khớp: Giống như học sinh chỉ học sơ qua, không nắm được kiến thức → làm bài nào cũng sai.
  • Vừa khớp (Good fit): Học sinh hiểu bản chất kiến thức → làm tốt cả đề cũ lẫn đề mới.

Tóm lại: Quá khớp xảy ra khi mô hình quá phức tạp, còn chưa khớp xảy ra khi mô hình quá đơn giản. Mục tiêu là tìm sự cân bằng để mô hình vừa đủ phức tạp để học quy luật, nhưng vẫn tổng quát hóa tốt cho dữ liệu mới.


Discover more from Cùng Học Cùng Mơ

Subscribe to get the latest posts sent to your email.

Leave a Reply

error: Content is protected !!