Skip to content

I.8a quá khớp và chưa khớp là gì

Quá khớp (Overfitting) là khi mô hình học máy quá “nhớ” dữ liệu huấn luyện, dẫn đến dự đoán rất chính xác trên tập huấn luyện nhưng kém hiệu quả trên dữ liệu mới. Chưa khớp (Underfitting) là khi mô hình quá đơn giản, không nắm bắt được quy luật của dữ liệu, nên dự đoán sai cả trên tập huấn luyện lẫn dữ liệu mới.


📘 Giải thích chi tiết

1. Quá khớp (Overfitting)

  • Định nghĩa: Mô hình quá phức tạp, học cả nhiễu và chi tiết nhỏ trong dữ liệu huấn luyện.
  • Hậu quả:
    • Hiệu suất cao trên tập huấn luyện.
    • Hiệu suất thấp trên tập kiểm tra hoặc dữ liệu thực tế.
  • Ví dụ: Dùng hồi quy đa thức bậc rất cao để dự đoán xu hướng, mô hình khớp hoàn hảo với dữ liệu huấn luyện nhưng không dự đoán đúng cho dữ liệu mới.
  • Nguyên nhân:
    • Dữ liệu huấn luyện quá ít.
    • Mô hình quá phức tạp (nhiều tham số).
    • Huấn luyện quá lâu.
  • Cách khắc phục:
    • Dùng regularization (L1, L2).
    • Áp dụng cross-validation.
    • Tăng kích thước dữ liệu huấn luyện.
    • Giảm độ phức tạp mô hình.

2. Chưa khớp (Underfitting)

  • Định nghĩa: Mô hình quá đơn giản, không đủ khả năng nắm bắt quy luật dữ liệu.
  • Hậu quả:
    • Hiệu suất thấp trên cả tập huấn luyện và tập kiểm tra.
  • Ví dụ: Dùng hồi quy tuyến tính đơn giản để dự đoán dữ liệu có quan hệ phi tuyến phức tạp.
  • Nguyên nhân:
    • Mô hình quá đơn giản.
    • Huấn luyện chưa đủ lâu.
    • Thiếu đặc trưng (features) quan trọng.
  • Cách khắc phục:
    • Tăng độ phức tạp mô hình (thêm tham số, thêm đặc trưng).
    • Huấn luyện lâu hơn.
    • Chọn thuật toán phù hợp hơn.

3. So sánh nhanh

Đặc điểmQuá khớp (Overfitting)Chưa khớp (Underfitting)
Mức độ phức tạpQuá caoQuá thấp
Hiệu suất trên tập huấn luyệnRất tốtKém
Hiệu suất trên dữ liệu mớiKémKém
Nguyên nhânMô hình quá phức tạp, dữ liệu ítMô hình quá đơn giản, thiếu đặc trưng
Giải phápGiảm độ phức tạp, regularization, thêm dữ liệuTăng độ phức tạp, thêm đặc trưng, huấn luyện lâu hơn

Tóm lại: Quá khớp là mô hình “học vẹt” dữ liệu huấn luyện, còn chưa khớp là mô hình “học hời hợt”. Cả hai đều làm giảm khả năng tổng quát hóa của mô hình, nên mục tiêu là tìm sự cân bằng giữa độ phức tạp và khả năng khái quát.


Discover more from Cùng Học Cùng Mơ

Subscribe to get the latest posts sent to your email.

Leave a Reply

error: Content is protected !!