Tính chất của hệ số xác định

Ưu điểm: R^2 dễ hiểu, cung cấp cái nhìn nhanh về độ phù hợp của mô hình.
Hạn chế:

  • R^2 cao không đảm bảo mô hình tốt (có thể do quá khớp – overfitting).
  • Trong hồi quy bội, R^2 luôn tăng khi thêm biến, dù biến đó không có ý nghĩa. Nên dùng Adjusted R^2 để khắc phục.
  • Không phù hợp để so sánh giữa các mô hình khác nhau (như tuyến tính vs phi tuyến).

Ví dụ

Đánh giá mô hình: R^2 cao (SSR lớn, SSE nhỏ) cho thấy mô hình tốt. Trong ví dụ quảng cáo và doanh thu, R^2 = 0.99 cho thấy chi phí quảng cáo giải thích gần như toàn bộ biến thiên của doanh thu.
So sánh mô hình: Nếu thêm biến độc lập (ví dụ: kênh quảng cáo), SSR có thể tăng, nhưng cần kiểm tra xem SSE giảm đáng kể không.
Chẩn đoán: Nếu SSE lớn, cần kiểm tra lại giả định của hồi quy (tuyến tính, phân phối sai số, ngoại lai).

Liên hệ với các tổng bình phương:
R^2 = \frac{SSR}{SST} = 1 - \frac{SSE}{SST}

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

error: Content is protected !!