Skip to content

I.5-Hồi quy tuyến tính là gì


Hồi quy tuyến tính (Linear Regression) là một phương pháp thống kê và học máy dùng để mô hình hóa mối quan hệ tuyến tính giữa một biến phụ thuộc (Y) và một hoặc nhiều biến độc lập (X). Nó giúp dự đoán giá trị của Y dựa trên X bằng cách tìm “đường thẳng phù hợp nhất” đi qua dữ liệu.

1. Khái niệm cơ bản

Biến phụ thuộc (Y): giá trị cần dự đoán (ví dụ: giá nhà).
Biến độc lập (X): yếu tố ảnh hưởng đến Y (ví dụ: diện tích, số phòng).
Phương trình hồi quy tuyến tính đơn giản:

    \[ Y = \beta_0 + \beta_1 X + \epsilon\]

  • \beta_0: hệ số chặn (intercept).
  • \beta_1: hệ số góc (slope), cho biết mức thay đổi của Y khi X tăng 1 đơn vị.
  • \epsilon: sai số (error term).

2. Các loại hồi quy tuyến tính

Hồi quy tuyến tính đơn (Simple Linear Regression): chỉ có 1 biến độc lập.
Hồi quy tuyến tính đa biến (Multiple Linear Regression): có nhiều biến độc lập (X1, X2, …, Xn).

3. Phương pháp ước lượng

  • Phổ biến nhất là phương pháp bình phương tối thiểu (Ordinary Least Squares – OLS), tìm đường thẳng sao cho tổng bình phương sai số giữa giá trị thực và giá trị dự đoán là nhỏ nhất.

4. Ứng dụng thực tế

Kinh tế: dự đoán doanh thu dựa trên chi phí quảng cáo.
Y tế: phân tích mối quan hệ giữa cân nặng và huyết áp.
Khoa học xã hội: nghiên cứu tác động của trình độ học vấn đến thu nhập.
AI/Machine Learning: là nền móng cho nhiều mô hình phức tạp hơn.

5. Ưu điểm và hạn chế

Ưu điểm: đơn giản, dễ hiểu, dễ triển khai, kết quả dễ diễn giải.
Hạn chế: chỉ phù hợp khi mối quan hệ giữa X và Y gần tuyến tính; dễ bị ảnh hưởng bởi ngoại lệ (outliers).

Tóm lại: Hồi quy tuyến tính là công cụ thống kê cơ bản nhưng cực kỳ quan trọng, giúp mô hình hóa và dự đoán mối quan hệ giữa các biến bằng một phương trình tuyến tính. Nó vừa dễ hiểu vừa có ứng dụng rộng rãi trong kinh doanh, khoa học và trí tuệ nhân tạo.


Discover more from Cùng Học Cùng Mơ

Subscribe to get the latest posts sent to your email.

Leave a Reply

error: Content is protected !!