Skip to content

V.3b hồi quy logistic

Hồi quy logistic có thể được xây dựng dựa trên phân phối Bernoulli vì đầu ra của bài toán phân loại nhị phân chỉ có hai giá trị: y \in \{0,1\}.

🔎 Bước hình thành

  1. Mô hình Bernoulli cho biến nhãn y:
  • Giả sử xác suất để y=1p, thì:

        \[ P(y \mid x) = p^y (1-p)^{1-y}\]

  • Đây chính là phân phối Bernoulli.
  1. Liên hệ xác suất với đặc trưng x:
  • Ta muốn mô hình hóa p như một hàm của x.
  • Dùng hàm logistic (sigmoid):

        \[ p(x) = \sigma(z) = \frac{1}{1+e^{-z}}, \quad z = w^T x + b \]

  • Nhờ sigmoid, giá trị p(x) luôn nằm trong khoảng (0,1).
  1. Hàm likelihood (khả năng xảy ra):
  • Với tập dữ liệu \{(x_i, y_i)\}<em>{i=1}^n:

        \[ L(w) = \prod</em>{i=1}^n p(x_i)^{y_i} \cdot (1-p(x_i))^{1-y_i} \]

  1. Hàm log-likelihood:
  • Để dễ tính toán, lấy log:

        \[ \ell(w) = \sum_{i=1}^n \Big[ y_i \log p(x_i) + (1-y_i)\log(1-p(x_i)) \Big] \]

  1. Ước lượng tham số:
  • Tìm w tối ưu bằng cách tối đa hóa log-likelihood (Maximum Likelihood Estimation – MLE).
  • Thường dùng Gradient Descent hoặc các biến thể để giải.

🌍 Ý nghĩa

  • Hồi quy logistic thực chất là mô hình Bernoulli với xác suất thành công được mô hình hóa bằng hàm sigmoid của đặc trưng đầu vào.
  • Nhờ vậy, nó trở thành công cụ mạnh mẽ cho phân loại nhị phân: spam/không spam, bệnh/không bệnh, thắng/thua,…


Discover more from Cùng Học Cùng Mơ

Subscribe to get the latest posts sent to your email.

Leave a Reply

error: Content is protected !!