



Hãy tưởng tượng bạn là một đầu bếp tài ba, đang cố nấu món phở bò ngon nhất nhưng không biết công thức gia truyền. Bạn chỉ có phản hồi từ thực khách: “Mặn quá!”, “Thiếu ngọt!”, “Gần ngon rồi!”. MLE giống như cách bạn đoán tỷ lệ hoàn hảo của muối, thời gian hầm xương, và thịt bò để thực khách hài lòng nhất, dựa trên dữ liệu (phản hồi) có được.
Trong toán học, MLE là phương pháp tìm tham số của một mô hình xác suất sao cho xác suất xảy ra của dữ liệu quan sát
là lớn nhất. Nói đơn giản, ta tìm
để mô hình “giải thích” dữ liệu tốt nhất.
Cách hoạt động của MLE
- Mô hình (công thức phở): Bạn giả định món phở ngon nhất phụ thuộc vào các tham số
(như lượng muối, thời gian hầm). Trong thống kê, đây là một phân phối xác suất (ví dụ: chuẩn, Bernoulli) với hàm mật độ xác suất
.
- Dữ liệu (phản hồi thực khách): Dữ liệu là các quan sát
, ví dụ: điểm đánh giá từ 100 bát phở đã nấu. Giả sử các quan sát độc lập và cùng phân phối (i.i.d.).
- Hàm hợp lý (đo độ ngon): Hàm hợp lý tính xác suất kết hợp của dữ liệu dưới mô hình:
Vì phép nhân nhiều số nhỏ dễ gây khó khăn, ta dùng log-hàm hợp lý: - Tối ưu (tìm công thức ngon nhất): Tìm
để tối đa hóa
hoặc
. Cách làm:
- Lấy đạo hàm:
.
- Giải phương trình để tìm
.
- Kiểm tra cực đại (dùng đạo hàm bậc hai nếu cần).
Tính chất của MLE
Nhất quán: Khi số lượng dữ liệu ,
(tiến gần giá trị thật).
Hiệu quả: MLE thường có phương sai nhỏ trong số các ước lượng không chệch.
Bất biến: Nếu là MLE của
, thì
là MLE của
.
Tóm lại
MLE giống như trò chơi “nóng lạnh” với dữ liệu: bạn điều chỉnh tham số để mô hình “nóng” nhất, tức là phù hợp nhất với dữ liệu.