Skip to content

I.4 Tham số và hàm mất mát là gì

Trong thống kê, tham số là một đặc trưng số của tổng thể (population), dùng để mô tả hoặc khái quát toàn bộ tổng thể. Ví dụ: trung bình chiều cao của tất cả thanh niên Việt Nam, tỷ lệ người ủng hộ một chính sách trong toàn dân số, hay phương sai của thu nhập trong một quốc gia.

1. Khái niệm tham số

  • Tham số (parameter) là một giá trị cố định nhưng thường không biết chính xác, vì ta không thể khảo sát toàn bộ tổng thể.
  • Nó mô tả đặc điểm của tổng thể, chẳng hạn:
    • Kỳ vọng (μ): trung bình của tổng thể.
    • Phương sai (σ²): mức độ phân tán của dữ liệu trong tổng thể.
    • Tỷ lệ (p): phần trăm các phần tử có đặc điểm nào đó.

2. Phân biệt tham số và thống kê

Đặc điểmTham số (Parameter)Thống kê (Statistic)
Nguồn gốcTính từ toàn bộ tổng thểTính từ mẫu (sample)
Tính chấtThường là giá trị cố định, nhưng không biết chính xácGiá trị thay đổi tùy mẫu
Ví dụTrung bình chiều cao của toàn bộ dân số VNTrung bình chiều cao của 1.000 người được chọn ngẫu nhiên

👉 Như vậy, thống kê được dùng để ước lượng tham số. Ví dụ, ta lấy mẫu 1.000 người để tính trung bình chiều cao, rồi dùng kết quả đó để ước lượng trung bình của toàn bộ dân số.

3. Phương pháp ước lượng tham số

  • Ước lượng điểm: đưa ra một giá trị duy nhất (ví dụ: trung bình mẫu = 165 cm).
  • Ước lượng khoảng (khoảng tin cậy): đưa ra một khoảng giá trị có xác suất cao chứa tham số thật (ví dụ: trung bình dân số nằm trong khoảng 164–166 cm với độ tin cậy 95%).

4. Vai trò của tham số trong thống kê

  • Giúp mô tả đặc điểm tổng thể mà ta quan tâm.
  • Là cơ sở cho các phân tích suy luận thống kê (ví dụ: kiểm định giả thuyết, xây dựng mô hình).
  • Ứng dụng trong nhiều lĩnh vực: kinh tế (ước lượng GDP bình quân đầu người), y học (tỷ lệ mắc bệnh), xã hội học (tỷ lệ thất nghiệp)….

Tóm lại: Tham số trong thống kê là giá trị đặc trưng của tổng thể (như trung bình, phương sai, tỷ lệ), thường không thể biết chính xác mà phải ước lượng thông qua dữ liệu mẫu.


Hàm mất mát (Loss Function) là một hàm toán học dùng để đo lường sự khác biệt giữa kết quả dự đoán của mô hình học máy và giá trị thực tế. Nó cho biết mô hình dự đoán “sai” bao nhiêu, từ đó hướng dẫn quá trình huấn luyện để cải thiện độ chính xác.

1. Khái niệm

  • Hàm mất mát còn gọi là hàm chi phí (Cost Function) hoặc hàm mục tiêu (Objective Function).
  • Nó trả về một giá trị số duy nhất biểu thị mức độ lỗi:
    • Giá trị cao → mô hình dự đoán kém chính xác.
    • Giá trị thấp → mô hình dự đoán gần với dữ liệu thực tế.

2. Vai trò trong học máy

  • Đánh giá hiệu suất: cung cấp thước đo khách quan về chất lượng dự đoán.
  • Hướng dẫn tối ưu hóa: thuật toán học sẽ điều chỉnh tham số (weights) để giảm giá trị hàm mất mát.
  • So sánh mô hình: mô hình nào có hàm mất mát thấp hơn thường được coi là tốt hơn.

3. Các loại hàm mất mát phổ biến

  • Mean Squared Error (MSE): thường dùng trong hồi quy, đo lường bình phương sai số trung bình.
  • Cross-Entropy Loss: dùng trong phân loại, đo sự khác biệt giữa phân phối dự đoán và phân phối thực tế.
  • Hinge Loss: thường dùng cho SVM, tập trung vào biên phân loại.
  • Huber Loss: kết hợp ưu điểm của MSE và MAE, ít nhạy cảm với ngoại lệ.

4. Ví dụ minh họa

Giả sử ta dự đoán giá nhà:

  • Giá thực tế: 1 tỷ VNĐ
  • Giá dự đoán: 900 triệu VNĐ
  • Sai số: 100 triệu VNĐ
    → Hàm mất mát sẽ tính toán dựa trên sai số này để phản ánh mức độ “tệ” của dự đoán.

Tóm lại: Hàm mất mát là thước đo sai số giữa dự đoán và thực tế, đóng vai trò cốt lõi trong việc huấn luyện và tối ưu hóa mô hình học máy.


Discover more from Cùng Học Cùng Mơ

Subscribe to get the latest posts sent to your email.

Leave a Reply

error: Content is protected !!