Chuyển tới nội dung

V.1 phân loại là gì

  • bởi

Phân loại trong học máy là quá trình dùng dữ liệu để huấn luyện mô hình nhằm gán nhãn cho đối tượng mới, và nó có rất nhiều ứng dụng thực tế như nhận diện… V.1 phân loại là gì

IV.5c-Xác thực chéo với K = 5

  • bởi

Giả sử bạn đang xây một mô hình dự đoán giá nhà dựa trên diện tích và số phòng. Bạn có 100 ngôi nhà:

IV.5a Xác thực chéo

  • bởi

Xác thực chéo — hay còn gọi là cross-validation — chính là kiểu “kiểm tra lại xem mô hình có phải là học trò ngoan không hay chỉ giỏi làm bài… đúng một đề 😅”.… IV.5a Xác thực chéo

IV.1 Siêu tham số là gì?

  • bởi

Siêu tham số là gì? Đó là những “bí kíp võ công” bạn phải set sẵn trước khi cho mô hình học máy “luyện công” (huấn luyện). Không giống trọng số tự học từ dữ… IV.1 Siêu tham số là gì?

III.7 – hồi quy Ridge

  • bởi

Hồi quy Ridge, anh bạn thân của Lasso, cũng là một “cao bồi” trong thế giới hồi quy, nhưng tính cách thì… hiền lành hơn một chút! Nếu Lasso là chàng cao bồi vung dây… III.7 – hồi quy Ridge

III.6 Hồi quy Lasso

  • bởi

Lasso là viết tắt của Least Absolute Shrinkage and Selection Operator (nghe dài dòng nhưng cứ hiểu là “thu nhỏ và chọn lọc” là được). Nó là một dạng hồi quy tuyến tính, nhưng có… III.6 Hồi quy Lasso

III.1-Lựa Chọn Đặc Trưng

  • bởi

Hãy tưởng tượng bạn đang tuyển người yêu. Có cả trăm người ứng tuyển, mỗi người đều có “đặc trưng” riêng: cao, thấp, biết nấu ăn, thích xem phim, mê thể thao, yêu mèo, ghét… III.1-Lựa Chọn Đặc Trưng

V.5d Chỉ số Gini Index

  • bởi

Gini cũng là một chỉ số đo hỗn loạn, nhưng tính theo cách khác so với Entropy. Nó tính xác suất để hai mẫu lấy ngẫu nhiên mà khác loại nhau. Nếu chỉ số Gini… V.5d Chỉ số Gini Index

error: Content is protected !!