III.7 – hồi quy Ridge
Hồi quy Ridge, anh bạn thân của Lasso, cũng là một “cao bồi” trong thế giới hồi quy, nhưng tính cách thì… hiền lành hơn một chút! Nếu Lasso là chàng cao bồi vung dây… III.7 – hồi quy Ridge
III.6 Hồi quy Lasso
Lasso là viết tắt của Least Absolute Shrinkage and Selection Operator (nghe dài dòng nhưng cứ hiểu là “thu nhỏ và chọn lọc” là được). Nó là một dạng hồi quy tuyến tính, nhưng có… III.6 Hồi quy Lasso
III.5 so sánh lựa chọn tiến – lùi – từng bước
📊 So sánh 3 phương pháp: Phương pháp Chiến lược Ưu điểm Nhược điểm Lựa chọn tiến Chỉ thêm đặc trưng Nhanh, đơn giản Có thể bỏ lỡ tổ hợp đặc biệt Lựa chọn lùi… III.5 so sánh lựa chọn tiến – lùi – từng bước
III. 4 Lựa chọn từng bước
Lựa chọn từng bước (Stepwise Selection) là một sự kết hợp khéo léo giữa “tiến” và “lùi” – như đang chọn người yêu nhưng vẫn lùi bước khi thấy “cờ đỏ” 🚩🤣 Bạn đang xây… III. 4 Lựa chọn từng bước
III.3b Ví dụ: lựa chọn đặc trưng lùi
Lựa chọn tính năng ngược (backward feature selection) bắt đầu với mô hình đầy đủ bao gồm tất cả các tính năng và lặp đi lặp lại loại bỏ tính năng ít quan trọng nhất… III.3b Ví dụ: lựa chọn đặc trưng lùi
III.3a Lựa Chọn Lùi –Chọn Người Để “Đuổi Việc”
LỰA CHỌN LÙI (Backward Selection) – “biệt đội đã full người, giờ phải loại bớt” Giả sử bạn đang quản lý một biệt đội siêu nhân đông đúc, kiểu: “Càng đông càng mạnh” – bạn… III.3a Lựa Chọn Lùi –Chọn Người Để “Đuổi Việc”
III.2b Ví dụ: lựa chọn đặc trưng tiến
Lựa chọn đặc trưng tiến bắt đầu với một mô hình trống và thêm các đặc trưng từng cái một. Ở mỗi bước, đặc trưng cải thiện hiệu suất mô hình nhiều nhất sẽ được… III.2b Ví dụ: lựa chọn đặc trưng tiến
III.2a lựa chọn đặc trưng tiến
LỰA CHỌN TIẾN (Forward Selection) – như… tuyển quân làm nhiệm vụ đặc biệt Bạn là đội trưởng của một biệt đội siêu nhân. Trước mặt bạn là một danh sách dài các ứng viên… III.2a lựa chọn đặc trưng tiến
III.1-Lựa Chọn Đặc Trưng
Hãy tưởng tượng bạn đang tuyển người yêu. Có cả trăm người ứng tuyển, mỗi người đều có “đặc trưng” riêng: cao, thấp, biết nấu ăn, thích xem phim, mê thể thao, yêu mèo, ghét… III.1-Lựa Chọn Đặc Trưng
II.8-Tiêu chí BIC (Bayesian Information Criterion)
🎯 BIC (Bayesian Information Criterion) là “phiên bản nghiêm khắc hơn của AIC” trong việc chọn mô hình thống kê! 🧠 BIC là gì? Hãy tưởng tượng bạn đang tuyển chọn mô hình cho một… II.8-Tiêu chí BIC (Bayesian Information Criterion)
II.7-Tiêu chí thông tin Akaike Information Criterion (AIC)
AIC được tính như sau: Trong đó: 👉 Mô hình nào có AIC thấp nhất sẽ được trao vương miện 🎖️ 🎬 Ví dụ vui Bạn có 3 mô hình dự đoán điểm… II.7-Tiêu chí thông tin Akaike Information Criterion (AIC)
II.6-Hệ số xác định hiệu chỉnh
Hệ số xác định hiệu chỉnh như một chiếc kính lúp tinh chỉnh giúp bạn đo lường chính xác hơn trong các mô hình thống kê hoặc tính toán. 🧠 Ví dụ vui cho dễ… II.6-Hệ số xác định hiệu chỉnh
II.5 Tính chất của hệ số xác định
Ưu điểm: dễ hiểu, cung cấp cái nhìn nhanh về độ phù hợp của mô hình.Hạn chế: Ví dụ Đánh giá mô hình: cao (SSR lớn, SSE nhỏ) cho thấy mô hình tốt. Trong ví… II.5 Tính chất của hệ số xác định
II.4-Các loại Tổng bình phương (Sum of Squares)
Trong hồi quy, ta hay nghe tới tổng bình phương – như thể đây là món “gia vị” không thể thiếu trong món ăn thống kê. Nhưng mà tổng bình phương thì cũng có… họ… II.4-Các loại Tổng bình phương (Sum of Squares)
II.3-Phép biến đổi log là gì?
Hãy tưởng tượng dữ liệu của bạn là một đám đông đang chen chúc trong một buổi hòa nhạc rock. Có đứa thì hét to kinh khủng (giá trị lớn), có đứa thì thì thầm… II.3-Phép biến đổi log là gì?
II.2-Biểu đồ phần dư – có nên đu trend?
Hãy tưởng tượng bạn đang cố gắng vẽ một đường thẳng (mô hình hồi quy tuyến tính) để “chinh phục” đám mây điểm dữ liệu. Đường thẳng này giống như một người bạn cố gắng… II.2-Biểu đồ phần dư – có nên đu trend?
II.1d hồi quy tuyến tính đa biến – các giả định cần nhớ (và nhớ cho vui)
Mô hình hồi quy tuyến tính đa biến không chỉ là một công cụ dự đoán, mà còn là một người bạn “khó tính” – muốn làm việc với nó thì bạn phải tuân thủ… II.1d hồi quy tuyến tính đa biến – các giả định cần nhớ (và nhớ cho vui)
V.5d Chỉ số Gini Index
Gini cũng là một chỉ số đo hỗn loạn, nhưng tính theo cách khác so với Entropy. Nó tính xác suất để hai mẫu lấy ngẫu nhiên mà khác loại nhau. Nếu chỉ số Gini… V.5d Chỉ số Gini Index
V.5c Entropy (Sự rối loạn của dữ liệu)
Entropy giống như một “chỉ số hỗn loạn” của một nhóm dữ liệu. Nếu trong nhóm, tất cả mọi người đều giống nhau (chẳng hạn tất cả đều thích pizza), thì entropy = 0, nghĩa… V.5c Entropy (Sự rối loạn của dữ liệu)
II.1c Ví dụ về hồi quy đa biến
Hồi quy đa biến là khi ta dự đoán một biến phụ thuộc dựa trên nhiều biến độc lập . 🔎 Ví dụ thực tế: Dự đoán giá nhà Biến phụ thuộc (Y): Giá nhà… II.1c Ví dụ về hồi quy đa biến
II.1b Thiết lập dạng ma trận cho hồi quy đa biến
Thiết lập dạng ma trận cho hồi quy đa biến là cách biểu diễn mô hình hồi quy tuyến tính nhiều biến dưới dạng đại số tuyến tính, giúp việc tính toán và ước lượng… II.1b Thiết lập dạng ma trận cho hồi quy đa biến
II.1a – Hồi quy đa biến là gì
Hãy tưởng tượng bạn là một đạo diễn phim 🎬 đang lựa chọn dàn diễn viên cho bộ phim “Dự đoán điểm thi cuối kỳ”. Diễn viên chính: Điểm thi 🧠Diễn viên phụ: Số giờ… II.1a – Hồi quy đa biến là gì
I.8c Ví dụ về quá khớp, chưa khớp
📊 Ví dụ minh họa 1. Quá khớp (Overfitting) 👉 Ví dụ thực tế: Một mô hình phân loại ảnh mèo/chó được huấn luyện quá lâu trên một tập nhỏ. Nó học thuộc chi tiết… I.8c Ví dụ về quá khớp, chưa khớp
I.8b hồi quy đa thức
Hãy tưởng tượng bạn đang ở một khu vui chơi, và nhiệm vụ của bạn là ném vòng vào các cột để giành giải thưởng. Nhưng thay vì ném vòng một cách ngẫu nhiên, bạn… I.8b hồi quy đa thức
I.8a quá khớp và chưa khớp là gì
Quá khớp (Overfitting) là khi mô hình học máy quá “nhớ” dữ liệu huấn luyện, dẫn đến dự đoán rất chính xác trên tập huấn luyện nhưng kém hiệu quả trên dữ liệu mới. Chưa… I.8a quá khớp và chưa khớp là gì
I.7c Cách phân chia tập huấn luyện – tập kiểm tra
📊 Trong học máy, việc phân chia tập dữ liệu thành tập huấn luyện và tập kiểm tra là bước cực kỳ quan trọng để đánh giá khả năng khái quát hóa của mô hình.… I.7c Cách phân chia tập huấn luyện – tập kiểm tra
I.7b-phân chia tập huấn luyện – tập kiểm tra
Hãy tưởng tượng bạn đang huấn luyện một chú mèo để làm xiếc, như nhảy qua vòng lửa. Tập huấn luyện (Training set): Đây là phần “bí kíp” bạn dùng để dạy chú mèo. Bạn… I.7b-phân chia tập huấn luyện – tập kiểm tra
I.7a khả năng khái quát hóa
Trong học máy, khả năng khái quát hóa (generalization) là năng lực của mô hình dự đoán chính xác trên dữ liệu chưa từng thấy — không chỉ “học thuộc lòng” dữ liệu huấn luyện… I.7a khả năng khái quát hóa
I.6 Tiêu chí đánh giá: MSE, MAE, RMSE
📊 MSE, MAE và RMSE là ba tiêu chí phổ biến dùng để đánh giá độ chính xác của mô hình hồi quy hoặc dự báo. Mỗi tiêu chí có cách đo lường sai số… I.6 Tiêu chí đánh giá: MSE, MAE, RMSE
I.5-Hồi quy tuyến tính là gì
Hồi quy tuyến tính (Linear Regression) là một phương pháp thống kê và học máy dùng để mô hình hóa mối quan hệ tuyến tính giữa một biến phụ thuộc (Y) và một hoặc nhiều… I.5-Hồi quy tuyến tính là gì
I.4 Tham số và hàm mất mát là gì
Trong thống kê, tham số là một đặc trưng số của tổng thể (population), dùng để mô tả hoặc khái quát toàn bộ tổng thể. Ví dụ: trung bình chiều cao của tất cả thanh… I.4 Tham số và hàm mất mát là gì
I.3 Học không có giám sát
Học không có giám sát giống như thám tử tự mò mẫm manh mối mà không có ai chỉ dẫn. Đôi khi nó tìm ra những điều bất ngờ mà chính bạn cũng không nghĩ… I.3 Học không có giám sát
I.2-Học có giám sát
Học có giám sát giống như có một “thầy giáo” nghiêm khắc đứng bên cạnh, luôn sửa sai khi bạn làm bài tập. Nhưng khi “thầy” đi vắng (gặp dữ liệu mới), bạn phải tự… I.2-Học có giám sát
- « Previous
- 1
- 2
- 3
- 4
- Next »

































