III.7 – hồi quy Ridge
Hồi quy Ridge, anh bạn thân của Lasso, cũng là một “cao bồi” trong thế giới hồi quy, nhưng tính cách thì… hiền lành hơn một chút! Nếu Lasso là chàng cao bồi vung dây… III.7 – hồi quy Ridge
Hồi quy Ridge, anh bạn thân của Lasso, cũng là một “cao bồi” trong thế giới hồi quy, nhưng tính cách thì… hiền lành hơn một chút! Nếu Lasso là chàng cao bồi vung dây… III.7 – hồi quy Ridge
Lasso là viết tắt của Least Absolute Shrinkage and Selection Operator (nghe dài dòng nhưng cứ hiểu là “thu nhỏ và chọn lọc” là được). Nó là một dạng hồi quy tuyến tính, nhưng có… III.6 Hồi quy Lasso
📊 So sánh 3 phương pháp: Phương pháp Chiến lược Ưu điểm Nhược điểm Lựa chọn tiến Chỉ thêm đặc trưng Nhanh, đơn giản Có thể bỏ lỡ tổ hợp đặc biệt Lựa chọn lùi… III.5 so sánh lựa chọn tiến – lùi – từng bước
Lựa chọn từng bước (Stepwise Selection) là một sự kết hợp khéo léo giữa “tiến” và “lùi” – như đang chọn người yêu nhưng vẫn lùi bước khi thấy “cờ đỏ” 🚩🤣 Bạn đang xây… III. 4 Lựa chọn từng bước
Lựa chọn tính năng ngược (backward feature selection) bắt đầu với mô hình đầy đủ bao gồm tất cả các tính năng và lặp đi lặp lại loại bỏ tính năng ít quan trọng nhất… III.3b Ví dụ: lựa chọn đặc trưng lùi
LỰA CHỌN LÙI (Backward Selection) – “biệt đội đã full người, giờ phải loại bớt” Giả sử bạn đang quản lý một biệt đội siêu nhân đông đúc, kiểu: “Càng đông càng mạnh” – bạn… III.3a Lựa Chọn Lùi –Chọn Người Để “Đuổi Việc”
Lựa chọn đặc trưng tiến bắt đầu với một mô hình trống và thêm các đặc trưng từng cái một. Ở mỗi bước, đặc trưng cải thiện hiệu suất mô hình nhiều nhất sẽ được… III.2b Ví dụ: lựa chọn đặc trưng tiến
LỰA CHỌN TIẾN (Forward Selection) – như… tuyển quân làm nhiệm vụ đặc biệt Bạn là đội trưởng của một biệt đội siêu nhân. Trước mặt bạn là một danh sách dài các ứng viên… III.2a lựa chọn đặc trưng tiến
Hãy tưởng tượng bạn đang tuyển người yêu. Có cả trăm người ứng tuyển, mỗi người đều có “đặc trưng” riêng: cao, thấp, biết nấu ăn, thích xem phim, mê thể thao, yêu mèo, ghét… III.1-Lựa Chọn Đặc Trưng
🎯 BIC (Bayesian Information Criterion) là “phiên bản nghiêm khắc hơn của AIC” trong việc chọn mô hình thống kê! 🧠 BIC là gì? Hãy tưởng tượng bạn đang tuyển chọn mô hình cho một… II.8-Tiêu chí BIC (Bayesian Information Criterion)
AIC được tính như sau: Trong đó: 👉 Mô hình nào có AIC thấp nhất sẽ được trao vương miện 🎖️ 🎬 Ví dụ vui Bạn có 3 mô hình dự đoán điểm… II.7-Tiêu chí thông tin Akaike Information Criterion (AIC)
Hệ số xác định hiệu chỉnh như một chiếc kính lúp tinh chỉnh giúp bạn đo lường chính xác hơn trong các mô hình thống kê hoặc tính toán. 🧠 Ví dụ vui cho dễ… II.6-Hệ số xác định hiệu chỉnh
Ưu điểm: dễ hiểu, cung cấp cái nhìn nhanh về độ phù hợp của mô hình.Hạn chế: Ví dụ Đánh giá mô hình: cao (SSR lớn, SSE nhỏ) cho thấy mô hình tốt. Trong ví… II.5 Tính chất của hệ số xác định
Trong hồi quy, ta hay nghe tới tổng bình phương – như thể đây là món “gia vị” không thể thiếu trong món ăn thống kê. Nhưng mà tổng bình phương thì cũng có… họ… II.4-Các loại Tổng bình phương (Sum of Squares)
Hãy tưởng tượng dữ liệu của bạn là một đám đông đang chen chúc trong một buổi hòa nhạc rock. Có đứa thì hét to kinh khủng (giá trị lớn), có đứa thì thì thầm… II.3-Phép biến đổi log là gì?
Hãy tưởng tượng bạn đang cố gắng vẽ một đường thẳng (mô hình hồi quy tuyến tính) để “chinh phục” đám mây điểm dữ liệu. Đường thẳng này giống như một người bạn cố gắng… II.2-Biểu đồ phần dư – có nên đu trend?
Mô hình hồi quy tuyến tính đa biến không chỉ là một công cụ dự đoán, mà còn là một người bạn “khó tính” – muốn làm việc với nó thì bạn phải tuân thủ… II.1d hồi quy tuyến tính đa biến – các giả định cần nhớ (và nhớ cho vui)
Gini cũng là một chỉ số đo hỗn loạn, nhưng tính theo cách khác so với Entropy. Nó tính xác suất để hai mẫu lấy ngẫu nhiên mà khác loại nhau. Nếu chỉ số Gini… V.5d Chỉ số Gini Index
Entropy giống như một “chỉ số hỗn loạn” của một nhóm dữ liệu. Nếu trong nhóm, tất cả mọi người đều giống nhau (chẳng hạn tất cả đều thích pizza), thì entropy = 0, nghĩa… V.5c Entropy (Sự rối loạn của dữ liệu)
Hồi quy đa biến là khi ta dự đoán một biến phụ thuộc dựa trên nhiều biến độc lập . 🔎 Ví dụ thực tế: Dự đoán giá nhà Biến phụ thuộc (Y): Giá nhà… II.1c Ví dụ về hồi quy đa biến
Thiết lập dạng ma trận cho hồi quy đa biến là cách biểu diễn mô hình hồi quy tuyến tính nhiều biến dưới dạng đại số tuyến tính, giúp việc tính toán và ước lượng… II.1b Thiết lập dạng ma trận cho hồi quy đa biến
Hãy tưởng tượng bạn là một đạo diễn phim 🎬 đang lựa chọn dàn diễn viên cho bộ phim “Dự đoán điểm thi cuối kỳ”. Diễn viên chính: Điểm thi 🧠Diễn viên phụ: Số giờ… II.1a – Hồi quy đa biến là gì
📊 Ví dụ minh họa 1. Quá khớp (Overfitting) 👉 Ví dụ thực tế: Một mô hình phân loại ảnh mèo/chó được huấn luyện quá lâu trên một tập nhỏ. Nó học thuộc chi tiết… I.8c Ví dụ về quá khớp, chưa khớp
Hãy tưởng tượng bạn đang ở một khu vui chơi, và nhiệm vụ của bạn là ném vòng vào các cột để giành giải thưởng. Nhưng thay vì ném vòng một cách ngẫu nhiên, bạn… I.8b hồi quy đa thức
Quá khớp (Overfitting) là khi mô hình học máy quá “nhớ” dữ liệu huấn luyện, dẫn đến dự đoán rất chính xác trên tập huấn luyện nhưng kém hiệu quả trên dữ liệu mới. Chưa… I.8a quá khớp và chưa khớp là gì
📊 Trong học máy, việc phân chia tập dữ liệu thành tập huấn luyện và tập kiểm tra là bước cực kỳ quan trọng để đánh giá khả năng khái quát hóa của mô hình.… I.7c Cách phân chia tập huấn luyện – tập kiểm tra
Hãy tưởng tượng bạn đang huấn luyện một chú mèo để làm xiếc, như nhảy qua vòng lửa. Tập huấn luyện (Training set): Đây là phần “bí kíp” bạn dùng để dạy chú mèo. Bạn… I.7b-phân chia tập huấn luyện – tập kiểm tra
Trong học máy, khả năng khái quát hóa (generalization) là năng lực của mô hình dự đoán chính xác trên dữ liệu chưa từng thấy — không chỉ “học thuộc lòng” dữ liệu huấn luyện… I.7a khả năng khái quát hóa
📊 MSE, MAE và RMSE là ba tiêu chí phổ biến dùng để đánh giá độ chính xác của mô hình hồi quy hoặc dự báo. Mỗi tiêu chí có cách đo lường sai số… I.6 Tiêu chí đánh giá: MSE, MAE, RMSE
Hồi quy tuyến tính (Linear Regression) là một phương pháp thống kê và học máy dùng để mô hình hóa mối quan hệ tuyến tính giữa một biến phụ thuộc (Y) và một hoặc nhiều… I.5-Hồi quy tuyến tính là gì
Trong thống kê, tham số là một đặc trưng số của tổng thể (population), dùng để mô tả hoặc khái quát toàn bộ tổng thể. Ví dụ: trung bình chiều cao của tất cả thanh… I.4 Tham số và hàm mất mát là gì
Học không có giám sát giống như thám tử tự mò mẫm manh mối mà không có ai chỉ dẫn. Đôi khi nó tìm ra những điều bất ngờ mà chính bạn cũng không nghĩ… I.3 Học không có giám sát
Học có giám sát giống như có một “thầy giáo” nghiêm khắc đứng bên cạnh, luôn sửa sai khi bạn làm bài tập. Nhưng khi “thầy” đi vắng (gặp dữ liệu mới), bạn phải tự… I.2-Học có giám sát
Học máy, một nhánh quan trọng thuộc trí tuệ nhân tạo (AI), được định nghĩa là khả năng của các hệ thống máy tính trong việc học hỏi và cải thiện từ các trải nghiệm… I.1-Những ứng dụng của học máy