V.1 phân loại là gì
Phân loại trong học máy là quá trình dùng dữ liệu để huấn luyện mô hình nhằm gán nhãn cho đối tượng mới, và nó có rất nhiều ứng dụng thực tế như nhận diện… V.1 phân loại là gì
Phân loại trong học máy là quá trình dùng dữ liệu để huấn luyện mô hình nhằm gán nhãn cho đối tượng mới, và nó có rất nhiều ứng dụng thực tế như nhận diện… V.1 phân loại là gì
Siêu tham số giống như những quy tắc trước khi huấn luyện một đội bóng: chọn chiến thuật, thời gian tập luyện, ăn kiêng,… Nếu chọn sai, cả đội chơi như gà mắc tóc. Tối… IV.6-tìm kiếm ngẫu nhiên để tối ưu siêu tham số
Giả sử bạn đang xây một mô hình dự đoán giá nhà dựa trên diện tích và số phòng. Bạn có 100 ngôi nhà:
Xác thực chéo giống như việc bạn kiểm tra một học sinh bằng nhiều bài kiểm tra khác nhau để đảm bảo học sinh đó thực sự hiểu bài, chứ không chỉ học vẹt một… IV.5b-Xác thực chéo (cross validation) với K = 3
Xác thực chéo — hay còn gọi là cross-validation — chính là kiểu “kiểm tra lại xem mô hình có phải là học trò ngoan không hay chỉ giỏi làm bài… đúng một đề 😅”.… IV.5a Xác thực chéo
chi tiết hơn: Trong lĩnh vực machine learning, việc chia dữ liệu thành ba tỷ lệ chính: huấn luyện, đào tạo và kiểm tra là một bước không thể thiếu. Mỗi tỷ lệ đảm nhận… IV.3b Các Tỉ Lệ Huấn Luyện-Đào Tạo-Kiểm Tra Phổ Biến
Để hiểu tập xác nhận (validation set), hãy nhớ lại câu chuyện huấn luyện chú mèo xiếc của chúng ta! 😺 Tập xác nhận (Validation set) là gì? Hãy tưởng tượng bạn đang huấn luyện… IV.2-phân chia tập xác nhận (validation set)
Siêu tham số là gì? Đó là những “bí kíp võ công” bạn phải set sẵn trước khi cho mô hình học máy “luyện công” (huấn luyện). Không giống trọng số tự học từ dữ… IV.1 Siêu tham số là gì?
Hồi quy Ridge, anh bạn thân của Lasso, cũng là một “cao bồi” trong thế giới hồi quy, nhưng tính cách thì… hiền lành hơn một chút! Nếu Lasso là chàng cao bồi vung dây… III.7 – hồi quy Ridge
Lasso là viết tắt của Least Absolute Shrinkage and Selection Operator (nghe dài dòng nhưng cứ hiểu là “thu nhỏ và chọn lọc” là được). Nó là một dạng hồi quy tuyến tính, nhưng có… III.6 Hồi quy Lasso
📊 So sánh 3 phương pháp: Phương pháp Chiến lược Ưu điểm Nhược điểm Lựa chọn tiến Chỉ thêm đặc trưng Nhanh, đơn giản Có thể bỏ lỡ tổ hợp đặc biệt Lựa chọn lùi… III.5 so sánh lựa chọn tiến – lùi – từng bước
Lựa chọn từng bước (Stepwise Selection) là một sự kết hợp khéo léo giữa “tiến” và “lùi” – như đang chọn người yêu nhưng vẫn lùi bước khi thấy “cờ đỏ” 🚩🤣 Bạn đang xây… III. 4 Lựa chọn từng bước
Lựa chọn tính năng ngược (backward feature selection) bắt đầu với mô hình đầy đủ bao gồm tất cả các tính năng và lặp đi lặp lại loại bỏ tính năng ít quan trọng nhất… III.3b Ví dụ: lựa chọn đặc trưng lùi
LỰA CHỌN LÙI (Backward Selection) – “biệt đội đã full người, giờ phải loại bớt” Giả sử bạn đang quản lý một biệt đội siêu nhân đông đúc, kiểu: “Càng đông càng mạnh” – bạn… III.3a Lựa Chọn Lùi –Chọn Người Để “Đuổi Việc”
Lựa chọn đặc trưng tiến bắt đầu với một mô hình trống và thêm các đặc trưng từng cái một. Ở mỗi bước, đặc trưng cải thiện hiệu suất mô hình nhiều nhất sẽ được… III.2b Ví dụ: lựa chọn đặc trưng tiến
LỰA CHỌN TIẾN (Forward Selection) – như… tuyển quân làm nhiệm vụ đặc biệt Bạn là đội trưởng của một biệt đội siêu nhân. Trước mặt bạn là một danh sách dài các ứng viên… III.2a lựa chọn đặc trưng tiến
Hãy tưởng tượng bạn đang tuyển người yêu. Có cả trăm người ứng tuyển, mỗi người đều có “đặc trưng” riêng: cao, thấp, biết nấu ăn, thích xem phim, mê thể thao, yêu mèo, ghét… III.1-Lựa Chọn Đặc Trưng
🎯 BIC (Bayesian Information Criterion) là “phiên bản nghiêm khắc hơn của AIC” trong việc chọn mô hình thống kê! 🧠 BIC là gì? Hãy tưởng tượng bạn đang tuyển chọn mô hình cho một… II.8-Tiêu chí BIC (Bayesian Information Criterion)
AIC được tính như sau: Trong đó: 👉 Mô hình nào có AIC thấp nhất sẽ được trao vương miện 🎖️ 🎬 Ví dụ vui Bạn có 3 mô hình dự đoán điểm… II.7-Tiêu chí thông tin Akaike Information Criterion (AIC)
Hệ số xác định hiệu chỉnh như một chiếc kính lúp tinh chỉnh giúp bạn đo lường chính xác hơn trong các mô hình thống kê hoặc tính toán. 🧠 Ví dụ vui cho dễ… II.6-Hệ số xác định hiệu chỉnh
Ưu điểm: dễ hiểu, cung cấp cái nhìn nhanh về độ phù hợp của mô hình.Hạn chế: Ví dụ Đánh giá mô hình: cao (SSR lớn, SSE nhỏ) cho thấy mô hình tốt. Trong ví… II.5 Tính chất của hệ số xác định
Trong hồi quy, ta hay nghe tới tổng bình phương – như thể đây là món “gia vị” không thể thiếu trong món ăn thống kê. Nhưng mà tổng bình phương thì cũng có… họ… II.4-Các loại Tổng bình phương (Sum of Squares)
Hãy tưởng tượng dữ liệu của bạn là một đám đông đang chen chúc trong một buổi hòa nhạc rock. Có đứa thì hét to kinh khủng (giá trị lớn), có đứa thì thì thầm… II.3-Phép biến đổi log là gì?
Hãy tưởng tượng bạn đang cố gắng vẽ một đường thẳng (mô hình hồi quy tuyến tính) để “chinh phục” đám mây điểm dữ liệu. Đường thẳng này giống như một người bạn cố gắng… II.2-Biểu đồ phần dư – có nên đu trend?
Mô hình hồi quy tuyến tính đa biến không chỉ là một công cụ dự đoán, mà còn là một người bạn “khó tính” – muốn làm việc với nó thì bạn phải tuân thủ… II.1d hồi quy tuyến tính đa biến – các giả định cần nhớ (và nhớ cho vui)
Gini cũng là một chỉ số đo hỗn loạn, nhưng tính theo cách khác so với Entropy. Nó tính xác suất để hai mẫu lấy ngẫu nhiên mà khác loại nhau. Nếu chỉ số Gini… V.5d Chỉ số Gini Index
Entropy giống như một “chỉ số hỗn loạn” của một nhóm dữ liệu. Nếu trong nhóm, tất cả mọi người đều giống nhau (chẳng hạn tất cả đều thích pizza), thì entropy = 0, nghĩa… V.5c Entropy (Sự rối loạn của dữ liệu)
Hồi quy đa biến là khi ta dự đoán một biến phụ thuộc dựa trên nhiều biến độc lập . 🔎 Ví dụ thực tế: Dự đoán giá nhà Biến phụ thuộc (Y): Giá nhà… II.1c Ví dụ về hồi quy đa biến
Thiết lập dạng ma trận cho hồi quy đa biến là cách biểu diễn mô hình hồi quy tuyến tính nhiều biến dưới dạng đại số tuyến tính, giúp việc tính toán và ước lượng… II.1b Thiết lập dạng ma trận cho hồi quy đa biến
Hãy tưởng tượng bạn là một đạo diễn phim 🎬 đang lựa chọn dàn diễn viên cho bộ phim “Dự đoán điểm thi cuối kỳ”. Diễn viên chính: Điểm thi 🧠Diễn viên phụ: Số giờ… II.1a – Hồi quy đa biến là gì
📊 Ví dụ minh họa 1. Quá khớp (Overfitting) 👉 Ví dụ thực tế: Một mô hình phân loại ảnh mèo/chó được huấn luyện quá lâu trên một tập nhỏ. Nó học thuộc chi tiết… I.8c Ví dụ về quá khớp, chưa khớp