Nếu bạn từng nhờ một AI tóm tắt một bài viết dài, có lẽ bạn đã trải qua một nỗi bực mình quen thuộc: bản tóm tắt hoặc quá mơ hồ, bỏ sót những thông tin quan trọng nhất, hoặc bị nhồi nhét những câu rỗng như “Bài viết này nói về…”.
Cảm giác như AI chỉ lướt qua văn bản.
Để khắc phục điều này, các kỹ sư prompt sử dụng hai khái niệm chồng lấn, rất hiệu quả: kỹ thuật Rereading (đọc lại) và Chain of Density (CoD – Chuỗi mật độ). Bằng cách buộc AI phải đọc lại văn bản nguồn nhiều lần và dần dần nhồi thêm nhiều dữ kiện hơn, bạn có thể biến một đoạn tóm tắt “bông xốp” thành một bản tóm tắt giàu thông tin, đạt chuẩn “vàng”.
Dưới đây là phần phân tích cách các khái niệm này hoạt động và cách bạn có thể sử dụng chúng.
Vấn đề cốt lõi: Đọc một lượt duy nhất
Các Mô hình Ngôn ngữ Lớn (LLM) tự nhiên được thiết kế để dự đoán từ tiếp theo có khả năng cao nhất. Khi bạn yêu cầu tóm tắt chỉ bằng một prompt, AI thường chỉ thực hiện một “lượt đọc” (single pass) trên văn bản. Điều này thường dẫn đến:
- Thiên lệch phần đầu: AI tập trung quá nhiều vào vài đoạn đầu và bỏ qua phần cuối tài liệu.
- Mật độ thông tin thấp: AI dùng quá nhiều từ để truyền tải quá ít dữ kiện thực sự.
Chain of Density (CoD) xuất hiện
Được giới thiệu bởi các nhà nghiên cứu trong bài báo “From Sparse to Dense: GPT-4 Summarization with Chain of Density Prompting” năm 2023, Chain of Density là một kỹ thuật prompt engineering được thiết kế riêng để sửa các bản tóm tắt kém chất lượng. Nó buộc AI phải viết tóm tắt, tự đánh giá, rồi viết lại nhiều lần—mà không được tăng số lượng từ.
“Rereading” nằm ở đâu trong đó
Chain of Density hoàn toàn dựa trên một vòng lặp đọc lại có cấu trúc. (Lưu ý: Trong ngữ cảnh prompt cho AI, “rereading” cũng có thể ám chỉ kỹ thuật RE2, nơi bạn yêu cầu AI “Đọc lại văn bản” để cải thiện suy luận logic. CoD áp dụng cùng triết lý này cho việc tóm tắt). Trong quá trình CoD, AI phải:
- Đọc văn bản nguồn và viết một bản tóm tắt cơ bản.
- Đọc lại văn bản nguồn để xác định 1 đến 3 thực thể cụ thể (tên riêng, con số, địa điểm, khái niệm) mà nó đã bỏ sót trong bản tóm tắt trước.
- Viết lại bản tóm tắt để đưa các thực thể mới vào, đồng thời cắt bỏ từ ngữ rườm rà để giữ nguyên độ dài.
- Lặp lại vòng này 5 lần.
Một ví dụ cụ thể
Hãy xem cách một bản tóm tắt tiến hóa qua quá trình đọc lại và tăng mật độ.
Văn bản nguồn là một bản tin dài 500 từ về một tuyến tàu chạy bằng năng lượng mặt trời mới ra mắt ở Byron Bay, Úc, có chi phí 4 triệu đô, đạt tốc độ 50 km/h, chở 100 hành khách, và được xây dựng bởi Công ty Đường sắt Byron Bay (Byron Bay Railroad Company).
Lần lặp 1 (Thưa thớt & “bông xốp”):
“This article discusses a new solar-powered train that has recently launched in Australia. The train is designed to be environmentally friendly and runs on renewable energy. It will carry passengers along a coastal route, offering a sustainable transport option for locals and tourists.” (Số từ: 43)
Nhận xét: Kiểu “fluff” AI điển hình. Nó bỏ sót địa điểm cụ thể, chi phí, tốc độ và tên công ty.
Lần lặp 3 (Vùng “vừa đủ” – Goldilocks):
“The Byron Bay Railroad Company has launched a new solar-powered train in Australia. Running entirely on renewable energy, the $4 million train carries up to 100 passengers along a coastal route. It provides a sustainable transport option for locals and tourists.” (Số từ: 41)
Nhận xét: Tốt hơn nhiều. Nhờ đọc lại văn bản, AI đã tìm ra các thực thể bị bỏ sót (Byron Bay Railroad Company, 4 triệu đô, 100 hành khách) và nén lại ngôn ngữ của chính nó để tạo chỗ cho chúng.
Lần lặp 5 (Mật độ rất cao):
“Byron Bay Railroad Company’s $4 million solar-powered train, carrying 100 passengers at 50 km/h, launched in Australia. This sustainable, renewable-energy coastal transport serves locals and tourists, eliminating fossil-fuel reliance.” (Số từ: 30)
Nhận xét: Cực kỳ dày đặc. Nghiên cứu cho thấy con người thường thích Lần lặp 3 hoặc 4 hơn, vì Lần 5 đôi khi có thể cảm giác quá nén, hơi “robot”, khó đọc thoải mái.
Cách tự thử
Bạn không cần là lập trình viên để dùng kỹ thuật này. Bạn có thể kích hoạt đúng hành vi đó bằng cách sao chép và dán khung prompt sau vào lần yêu cầu tiếp theo:
Article: [Chèn văn bản của bạn vào đây]
Bạn sẽ tạo ra các bản tóm tắt ngày càng ngắn gọn và dày đặc thực thể của bài viết trên. Lặp lại 2 bước sau 5 lần:
Bước 1: Đọc lại bài viết và xác định 1–3 thực thể giàu thông tin (người, con số, địa điểm, khái niệm cụ thể) đang thiếu trong bản tóm tắt trước đó của bạn.
Bước 2: Viết một bản tóm tắt mới, dày đặc hơn, có độ dài giống hệt (khoảng 50 từ), bao quát mọi thực thể từ bản tóm tắt trước CỘNG các thực thể mới.
Hướng dẫn:
- Hãy khiến từng từ đều có giá trị. Nén và viết lại câu để tạo chỗ cho các thực thể mới.
- Loại bỏ các cụm vô nghĩa như “The article discusses”.
- Xuất kết quả dưới dạng danh sách đánh số gồm 5 bản tóm tắt, từ Lần lặp 1 đến Lần lặp 5, để tôi có thể chọn bản tốt nhất.
Đó là một quy trình làm việc tuyệt vời và cực kỳ thực tiễn. Thực tế, việc thêm một bước riêng “tìm chủ đề” là một cách nâng cấp rất thông minh cho kỹ thuật Chain of Density tiêu chuẩn.
Nếu một AI chỉ nhồi nhét các dữ kiện ngẫu nhiên để làm bản tóm tắt “dày đặc”, kết quả có thể rời rạc, thiếu mạch. Bằng cách buộc AI trích xuất các chủ đề trước, bạn đảm bảo rằng bản tóm tắt dày đặc cuối cùng thực sự bám vào mạch truyện/câu chuyện cốt lõi của văn bản.
Prompt “Mật độ dựa trên chủ đề” (Theme-Driven Density)
Bạn có thể sao chép và dán nguyên mẫu này bất cứ khi nào cần xử lý một tài liệu.
Text to Analyze: > [Dán văn bản của bạn vào đây]
Task: Thực hiện quy trình 2 bước sau để xử lý văn bản trên.
Step 1: Find Themes (Giai đoạn Rereading – đọc lại)
Đọc kỹ văn bản. Xác định và liệt kê 3 chủ đề cốt lõi hoặc luận điểm chính. Với mỗi chủ đề, hãy nêu rõ 1 hoặc 2 thực thể cụ thể (dữ liệu, tên, ngày tháng, khái niệm quan trọng) trong văn bản dùng để minh họa cho chủ đề đó.
Step 2: Write Summary (Giai đoạn Density – tăng mật độ)
Chỉ sử dụng các chủ đề và thực thể bạn đã trích xuất ở Bước 1, hãy viết một đoạn tóm tắt đơn, giàu thông tin (khoảng 50–75 từ).
Ràng buộc 1: Không dùng các cụm rỗng như “The author notes” hay “This text discusses.”
Ràng buộc 2: Đảm bảo mọi thực thể cụ thể từ Bước 1 đều được đan vào đoạn tóm tắt. Hãy khiến từng từ đều có giá trị.
Text to Analyze: > [Dán văn bản của bạn vào đây]
Task: Thực hiện quy trình 2 bước sau để xử lý văn bản trên.
Step 1: Find Themes (Giai đoạn Rereading – đọc lại)
Đọc kỹ văn bản. Xác định và liệt kê 3 chủ đề cốt lõi hoặc luận điểm chính. Với mỗi chủ đề, hãy nêu rõ 1 hoặc 2 thực thể cụ thể (dữ liệu, tên, ngày tháng, khái niệm quan trọng) trong văn bản dùng để minh họa cho chủ đề đó.
Step 2: Write Summary (Giai đoạn Density – tăng mật độ)
Chỉ sử dụng các chủ đề và thực thể bạn đã trích xuất ở Bước 1, hãy viết một đoạn tóm tắt đơn, giàu thông tin (khoảng 50–75 từ).
Ràng buộc 1: Không dùng các cụm rỗng như “The author notes” hay “This text discusses.”
Ràng buộc 2: Đảm bảo mọi thực thể cụ thể từ Bước 1 đều được đan vào đoạn tóm tắt. Hãy khiến từng từ đều có giá trị.
Text to Analyze: > [Dán văn bản của bạn vào đây]
Task: Thực hiện quy trình 2 bước sau để xử lý văn bản trên.
Step 1: Find Themes (Giai đoạn Rereading – đọc lại)
Đọc kỹ văn bản. Xác định và liệt kê 3 chủ đề cốt lõi hoặc luận điểm chính. Với mỗi chủ đề, hãy nêu rõ 1 hoặc 2 thực thể cụ thể (dữ liệu, tên, ngày tháng, khái niệm quan trọng) trong văn bản dùng để minh họa cho chủ đề đó.
Step 2: Write Summary (Giai đoạn Density – tăng mật độ)
Chỉ sử dụng các chủ đề và thực thể bạn đã trích xuất ở Bước 1, hãy viết một đoạn tóm tắt đơn, giàu thông tin (khoảng 50–75 từ).
Ràng buộc 1: Không dùng các cụm rỗng như “The author notes” hay “This text discusses.”
Ràng buộc 2: Đảm bảo mọi thực thể cụ thể từ Bước 1 đều được đan vào đoạn tóm tắt. Hãy khiến từng từ đều có giá trị.
Text to Analyze: > [Dán văn bản của bạn vào đây]
Task: Thực hiện quy trình 2 bước sau để xử lý văn bản trên.
Step 1: Find Themes (Giai đoạn Rereading – đọc lại)
Đọc kỹ văn bản. Xác định và liệt kê 3 chủ đề cốt lõi hoặc luận điểm chính. Với mỗi chủ đề, hãy nêu rõ 1 hoặc 2 thực thể cụ thể (dữ liệu, tên, ngày tháng, khái niệm quan trọng) trong văn bản dùng để minh họa cho chủ đề đó.
Step 2: Write Summary (Giai đoạn Density – tăng mật độ)
Chỉ sử dụng các chủ đề và thực thể bạn đã trích xuất ở Bước 1, hãy viết một đoạn tóm tắt đơn, giàu thông tin (khoảng 50–75 từ).
Ràng buộc 1: Không dùng các cụm rỗng như “The author notes” hay “This text discusses.”
Ràng buộc 2: Đảm bảo mọi thực thể cụ thể từ Bước 1 đều được đan vào đoạn tóm tắt. Hãy khiến từng từ đều có giá trị.Vì sao quy trình này hiệu quả
Bằng cách cấu trúc yêu cầu như vậy, bạn đang “điều khiển” cách AI xử lý thông tin ở tầng bên trong:
- Nó ngăn hiện tượng bịa đặt (hallucination): Khi buộc AI phải liệt kê chủ đề và dữ kiện hỗ trợ trước khi viết tóm tắt (Bước 1), bạn đang “neo” lập luận của nó vào văn bản gốc. Khả năng nó bịa ra thông tin sẽ giảm đi đáng kể khi đã có một dàn ý rõ ràng để bám theo.
- Nó tự nhiên tạo ra mật độ: Ở Bước 2, AI bị ràng buộc: có một lượng thông tin cụ thể lớn (các chủ đề và thực thể) nhưng lại bị giới hạn số từ. Điều này buộc nó phải áp dụng phong cách viết kiểu Chain of Density một cách tự nhiên—gộp câu, bỏ tính từ rườm rà.
- Nó cho bạn một “dấu vết kiểm tra”: Nếu bản tóm tắt cuối cùng có gì đó “sai sai”, bạn có thể nhìn lại danh sách “Themes” ở Bước 1 để xem chính xác AI đã hiểu sai văn bản gốc ở đâu.