Bộ skill biến AI Agent thành máy số hóa tài liệu chuyên nghiệp. Thay vì dùng OCR truyền thống (Tesseract), skill tận dụng trực tiếp mô hình Vision của AI Agent để đọc ảnh scan, nhận diện font chữ, căn lề, bold/italic, heading, bảng biểu và ảnh minh họa.
OCR bằng AI Vision — Không phụ thuộc Tesseract. AI Agent nhìn trực tiếp từng trang scan, nhận diện chính xác cả văn bản tiếng Việt có dấu, bảng biểu phức tạp và ảnh minh họa nhúng trong tài liệu.
Xuất DOCX chuẩn format — Pipeline 5 layer tự động: convert Markdown sang DOCX, tái cấu trúc header theo chuẩn Nghị định 30, format paragraph/table, và áp dụng typography Times New Roman cho tiếng Việt.
Xử lý song song — OCR 3-5 trang đồng thời, có checkpoint tự động. Nếu bị gián đoạn giữa chừng, chạy lại sẽ bỏ qua các trang đã xử lý xong.
Skill tương thích với Google Antigravity và Claude. Miễn phí sử dụng, chỉ cần giữ credit giới thiệu tác giả.
Hướng dẫn cài đặt
Để sử dụng bộ skill này, bạn làm theo 2 bước đơn giản sau.
Bước 1 - Copy skill vào hệ thống
- Giải nén file ZIP
boc-tach-pdf-v1.0vừa tải về. Bạn sẽ được một thư mục có tên làboc-tach-pdf. - Copy toàn bộ thư mục này và dán vào thư mục skills của Antigravity trên máy tính của bạn:
Trên Windows:
C:\Users\Ten_cua_ban\.gemini\config\skills\
Bước 2 - Trải nghiệm
Bật giao diện Antigravity lên và thử yêu cầu AI làm việc ngay. Một số câu lệnh mẫu:
- “Chuyển file PDF scan này ra Word giúm tôi.”
- “Bóc tách tài liệu scan 20 trang, xuất ra DOCX giữ nguyên format.”
- “OCR file scan tiếng Việt, giữ bảng biểu và ảnh minh họa.”
Đây là phiên bản do tác giả tự phát triển, nên có thể không hoàn toàn phù hợp với mọi trường hợp sử dụng. Bạn nên tự dùng, tự tối ưu và tinh chỉnh lại cho phù hợp với mục tiêu của bản thân.