Bộ Skill Bóc tách PDF Scan dành cho AI Agent

Số hóa toàn diện file PDF scan thành DOCX trung thực — giữ nguyên bố cục, font chữ, căn lề, bảng biểu và ảnh minh họa gốc. Thiết kế đặc biệt cho văn bản hành chính Việt Nam theo chuẩn Nghị định 30.

#AI Agent #OCR #PDF #DOCX #Antigravity

Mở tài nguyên gốc ↗

Bộ skill biến AI Agent thành máy số hóa tài liệu chuyên nghiệp. Thay vì dùng OCR truyền thống (Tesseract), skill tận dụng trực tiếp mô hình Vision của AI Agent để đọc ảnh scan, nhận diện font chữ, căn lề, bold/italic, heading, bảng biểu và ảnh minh họa.

OCR bằng AI Vision — Không phụ thuộc Tesseract. AI Agent nhìn trực tiếp từng trang scan, nhận diện chính xác cả văn bản tiếng Việt có dấu, bảng biểu phức tạp và ảnh minh họa nhúng trong tài liệu.

Xuất DOCX chuẩn format — Pipeline 5 layer tự động: convert Markdown sang DOCX, tái cấu trúc header theo chuẩn Nghị định 30, format paragraph/table, và áp dụng typography Times New Roman cho tiếng Việt.

Xử lý song song — OCR 3-5 trang đồng thời, có checkpoint tự động. Nếu bị gián đoạn giữa chừng, chạy lại sẽ bỏ qua các trang đã xử lý xong.

Skill tương thích với Google Antigravity và Claude. Miễn phí sử dụng, chỉ cần giữ credit giới thiệu tác giả.

Hướng dẫn cài đặt

Để sử dụng bộ skill này, bạn làm theo 2 bước đơn giản sau.

Bước 1 - Copy skill vào hệ thống

Giải nén file ZIP boc-tach-pdf-v1.0 vừa tải về. Bạn sẽ được một thư mục có tên là boc-tach-pdf.
Copy toàn bộ thư mục này và dán vào thư mục skills của Antigravity trên máy tính của bạn:

Trên Windows:

C:\Users\Ten_cua_ban\.gemini\config\skills\

Bước 2 - Trải nghiệm

Bật giao diện Antigravity lên và thử yêu cầu AI làm việc ngay. Một số câu lệnh mẫu:

“Chuyển file PDF scan này ra Word giúm tôi.”
“Bóc tách tài liệu scan 20 trang, xuất ra DOCX giữ nguyên format.”
“OCR file scan tiếng Việt, giữ bảng biểu và ảnh minh họa.”

Đây là phiên bản do tác giả tự phát triển, nên có thể không hoàn toàn phù hợp với mọi trường hợp sử dụng. Bạn nên tự dùng, tự tối ưu và tinh chỉnh lại cho phù hợp với mục tiêu của bản thân.

Bộ Skill Bóc tách PDF Scan dành cho AI Agent

Hướng dẫn cài đặt

Bước 1 - Copy skill vào hệ thống

Bước 2 - Trải nghiệm

Bộ Skill Nghiên cứu PDCA dành cho AI Agent

Agent HR AI Workforce Framework

Bộ Skill Xử lý Văn phòng dành cho AI Agent