
关于
将签证申请文件(图片)翻译为英文,并创建包含原文和译文的双语 PDF。
name: visa-doc-translate description: 翻译签证申请文件(图片)为英文,并创建包含原文和译文的双语PDF
你正在帮助翻译签证申请所需的文件。
操作说明
当用户提供图片文件路径时,自动执行以下步骤,无需确认:
-
图片转换:如果文件是HEIC格式,使用
sips -s format png <input> --out <output>转换为PNG -
图片旋转:
- 检查EXIF方向数据
- 根据EXIF数据自动旋转图片
- 如果EXIF方向为6,逆时针旋转90度
- 根据需要进行额外旋转(如文档倒置则尝试旋转180度)
-
OCR文字提取:
- 自动尝试多种OCR方法:
- macOS Vision框架(macOS首选)
- EasyOCR(跨平台,无需tesseract)
- Tesseract OCR(如可用)
- 提取文档中的所有文字信息
- 识别文档类型(存款证明、在职证明、退休证明等)
- 自动尝试多种OCR方法:
-
翻译:
- 将所有文字内容专业翻译为英文
- 保持原始文档结构和格式
- 使用适合签证申请的专业术语
- 保留原文中的专有名词,英文放在括号内
- 中文姓名使用拼音格式(如 WU Zhengye)
- 准确保留所有数字、日期和金额
-
PDF生成:
- 使用PIL和reportlab库创建Python脚本
- 第1页:显示旋转后的原始图片,居中缩放适应A4页面
- 第2页:显示英文翻译,格式规范:
- 标题居中加粗
- 内容左对齐,间距适当
- 适合正式文件的专业排版
- 底部添加注释:"This is a certified English translation of the original document"
- 执行脚本生成PDF
-
输出:在同一目录下创建名为
<原始文件名>_Translated.pdf的PDF文件
支持的文档类型
- 银行存款证明
- 收入证明
- 在职证明
- 退休证明
- 房产证明
- 营业执照
- 身份证和护照
- 其他官方文件
技术实现
OCR方法(按优先顺序尝试)
-
macOS Vision框架(仅限macOS):
import Vision from Foundation import NSURL -
EasyOCR(跨平台):
pip install easyocr -
Tesseract OCR(如可用):
brew install tesseract tesseract-lang pip install pytesseract
必需的Python库
pip install pillow reportlab
macOS Vision框架需要:
pip install pyobjc-framework-Vision pyobjc-framework-Quartz
重要准则
- 不要在每个步骤询问用户确认
- 自动确定最佳旋转角度
- 如果一种OCR方法失败,尝试其他方法
- 确保所有数字、日期和金额翻译准确
- 使用简洁、专业的格式
- 完成整个流程后报告最终PDF位置
使用示例
/visa-doc-translate RetirementCertificate.PNG
/visa-doc-translate BankStatement.HEIC
/visa-doc-translate EmploymentLetter.jpg
输出示例
该技能将:
- 使用可用的OCR方法提取文字
- 翻译为专业英文
- 生成
<文件名>_Translated.pdf,包含:- 第1页:原始文档图片
- 第2页:专业英文翻译
适用于澳大利亚、美国、加拿大、英国及其他需要翻译文件的国家的签证申请。
兼容工具
Claude CodeCursor
标签
前端开发
