PDFMathTranslate 一个兼容多款翻译引擎的AI+PDF保留原格式多语言翻译工具
· 3 min read
PDFMathTranslate 是一个强大的PDF文档翻译工具,它能够在翻译的同时保留原文档中的公式、图表、目录和注释格式,且支持多种翻译引擎,同时也可以接入AI(Ollama、openAI)。本文将详细介绍如何安装和使用这个工具。
主要特性
- 支持多种语言之间的互译
- 保留原文档的排版格式
- 提供命令行和图形界面两种使用方式
- 支持多种翻译服务(Google、DeepL、Ollama等)
- 支持Docker容器化部署
快速开始
1. 本地安装
首先确保您的系统满足以下要求:
- Python 3.8-3.11
- pip包管理器
执行以下命令安装:
pip install pdf2zh
2. Docker部署
如果您倾向于使用Docker,可以通过以下命令快速部署:
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zh
部署完成后访问 http://localhost:7860
即可使用Web界面。
使用教程
1. 命令行使用
基本翻译命令:
pdf2zh your_document.pdf
指定翻译语言:
# 将英文文档翻译成中文
pdf2zh your_document.pdf -li en -lo zh
2. 图形界面使用
启动图形界面(本质上就是 gradio写得webui):
pdf2zh -i
3. 使用Ollama翻译服务
要使用Ollama服务,需要进行以下配置:
- 设置Ollama服务器地址:
export OLLAMA_HOST=http://your_ollama_server:11434
- 在图形界面中:
- 选择Ollama作为翻译服务
- 在Model ID中输入模型名称(如:qwen2:7b-instruct)
环境变量配置
1. 模型存储位置
项目中使用Hugging Face的模型库 DocLayout-YOLO-DocStructBench
,如果您想自定义模型下载位置,可以设置以下环境变量:
export HF_HOME=/path/to/your/models
这样模型将被下载到指定目录而不是默认的用户目录。
2. Ollama服务配置
设置Ollama服务器地址:
export OLLAMA_HOST=http://localhost:11434 # 默认地址
# 或
export OLLAMA_HOST=http://your_server:11434 # 自定义地址
3. 其他翻译服务配置
对于其他翻译服务,需要设置相应的API密钥:
# DeepL
export DEEPL_AUTH_KEY=your_key
# DeepLX
export DEEPLX_AUTH_KEY=your_key
# Azure
export AZURE_APIKEY=your_key
# OpenAI
export OPENAI_API_KEY=your_key