开源pdf翻译工具(PDFMathTranslate) 一个兼容多款翻译引擎的AI+PDF保留原格式多语言翻译工具
3 min read

PDFMathTranslate 是一个强大的PDF文档翻译工具,它能够在翻译的同时保留原文档中的公式、图表、目录和注释格式,且支持多种翻译引擎,同时也可以接入AI(Ollama、openAI)。本文将详细介绍如何安装和使用这个工具。
主要特性
- 支持多种语言之间的互译
- 保留原文档的排版格式
- 提供命令行和图形界面两种使用方式
- 支持多种翻译服务(Google、DeepL、Ollama等)
- 支持Docker容器化部署
快速开始
1. 本地安装
首先确保您的系统满足以下要求:
- Python 3.8-3.11
- pip包管理器
执行以下命令安装:
pip install pdf2zh
2. Docker部署
如果您倾向于使用Docker,可以通过以下命令快速部署:
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zh
部署完成后访问 http://localhost:7860
即可使用Web界面。

使用教程
1. 命令行使用
基本翻译命令:
pdf2zh your_document.pdf
指定翻译语言:
# 将英文文档翻译成中文
pdf2zh your_document.pdf -li en -lo zh
2. 图形界面使用
启动图形界面(本质上就是 gradio写得webui):
pdf2zh -i
3. 使用Ollama翻译服务
要使用Ollama服务,需要进行以下配置:
- 设置Ollama服务器地址:
export OLLAMA_HOST=http://your_ollama_server:11434
- 在图形界面中:
- 选择Ollama作为翻译服务
- 在Model ID中输入模型名称(如:qwen2:7b-instruct)
环境变量配置
1. 模型存储位置
项目中使用Hugging Face的模型库 DocLayout-YOLO-DocStructBench
,如果您想自定义模型下载位置,可以设置以下环境变量:
export HF_HOME=/path/to/your/models
这样模型将被下载到指定目录而不是默认的用户目录。
2. Ollama服务配置
设置Ollama服务器地址:
export OLLAMA_HOST=http://localhost:11434 # 默认地址
# 或
export OLLAMA_HOST=http://your_server:11434 # 自定义地址
3. 其他翻译服务配置
对于其他翻译服务,需要设置相应的API密钥:
# DeepL
export DEEPL_AUTH_KEY=your_key
# DeepLX
export DEEPLX_AUTH_KEY=your_key
# Azure
export AZURE_APIKEY=your_key
# OpenAI
export OPENAI_API_KEY=your_key
更多文章

企业级部署实操:SGLang 多节点集群部署 Qwen 系列大模型

重磅!OpenAI 发布全能推理模型 o3 与高效型 o4-mini

开源DeepSeek推理引擎:推动AI基础设施的社区协作新篇章

Meta Llama 4涉嫌刷榜争议与高管离职风波交织,AI战略面临考验

一文秒懂AI核心技术:MCP、Agent、RAG、Function Call的协同之道

Qwen2.5-Omni 全能旗舰 VS 国产小钢炮 MiniCPM-V:参数、硬件、资源、优势全解析,谁才是真香之选?

DeepSeek-V3-0324 更新:全面提升的推理与创作能力

AI巨头正面交锋:Grok 3图片编辑功能横空出世,谷歌Gemini措手不及?

Mistral Small 3.1:轻量级大模型的王者归来,能否撼动Gemma 3的霸主地位?