Tech Explorer Logo

搜索内容

PDFMathTranslate 一个兼容多款翻译引擎的AI+PDF保留原格式多语言翻译工具

3 min read
Cover image for PDFMathTranslate 一个兼容多款翻译引擎的AI+PDF保留原格式多语言翻译工具

PDFMathTranslate 是一个强大的PDF文档翻译工具,它能够在翻译的同时保留原文档中的公式、图表、目录和注释格式,且支持多种翻译引擎,同时也可以接入AI(Ollama、openAI)。本文将详细介绍如何安装和使用这个工具。

主要特性

  • 支持多种语言之间的互译
  • 保留原文档的排版格式
  • 提供命令行和图形界面两种使用方式
  • 支持多种翻译服务(Google、DeepL、Ollama等)
  • 支持Docker容器化部署

快速开始

1. 本地安装

首先确保您的系统满足以下要求:

  • Python 3.8-3.11
  • pip包管理器

执行以下命令安装:

   pip install pdf2zh

2. Docker部署

如果您倾向于使用Docker,可以通过以下命令快速部署:

   docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zh

部署完成后访问 http://localhost:7860 即可使用Web界面。

pdfmathtranslate-hero-02.png

使用教程

1. 命令行使用

基本翻译命令:

   pdf2zh your_document.pdf

指定翻译语言:

   # 将英文文档翻译成中文
pdf2zh your_document.pdf -li en -lo zh

2. 图形界面使用

启动图形界面(本质上就是 gradio写得webui):

   pdf2zh -i

3. 使用Ollama翻译服务

要使用Ollama服务,需要进行以下配置:

  1. 设置Ollama服务器地址:
   export OLLAMA_HOST=http://your_ollama_server:11434
  1. 在图形界面中:
    • 选择Ollama作为翻译服务
    • 在Model ID中输入模型名称(如:qwen2:7b-instruct)

环境变量配置

1. 模型存储位置

项目中使用Hugging Face的模型库 DocLayout-YOLO-DocStructBench,如果您想自定义模型下载位置,可以设置以下环境变量:

   export HF_HOME=/path/to/your/models

这样模型将被下载到指定目录而不是默认的用户目录。

2. Ollama服务配置

设置Ollama服务器地址:

   export OLLAMA_HOST=http://localhost:11434  # 默认地址
# 或
export OLLAMA_HOST=http://your_server:11434  # 自定义地址

3. 其他翻译服务配置

对于其他翻译服务,需要设置相应的API密钥:

   # DeepL
export DEEPL_AUTH_KEY=your_key

# DeepLX
export DEEPLX_AUTH_KEY=your_key

# Azure
export AZURE_APIKEY=your_key

# OpenAI
export OPENAI_API_KEY=your_key
Share

更多文章

相关文章

暂无相关文章