Home

PDFMathTranslate 一个兼容多款翻译引擎的AI+PDF保留原格式多语言翻译工具

Published

- 3 min read

img of PDFMathTranslate 一个兼容多款翻译引擎的AI+PDF保留原格式多语言翻译工具

PDFMathTranslate 是一个强大的PDF文档翻译工具,它能够在翻译的同时保留原文档中的公式、图表、目录和注释格式,且支持多种翻译引擎,同时也可以接入AI(Ollama、openAI)。本文将详细介绍如何安装和使用这个工具。

主要特性

  • 支持多种语言之间的互译
  • 保留原文档的排版格式
  • 提供命令行和图形界面两种使用方式
  • 支持多种翻译服务(Google、DeepL、Ollama等)
  • 支持Docker容器化部署

快速开始

1. 本地安装

首先确保您的系统满足以下要求:

  • Python 3.8-3.11
  • pip包管理器

执行以下命令安装:

    pip install pdf2zh  

2. Docker部署

如果您倾向于使用Docker,可以通过以下命令快速部署:

    docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zh  

部署完成后访问 http://localhost:7860 即可使用Web界面。

pdfmathtranslate-hero-02.png

使用教程

1. 命令行使用

基本翻译命令:

    pdf2zh your_document.pdf  

指定翻译语言:

    # 将英文文档翻译成中文
pdf2zh your_document.pdf -li en -lo zh  

2. 图形界面使用

启动图形界面(本质上就是 gradio写得webui):

    pdf2zh -i  

3. 使用Ollama翻译服务

要使用Ollama服务,需要进行以下配置:

  1. 设置Ollama服务器地址:
    export OLLAMA_HOST=http://your_ollama_server:11434  
  1. 在图形界面中:
    • 选择Ollama作为翻译服务
    • 在Model ID中输入模型名称(如:qwen2:7b-instruct)

环境变量配置

1. 模型存储位置

项目中使用Hugging Face的模型库 DocLayout-YOLO-DocStructBench ,如果您想自定义模型下载位置,可以设置以下环境变量:

    export HF_HOME=/path/to/your/models  

这样模型将被下载到指定目录而不是默认的用户目录。

2. Ollama服务配置

设置Ollama服务器地址:

    export OLLAMA_HOST=http://localhost:11434  # 默认地址
# 或
export OLLAMA_HOST=http://your_server:11434  # 自定义地址  

3. 其他翻译服务配置

对于其他翻译服务,需要设置相应的API密钥:

    # DeepL
export DEEPL_AUTH_KEY=your_key

# DeepLX
export DEEPLX_AUTH_KEY=your_key

# Azure
export AZURE_APIKEY=your_key

# OpenAI
export OPENAI_API_KEY=your_key  

相关文章

There are no related posts yet. 😢