← 返回
开发者工具 Key

Mineru Pdf Parser

使用 MinerU API 将 PDF 解析为 Markdown,支持公式、表格、OCR。提供本地文件和在线 URL 两种解析方式。触发条件:(1) 用户说"解析 PDF [路径]",(2) 用户说"将 PDF 转为 Markdown",(3) 在 paper-workflow 中自动调用。使用场景:学术论文解析...
使用 MinerU API 将 PDF 解析为 Markdown,支持公式、表格、OCR。提供本地文件和在线 URL 两种解析方式。触发条件:(1) 用户说"解析 PDF [路径]",(2) 用户说"将 PDF 转为 Markdown",(3) 在 paper-workflow 中自动调用。使用场景:学术论文解析...
alex-zxyz alex-zxyz 来源
开发者工具 clawhub v3.0.3 3 版本 99877.8 Key: 需要
★ 1
Stars
📥 797
下载
💾 156
安装
3
版本
#latest

概述

PDF Parser Skill

基于 MinerU 提供 PDF 解析能力。

功能

  • PDF 解析: 将 PDF 转换为 Markdown 格式
  • 公式识别: 支持 LaTeX 公式提取
  • 表格识别: 自动识别并转换表格结构
  • OCR: 支持图片型 PDF 文字识别
  • 多语言: 支持中文、英文,日文、韩文等

⚠️ 安装前必读

使用本技能即表示:

  1. 你愿意提供你的 MinerU API Token (MINERU_TOKEN)
  2. Token 会被发送给 https://mineru.net/
  3. 确认 MinerU 服务可信,接受其隐私政策
  4. 已在本地源码中确认无额外意外行为

前提条件

1. 安装依赖

pip install requests

2. 获取 MinerU Token

访问 注册并获取 API Token。

3. 设置环境变量

Windows (PowerShell):

$env:MINERU_TOKEN = "your-token-here"

macOS / Linux:

export MINERU_TOKEN=your-token-here

支持的引擎

引擎说明
------------
vlmVLM 引擎(默认)
pipeline管道引擎
MinerU-HTMLHTML 输出

快速开始

# 解析 PDF (默认 vlm 引擎)
python scripts/mineru_api.py -f <pdf路径> --wait

# 指定引擎
python scripts/mineru_api.py -f <pdf路径> --engine pipeline --wait

选项

参数说明默认值
--------------------
-f, --files本地 PDF 文件-
--engine解析引擎vlm
--lang语言 (ch/en/ja/ko)ch
--wait等待解析完成

环境变量

变量必填说明
------------------
MINERU_TOKENMinerU API Token

输出

解析结果保存在 ~/.openclaw/MinerU_Results/ 目录下。

工作流

  1. 设置 MINERU_TOKEN 环境变量
  2. 执行解析命令
  3. 等待解析完成
  4. 读取 full.md 分析内容
  5. 根据内容重命名目录

版本历史

共 3 个版本

  • v3.0.3 当前
    2026-03-29 15:03 安全 安全
  • v3.0.2
    2026-03-26 22:18
  • v1.0.0
    2026-03-11 17:45

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

office-efficiency

Excel / XLSX

ivangdavila
创建、检查和编辑 Microsoft Excel 工作簿及 XLSX 文件,支持可靠的公式、日期、类型、格式、重算及模板保留功能。
★ 372 📥 142,617

minimax-plan-usage

alex-zxyz
查询 MiniMax Token Plan 剩余用量。slash command。 查询 MiniMax Token Plan 剩余次数和重置时间,支持 M2.7/Speech/视频/图片/音乐等模型的用量查询。 Query MiniMax
★ 1 📥 480
office-efficiency

Word / DOCX

ivangdavila
创建、检查和编辑 Microsoft Word 文档及 DOCX 文件,支持样式、编号、修订记录、表格、分节符及兼容性检查等功能。
★ 447 📥 149,903