将文件转换为可继续分析的 Markdown 或文本。默认把当前 Agent / 平台的文件解析能力放在第一优先级;得理 OCR 只作为兜底能力。
对每个文件先使用当前 Agent 或平台已有能力解析:
pdfplumber、PyMuPDF 或同类本地解析。python-docx、openpyxl、CSV/JSON 解析。满足以下条件时,视为原生解析成功,不要调用得理 OCR:
只有出现以下情况才使用 scripts/parse_file.py:
运行示例:
python3 scripts/parse_file.py <input_file> --output_dir <output_directory> --save-response
常用参数:
--lang zh-cn+en:OCR 语言,默认中文加英文。--task-type file_parsing:接口任务类型,默认通用文件解析;也可按场景设为 pdf_to_markdown、image_ocr、document_ocr。--save-response:同时保存接口原始 JSON,便于排查。输出:
<原文件名>.md:可继续交给其他 skill 或 Agent 分析的 Markdown。<原文件名>.ocr.json:仅在 --save-response 时生成的接口响应。对目录中的多个文件逐个判断,避免对已经能解析的文件重复调用 OCR。推荐输出到单独目录:
parsed/
├── 01_合同扫描件.md
├── 02_付款回单.md
└── raw_response/
后续证据整理、合同审查、法律意见书等任务应直接使用已解析的 Markdown / 文本结果。
得理接口支持以下上传格式:
| 类型 | 扩展名 |
|---|---|
| ------ | -------- |
| 文档 | .pdf、.docx、.doc、.docm、.dotm、.rtf、.txt、.ofd |
| 表格 | .xlsx、.xls |
| 图片 | .png、.jpeg、.gif、.bmp、.img |
| 网页 | .html |
如果文件格式不支持,先提示用户转换格式,不要调用接口。
config.json 文件:```json
{
"apikey": "你的API Key"
}
```
> ⚠️ 未配置 API Key 时,不得执行检索,必须先提示用户:
> "config.json 中的 apikey 尚未配置。请前往 https://open.delilegal.com/personal/keys 创建 API Key,并填入技能目录下的 config.json 文件中。"
配置说明:
apikey:得理开放平台 API Key。openapiBaseUrl:可选,用于覆盖默认接口地址;正式环境通常不需要配置。EVIDENCE_OCR_API_URL、EVIDENCE_OCR_API_TOKEN、EVIDENCE_FILE_API_TOKEN、AILAWYERS_API_KEY。config.json 已配置 apikey 就自动调用得理 OCR。.md 或 .txt 文件。共 1 个版本