本技能对任意类型的文档进行审核,聚焦四大核心问题:
| 问题类型 | 说明 | 优先级 |
|---|---|---|
| ---------- | ------ | -------- |
| 逻辑冲突 | 前后矛盾、论述打架、论据与结论不一致 | 高 |
| 事实冲突 | 数据矛盾、时间线错误、引用来源冲突 | 高 |
| 文字错误 | 错别字、语病、标点错误、格式不一致 | 中 |
| 逻辑混乱 | 结构散乱、论证跳跃、归因谬误、重复冗余 | 中 |
| 文档类型 | 示例 |
|---|---|
| ---------- | ------ |
| 技术文档 | 技术方案、设计文档、接口文档 |
| 商务文档 | 投标文件、合同、协议、报价单 |
| 研究报告 | 市场分析、行业报告、可行性研究 |
| 内容稿件 | 新闻稿、宣传文、公众号文章 |
| 学术论文 | 毕业论文、研究报告、文献综述 |
| 日常文档 | 邮件、备忘录、会议纪要、规章制度 |
目标:找到并确认文件可访问。
D:\文档\技术方案.docx)项目报告.pdf)投标书)# Windows PowerShell
Get-ChildItem -Path . -Recurse -Include *.docx,*.pdf,*.pptx,*.txt,*.md -ErrorAction SilentlyContinue | Where-Object { $_.Name -like "*关键词*" } | Select-Object FullName, LastWriteTime
# 快速检查文件
Test-Path "文件路径"
(Get-Item "文件路径").Length / 1KB
pip install python-docx
python -c "
from docx import Document
doc = Document('document.docx')
for para in doc.paragraphs:
text = para.text.strip()
if text:
print(text)
for table in doc.tables:
for row in table.rows:
cells = [cell.text.strip() for cell in row.cells if cell.text.strip()]
if cells:
print(' | '.join(cells))
"
pip install pymupdf
python -c "
import fitz
doc = fitz.open('document.pdf')
for i, page in enumerate(doc):
text = page.get_text()
if text.strip():
print(f'=== 第 {i+1} 页 ===')
print(text)
"
pip install python-pptx
python -c "
from pptx import Presentation
prs = Presentation('document.pptx')
for i, slide in enumerate(prs.slides):
print(f'\\n=== 第 {i+1} 页 ===')
for shape in slide.shapes:
if hasattr(shape, 'text') and shape.text.strip():
print(shape.text.strip())
"
Get-Content "document.txt" -Raw
定义:文档内部或与已知事实存在自相矛盾的表述。
常见类型:
| 类型 | 示例 | 检查方法 |
|---|---|---|
| ------ | ------ | ---------- |
| 前后矛盾 | 前文说"功能A已上线",后文说"功能A计划开发" | 对比全文相同关键词的表述 |
| 论据与结论矛盾 | 论据支持方案A,结论却选了方案B | 检查论证链条 |
| 条件矛盾 | "必须"和"可选"同时出现在同一要求 | 检查约束条件表述 |
| 范围矛盾 | 标题说"全面",内容只覆盖部分 | 对比承诺与实际 |
| 时间矛盾 | 里程碑时间倒置 | 检查时间线逻辑 |
检查命令:
# 提取文档后,用 AI 模型进行逻辑冲突分析
# 提示词:
# "请仔细阅读以下文档,标注所有逻辑冲突:
# 1. 前后矛盾的表述(需列出矛盾的两个位置)
# 2. 论据与结论不一致的地方
# 3. 条件或约束相互冲突的地方
# 格式:[冲突位置] 矛盾描述"
定义:与可靠来源或客观事实明显不符的表述。
常见类型:
| 类型 | 示例 | 检查方法 |
|---|---|---|
| ------ | ------ | ---------- |
| 数据矛盾 | 前文"市场份额30%",后文"25%" | 对比全文数据一致性 |
| 时间错误 | 日期早于事件发生时间 | 核查时间线 |
| 引用错误 | 引用的法规、标准已废止 | 核实引用来源时效 |
| 名称错误 | 人物/公司/产品名称不匹配 | 交叉验证 |
| 常识冲突 | 明显违背基本常识的数据 | 结合领域知识判断 |
核查优先级:
常见类型:
| 类型 | 示例 | 检查方法 |
|---|---|---|
| ------ | ------ | ---------- |
| 错别字 | "已得"应为"赢得","象限"应为"选项" | 逐字排查高频错别字 |
| 语病 | "由于...因此..."句式残缺 | 语法分析 |
| 标点错误 | 逗号句号混用、引号不匹配 | 标点一致性检查 |
| 格式不一致 | 同一术语有多种写法 | 术语统一性检查 |
| 繁简混用 | 正文中繁简不统一 | 全局搜索 |
| 数字用法 | "一"和"1"混用、"1990年代"vs"1990s" | 数字格式统一 |
高频错别字参考表:
已得→赢得 / 象限→选项 / 决对→绝对 / 布署→部署
事绩→业绩 / 收届→受到 / 桃战→挑战 / 邦定→绑定
针对于→针对 / 大大的→大大 / 简单点→简单点(口语)
常见类型:
| 类型 | 示例 | 检查方法 |
|---|---|---|
| ------ | ------ | ---------- |
| 结构散乱 | 同一话题分散在多个章节 | 检查段落主题集中度 |
| 论证跳跃 | A→C 缺少 B 作为过渡 | 检查论证链条 |
| 归因谬误 | 相关性当作因果性 | 检查因果关系表述 |
| 重复冗余 | 同一内容反复出现 | 检查重复段落 |
| 归类不清 | 不同层级内容混放 | 检查标题层级 |
| 主语不清 | 句子主语频繁切换 | 检查代词指代 |
# 文档审核报告
**审核文档**: [文档名称]
**审核时间**: YYYY-MM-DD HH:mm
**文档类型**: [技术方案/商务文档/研究报告/etc.]
**文档规模**: XX页 / XX字
---
## 📊 问题概览
| 问题类型 | 数量 | 严重程度 |
|----------|------|----------|
| 逻辑冲突 | X | [高/中/低] |
| 事实冲突 | X | [高/中/低] |
| 文字错误 | X | [高/中/低] |
| 逻辑混乱 | X | [高/中/低] |
| **合计** | **X** | — |
---
## 🔍 逻辑冲突
### 位置:[第X页 / 标题]
**问题描述**:
[矛盾的具体表述]
**冲突分析**:
- 冲突点A:[内容]
- 冲突点B:[内容]
- 矛盾原因:[分析]
**修改建议**:
[具体修改方案]
---
## 🔍 事实冲突
### 位置:[第X页 / 标题]
**问题描述**:
[与事实不符的具体表述]
**事实依据**:
[正确的客观事实]
**修改建议**:
[具体修改方案]
---
## 🔍 文字错误
### 错别字
| 位置 | 错误 | 正确 | 说明 |
|------|------|------|------|
| 第X页 | [错误字] | [正确字] | [原因] |
### 语病
| 位置 | 问题句子 | 修改建议 |
|------|----------|----------|
| 第X页 | [病句] | [修改后] |
### 标点/格式问题
| 位置 | 问题 | 修改建议 |
|------|------|----------|
| 第X页 | [问题描述] | [修改建议] |
---
## 🔍 逻辑混乱
### 位置:[第X页 / 标题]
**问题类型**:[结构散乱/论证跳跃/归因谬误/etc.]
**问题描述**:
[混乱的具体表现]
**修改建议**:
[具体修改方案]
---
## 💡 综合改进建议
### 高优先级(必须修改)
1. [最重要的问题及修改方案]
### 中优先级(建议修改)
2. [次要问题及修改方案]
### 低优先级(可选优化)
3. [小问题或风格优化]
---
## 📋 问题清单汇总
| # | 类型 | 位置 | 问题简述 | 优先级 |
|---|------|------|----------|--------|
| 1 | 逻辑冲突 | 第X页 | [简述] | 高 |
| 2 | 事实冲突 | 第X页 | [简述] | 高 |
| 3 | 文字错误 | 第X页 | 错别字:[字] | 中 |
---
## 🎯 总结
### 整体评价
[对文档进行整体评价,100字以内]
### 建议
- ✅ **建议**:**[修改后可直接使用/需重大修改后使用]**
- 📝 **主要问题**:**[最需要优先解决的一到两个问题]**
| 等级 | 说明 | 处理建议 |
|---|---|---|
| ------ | ------ | ---------- |
| 高 | 严重影响文档可信度或合规性,如事实性数据错误、法规引用错误、核心结论自相矛盾 | 必须修改 |
| 中 | 影响文档专业性或阅读体验,如次要段落逻辑混乱、少量错别字、格式不统一 | 建议修改 |
| 低 | 轻微问题,如表述可更精炼、个别用词可优化 | 可选修改 |
# 搜索文档中某术语出现的位置
Select-String -Path "*.docx" -Pattern "关键词" -Recurse
# 搜索矛盾表述(如同时出现"必须"和"可选")
Select-String -Path "*.docx" -Pattern "必须" -Recurse
Select-String -Path "*.docx" -Pattern "可选" -Recurse
# 逻辑冲突检测提示词
请仔细阅读以下文档,逐一标注所有逻辑冲突:
- 前后矛盾的表述(列出矛盾双方及各自位置)
- 论据与结论不一致的地方
- 同一约束条件相互矛盾的地方
输出格式:[位置] 矛盾描述
# 事实冲突检测提示词
请核查以下文档中的事实陈述,重点检查:
- 涉及数据的内容(比例、金额、人数)
- 涉及时间的内容(日期、期限)
- 涉及法规标准的内容(法规名称、条款号)
如发现与客观事实不符,请标注。
输出格式:[位置] 问题描述 | 正确事实
# 文字错误检测提示词
请检查以下文档的文字错误:
- 错别字
- 语法病句
- 标点符号错误
- 格式不统一(如繁简混用、数字格式不统一)
输出格式:[位置] 错误内容 | 修改建议
# Word处理
pip install python-docx
# PDF处理
pip install pymupdf
# PPT处理
pip install python-pptx
共 1 个版本