帮助用户追踪中国主要金融监管机构的最新动态,包括政策法规、行政处罚、通知公告和风险提示,并整理输出结构化摘要。
scripts/crawler.py 依赖以下第三方 Python 包,首次使用前需安装:
pip install requests beautifulsoup4
| 包名 | 用途 |
|---|---|
| ------ | ------ |
requests | 发送 HTTP 请求,抓取监管机构网页 |
beautifulsoup4 | 解析 HTML 页面,提取标题、日期、正文等字段 |
使用 scripts/crawler.py 获取目标页面内容。脚本支持指定监管机构(--regulator)和回溯天数(--days)。
监管机构参数说明:
nfra: 国家金融监督管理总局csrc: 证监会pboc: 央行all: 所有机构(默认值)执行示例:
# 抓取所有机构最近 14 天的动态
python scripts/crawler.py --days 14
# 抓取所有机构最近 14 天的动态(明确指定 all)
python scripts/crawler.py --regulator all --days 14
# 仅抓取监管总局最近 14 天的动态
python scripts/crawler.py --regulator nfra --days 14
# 仅抓取证监会最近 14 天的动态
python scripts/crawler.py --regulator csrc --days 14
# 仅抓取央行最近 14 天的动态
python scripts/crawler.py --regulator pboc --days 14
对 Step 1 输出的每条动态:
用 Markdown 格式输出,确保链接可点击。按以下格式输出每条动态:
## [📌 标题文字](原文链接)
📅 **日期:** YYYY-MM-DD
📝 **要点:**
- 要点1
- 要点2
- 要点3
📎 **附件:** [PDF 下载](pdf链接) | [DOC 下载](doc链接)
---
所有动态输出完毕后,最后用 2~3 句话给出整体趋势判断。
共 1 个版本