← 返回
未分类

Pugongying Data Skill

蒲公英数据开发工程师Skill套件 - 专为数据开发工程师设计的完整AI Skill生态系统。 包含7个核心模块:需求分析、架构设计、数据建模、SQL开发、ETL Pipeline、数据质量、数据测试。 当用户需要端到端数据开发解决方案、数据仓库建设、ETL开发、SQL优化、数据质量管理时触发。 触发词:数据开发...
蒲公英数据开发工程师Skill套件——专为数据开发工程师打造的全链路AI Skill生态系统,涵盖需求分析、架构设计、数据建模、SQL开发、ETL Pipeline、数据质量、数据测试7大核心模块,适用于端到端数据开发、数据仓库建设、ETL与SQL优化、数据质量管理。触发词:数据开发
shixiangyu2
未分类 clawhub v1.0.1 2 版本 100000 Key: 无需
★ 5
Stars
📥 576
下载
💾 22
安装
2
版本
#claude#data-engineering#data-modeling#data-quality#data-testing#data-warehouse#etl#latest#openclaw#sql

概述

🌼 蒲公英数据开发工程师Skill套件

专为数据开发工程师设计的完整AI Skill生态系统,包含7个核心模块,支持端到端数据开发工作流。

🎯 核心价值

  • 端到端覆盖:从需求分析到数据测试的完整数据开发生命周期
  • 模块化设计:7个独立模块,可按需组合使用
  • 智能联动:模块间自动数据流转,减少重复工作
  • 企业级标准:遵循数据工程最佳实践和行业标准

📦 模块概览

模块入口命令核心功能适用场景
------------------------------------
需求分析助手/requirement-analyst业务需求分析、功能规格定义项目启动、需求澄清
架构设计助手/architecture-designer数据架构设计、技术选型系统设计、架构评审
数据建模助手/modeling-assistant维度建模、dbt开发、血缘分析数仓建设、模型设计
SQL智能开发助手/sql-assistantSQL生成、审查、执行计划分析查询开发、性能优化
ETL Pipeline开发助手/etl-assistantETL代码生成、审查、测试数据管道开发
数据质量检查助手/dq-assistant质量规则生成、检查、文档数据质量管理
测试工程师/test-engineer单元测试、集成测试、性能测试数据测试保障

🚀 快速开始

方式1:端到端工作流(推荐)

# 完整数仓建设工作流
/skill-hub 端到端建设电商数仓

# 快速Pipeline开发
/sql-assistant → /etl-assistant 生成订单数据同步Pipeline

# 质量到测试
/dq-assistant → /test-engineer 基于质量规则生成测试用例

方式2:独立模块使用

# 需求分析
/requirement-analyst 分析电商用户行为分析需求

# SQL开发
/sql-assistant 生成用户活跃度分析SQL

# ETL开发
/etl-assistant 创建用户行为数据ETL Pipeline

📋 示例快速索引

需求场景推荐工作流命令示例
-------------------------------
从零建设数仓端到端工作流/skill-hub 端到端建设电商数仓
需求澄清需求分析/requirement-analyst 分析需求
架构选型需求到架构/requirement-analyst → /architecture-designer
数据建模架构到建模/architecture-designer → /modeling-assistant
生成SQL建模到SQL/modeling-assistant → /sql-assistant
开发PipelineSQL到ETL/sql-assistant → /etl-assistant
质量监控ETL到质量/etl-assistant → /dq-assistant
生成测试质量到测试/dq-assistant → /test-engineer
部署上线测试驱动部署/test-engineer 验证并部署
快速建模开发建模到开发/modeling-assistant → /sql-assistant → /etl-assistant

🔗 上下游联动说明

完整数据流

requirement_package.yaml
    ↓(业务需求、实体定义)
architecture_package.yaml
    ↓(分层架构、技术栈)
modeling_package.yaml
    ↓(事实表、维度表)
sql_package.yaml
    ↓(DDL、转换SQL)
etl_package.yaml
    ↓(Pipeline代码)
dq_package.yaml
    ↓(质量规则)
test_package.yaml
    ↓(测试通过)
部署上线

快捷联动命令

联动命令输出
------------------
需求→架构/architecture-designer --from-requirementarchitecture_package.yaml
架构→建模/model-design --from-architecturemodeling_package.yaml
建模→SQL/sql-gen --from-modelsql_package.yaml
建模→ETL/etl-template --from-modeletl_package.yaml
SQL→ETL/etl-template --from-sqletl_package.yaml
ETL→质量/dq-rule-gen --from-etldq_package.yaml
质量→测试/unit-test --from-dqtest_package.yaml

🔗 智能联动系统

本Skill套件包含智能联动中枢,支持模块间自动数据流转:

需求分析 → 架构设计 → 数据建模 → SQL开发 → ETL开发 → 质量检查 → 数据测试

联动配置

查看详细联动关系:

# 查看Skill依赖关系
cat skill-connections.yaml

# 查看完整工作流定义
cat skill-hub.md

📁 项目结构

pugongying-data-skills/
├── SKILL.md                    # 本文件(主Skill定义)
├── README.md                   # 详细文档
├── skill-connections.yaml      # Skill联动配置
├── skill-hub.md               # 联动中枢文档
├── requirement-analyst/        # 需求分析模块
├── architecture-designer/      # 架构设计模块
├── modeling-assistant/         # 数据建模模块
├── sql-assistant/             # SQL开发模块
├── etl-assistant/             # ETL开发模块
├── dq-assistant/              # 数据质量模块
└── test-engineer/             # 数据测试模块

🛠️ 技术特色

1. 标准化输出格式

每个模块输出标准化的YAML包文件,便于模块间数据交换:

包文件生成者主要用途
--------------------------
requirement_package.yamlrequirement-analyst业务需求、数据实体、指标定义
architecture_package.yamlarchitecture-designer架构决策、分层设计、技术栈
modeling_package.yamlmodeling-assistant事实表、维度表、SCD策略
sql_package.yamlsql-assistantSQL代码、表结构、优化建议
etl_package.yamletl-assistantPipeline代码、DAG配置、调度策略
dq_package.yamldq-assistant质量规则、检查结果、数据字典
test_package.yamltest-engineer测试用例、测试报告、部署决策

标准包格式

{package_name}:
  version: "1.0"
  metadata:
    generated_by: "skill-name"
    generated_at: "2024-01-15T10:00:00Z"
    upstream_package: "上游包文件名"
  content: { ... }
  downstream_specs:
    - target: "下游skill"
      input_file: "{package_name}.yaml"

2. 多Agent协作

  • general-purpose Agent:用于生成、编辑、执行任务
  • Explore Agent:用于分析、审查、只读操作
  • 智能Agent切换,确保安全性和效率

3. 企业级最佳实践

  • 数据建模:星型/雪花模型、SCD策略
  • SQL开发:性能优化、安全审查
  • ETL开发:幂等性、容错处理
  • 数据质量:完整性、准确性、一致性检查

📚 学习资源

套件文档

文档内容场景
------------------
README.md详细功能说明和使用指南了解套件全貌
skill-connections.yamlSkill联动配置查看模块间关系
skill-hub.md联动中枢文档了解工作流定义
skill-template.mdSkill开发模板开发新Skill
Skill驱动数据系统开发探讨.md设计理念和技术探讨深入理解设计思想

各模块文档

模块参考文档示例
----------------------
requirement-analystreferences/requirement-standards.mdexamples/
architecture-designerreferences/architecture-standards.mdexamples/
modeling-assistantreferences/data-modeling-standards.mdexamples/
sql-assistantreferences/sql-standards.mdexamples/
etl-assistantreferences/etl-standards.mdexamples/
dq-assistantreferences/data-quality-standards.mdexamples/
test-engineerreferences/test-standards.mdexamples/

🔄 版本管理

版本号规则

  • v1.0.0:基础功能发布
  • v1.1.0:功能增强和优化
  • v2.0.0:重大架构升级

更新日志

查看各模块内的CHANGELOG.md文件获取详细更新记录。

🆘 故障排除

常见问题

  1. Skill未触发
    • 确认skill文件在正确的skills目录
    • 检查Frontmatter格式是否正确
    • 重启Claude Code
  1. 模块联动失败
    • 检查skill-connections.yaml配置
    • 确认输出包文件格式正确
    • 查看模块日志输出
  1. 性能问题
    • 复杂任务建议分步骤执行
    • 使用多Agent并行处理
    • 优化输入描述,提供更明确的上下文

技术支持

  • 查看各模块的故障排除章节
  • 参考示例项目学习正确用法
  • 在ClawHub社区寻求帮助

🌟 未来规划

近期计划

  • 增加更多数据库方言支持
  • 优化联动性能
  • 增加可视化输出

长期愿景

  • 集成更多数据工具(dbt、Airflow、Great Expectations等)
  • 支持更多数据架构模式(Data Vault、Lakehouse等)
  • 建立数据开发社区和最佳实践库

蒲公英数据开发工程师Skill套件 - 让数据开发更智能、更高效、更可靠。

🌼 像蒲公英种子一样,将数据开发的最佳实践传播到每一个项目

版本历史

共 2 个版本

  • v1.0.1 当前
    2026-05-03 04:38 安全 安全
  • v1.0.0
    2026-03-30 12:28 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

AppDev Skill - 通用应用软件开发工作流

shixiangyu2
通用应用软件开发完整工作流(HarmonyOS版)。支持从需求到部署的全流程开发管理。 包含:产品功能设计、代码生成、TDD开发、调试诊断、编译验证、版本管理。 适用于各类HarmonyOS应用的快速开发。 当用户需要开发HarmonyOS
★ 0 📥 587

PRD FullStack Skill

shixiangyu2
全栈PRD协作工作流。与用户共同探讨,产出可供开发、设计、测试、运营、项目经理使用的完整PRD文档。 包含:需求分析、原型设计、UI规范、技术方案、测试方案、运营方案、项目计划等14个章节。 当用户说"帮我写PRD"、"做完整需求文档"、"
★ 7 📥 1,304

模型蒸馏大师

shixiangyu2
模型蒸馏大师:将大模型能力迁移到小模型的完整工作流。 支持自适应蒸馏、课程学习、能力感知、对抗训练、多维度评估。 触发词:「蒸馏模型」「把XX模型蒸馏到YY」「压缩模型」「做小模型」「教师模型分析」。 默认学生模型:gemma-3-4b-i
★ 0 📥 381