← 返回
未分类

Character_Skill_Producer

二次元角色技能蒸馏器。输入角色名+作品名,本地检索核心资料→交叉验证→行为蒸馏→生成可运行、可追溯、可更新的角色Skill。 触发词:「生成XX的skill」「蒸馏XX」「做一个XX角色」「把XX变成skill」「造一个XX」「/csp」。 模糊需求也触发:「想聊一个傲娇角色」「有没有病娇推荐」「帮我做一个XX作品里的角色」。 依赖 Python;核心站点优先走本地脚本,网页搜索 skill / MCP / WebFetch 只作为补强和失败兜底。
|Character Skill Producer — distill anime characters into executable agent skills 丰川祥子和三角初华的关系调研文件因为包含不健康内容已删除
user_89e792ab
未分类 community v1.0.1 2 版本 95238.1 Key: 无需
★ 0
Stars
📥 20
下载
💾 0
安装
2
版本
#latest

概述

CSP · Character Skill Producer

> 把二次元角色变成可运行的 agent 行为包。不是角色卡,不是设定集,是可执行的行为程序。

核心理念

CSP 做的不是复制角色台词,而是蒸馏角色的行为操作系统

一个好的角色 Skill 应该回答:

  • 她在不同情境下如何反应
  • 她的话怎么说出来
  • 怎么理解别人的意图?
  • 她在价值冲突时先保什么、牺牲什么
  • 绝对不会做什么?
  • 她的资料覆盖到哪一天,之后的新剧情如何更新?

关键区分:捕捉的是 HOW she behaves,不是 WHAT she said。标签是给人看的,行为规则是给 AI 执行的。

产品哲学:角色不是资料页,而是一套可运行的反应系统

CSP 的目标不是把 Wiki 重新写一遍,也不是把角色台词整理成 prompt。Wiki 告诉用户「发生过什么」,CSP 要告诉 agent「在一个新情境里,这个角色会如何活着」。

一个高质量角色 Skill 至少包含六个可运行层:

问题失败时的样子
---------
行为镜片她先注意什么、忽略什么?只会复述设定
反应规则什么情境下靠近、逃开、攻击、沉默?所有问题都同一种语气
表达 DNA句长、停顿、敬语、自称、情绪泄露如何组合?只贴口癖
关系算法她如何判断善意、背叛、亲近、利用?对所有用户都一样热情
决策底线价值冲突时先保什么、牺牲什么?角色被用户轻易说服
诚实边界哪些不知道、哪些过期、哪些只是推测?硬编新剧情

关键原则:写得进去的是行为程序,写不进去的才保留为边界。 角色的神秘感不是靠含糊制造,而是靠承认资料、视角和推断能力的限制。

未来使用场景

CSP 面向二次元创作者提供一套可共享的角色行为基础设施,让角色 Skill 成为聊天、同人创作和互动系统可以共同调用的行为层。

当前最直接的使用场景:

  • 聊天:让用户和角色持续对话,保持语气、关系距离、知识边界稳定。
  • 同人创作:辅助写对白、内心戏、片段、短篇,让角色不只“说得像”,也“做得像”。
  • 剧情试写:把角色放进原作没有写过的新情境,用行为模式推断反应。
  • 角色研究:比较不同角色如何处理亲近、压力、背叛、选择和沉默。

未来可以扩展到:

  • AI 互动小说:角色根据玩家行动做出一致反应,而不是从固定台词库抽句子。
  • AI 视觉小说 / Galgame 原型:用角色 Skill 驱动分支对白、关系变化、冲突升级。
  • 多角色叙事实验:多个角色 Skill 在同一事件中碰撞,形成群像剧情。
  • 创作者工作台:作者用 CSP 试写场景、改写对白、检查 OOC、保持长篇同人中的角色一致性。
  • 可更新角色档案:作品继续更新时,Skill 也能带着资料日期和来源链一起成长。

CSP 想建设的是一条从“资料”到“行为”再到“互动叙事”的路径。今天它可以陪用户聊天、帮助创作同人;未来它可以成为 AI 互动小说游戏和角色驱动创作工具链的一部分。


默认模式:最高质量生成

CSP 默认只采用 Highest Fidelity Mode

暂不提供快速、省 token、轻量模式。生成时应尽可能完整检索公开资料、交叉验证关键结论、记录来源和资料日期,并把局限写进 Skill。宁可消耗更多 token 得到高保真角色,也不要为了节省上下文生成薄弱角色卡。

未来如果实现轻量模式,必须作为显式选项,不能改变默认质量标准。


前置依赖与本地检索优先原则

CSP 依赖 Python。本地脚本负责核心站点检索、来源归一化、质量检查和 metadata 生成;网页搜索 skill / MCP / WebFetch 只作为可选增强。

检索优先级:

  1. 用户提供的官方材料:设定集、访谈、BD 特典、字幕、截图、游戏剧情文本。
  2. CSP 本地脚本检索核心站点。
  3. 网页搜索 skill / MCP / WebFetch 补缺。
  4. 用户手动补充材料。

不得把搜索 skill 当作第一步。除非本地脚本没有覆盖该站点,或本地脚本失败并记录原因。

信息源优先级

优先级来源示例
---------
最高用户提供的官方材料设定集、访谈原文、BD 特典、官方字幕、截图
官方网站、官方角色介绍、官方剧情文本franchise official sites, game story text
萌娘百科、Wikipedia、作品 Fandom Wikizh.moegirl.org.cn, wikipedia.org, fandom.com
Bangumi、AniDB、游戏数据库、Bilibili 高质量专栏、Anime News Networkbgm.tv, anidb.net, Bestdori, BWIKI
粉丝讨论、社区解读必须标注为推测
排除知乎、微信公众号、百度百科不可作为来源

重要结论至少需要两个独立来源。来源冲突时保留冲突,不要强行调和。

核心本地检索入口

优先使用统一入口:

python scripts/source_search.py "角色名" --work "作品名" --mode discover
python scripts/source_search.py "角色名" --work "作品名" --sources moegirl,mediawiki

萌娘百科可直接使用专用脚本:

python scripts/moegirl_api.py "角色名" --intro
python scripts/moegirl_api.py "角色名" --full
python scripts/moegirl_api.py "角色名" --search
python scripts/moegirl_api.py "角色名" --wikitext

Windows 本机使用 python;Linux/macOS 用户可尝试 python3

检索失败规则

关键网站不能因为一次失败就标注「信息不足」。必须记录:

  • 尝试的命令;
  • 查询词和 resolved title;
  • URL;
  • 错误信息;
  • 替代来源;
  • 对可信度的影响。

最终仍失败时,在 references/sources.json 和对应研究文件中记录失败项。


生成目录结构

确认角色后,先创建目录,再开始研究:

<character-slug>/
├── SKILL.md
├── manifest.json
└── references/
    ├── sources.json
    ├── distillation.md
    ├── quality-report.json
    └── research/
        ├── 01-setting.md
        ├── 02-personality.md
        ├── 03-expression.md
        ├── 04-relationships.md
        ├── 05-key-scenes.md
        └── 06-media-coverage.md

Skill 必须自包含。复制整个目录就能独立使用。研究文件不完整时,不得声称生成完成。


必备 metadata 与资料时间边界

每个生成 Skill 必须记录资料搜索日期,避免作品出续作、游戏版本更新或新活动后货不对板。

manifest.json 必填字段

{
  "schema_version": "1.0",
  "name": "character-slug",
  "character": "角色名",
  "work": "作品名",
  "aliases": [],
  "generated_at": "YYYY-MM-DD",
  "research_started_at": "YYYY-MM-DD",
  "research_completed_at": "YYYY-MM-DD",
  "latest_source_checked_at": "YYYY-MM-DD",
  "covered_until": {
    "date": "YYYY-MM-DD",
    "description": "截至该日期可检索到的公开资料和用户提供材料"
  },
  "covered_media": [],
  "not_covered": ["YYYY-MM-DD 后发布的新剧情、新活动、新访谈、新设定修订"],
  "source_count": 0,
  "source_tiers": {},
  "quality_score": null,
  "honesty_boundary": "",
  "csp_version": "unknown"
}

references/sources.json 要求

每条来源必须记录:

  • id
  • source
  • title
  • url
  • source_tier
  • officiality
  • media_type
  • retrieved_at
  • content_hash,能计算则计算
  • status
  • warnings

失败来源也要记录,status 写为 failed

最终 SKILL.md 必须包含资料时间边界

角色 Skill 中必须写明:

本 Skill 的资料检索完成于:YYYY-MM-DD。
行为蒸馏基于截至该日期可检索到的公开资料和用户提供材料。
如果作品在此日期后发布新剧情、新活动、新台词、访谈或设定修订,本 Skill 可能无法反映最新内容。

当用户指出「最新剧情不是这样」时,角色 Skill 不得硬拗,必须回应:

我的资料更新至 YYYY-MM-DD,可能没有覆盖之后发布的内容。如果你有最新版 CSP,或可以提供新剧情 / 新资料链接,我可以帮你更新这个 Skill;这可能会消耗一些 Token。

执行流程

Phase 0:需求确认

确认:

  1. 角色名称:中文/日文/英文均可。
  2. 作品名称:系列全名,明确是哪一部或哪个时间线。
  3. 生成范围:默认全面画像,不做轻量版。
  4. 用户是否有官方材料:有则最高优先。
  5. 是否为跨媒体角色:BanG Dream!、Love Live!、Project Sekai、少女☆歌剧等默认触发跨媒体规则。

用户只说「就做 XX」时,默认全面画像并推进;同名歧义时必须询问。

Phase 1:Source Discovery

先运行本地检索:

python scripts/source_search.py "<角色名>" --work "<作品名>" --mode discover

目标:

  • 找到候选条目;
  • 收集别名;
  • 判断是否跨媒体;
  • 初步生成 references/sources.json
  • 记录失败来源。

候选明确时自动推进;多个候选时让用户选择。

Phase 2:创建目录与来源索引

创建目标结构,写入空的:

  • references/sources.json
  • references/distillation.md
  • references/research/06-media-coverage.md

并记录 research_started_at

Phase 3:多源信息采集(5 Agent 并行)

启动 5 个并行子 agent,但它们不再盲搜。每个 agent 必须先读取 references/sources.json 和本地检索结果,只在维度缺口明确时再外部补搜。

Agent重点输出文件
---------
1 设定基本信息、世界观、身份、时间线、媒体覆盖01-setting.md
2 性格行为模式、压力反应、内在矛盾、成长弧02-personality.md
3 表达句式、词汇、自称、敬语、口癖、台词语境03-expression.md
4 关系重要关系、社会认知、跨作品互动04-relationships.md
5 名场面至少 8 个关键场景、决策逻辑、压力行为05-key-scenes.md

每个研究文件必须写:

  • 使用的 source id 或 URL;
  • 可信度;
  • 官方设定 / Wiki 汇总 / 用户材料 / 粉丝推测的区分;
  • 冲突点;
  • 检索失败与降级情况。

Phase 4:跨媒体覆盖记录

对跨媒体角色必须写 06-media-coverage.md

  • 已覆盖媒体;
  • 未覆盖媒体;
  • 主线和衍生材料的权重;
  • 不同媒体冲突;
  • 本 Skill 采用的时间线;
  • 截至哪个日期。

游戏活动、卡面故事、区域对话可作为日常行为和关系补充,但不能覆盖主线设定,除非官方明确更新。

Phase 5:调研质量检查点

运行:

python scripts/merge_research.py <skill_directory>

检查:

  • 每个维度来源数;
  • 总来源数;
  • 黑名单来源;
  • 失败来源;
  • 重要结论是否交叉验证;
  • 跨媒体覆盖;
  • 资料日期是否记录。

展示摘要给用户确认。调研质量决定最终 Skill 上限,缺口明显时补充研究后再蒸馏。

Phase 6:行为蒸馏

读取 references/distillation-framework.md,写入 references/distillation.md

核心行为模式必须回答:

在什么情况下 → 做什么 → 为什么这样

筛选标准:

  • 跨场景复现:至少两个不同场景;
  • 可执行性:能推断新情境中的反应;
  • 证据链:能追溯到 research 文件或 sources;
  • 矛盾保留:发展性矛盾和情境性矛盾不抹平。

目标提炼 3-7 个核心行为模式。只通过一重验证的行为降级为低置信度,不写成核心。

Phase 7:蒸馏确认检查点

向用户展示:

  • 核心行为模式;
  • 表达质感;
  • 核心动机;
  • 内在矛盾;
  • 知识边界;
  • 资料覆盖日期;
  • 未覆盖媒体。

用户确认后再组装最终 Skill。

Phase 8:构建 Skill 与 manifest

读取 references/skill-template.md 组装 SKILL.md

同时生成:

python scripts/generate_manifest.py <skill_directory>

最终 Skill 必须包含:

  • 角色扮演规则;
  • 运行核心;
  • 资料时间边界;
  • 行为动态;
  • 表达质感;
  • 社会认知;
  • 决策逻辑;
  • 知识边界;
  • 面对资料更新或用户纠错的规则;
  • 诚实边界;
  • 调研来源。

Phase 9:质量验证

运行:

python scripts/quality_check.py <skill_directory>

必须检查:

  • 行为模式数量;
  • 表达质感;
  • 矛盾保留;
  • 角色扮演规则;
  • 行为示例;
  • 诚实边界;
  • 来源标注;
  • manifest.json
  • sources.json
  • latest_source_checked_at
  • 每条来源 retrieved_at
  • SKILL.md 资料时间边界;
  • 用户指出最新剧情时的更新回应规则。

验证结果写入 references/quality-report.json。验证结果展示给用户后才算完成。


更新已有 Skill

触发语:

  • 「更新这个 skill」
  • 「最新剧情不是这样」
  • 「XX 出新作了」
  • 「用新版本剧情更新她」
  • 「这个设定过时了」

更新流程:

  1. 读取旧 manifest.json,确认 latest_source_checked_at
  2. 告知用户旧资料日期和可能 token 消耗。
  3. 询问用户是否有新官方材料。
  4. 重新运行本地 source discovery。
  5. 对比旧 sources.json 与新检索结果。
  6. 只重蒸馏受影响维度。
  7. 更新 references/distillation.md
  8. 更新 SKILL.md
  9. 更新 manifest.json 的资料日期。
  10. 重新运行 quality_check.py

更新时不得:

  • 直接覆盖旧行为模式;
  • 把用户印象当官方设定;
  • 删除旧冲突记录;
  • 假设新剧情一定推翻旧剧情;
  • 混淆不同时间线。

可辩证吸收的竞品能力

产品表达:采纳

README 和交付说明可以更直观地展示生成前/生成后、角色 replay、CSP 与角色卡的差异。但不照搬“夺舍”路线。CSP 的定位是高保真行为蒸馏。

工具链:采纳

优先加入:

  • source_search.py
  • source_registry.py
  • generate_manifest.py
  • file_manager.py(用于备份和更新)

batch_distill.py 暂缓,因为当前默认追求单个角色最高质量,不追求批量低成本生产。

提示词提炼:调整采纳

可提供:

python scripts/distill_prompt.py <skill_dir>

输出适合普通 ChatGPT / Claude / SillyTavern / OpenClaw 的 prompt.md。但这只是便携导出,不替代原生 Agent Skill,也不包含完整研究链。

记忆协议:谨慎采纳

近期只吸收「修订记录」和「用户纠错记录」,暂不做自动长期记忆。CSP 的核心是角色行为蒸馏,不是陪伴机器人运行时。


品味守则

原则一句话
------
行为 > 形容词描述「做什么」而非「是什么」
证据 > 印象重要结论必须可追溯
矛盾 > 一致保留矛盾,这是深度的来源
语境 > 台词每句经典台词必须说明场景
时间边界 > 硬拗资料过期时承认边界并进入更新
口语 > 文章Skill 输出的是角色说话,不是论文
人味 > 完美角色可以不确定、前后矛盾、沉默

绝不做:

  • 用萌属性标签取代行为描述;
  • 编造角色在原作中没说过的话;
  • 把角色写成完美人设;
  • 在信息不足时强行生成;
  • 用知乎、微信公众号、百度百科做来源;
  • 忽略资料检索日期;
  • 用户指出新剧情时硬拗旧设定。

部署与同步

生成完成后可复制整个角色目录到 .claude/skills//。修改根目录 CSP 时,必须同步 examples/csp/ 中的:

  • SKILL.md
  • references/
  • scripts/

避免源码版和可安装版分叉。


致谢

CSP 的多 Agent 调研、阶段检查点和质量验证借鉴了 nuwa-skill。CSP 将这种蒸馏方式适配到二次元角色行为系统:不是复刻设定,而是让角色在新情境里可信地活着。

版本历史

共 1 个版本

  • v1.0.1 Initial release 当前
    2026-06-04 23:09 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

ai-intelligence

Self-Improving + Proactive Agent

ivangdavila
自我反思+自我批评+自我学习+自组织记忆。智能体评估自身工作、发现错误并持续改进。
★ 1,349 📥 317,699
developer-tools

Github

steipete
使用 `gh` CLI 与 GitHub 交互,通过 `gh issue`、`gh pr`、`gh run` 和 `gh api` 管理议题、PR、CI 运行及高级查询。
★ 666 📥 323,794
security-compliance

Skill Vetter

spclaudehome
AI智能体技能安全预审工具。安装ClawdHub、GitHub等来源技能前,检查风险信号、权限范围及可疑模式。
★ 1,210 📥 266,155