将任意文本内容转化为双主持人对话式播客脚本。两位主持人分工明确——一位主导讲解,一位补充提问与总结——模拟真实播客的自然互动。支持 URL、本地文件、粘贴文本等多种输入方式。
根据用户提供的内容类型,自动选择提取方式:
| 输入类型 | 提取方法 |
|---|---|
| ---------- | ---------- |
| URL 链接 | 使用 WebFetch 抓取网页正文 |
| PDF 文件 | 使用 pdf skill 或 Read 工具提取文本 |
| Word 文档 | 使用 docx skill 读取内容 |
| Markdown/纯文本 | 直接 Read 文件内容 |
| 粘贴文本 | 直接使用用户提供的文本 |
| 本地 HTML | Read 文件后提取正文 |
若内容过长(超过 10000 字),自动生成摘要后再创建脚本。告知用户原始长度和处理方式。
询问用户以下偏好(若用户未明确指定,使用默认值):
tech-deep — 技术深度:适合技术文章、论文解读,主持人深入分析技术细节casual-chat — 轻松闲聊:如朋友聊天,通俗易懂,适合大众内容(默认)news-brief — 新闻播报:快节奏、信息密度高,适合新闻时事teach-explain — 教学讲解:一主一辅,层层递进式讲解,适合教程类内容debate-explore — 观点探讨:对话题进行多角度辩证讨论short — 5-8 分钟(约 1000-1500 字脚本)medium — 10-15 分钟(约 2000-3000 字脚本,默认)long — 20-30 分钟(约 4000-6000 字脚本)小智(主导,知识丰富,善于讲解)+ 小灵(辅助,好奇心强,善于提问与总结)script-only — 仅生成文字脚本(默认)with-audio — 生成脚本后尝试合成音频加载 references/podcast_styles.md 中对应风格的详细模板,然后分析内容:
根据选定的风格模板和关键点,生成完整的对话脚本。核心原则:
人物塑造:
脚本格式:
【播客标题】{标题}
【时长预估】约 {X} 分钟
【主持人】{主导名} & {辅助名}
【风格】{风格名称}
────────────────────────
{主导名}:{开场白...}
{辅助名}:{回应/提问...}
{主导名}:{讲解...}
...(对话交替进行)
{辅助名}:{结尾总结...}
{主导名}:{收尾语...}
────────────────────────
【生成信息】
- 原始内容:{来源说明}
- 总字数:{字数}
- 对话轮次:{轮次数}
脚本质量要求:
仅在用户选择 with-audio 时执行。告知用户当前音频合成的限制:
say 命令生成基础 TTS 音频若用户确认需要音频:
say -v {voice} -o output.aiff 逐段合成后拼接自动识别并处理 URL、PDF、Word、Markdown、纯文本等多种格式。对超长内容自动摘要。
覆盖技术、闲聊、新闻、教学、辩论五大场景,每种风格有专用模板(详见 references/podcast_styles.md)。
双主持人互动模式,主导+辅助的角色分工,模拟真实播客的流畅感。
支持脚本长度、风格强度、主持人性格的灵活调整。默认仅输出文字脚本,可选合成音频。
包含五种播客风格的详细模板,包括:
生成脚本前,必须加载对应风格模板以获取详细指导。
共 1 个版本