概述

AI 播客生成器

概述

将任意文本内容转化为双主持人对话式播客脚本。两位主持人分工明确——一位主导讲解，一位补充提问与总结——模拟真实播客的自然互动。支持 URL、本地文件、粘贴文本等多种输入方式。

工作流程

第一步：识别输入源并提取内容

根据用户提供的内容类型，自动选择提取方式：

输入类型	提取方法
----------	----------
URL 链接	使用 WebFetch 抓取网页正文
PDF 文件	使用 pdf skill 或 Read 工具提取文本
Word 文档	使用 docx skill 读取内容
Markdown/纯文本	直接 Read 文件内容
粘贴文本	直接使用用户提供的文本
本地 HTML	Read 文件后提取正文

若内容过长（超过 10000 字），自动生成摘要后再创建脚本。告知用户原始长度和处理方式。

第二步：确认播客风格与参数

询问用户以下偏好（若用户未明确指定，使用默认值）：

播客风格（默认：轻松对话）：
tech-deep — 技术深度：适合技术文章、论文解读，主持人深入分析技术细节
casual-chat — 轻松闲聊：如朋友聊天，通俗易懂，适合大众内容（默认）
news-brief — 新闻播报：快节奏、信息密度高，适合新闻时事
teach-explain — 教学讲解：一主一辅，层层递进式讲解，适合教程类内容
debate-explore — 观点探讨：对话题进行多角度辩证讨论

目标时长（默认：中等）：
short — 5-8 分钟（约 1000-1500 字脚本）
medium — 10-15 分钟（约 2000-3000 字脚本，默认）
long — 20-30 分钟（约 4000-6000 字脚本）

主持人设置（默认使用预设）：
默认：小智（主导，知识丰富，善于讲解）+ 小灵（辅助，好奇心强，善于提问与总结）
用户可自定义主持人名称和性格

音频合成（默认：仅输出脚本）：
script-only — 仅生成文字脚本（默认）
with-audio — 生成脚本后尝试合成音频

第三步：内容分析与关键点提取

加载 references/podcast_styles.md 中对应风格的详细模板，然后分析内容：

核心主题识别：这段内容在讲什么？核心观点是什么？
关键信息点：提取 3-8 个值得在对话中展开的关键信息
趣味元素挖掘：找出内容中的有趣事实、反常识观点、生动案例（用于增加对话趣味性）
逻辑串联：确定这些关键点的讲述顺序，形成自然的叙事弧线

第四步：生成播客脚本

根据选定的风格模板和关键点，生成完整的对话脚本。核心原则：

人物塑造：

主导主持人是"懂行的人"，负责讲解核心内容
辅助主持人是"好奇的朋友"，负责提问、确认理解、补充联想、总结金句
两人的互动要自然：有打断、有共鸣、有惊讶、有追问

脚本格式：

【播客标题】{标题}
【时长预估】约 {X} 分钟
【主持人】{主导名} & {辅助名}
【风格】{风格名称}
────────────────────────

{主导名}：{开场白...}

{辅助名}：{回应/提问...}

{主导名}：{讲解...}

...（对话交替进行）

{辅助名}：{结尾总结...}

{主导名}：{收尾语...}

────────────────────────
【生成信息】
- 原始内容：{来源说明}
- 总字数：{字数}
- 对话轮次：{轮次数}

脚本质量要求：

用中文口语化表达，避免书面化长句
每轮对话控制在 80-200 字，避免单段过长
适当加入语气词（"嗯"、"哇"、"等等"、"有意思"）增加自然感
主导人占比约 60-70%，辅助人 30-40%
开头 3 轮内必须抛出钩子吸引听众
结尾必须有清晰的总结和金句收尾

第五步：可选 — 音频合成

仅在用户选择 with-audio 时执行。告知用户当前音频合成的限制：

macOS 系统可使用 say 命令生成基础 TTS 音频
如需高质量 AI 配音（如 ElevenLabs、Edge TTS），需用户自行配置 API
建议优先交付脚本，音频合成作为可选增值

若用户确认需要音频：

macOS：使用 say -v {voice} -o output.aiff 逐段合成后拼接
其他系统：提示用户安装 edge-tts 或提供在线 TTS 工具建议

核心能力

1. 多源内容输入

自动识别并处理 URL、PDF、Word、Markdown、纯文本等多种格式。对超长内容自动摘要。

2. 五档播客风格

覆盖技术、闲聊、新闻、教学、辩论五大场景，每种风格有专用模板（详见 references/podcast_styles.md）。

3. 自然对话生成

双主持人互动模式，主导+辅助的角色分工，模拟真实播客的流畅感。

4. 灵活输出控制

支持脚本长度、风格强度、主持人性格的灵活调整。默认仅输出文字脚本，可选合成音频。

典型使用场景

"帮我把这篇技术博客转成播客对话" → 提取 URL 内容，生成技术深度风格脚本
"这份 PDF 报告太长了，帮我做成 10 分钟的播客" → 自动摘要 + 中等长度脚本
"用轻松聊天的方式讲讲今天的 AI 新闻" → 搜索新闻 + 轻松闲聊风格
"把这个教程变成两个老师讲课的对话" → 教学讲解风格，主辅配合
"这篇文章的观点很有意思，两个人辩论一下" → 观点探讨风格，正反交锋

参考资源

references/podcast_styles.md

包含五种播客风格的详细模板，包括：

每种风格的开场白模板
对话节奏与互动模式
转场话术与金句策略
完整示例片段

生成脚本前，必须加载对应风格模板以获取详细指导。

版本历史

共 1 个版本

v1.0.0 Initial release 当前

2026-06-05 23:50 安全安全

安全检测

腾讯云安全 (Keen)

安全，无风险

查看报告

腾讯云安全 (Sanbu)

安全，无风险

查看报告

AI 播客生成器

概述

AI 播客生成器

概述

工作流程

第一步：识别输入源并提取内容

第二步：确认播客风格与参数

第三步：内容分析与关键点提取

第四步：生成播客脚本

第五步：可选 — 音频合成

核心能力

1. 多源内容输入

2. 五档播客风格

3. 自然对话生成

4. 灵活输出控制

典型使用场景

参考资源

references/podcast_styles.md

版本历史

安全检测

腾讯云安全 (Keen)

腾讯云安全 (Sanbu)

🔗 相关推荐

Skill Vetter

Github

self-improving agent