← 返回
未分类

AI 播客生成器

AI播客生成器:将文章、文档、网页或任意文本内容转化为自然流畅的双人对话式播客脚本。当用户提到播客、podcast、转成对话、双人对话、播客脚本、AI播客、语音播客、转音频等关键词,或要求将文本内容改编为口语化对话时触发。支持技术深度、轻松闲聊、新闻播报、教学讲解、观点探讨五种风格,输出专业对话脚本,可选合成音频。
AI播客生成器:将文章、文档、网页或任意文本内容转化为自然流畅的双人对话式播客脚本。当用户提到播客、podcast、转成对话、双人对话、播客脚本、AI播客、语音播客、转音频等关键词,或要求将文本内容改编为口语化对话时触发。支持技术深度、轻松闲聊、新闻播报、教学讲解、观点探讨五种风格,输出专业对话脚本,可选合成音频。
user_6c1436c7
未分类 community v1.0.0 1 版本 95238.1 Key: 无需
★ 0
Stars
📥 20
下载
💾 0
安装
1
版本
#latest

概述

AI 播客生成器

概述

将任意文本内容转化为双主持人对话式播客脚本。两位主持人分工明确——一位主导讲解,一位补充提问与总结——模拟真实播客的自然互动。支持 URL、本地文件、粘贴文本等多种输入方式。

工作流程

第一步:识别输入源并提取内容

根据用户提供的内容类型,自动选择提取方式:

输入类型提取方法
--------------------
URL 链接使用 WebFetch 抓取网页正文
PDF 文件使用 pdf skill 或 Read 工具提取文本
Word 文档使用 docx skill 读取内容
Markdown/纯文本直接 Read 文件内容
粘贴文本直接使用用户提供的文本
本地 HTMLRead 文件后提取正文

若内容过长(超过 10000 字),自动生成摘要后再创建脚本。告知用户原始长度和处理方式。

第二步:确认播客风格与参数

询问用户以下偏好(若用户未明确指定,使用默认值):

  • 播客风格(默认:轻松对话):
  • tech-deep — 技术深度:适合技术文章、论文解读,主持人深入分析技术细节
  • casual-chat — 轻松闲聊:如朋友聊天,通俗易懂,适合大众内容(默认)
  • news-brief — 新闻播报:快节奏、信息密度高,适合新闻时事
  • teach-explain — 教学讲解:一主一辅,层层递进式讲解,适合教程类内容
  • debate-explore — 观点探讨:对话题进行多角度辩证讨论
  • 目标时长(默认:中等):
  • short — 5-8 分钟(约 1000-1500 字脚本)
  • medium — 10-15 分钟(约 2000-3000 字脚本,默认)
  • long — 20-30 分钟(约 4000-6000 字脚本)
  • 主持人设置(默认使用预设):
  • 默认:小智(主导,知识丰富,善于讲解)+ 小灵(辅助,好奇心强,善于提问与总结)
  • 用户可自定义主持人名称和性格
  • 音频合成(默认:仅输出脚本):
  • script-only — 仅生成文字脚本(默认)
  • with-audio — 生成脚本后尝试合成音频

第三步:内容分析与关键点提取

加载 references/podcast_styles.md 中对应风格的详细模板,然后分析内容:

  1. 核心主题识别:这段内容在讲什么?核心观点是什么?
  2. 关键信息点:提取 3-8 个值得在对话中展开的关键信息
  3. 趣味元素挖掘:找出内容中的有趣事实、反常识观点、生动案例(用于增加对话趣味性)
  4. 逻辑串联:确定这些关键点的讲述顺序,形成自然的叙事弧线

第四步:生成播客脚本

根据选定的风格模板和关键点,生成完整的对话脚本。核心原则:

人物塑造

  • 主导主持人是"懂行的人",负责讲解核心内容
  • 辅助主持人是"好奇的朋友",负责提问、确认理解、补充联想、总结金句
  • 两人的互动要自然:有打断、有共鸣、有惊讶、有追问

脚本格式

【播客标题】{标题}
【时长预估】约 {X} 分钟
【主持人】{主导名} & {辅助名}
【风格】{风格名称}
────────────────────────

{主导名}:{开场白...}

{辅助名}:{回应/提问...}

{主导名}:{讲解...}

...(对话交替进行)

{辅助名}:{结尾总结...}

{主导名}:{收尾语...}

────────────────────────
【生成信息】
- 原始内容:{来源说明}
- 总字数:{字数}
- 对话轮次:{轮次数}

脚本质量要求

  • 用中文口语化表达,避免书面化长句
  • 每轮对话控制在 80-200 字,避免单段过长
  • 适当加入语气词("嗯"、"哇"、"等等"、"有意思")增加自然感
  • 主导人占比约 60-70%,辅助人 30-40%
  • 开头 3 轮内必须抛出钩子吸引听众
  • 结尾必须有清晰的总结和金句收尾

第五步:可选 — 音频合成

仅在用户选择 with-audio 时执行。告知用户当前音频合成的限制:

  • macOS 系统可使用 say 命令生成基础 TTS 音频
  • 如需高质量 AI 配音(如 ElevenLabs、Edge TTS),需用户自行配置 API
  • 建议优先交付脚本,音频合成作为可选增值

若用户确认需要音频:

  • macOS:使用 say -v {voice} -o output.aiff 逐段合成后拼接
  • 其他系统:提示用户安装 edge-tts 或提供在线 TTS 工具建议

核心能力

1. 多源内容输入

自动识别并处理 URL、PDF、Word、Markdown、纯文本等多种格式。对超长内容自动摘要。

2. 五档播客风格

覆盖技术、闲聊、新闻、教学、辩论五大场景,每种风格有专用模板(详见 references/podcast_styles.md)。

3. 自然对话生成

双主持人互动模式,主导+辅助的角色分工,模拟真实播客的流畅感。

4. 灵活输出控制

支持脚本长度、风格强度、主持人性格的灵活调整。默认仅输出文字脚本,可选合成音频。

典型使用场景

  • "帮我把这篇技术博客转成播客对话" → 提取 URL 内容,生成技术深度风格脚本
  • "这份 PDF 报告太长了,帮我做成 10 分钟的播客" → 自动摘要 + 中等长度脚本
  • "用轻松聊天的方式讲讲今天的 AI 新闻" → 搜索新闻 + 轻松闲聊风格
  • "把这个教程变成两个老师讲课的对话" → 教学讲解风格,主辅配合
  • "这篇文章的观点很有意思,两个人辩论一下" → 观点探讨风格,正反交锋

参考资源

references/podcast_styles.md

包含五种播客风格的详细模板,包括:

  • 每种风格的开场白模板
  • 对话节奏与互动模式
  • 转场话术与金句策略
  • 完整示例片段

生成脚本前,必须加载对应风格模板以获取详细指导。

版本历史

共 1 个版本

  • v1.0.0 Initial release 当前
    2026-06-05 23:50 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

security-compliance

Skill Vetter

spclaudehome
AI智能体技能安全预审工具。安装ClawdHub、GitHub等来源技能前,检查风险信号、权限范围及可疑模式。
★ 1,210 📥 266,155
developer-tools

Github

steipete
使用 `gh` CLI 与 GitHub 交互,通过 `gh issue`、`gh pr`、`gh run` 和 `gh api` 管理议题、PR、CI 运行及高级查询。
★ 666 📥 323,795
ai-intelligence

self-improving agent

pskoett
捕获经验教训、错误和纠正,以实现持续改进。使用时机:(1)命令或操作意外失败;(2)用户纠正……
★ 4,055 📥 795,972