端到端将抖音视频转换为结构化 Markdown 文案,并自动同步到乐享知识库。
一条抖音链接进去,一篇编号分段的知识库文章出来。
用户提供抖音链接
↓
① 下载视频(douyin-download-v2 download)
↓
② 语音转文字(本地 Whisper small 模型,中文)
↓
③ AI 语义分段(按自然语义分段落,编号 ①②③...)
↓
④ 保存到工作目录:{视频ID}_{视频标题}.md
↓
⑤ 同步到乐享「抖音」知识库(查当前第N篇,按序命名为"第N+1篇"上传)
使用 douyin-download-v2 技能下载视频:
node ~/.workbuddy/skills/douyin-download-v2/douyin.js download "<抖音链接>" -o /tmp/dy-text
mkdir -p /tmp/dy-text curl -L -A "com.ss.android.ugc.aweme/130200 (Linux; U; Android 13; zh_CN)" "
使用本地 Whisper small 模型转录中文音频:
/usr/bin/python3 -c "
import whisper
model = whisper.load_model('small')
result = model.transcribe('/tmp/dy-text/<视频ID>.mp4', language='zh')
print(result['text'])
"
根据转录文本进行自然语义分段,遵循以下原则:
① 段落标题 格式编号--- 分隔文件命名规则:{视频ID}_{视频标题}.md
格式模板:
# {视频标题}
> 视频ID:{视频ID}
> 提取时间:{YYYY-MM-DD}
---
**① 段落标题**
段落内容...
---
**② 段落标题**
段落内容...
---
(以此类推)
保存到当前工作目录(用户指定或默认项目目录)。
详细配置见 references/lexiang-config.md。
使用 mcp__lexiang__entry_list_children 查询父节点下的所有文章:
parent_id: "a7df7ca149844bceb0e2b7e260360ecf"limit: 50sort_by: "sort_id"从返回结果中找到最大序号 N。
使用 mcp__lexiang__entry_import_content 上传:
space_id: "6f2366cc327c432e96c7d2ceb1eecde8"parent_id: "a7df7ca149844bceb0e2b7e260360ecf"name: "第N+1篇"content_type: "markdown"content: 完整的 Markdown 内容(与本地保存的文件内容一致)如果用户跳过链接直接提供文案标题和文本(无视频下载),则:
如果用户要求仿写文案(而非提取),使用以下人设:
{视频ID}_{视频标题}.md{标题}.md共 1 个版本