我写的用 Claude Code 剪视频的 15 个 Skill
作者:Jian Shuo Wang 发表于:2026-05-14 19:11 · 未分类上周和任鑫在茶馆聊天,一言不合就开录播客,大约一个多小时。
录完,发现我很多年来的执念还是没有放下:视频自动剪辑。这是 5 年前我就没日没夜的写的东西,总觉得有一天视频可以交个 AI 自动剪辑,但是效果总是不是很理想,这次有了视频,又有了 Claude Code,这不是巧了吗?结果花一晚上把视频剪辑这事情写了一遍。
然后就是那天我在Skill 是新时代的函数 说的,那种熟悉的代码崩坏的感觉在 Skill 世界又出现了,结果做了一轮重构,统一了名字,把所有的 Skill 拆分称为 15 个独立的子 Skill,加上一些流水线 Skill,就是现在的样子。

代码在 https://github.com/jianshuo/Claude-skills
用法
#方式1:从ClawHub 装单个skillclawhub install wjs-transcribing-audio #方式2:把整个仓库作为Claude Code marketplaceclaude plugin marketplace add jianshuo/claude-skillsclaude plugin install wjs-transcribing-audio #方式3:直接clone 到skills 目录git clone https://github.com/jianshuo/claude-skills ~/.claude/skills/wjs
内容
每个 skill 只做一道工序。你可以让它们一个接一个跑完整条线,也可以只点亮其中某一个。
有个细节是我故意这么设计的:每个 skill 的名字,都是一个"动作"。transcribing(转写)、translating(翻译)、dubbing(配音)、burning(烧字幕)、segmenting(切片)、overlaying(叠加)、reframing(转横竖屏)……
为什么?因为一个 skill 想做的事情越少,它就越靠得住,也越容易跟别的 skill 接上。一个 skill 的名字,其实就是它对外的接口。

十五个,我把它分成五组。
第一组:把视频换一种语言(5 个)
这一组是给视频做"本地化"的——比如把我一段中文播客,变成带西语字幕、甚至西语配音的视频。
wjs-transcribing-audio —— 把音频或视频转成带时间戳的字幕(SRT)。中文走豆包的识别,其他语言走 Whisper。你就说"帮我把这个视频转成字幕"。
wjs-translating-subtitles —— 把字幕翻成另一种语言,会按标点重新断句,让每一句字幕在该断的地方断。要中英双语也行。
wjs-dubbing-video —— 按翻译好的字幕,生成对得上时间的配音,让视频真的"说"那门语言。
wjs-burning-subtitles —— 把字幕烧进画面,或者做最后的合成:字幕、配音、原声垫底,一次编码完成。
wjs-localizing-video —— 上面四个的总调度。顺序调用上面的四步。
第二组:把一条长视频,变成能发的短视频(3 个)
wjs-segmenting-video —— 把一个多小时的访谈、讲座、播客,按主题切成 3 到 6 条能独立成立的短片。它只负责"切",切完交给下一棒。
wjs-overlaying-video —— 做后期:加 AI 生成的封面、跟着字幕走的动态字幕、关键处的动画、章节小标签、片尾的关注引导。它接在切片后面,把毛坯片变成能直接发的成品。这个调用了 Hyperframe
wjs-reframing-video —— 横屏转竖屏(或者反过来)。它不是简单裁中间,是会追着"正在说话的那个人"裁——靠的是嘴在不在动。所以画面里有好几个人,镜头也不会跟丢。以前拿 Mediapipe 自己跟踪过,效果没有这一版本好。
第三组:多机位(2 个)
这是我最后的执念,一定要把这个搞出来,结果,原来写了几个月的东西,十几分钟 Claude Code 写的稳定性和效果都比自己那个时候哪怕拿 Cursor 手写的要好。
wjs-syncing-multicam —— 把这几路录音录像对齐到同一条时间线上。它只产出一个很轻的 .sync.json 小文件,原始素材一帧都不动。
wjs-editing-multicam —— 在对齐之后,把多个机位合成一条片子,按声音大小自动切机位,还能加个画中画。
第四组:发出去(3 个)
东西做好了,得发出去——这一步也常常是最磨人的。
wjs-uploading-video —— 批量传 YouTube。标题、简介、标签可以从一个 UPLOAD_META.md 文件里读,不用一个个填。
wjs-publishing-wechat —— 写或者发公众号文章:润色、配题图、配解释图,准备好上传到后台。说句实话,这篇文章本身,就是用它在帮我。
wjs-promoting-skills —— 帮我把这些 skill 本身推广出去:研究别人怎么在 skill 市场上做营销,生成推广计划,自动发推。
第五组:两个不做视频的(2 个)
wjs-auditing-project —— 当我觉得"这个项目好像哪里不对、但说不清"的时候,让它做一次体检:没合并的分支、卡住的 PR、挂掉的自动构建、计划和现实的偏差……它先只看不动,列一张清单给我,我点头了它才动手。这个是为了 Cathier 项目做的。
wjs-eating-and-growing —— 这个最特别,是我最喜欢的「吃一堑长一智」,不过这个单独写文章来说,反正对我个人成长来说非常有用。
回到开头那期播客。我实际做的,是这样一句话一句话喂过去的:
把这个录音转成字幕 → 切成四条短视频 → 第二条横转竖 → 给它们加封面和字幕 → 把讲 AI 教育那段配上西语 → 全部传到 YouTube。
视频挺大烧制花了不少时间,大约 5 个小时,我睡醒就做好了
后注:这些 skill 都已经发布在我的 claude-skills 仓库里了,欢迎大家直接拿去用。