视频下载与总结工具

D5.0

本 skill 提供完整的视频内容提取和分析流程:

intermediateCoding & Developmentcodingclaude-skill
Get This Skill on GitHub

Overview


name: video-summarizer description: 下载并总结 YouTube 和 B站视频内容。支持提取字幕、语音转文字、内容总结、方法归纳和问答功能。当用户提供视频链接、要求总结视频、归纳视频方法或基于视频内容提问时自动触发。 allowed-tools: Read, Write, Bash, Glob, Grep

视频下载与总结工具

功能概述

本 skill 提供完整的视频内容提取和分析流程:

  1. 视频下载:支持 YouTube 和 B站(bilibili.com)
  2. 字幕提取:优先获取官方字幕或 CC 字幕
  3. 语音转文字:无字幕时使用 Whisper API 转录
  4. 内容分析:总结、归纳方法、支持问答

支持的平台

  • YouTube (youtube.com, youtu.be)
  • 哔哩哔哩 (bilibili.com, b23.tv)

工作流程

步骤 1:依赖检查

首先运行依赖检查脚本确认环境:

python3 {baseDir}/scripts/setup_check.py

如果缺少依赖,提示用户安装:

  • brew install yt-dlp ffmpeg
  • pip install openai

步骤 2:下载视频/提取字幕

根据用户提供的 URL 执行下载:

python3 {baseDir}/scripts/download.py --url "VIDEO_URL" --output "{baseDir}/output"

对于 B站视频,如需登录才能获取字幕:

python3 {baseDir}/scripts/download.py --url "VIDEO_URL" --output "{baseDir}/output" --cookies-from-browser chrome

步骤 3:提取字幕文本

查找下载的字幕文件并提取纯文本:

python3 {baseDir}/scripts/extract_subtitles.py --input-dir "{baseDir}/output" --output "{baseDir}/output/transcript.txt"

步骤 4:语音转文字(无字幕时)

如果没有字幕,使用 Whisper API 转录音频(带时间戳):

python3 {baseDir}/scripts/transcribe.py --input-dir "{baseDir}/output" --output "{baseDir}/output/transcript.txt" --timestamps

支持本地 Whisper(无需 API key,推荐):

python3 {baseDir}/scripts/transcribe.py --input-dir "{baseDir}/output" --output "{baseDir}/output/transcript.txt" --local --model turbo --timestamps

注意:始终使用 --timestamps 参数,以便在总结中引用具体时间点。

步骤 5:内容分析

使用 Read 工具读取 {baseDir}/output/transcript.txt 的内容,然后根据用户需求进行分析。

分析类型

1. 视频总结

根据转录文本,提供结构化的视频内容总结:

  • 视频主题和核心观点
  • 主要内容分段概述
  • 关键信息和数据
  • 结论和要点

2. 方法归纳

从视频中提取可操作的方法和步骤:

  • 识别视频中介绍的方法/技巧
  • 整理为清晰的步骤列表
  • 标注注意事项和前提条件

3. 问答模式

基于视频内容回答用户的具体问题:

  • 定位相关内容段落
  • 提供准确的回答
  • 引用视频中的原话(如适用)

自动保存总结

重要:完成分析后,必须将总结保存为 Markdown 文件:

保存位置:~/lzz/video-summaries/

文件命名格式:YYYY-视频标题简述.md

Markdown 总结模板

# 视频标题

> **视频来源**: [平台] - [频道名]
> **总结时间**: YYYY-MM-DD

---

## 核心观点
[一句话概括视频核心]

---

## 主要内容

### 一、[主题1] [时间戳范围]
- 要点1
- 要点2

### 二、[主题2] [时间戳范围]
- 要点1
- 要点2

---

## 关键要点/方法清单
- [ ] 要点1
- [ ] 要点2

---

*总结生成于 Claude Code Video Summarizer*

输出文件说明

下载完成后,{baseDir}/output/ 目录将包含:

  • *.info.json - 视频元信息(标题、描述、时长等)
  • *.srt*.vtt - 字幕文件(如有)
  • *.m4a*.mp3 - 音频文件(用于转录)
  • transcript.txt - 最终的文本转录

错误处理

  • 如果视频无法下载,检查 URL 是否有效
  • B站视频需要 cookies 时,提示用户配置
  • Whisper API 调用失败时,建议使用本地模式或检查 API key
  • 音频文件过大时,脚本会自动分段处理

清理

分析完成后,可以清理临时文件:

rm -rf {baseDir}/output/*

示例用法

What This Skill Can Do

AI-generated examples showing real capabilities

Ready to use this skill?

Visit the original repository to get the full skill configuration and installation instructions.

View on GitHub

Related Skills