Skip to content

懂的都懂,这是一个将视频语音翻译成中文并给视频添加中文字幕的工具

Notifications You must be signed in to change notification settings

timerainers/VideoToCh

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

视频字幕处理工具

一个桌面Python应用程序,用于从视频中提取语音,生成字幕,并将字幕嵌入到视频中。该工具提供了友好的图形用户界面(GUI),使操作更加简单直观。

功能

  • 从视频文件中提取音频
  • 使用OpenAI Whisper进行语音识别,支持近100种语言
  • 自动检测语言,并根据需要将字幕翻译为中文
  • 生成SRT格式字幕文件
  • 将字幕嵌入到视频中
  • 保存带字幕的新视频文件
  • 图形用户界面,操作简单直观

安装和设置

1. 克隆仓库

git clone https://github.com/your-username/video-subtitle-tool.git
cd video-subtitle-tool

2. 创建虚拟环境(可选但推荐)

python -m venv venv
# Windows
venv\Scripts\activate
# macOS/Linux
source venv/bin/activate

3. 安装依赖

pip install -r requirements.txt

4. 安装FFmpeg

该工具依赖FFmpeg进行视频和音频处理。

  • Windows:

  • macOS (使用Homebrew):

    brew install ffmpeg
  • Linux:

    sudo apt update
    sudo apt install ffmpeg

5. 下载语音模型

运行以下命令下载必要的语音模型:

python download_models.py

使用方法

启动程序

python gui.py

使用界面

  1. 点击"选择视频"按钮选择要处理的视频文件
  2. 设置输出选项:
    • 选择输出文件路径
    • 选择目标语言(默认:中文)
    • 选择字幕类型(软字幕/硬字幕)
    • 选择翻译模型(在线/本地Ollama)
    • 设置字幕样式
  3. 点击"开始处理"按钮
  4. 在进度条中查看处理进度

高级选项

在界面中可以设置的选项包括:

  • 输出文件路径和格式(MP4/MKV)
  • 目标语言(默认:中文)
  • 字幕类型(软字幕/硬字幕)
  • 翻译模型选择(在线API/本地Ollama)
  • Ollama模型名称设置
  • 字幕样式(默认/轮廓/阴影/方框)

处理流程

  1. 提取音频: 从视频文件中提取WAV格式的音频
  2. 语音识别: 使用Whisper分析音频并生成文本(支持多语言)
  3. 创建字幕: 生成带时间戳的SRT格式字幕文件
  4. 翻译: 如果检测到非中文字幕,将其翻译成中文
  5. 嵌入字幕: 将字幕嵌入到视频中(软字幕或硬字幕)
  6. 保存视频: 保存带字幕的新视频文件

输出文件

程序会生成以下文件:

  1. WAV格式的音频文件
  2. 原始转录文本文件
  3. 原始语言的SRT字幕文件
  4. 翻译后的中文SRT字幕文件
  5. 带嵌入字幕的视频文件(MP4或MKV格式)

许可证

MIT

About

懂的都懂,这是一个将视频语音翻译成中文并给视频添加中文字幕的工具

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages