智能

AIGC 实战(环境篇)—— Debian安装Pyvideotrans(视频翻译配音工具)

波比AI · 5月2日 · 2025年本文共1677个字 · 预计阅读6分钟3次已读

这是一个视频翻译配音工具,可将一种语言的视频翻译为指定语言的视频,自动生成和添加该语言的字幕和配音。并支持API调用

语音识别支持faster-whisperopenai-whisperlaoxiongb2c地离线模型 及OpenAI SpeechToText APIGoogleSpeech阿里中文语音识别模型和豆包模型,并支持自定义语音识别api.

文字bobyai翻译支持微软翻译|Google翻译|百度翻译|腾讯翻译|ChatGPT|AzureAI|Gemini|DeepL|DeepLX|字节火山|离线翻译OTT

文字合成语音支持Microsoft Edge ttsGoogle ttsAzure AI TTSOpenai TTSElevenlabs TTS自定义TTS服务器apiGPT-SoVITSclone-voiceChatTTS-uiFilaoxiongb2csh TTSCosyVoice

允许保留背景伴奏音乐等(基于uvr5)

支持的语言:中文简繁、英语、韩语、日语、俄语、法语、德语、意大利语、西班牙语、葡萄牙语、越南语、泰国语、阿拉伯语、土耳其语、匈牙利语、印度语、乌克兰语、哈萨克语、印尼语、马来语、捷克语、波兰语、荷兰语、瑞典语/其他语言可选自动检测

一、主要用途和功能

【自动翻译视频并配音】将视频中的声音翻译为另一种语言的配音,并嵌入该语言字幕

【语音识别/将音频视频转为字幕】可批量将音频、视频文件中的人类说话声,识别为文字并导出为srt字幕文件

【语音合成/字幕配音】根据本地已有的srt字幕文件创建配音,支持单个或批量字幕

【翻译字幕文件】将一个或多个srt字幕文件翻译为其他语言的字幕文件

【合并视频和音频】批量将视频文件和音频文件一一对应合并

【合并视频和srt字幕】批量将视频文件srt字幕文件一一对应合并

【为视频添加图片水印】批量将视频文件中嵌入图片水印

【从视频中提取音频】从视频中分离为音频文件和无声视频

【音频视频格式转换】批量将音频视频进行格式转换

【字幕编辑并导出多格式】支持导入srt、vtt、ass格式字幕,编辑后可设置字体样式、色彩等导出对应格式字幕

【字幕格式转换】批量将字幕文件进行 srt/ass/vtt 格式互转

【下载油管视频】可从youtube上下载视频

【人声背景乐分离】

【API调用】支持 语音合成、语言识别、字幕翻译、视频翻译接口调用

AIGC 实战(环境篇)—— Debian安装Pyvideotrans(视频翻译配音工具)

二、Debian 源码部署

执行如下代码进行安装:

git clone https://github.com/jianchang512/pyvideotrans
cd pyvideotrans

conda create -n pyvideotrans python=3.10.4
conda activate pyvideotrans

pip install -r requirements.txt
apt install ffmpeg

如果提示失败,更换源

pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/
pip config set install.trusted-host mirrors.aliyun.com

如果要使用CUDA加速,分别执行

pip uninstall -y torch torchaudio
pip install torch==2.2.0 torchaudio==2.2.0 --index-url https://download.pytorch.org/whl/cu118
pip install nvidia-cublas-cu11 nvidia-cudnn-cu11

linux 如果要启用cuda加速,必须有英伟达显卡,并且配置好了CUDA11.8+环境,请自行搜索 “Linux CUDA 安装”
运行:

python sp.py

总结

参考

[Total: 0 Average: 0]
0 条回应

必须 注册 为本站用户, 登录 后才可以发表评论!