深度音频

UVR5(Ultimate Vocal Remover V5)

uvr5是音频分离软件,可以分离伴奏,去除人声,一键提取干声,降噪,提取贝斯声和鼓声,还能分离和声及去除混响。

页面内容

使用uvr5在线服务

您可能会对如何把uvr5部署到本地感到困惑。实际上,我们把这个功能封装到服务器,方便用户使用,为什么推荐用户使用uvr5的在线服务?

📶 测试了各种场景 各种音频视频格式及音乐风格
🧑🏻‍🤝‍🧑🏻 支持平台 Windows, macOS, iOS和Android
🎼 测试哪些渠道 网易云音乐、QQ音乐、抖音等多个短视频平台
⏱️ 时间 3 周
🎶 声音质量 高质量并清晰
✅ 处理速度 使用高端显卡,速度显著提升
🏅 文件保存 文件保存云端,不容易丢失

你也许想知道:

分离模型介绍

很多人有本地部署UVR5的需求,所以有必要做些了解

在线分离音频推荐模型:伴奏分离模型MDX23C-8KFFT-InstVoc_HQ_2.ckpt,和声分离模型6_HP-Karaoke-UVR.pth,去除一般混响模型UVR-De-Echo-Normal.pth,去除严重混响模型UVR-De-Echo-Aggressive.pth,降噪模型UVR-DeNoise.pth,6音轨提取模型htdemucs_6s.yaml。

要开始在本地使用 uvr,请通过https://ultimatevocalremover.com/下载并安装该程序。在 UVR 内部,选择需要下载分离模型。对于手动下载的模型,需要将.ckpt和.yaml文件放在对应文件夹中。

模型类别

  • RoFormer利用 Band-Split 模块将输入的复杂频谱图转换为子带级别的表示(目前最好的)。
  • MDX-net是竞赛中获奖的模型框架,专为音频源分离而设计,并支持基础模型的改进。
  • Vr-Arch是一种位置引导的视听空间音频分离模型,能够在大多数任务中取得出色的效果。
  • Demucs是一款一体化模型,能够从 4 到 6 个词干的音频中分离出大多数对象。它是 DemucsV4 的最佳版本。

RoFormer

  • RoFormer 方法包含两个预训练模型,BS-RoFormer和Mel-Band RoFormer
  • BS-Roformer-Viperx-1297:最适合分离人声和乐器
  • Mel-Roformer-Viperx-1143:分离人声和乐器

MDX-net

  • MDX23C-InstVoc HQ:一组不同的模型,可提供单一结果
  • UVR-MDX-NET Voc FT:该模型主要侧重于分离人声
  • UVR-MDX-NET Crowd HQ 1:将背景人声与主人声分开

Vr-Arch

  • UVR-DeEcho-DeReverb:分离混响和回声。
  • UVR-BVE-4B_SN-44100-1:多个背景声音分离器。
  • 5_Hp-Karaoke-UVR:单独的背景人声(最好的)。
  • UVR-DeNoise:消除噪音和一些伪影。

Demucs

  • htdemucs:默认模型,处理时间正常,结果良好。
  • htdemucs_ft:处理速度慢但结果更好。
  • htdemucs_6s:能够分离吉他和钢琴词干。

本地安装

Ultimate Vocal Remover是一款免费开源的软件工具,可帮助您从录音和音乐中删除人声。

vocalremover main interface

😊 安装条件

  • 有英伟达显卡
  • 可以魔法上网
  • 磁盘空间>30G

官方链接:

下载与安装:

  • 用户可以通过官网(https://www.ultimatevocalremover.com/ )或GitHub页面(https://github.com/Anjok07/ultimatevocalremovergui )下载UVR5软件。
  • 安装过程中,用户需要配置FFmpeg和CUDA环境变量,以确保软件能够正常运行。

操作步骤:

  • 1、导入音频文件:打开软件后,选择输入音频文件的路径,并设置输出文件夹和文件格式(如mp3、flac、wav等)。
  • 2、选择处理模式:根据需求选择合适的处理模式(如VR模式、卡拉OK模式等),并调整相关参数。
  • 3、开始处理:点击“开始”按钮,软件将自动进行人声与伴奏的分离处理。
  • 4、导出结果:处理完成后,用户可以导出生成的人声和伴奏文件。

提取音乐背景音

😊 提取音乐的关键配置

  • Segment Size:越大,消耗的资源越多,但可能会产生更好的结果。
  • Overlap:预测窗口之间的重叠量。
  • Window Size:更改音频处理桶,数字越小表示处理速度越慢,但效果越好,反之亦然。
  • Aggression Settings:改变执行分离的攻击性,较高的数字可能会消耗音频的重要频率。

提取影视中的人声

使用UVR5进行影视人声分离非常受用户欢迎,一键从电影中提取人声、提取音乐、提取特效声

😊 特征

  • 1、从电影电视等视频中提取人声
  • 2、从电影电视等视频中提取背景音乐
  • 3、从电影电视等视频中提取特效声(音响)

优势

  • 1、搭载了经大量电影电视数据训练、调优后的AI模型,让影视的音轨分离从未如此干净、彻底
  • 2、可非常精准的从电影电视等视频中提取人声、背景音乐、特效声
  • 3、简单易用,无繁杂的配置界面和模型运行环境配置,小白即可轻松上手

总结

本文汇总了 UVR5 使用过程的一些关键信息。一些设置需要反复使用才能体会出来。

我们强烈建议非专业用户使用 深度音频的在线分离音频

常见问题

在了解了上述高质量的人声去除器之后,这里还有一些其他相关的问题和答案供您学习

1. uvr5能降噪吗?

深度音频 伴奏分离功能可以降噪,效果极好,市面上不能去除的噪音,这里都能去除。

2. 分离哪些乐器声?

可分离4种乐器声钢琴声、吉他声、贝斯声和鼓声

3. 能提取和声吗

和声和延迟都能分离出来。

翻唱歌曲

用您的声音唱任何歌曲

去翻唱!