Q: 我录的短视频人声很小背景音乐很大，用这个工具能自动平衡吗？

不能。响度归一化是对整个音频做整体增益调整，不会区分人声和背景音乐。如果人声和背景音乐的音量差距过大（如人声 -20 LUFS、背景音乐 -10 LUFS），归一化后差距仍然存在。需要先使用音频编辑软件（如 Adobe Audition 或 DaVinci Resolve）将人声和背景音乐分离到不同轨道，分别调整音量后再混音，最后再上传做整体响度归一化。本工具适合“已经混音完成但整体响度不一致”的场景，不适合“多轨道混音不平衡”的场景。

Q: 工具支持批量处理多个文件吗？一次最多能传多大？

浏览器端模式不支持批量处理，每次只能上传一个文件，最大 2GB（受浏览器内存限制）。后端模式支持批量上传（最多 10 个文件，每个最大 500MB），处理完后会打包成 ZIP 下载。如果需要处理更多文件，建议使用 FFmpeg 命令行工具（`ffmpeg -i input.wav -af loudnorm=I=-14:LRA=1:TP=-1 output.wav`），本工具后端也是同样的命令。批量处理时，每个文件会分别计算响度并独立归一化，不会互相影响。

Question 1

响度归一化后，音量听起来反而变小了，是工具不准吗？

Accepted Answer

不是不准，而是 LUFS 标准本身是一个“平均响度”目标值（通常设为 -14 LUFS 或 -23 LUFS），不是“峰值最大化”。如果原始音频的瞬时峰值很高但平均响度低，归一化后会整体降低音量来匹配目标，导致听感变“小”。建议检查输出文件的实际 LUFS 值（可用本工具再测一次），确认是否达到设定目标。如果希望音量更大，可以换用“响度最大化”工具，但会牺牲动态范围。

Question 2

直播用的音频和录播视频，响度归一化应该选同一个目标值吗？

Accepted Answer

建议分开设置。国内短视频平台（抖音、快手）推荐 -14 LUFS，直播常用 -16 LUFS（避免峰值削波），广播/播客则按 ITU-R BS.1770 标准用 -23 LUFS。本工具默认 -14 LUFS，但支持自定义目标值（-40 到 0 LUFS 范围）。同一份素材如果同时用于直播和录播，建议导出两个版本：直播版 -16 LUFS，录播版 -14 LUFS，以防止直播时突发高音量导致平台自动压限。

Question 3

为什么我上传的 MP3 文件处理完后，格式变成了 WAV？

Accepted Answer

本工具底层使用 FFmpeg 的 loudnorm 滤镜处理音频，该滤镜输出为无损 PCM（WAV/PCM 格式）以保证响度计算精度。处理完成后，页面会提供“下载为 MP3”的选项（默认 320kbps CBR），也可以选择原样下载 WAV 源文件。如果必须保持原始格式（如 AAC、OGG），建议下载 WAV 后自行用其他工具转码。注意：转 MP3 时会重新编码，响度会保持，但音质有轻微损失。

Question 4

上传一个 2 小时的播客文件，处理要多久？会不会卡死？

Accepted Answer

处理时间取决于文件时长和你的设备性能。浏览器端（WASM）处理：大约为播放时长的 0.5-1 倍（2 小时文件约需 1-2 分钟）。如果文件超过 500MB 或时长大于 3 小时，建议改用后端处理模式（上传后服务器处理，无需保持页面打开）。浏览器端处理时如果标签页被切到后台，Chrome 等浏览器会降低优先级，可能导致处理变慢或卡顿，建议保持页面在前台。处理过程中页面会显示进度条，不会假死。

Question 5

这个工具的 LUFS 标准是哪个版本？和 YouTube 的 Loudness Normalization 一样吗？

Accepted Answer

本工具使用 FFmpeg 5.1 内置的 loudnorm 滤镜，实现的是 ITU-R BS.1770-4 标准（2015 年发布），包含门控测量（Gated Loudness）和真峰值检测。YouTube 使用的也是同一标准，但目标响度不同：YouTube 默认 -14 LUFS（非音乐类）或 -13 LUFS（音乐类），本工具默认 -14 LUFS 且支持自定义。两者算法一致，只是目标值差异。如果希望输出与 YouTube 完全一致，请将目标值设为 -14 LUFS，并关闭“限制真峰值”选项（YouTube 不做真峰值限制）。

Question 6

为什么同一段音频，用本工具和 Adobe Audition 的响度匹配结果不一样？

Accepted Answer

差异通常源于两个因素：1) 测量窗口——本工具使用整段音频的“整体响度”（Integrated Loudness），而 Audition 默认使用“短时响度”（Short-term Loudness）或“瞬时响度”（Momentary Loudness）进行匹配；2) 真峰值限制——本工具默认会限制真峰值（True Peak）到 -1 dBTP 以下，而 Audition 的响度匹配默认不限制真峰值。如果希望结果一致，请在 Audition 中开启“匹配到：整体响度”和“限制真峰值到：-1 dBTP”，目标值设为相同值。

Question 7

上传的音频文件有背景噪音，响度归一化后会放大噪音吗？

Accepted Answer

会。响度归一化是对整个音频做增益调整（整体放大或缩小），不是降噪。如果原始音频中噪音已经存在，归一化后噪音会按相同比例被放大/缩小。如果原始音频的噪音水平较高（如 SNR < 20dB），归一化到 -14 LUFS 后噪音会更加明显。建议先使用降噪工具（如 Audacity 的降噪滤镜或 RNNoise）处理音频，再上传到本工具进行响度归一化。本工具不内置降噪功能，后续版本可能会加入。

Question 8

我录的短视频人声很小背景音乐很大，用这个工具能自动平衡吗？

Accepted Answer

不能。响度归一化是对整个音频做整体增益调整，不会区分人声和背景音乐。如果人声和背景音乐的音量差距过大（如人声 -20 LUFS、背景音乐 -10 LUFS），归一化后差距仍然存在。需要先使用音频编辑软件（如 Adobe Audition 或 DaVinci Resolve）将人声和背景音乐分离到不同轨道，分别调整音量后再混音，最后再上传做整体响度归一化。本工具适合“已经混音完成但整体响度不一致”的场景，不适合“多轨道混音不平衡”的场景。

Question 9

工具支持批量处理多个文件吗？一次最多能传多大？

Accepted Answer

浏览器端模式不支持批量处理，每次只能上传一个文件，最大 2GB（受浏览器内存限制）。后端模式支持批量上传（最多 10 个文件，每个最大 500MB），处理完后会打包成 ZIP 下载。如果需要处理更多文件，建议使用 FFmpeg 命令行工具（`ffmpeg -i input.wav -af loudnorm=I=-14:LRA=1:TP=-1 output.wav`），本工具后端也是同样的命令。批量处理时，每个文件会分别计算响度并独立归一化，不会互相影响。

维度	本工具	竞品 A（Adobe Audition）	传统方法（手动调整）
数据隐私	纯浏览器端处理，文件不上传服务器	需安装客户端，文件本地处理	文件本地处理，无网络传输风险
处理速度	1-5 秒（取决于文件大小）	5-30 秒（含软件启动与渲染时间）	10-60 分钟（依赖人工听测与手动调整）
操作门槛	拖拽上传，一键处理	需安装软件，熟悉多轨/效果器操作	需专业音频知识，手动调整增益/压缩器
离线可用	依赖网络（加载 WASM 引擎）	完全离线	完全离线
收费	免费	按月/年订阅（Creative Cloud）	免费（人工成本）
批量处理	单次处理一个文件	支持批量处理与预设	逐一手动操作
输出标准	ITU-R BS.1770-4（LUFS）	支持多种响度标准（LUFS/EBU R128/ATSC A/85）	依赖个人经验，无统一标准

输入	输出	说明
输入音频文件（如 48kHz/16bit WAV，平均响度 -18 LUFS）	输出文件：归一化至 -14 LUFS（目标响度），峰值 -1 dBTP	典型场景：短视频平台统一音量标准
输入音频文件（如 44.1kHz/16bit MP3，平均响度 -23 LUFS）	输出文件：归一化至 -14 LUFS，峰值 -1 dBTP	典型场景：播客或直播录音音量提升
输入音频文件（如 96kHz/24bit FLAC，平均响度 -8 LUFS）	输出文件：归一化至 -14 LUFS，峰值 -1 dBTP	边界 case：原始响度已高于目标，会降低音量
输入音频文件（如 8kHz/8bit 电话录音，平均响度 -30 LUFS）	输出文件：归一化至 -14 LUFS，峰值 -1 dBTP	边界 case：极低采样率和位深，增益幅度大
输入音频文件（如 192kHz/32bit float，平均响度 -14 LUFS）	输出文件：归一化至 -14 LUFS，峰值 -1 dBTP	边界 case：已达标，输出基本无变化
输入音频文件（如 48kHz/16bit WAV，平均响度 -14 LUFS，但峰值 -0.5 dBTP）	输出文件：归一化至 -14 LUFS，峰值 -1 dBTP（可能削波或压缩）	易错 case：峰值已接近 0 dB，归一化后可能失真
输入音频文件（如 48kHz/16bit WAV，平均响度 -14 LUFS，但采样率 48kHz）	输出文件：归一化至 -14 LUFS，峰值 -1 dBTP	易错 case：用户误以为需要手动匹配采样率

响度归一化

音频响度标准化

上传音频

拖入或点击选择音频

分析结果

目标响度

LUFS 标准

关于本工具

使用场景

播客多轨混音

短视频平台分发

直播回放音量统一

有声书章节标准化

电台广告素材预检

对比矩阵本工具 vs 竞品 vs 传统方法

使用指南

输入输出示例7 个典型场景，覆盖常规、边界与易错

常见错误对照7 个常踩的坑 · 错误 → 修复

1. 目标响度值设成 0 LUFS 或正数

2. 输入了非音频文件（图片/视频无音频轨）

3. 把“峰值归一化”当成“响度归一化”

4. 对短促音效（小于 1 秒）使用完整 LUFS 测量

5. 忽略“真实峰值”限制直接设目标

6. 把“响度归一化”当成“音量最大化”

7. 对多声道文件使用错误的声道映射

工作原理

核心公式

变量说明

示例

适用范围

原理图

开发者集成

常见问题

相关工具