audio - 门控声级

我正在实施基于ITU标准的响度测量程序，因为它表明我应该使用某种门控来排除静音区域影响测量的平均声级 - 例如 - 如果例如，则采用3秒的一般积分时间 - 例如整个声音的第一秒包含语音，其中最后2/3包含静音（人们呼吸，思考或出于类似的原因）然后我得到的响度值小于它应该是 - 因为我考虑了沉默区域。所以有一些建议，但没有很好的文件解决方案 - 你需要“瞬时”（400毫秒）响度测量除了需要（3000毫秒）积分时间，如果“即时”响度是8LU（LU代表响度单位）低于测量的响度在“全时”（3000毫秒） - 然后暂停响度测量，同时获得远程水平范围内的即时水平。长话短说 - 你得到一些传入的样本，例如10ms，你计算你的滑动短期和长期响度，然后你比较短期响度是否比长期低8个单位并丢弃那组样本/暂停你刚刚获得的10ms样本的声音测量，有效地忽略它们并将你的长期响度保持在更高的水平 - 忽略那些“相对于长期保持沉默”的10ms;

所以问题是：因为我忽略了比我的长期响度水平低8o的所有样本（实际上是小块样本），我实际上应该阻止我的长期响度水平变小。

来自“2010年EBU P / Loud工作组的论文：

“P / LOUD在2009年第四季度和2010年1月进行了听力测试以确定最佳门控阈值。发现四个测试中的两个候选门控方法给出了良好的结果，两者在统计上显着优于其他两个这两种方法相对于非门控LKFS（'6rel'）是6LU的门，相对于非门控LKFS（'10rel'）是10LU。对于所有候选者，使用了400ms的块长度。实际上，选择8rel的值为8rel。针对广播者已使用的其他门控功能的进一步非正式测试“*

P.S抱歉我的恩，不是我的母语。

我没有看到标准中的哪个位置表明方法与您描述的一样复杂。相反，从我的，粗略地粗略地概述这一点，我认为你需要通过将窗口分成较小的时间箱来计算滑动窗口中的响度，并且如果该窗口中的任何较小的时间段低于阈值（ - 8LU），你把这些箱子留在计算之外。

也许你正在这样做，而不是正确计算平均值。要在丢弃样本时正确找到平均响度，您需要获取未丢弃的响度级别之和（即高于截止阈值的值），并且将其除以响度高于阈值的时间量。也就是说，我假设当你说“响度水平变得比它实际上要小”时，你所做的就是除以总时间，这会错误地降低平均值。相反，你应该只计算用于计算总和的时间，即 N*(small time bin size in seconds)，其中N是高于阈值的箱数。

也许这个算法看起来比实际上更复杂，因为你正在研究一种方法，它试图确定每个新时间段是否超出阈值，因为它进入滑动窗口，而不是重新计算它滑动窗口？这当然是可能的，并且是有效地实现它的方法，但算法有点复杂。

门控声级

1 个答案: