audio - 自动搜索并剪切mp3音频文件的每个语音

时间：2017-09-24 02:15:59

标签： audio mp3 diff speech-recognition cut

首先，我将广泛陈述我正在尝试做什么并征求意见。然后，我将解释我目前的方法，并寻求当前问题的答案。

问题

我有一个说英语的人的MP3文件是播客的故事。我想把它分成大致对应一个单词的段。（我会手动完成，但我们正在谈论我必须削减或分离的数小时数据。）

如果您有关于如何自动执行此操作的建议，我很乐意听到。

当前方法

我只能手动使用Audacity剪切。

答案 0 :(得分：1)

好吧，首先你的问题与MP3或其他任何编解码器无关。要进行任何有意义的处理，您必须将其转换为常规PCM流。 FFmpeg很适合这个，但还有很多其他MP3工具。

接下来，我建议研究语音识别库。将其中的一个剥离到其裸组件中可能会为您提供单词边界。

这个问题并不像在音频中寻找更安静的点并进行剪辑那么简单。说话的大多数人会在连续的呼吸和声音中这样做，通过清晰度控制气流和声音输出。专业人士尤其如此。你需要能够了解所说内容的背景，这就是为什么我认为语音识别库可能是一个很好的起点。