自动搜索并剪切mp3音频文件的每个语音

时间:2017-09-24 02:15:59

标签: audio mp3 diff speech-recognition cut

首先,我将广泛陈述我正在尝试做什么并征求意见。然后,我将解释我目前的方法,并寻求当前问题的答案。

问题

我有一个说英语的人的MP3文件是播客的故事。我想把它分成大致对应一个单词的段。 (我会手动完成,但我们正在谈论我必须削减或分离的数小时数据。)

如果您有关于如何自动执行此操作的建议,我很乐意听到。

当前方法

我只能手动使用Audacity剪切。

1 个答案:

答案 0 :(得分:1)

好吧,首先你的问题与MP3或其他任何编解码器无关。要进行任何有意义的处理,您必须将其转换为常规PCM流。 FFmpeg很适合这个,但还有很多其他MP3工具。

接下来,我建议研究语音识别库。将其中的一个剥离到其裸组件中可能会为您提供单词边界。

这个问题并不像在音频中寻找更安静的点并进行剪辑那么简单。说话的大多数人会在连续的呼吸和声音中这样做,通过清晰度控制气流和声音输出。专业人士尤其如此。你需要能够了解所说内容的背景,这就是为什么我认为语音识别库可能是一个很好的起点。

相关问题