当前位置: 代码迷 >> python >> 如何提取特定声音后的音频?
  详细解决方案

如何提取特定声音后的音频?

热度:37   发布时间:2023-07-16 10:25:44.0

假设我有一些很长的音频文件(例如,广播录音)。 我需要从每个文件中提取特定声音(例如,广告开始声音)后5秒钟。 每个文件可能包含3-5种这样的声音,因此我应该获得*(3-5) 个源文件结果文件。

我找到了和 python库,但不确定它们是否可以提供帮助。 我应该从什么开始呢?

您可以从计算信号与特定声音的相关性开始。 不知道librosa是否提供此功能。 我将从或开始。

不知道您的背景是什么。 如果您需要一些理论,请从开始。

基本上,如果音频匹配您的特定信号或与之非常相似,则相关性会很高。 确定这些位置后,您可以选择它们周围的区域。

  相关解决方案