如何提取特定声音后的音频？_python

假设我有一些很长的音频文件（例如，广播录音）。 我需要从每个文件中提取特定声音（例如，广告开始声音）后5秒钟。 每个文件可能包含3-5种这样的声音，因此我应该获得*（3-5） 个源文件结果文件。

我找到了和 python库，但不确定它们是否可以提供帮助。 我应该从什么开始呢？

您可以从计算信号与特定声音的相关性开始。 不知道librosa是否提供此功能。 我将从或开始。

不知道您的背景是什么。 如果您需要一些理论，请从开始。

基本上，如果音频匹配您的特定信号或与之非常相似，则相关性会很高。 确定这些位置后，您可以选择它们周围的区域。

如何提取特定声音后的音频？