当前位置: 代码迷 >> 综合 >> kaldi 声纹识别·资源汇总
  详细解决方案

kaldi 声纹识别·资源汇总

热度:49   发布时间:2023-12-15 04:30:49.0

kaldi 声纹识别·资源汇总

  • 0. 如何学习kaldi
  • 1. kaldi 基础
  • 2. kaldi 进阶
    • i-vector
    • x-vector
  • 3. kaldi 实战
  • 4. 代码细节
    • 绘制曲线
    • 计算ERR
    • plda训练和打分

0. 如何学习kaldi

  • 知乎:语音识别kaldi该如何学习?——多去看看内容以及评论,捋一捋思路

1. kaldi 基础

Kaldi 初识:ppt
kaldi egs(使用样例表)
kaldi入门详解——aishell步骤解释

官方文档:
kaldi-asr.org/doc
Kaldi中文手册

2. kaldi 进阶

!!各个模块的深入理解:Kaldi中的plda的训练以及computer-socre(很详细,值得一看)

i-vector

kaldi-timit-sre-ivector

参考《TIMIT 数据集_声纹识别_kaldi》pdf 学习如何使用TIMIT数据集!

x-vector

  • Kaldi TIMIT x-vector 说话人识别 (声纹识别)——非常相关,值得好好看看,附带的github仓库中也适合去学习!(最好先学习前面的i-vector)
  • 【kaldi】声纹识别之X-vector——介绍了Kaldi中现成的两个例子,非常值得学习!

3. kaldi 实战

语音识别从入门到放弃
Kaldi 中的声纹识别
初识语音识别及 Kaldi 的安装使用

kaldi中改写sre10/v1用timit dataset做说话人识别总结(来自语音识别kaldi该如何学习? - Leon晋的回答 - 知乎)

4. 代码细节

绘制曲线

python 绘制声纹识别DET曲线

计算ERR

  1. 从说话人识别demo开始学习kaldi–(7)EER的计算
  2. EER(等概率错误)——来自 jinmingz

plda训练和打分

  1. Kaldi中的plda的训练以及computer-socre((从底层源码细致分析)——来自 jinmingz