]> Gitweb @ Texas Instruments - Open Source Git Repositories - git.TI.com/gitweb - processor-sdk/kaldi.git/blobdiff - egs/sre16/v2/README.txt
[src,scripts,egs] Xvectors: DNN Embeddings for Speaker Recognition (#1896)
[processor-sdk/kaldi.git] / egs / sre16 / v2 / README.txt
diff --git a/egs/sre16/v2/README.txt b/egs/sre16/v2/README.txt
new file mode 100644 (file)
index 0000000..0c9cc0d
--- /dev/null
@@ -0,0 +1,30 @@
+ This recipe replaces iVectors used in the v1 recipe with embeddings extracted
+ from a deep neural network.  In the scripts, we refer to these embeddings as
+ "xvectors."  The recipe is based on 
+ http://www.danielpovey.com/files/2017_interspeech_embeddings.pdf but with
+ improvements due to augmentation in the DNN training data.
+
+ The recipe uses the following data for system development.  This is in
+ addition to the NIST SRE 2016 dataset used for evaluation (see ../README.txt).
+     Corpus              LDC Catalog No.
+     SWBD2 Phase 1       LDC98S75
+     SWBD2 Phase 2       LDC99S79
+     SWBD2 Phase 3       LDC2002S06
+     SWBD Cellular 1     LDC2001S13
+     SWBD Cellular 2     LDC2004S07
+     SRE2004             LDC2006S44
+     SRE2005 Train       LDC2011S01
+     SRE2005 Test        LDC2011S04
+     SRE2006 Train       LDC2011S09
+     SRE2006 Test 1      LDC2011S10
+     SRE2006 Test 2      LDC2012S01
+     SRE2008 Train       LDC2011S05
+     SRE2008 Test        LDC2011S08
+     SRE2010 Eval        LDC2017S06
+     Mixer 6             LDC2013S03
+
+ The following datasets are used in data augmentation.
+
+     MUSAN               http://www.openslr.org/17
+     RIR_NOISES          http://www.openslr.org/28