语音自动识别中分割时间上下文的深度学习

来源：wenku163.com 资料编号：WK16318009 资料等级：★★★★★ %E8%B5%84%E6%96%99%E7%BC%96%E5%8F%B7%EF%BC%9AWK16318009

资料介绍

语音自动识别中分割时间上下文的深度学习(中文7000字,英文PDF)
摘要
本篇论文介绍了语音识别最近的重要进展，即用深度神经结构取代基础的混合GMM/HMM方法。这些模型被证实能显著地提高识别性能，这归功于其捕获数据的潜在结构的能力。然而，它们仍然特别复杂，因为一个给定音素的整体时间的上下文是通过单一一个模型来学习的，因此该模型必须具有大量的可训练权重。本文提出了另一种解决方案，将整体时间的上下文分割成块，每个块都用一个单独分离的深度模型学习。我们证明了，与传统的深度学习方法相比，这种方法显著减少了参数的数量，并且在TIMIT数据集上得到了更好的结果，在最先进的技术方法中名列前茅（只有20.20%的音素错误率）。我们还表明，我们的方法能够吸收理解不同性质的数据，包括范围从宽到窄的带宽信号。
索引词：语音识别，神经网络，深度学习，分割时间上下文