使用贝叶斯混合概率线性回归的语音转换及其动态核心特征

来源：wenku163.com 资料编号：WK16318523 资料等级：★★★★★ %E8%B5%84%E6%96%99%E7%BC%96%E5%8F%B7%EF%BC%9AWK16318523

资料介绍

使用贝叶斯混合概率线性回归的语音转换及其动态核心特征(中文4500字,英文PDF)
摘要
语音转换可以制定作为找到一个映射功能化的变换功能的源讲话者那些目标讲话者。基于以高斯混合模型（GMM）为基础的转换技术[1，2]的有效性和高效性，其已被广泛用于语音转换。在最近的研究工作中[3]，我们将基于高斯混合模型的映射推广到混合模型的概率线性归（MPLR）。但是，基于映射的高斯混合模型和概率线性回归都会遭受过度适应的问题，特别是当语言培训次数很少时，更是如此。同时它们两个都忽略语音特征之间的固有时间依赖性。本文通过引入动态核心特征和进行贝叶斯概率线性回归分析来解决这个问题。在这个问题中，动态核心特征被计算为当前帧，上一帧和下一帧的内核变换，其可以对特征中的非线性和动态进行建模。我们进一步开发最大后验（MAP）推理，以通过引入先于核心变换的参数来缓解过度问题。我们的实验结果表明提出的这个方法实现后会有比基于MPLR的模型更好的性能。
关键词：动态核心特征，贝叶斯推理，语音转换，混合模型的概率线性回归