发明 2023117734938 一种基于原生声纹特征的拾音翻译方法、设备及存储介质
未下证 语音识别 翻译 5人
G10L17/02 G10L17/04 G10L17/14 G10L17/18 G10L13/08 G10L13/10 G10L21/013 G10L21/0208 G06F40/35 G06F40/58
免责声明:以上消息未经人工确认,本平台不担保其真实性和有效性,交易前请仔细核实。
本发明公开一种基于原生声纹特征的拾音翻译方法、设备及存储介质,涉及语音识别技术领域。本发明包括,获取原生音频;将原生音频进行分割得到多个原音素以及对应的顺序;获取每个原音素的若干个种类的声纹特征;对原生音频进行语义识别得到原语种文本;将原语种文本翻译为转译语义文本;对转译语义文本进行音素拟合得到多个转译音素以及对应的顺序;根据原音素和对应的顺序以及对应的若干个种类的声纹特征对转译音素进行修正得到转译音频。本发明通过对发言者的原生声纹特征进行识别提取,实现对语音翻译结果的修正,同时实现对翻译结果的润色。