专利名称:一种识别同一说话人的方法和装置专利类型:发明专利
发明人:张晴晴,贾艳明,张雪璐,岑吴镕申请号:CN202010545180.7申请日:20200616公开号:CN111508503A公开日:20200807
摘要:本发明公开一种识别同一说话人的方法和装置,该方法包括以下步骤:采集第一音频和第二音频,所述第一音频为第一说话人在第一背景环境下输出的人声,所述第二音频为第二说话人在所述第一背景环境下输出的人声;获取与所述第一背景环境对应的第一阈值;判断所述第一音频和所述第二音频的相似度是否大于所述第一阈值,若是,则确定所述第一说话人和所述第二说话人为同一说话人。本发明针对声纹识别的环境因素、语种等外部因素,判断音频背景环境并进行分类,从而确定阈值,并基于该阈值判断两个说话人是否为同一说话人,能够提升说话人识别的正确率。
申请人:北京爱数智慧科技有限公司
地址:100044 北京市海淀区高梁桥斜街59号院1号楼14层1415
国籍:CN
代理机构:北京智沃律师事务所
代理人:吴志宏
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容