柯南变声器的算法原理解析-伊何底止网

当前位置：首页 > 休闲 > 柯南变声器的算法原理解析

柯南变声器的算法原理解析

发布时间：2024-04-29 23:14:38 来源：伊何底止网作者：休闲

柯南变声器的算法原理解析

柯南昨天上热搜了，柯南今天分享下一个在刑侦破案中非常有用的变声技术—变声器的实现效果

0 1

小时候特别喜欢看柯南，里面有个变声蝴蝶结，算法让我印象深刻。原理变声蝴蝶结的解析作用就是可以把输入的语言转化成其它人的声音。举个例子，柯南如果我有这个语音转换功能，变声下次录歌的算法时候就可以用周杰伦的声音录制（唱功还是自己的
）。

如果要实现变声功能，这里面包含哪些技术点呢，解析首先要提取出语音中的柯南3种表征：

内容表征：输入语音的具体内容
声纹表征：可以理解为人的声色，每个人都是变声不同的
说话风格表征：说话的语气、强弱、算法快慢等风格相关

通过上述分析，原理如何实现变声功能就比较好理解了。解析首先把语音分解为内容表征、声纹表征、说话风格表征3种特征，然后把声纹表征替换成其他人的声纹特征即可实现。

0 2

那么声纹识别如何实现就成了变声功能的关键。先看下声音信号是什么样的：

大家应该在各种k歌工具中都多少了解些声音信号的样子，基本上声音信号就是一堆脉冲。脉冲是一个时序信号数据，很难处理。需要对声音时序信号进行傅里叶转换，才能转换成频谱图（学过通信的同学应该比较好理解，通信专业的我当年碰到傅里叶这3个字就抖），转换效果如下图：

傅里叶转换后的图其实就成了一个与时间无关的图，所以就可以通过深度学习CNN算法去学习规律，对于深度学习有了解的同学应该知道CNN可以快速学习图像中的一些细节差别，其实根本原理跟人脸识别或者文字识别等场景都是一致的，于是就可以基于这种方法实现对于语音信号的声纹的分析和识别。

0 3

上文大概讲了下变声这个功能的大体理论以及声纹识别的算法原理，接下来讲一个适用场景吧，早在14年我在某外资手机巨头做手机软件开发的时候就想到一个场景，通过声纹识别解决骚扰电话。

当时想的方法是这样的：首先通过声纹识别把用户所有有关联的人的声纹pattern都识别出来，存储到手机内。一旦有个电话进来，先不着急接通，而是要求拨电话的人说一句话，这时候马上识别他的声纹与手机中存储的声纹pattern作比对。如果拨电话的人的声纹是一个新声纹，则判定为骚扰电话，拒绝接通~

现在想想，那时候这种通过声纹识别拦截骚扰电话的想法还是挺超前的。好啦，今天就简单分享到这里，谢谢大家，希望能对大家有所帮助~

上一篇：抖音神曲《游山恋》热议不断，＂戏腔＂抓耳但它不是戏曲
下一篇：【矿君茶馆】第十九期：灾厄mod深渊详解（物品篇）

随便看看

刘欢成立公益金鼓励原创音乐 95后唱作人闫泽欢获百万元奖金马思纯赞陈伟霆《橙红》演技爆棚称私人状态挺好晨风透明皮肤修改器2013（晨风软件工作室qq透明皮肤修改器）2018年农历十月二十八日子是吉日吗？今日卦象如何？《魔兽世界》怀旧服战士属性优先级推荐 5个武汉人的解封生活：64岁患者不敢出门担心歧视龙济堂历代杯盏专辑！腾讯老总是谁少女时代已衰落？出道10年的T-ara，或为南韩最大赢家汶川地震爱的奉献捐款名单送爸爸生日实用的10个礼物，爸爸过生日送什么礼物好 msgbox.html5.qq.com,怎样制作qq透明背景皮肤回家的路先于微信出现的Talkbox究竟是怎样失掉先机的？71岁蒋大为全家近照曝光，女儿竟比妈妈漂亮，如今因这事惹人嫌！全球公爵黑卡相似应用下载就算是写水文，你也得先写起来吧！无敌骑士团手游官方最新版 v4.1.0 公认最好看的十大日本动漫，第五名已全网禁播，《死亡笔记》在榜全媒派｜连线Insight主编：多家媒体同时报道，我们如何差异化？4月8日武汉“解封” 预计当日5.5万人坐火车离汉易语言解析音悦台MV提供超清下载地址的代码冯提莫做客天天向上谎称自己是大学老师，学历造假丑闻彻底公开《史上最坑爹的游戏10》攻略图文全关卡-迷失攻略组 qq2012透明皮肤喵心难测最新章节,喵心难测全文阅读(一梦萧瑟)绣架批发全球公爵黑卡其承诺的话费根本无法兑现！二十四节气6.21-7.6：日本人如何过夏至？为什么山东最近发不了快递_山东快递什么时候恢复最新消息2022 中国历史上真实存在的“九大武林高手”最后一个无可争议！思量QQ透明皮肤 v1.4 QQ辅助 2018年农历十月二十八日子是吉日吗？今日卦象如何？音乐如愿-周深的MP3下载赵薇穿背带裤时髦又减龄联系客服天赐的声音2 第3期：许飞、马頔唱哭孟美岐，周传雄勾起张韶涵青春记忆微博之夜神仙同框承包热搜！小尼徐铮“撞脸”uc软件有哪些？uc软件下载中心-手机uc软件下载合集 iphone5和5s的区别是什么？参数配置对比