ai声音合成，AI声音合成技术是什么

编程之家2026-06-07946次浏览

AI声音合成技术是什么

骗子利用AI声音冒充亲人诈骗

！

随着科技发展的步伐越来越快，人们的生活也变得越来越数字化，数据化、智能化。与此相应，黑客和骗子们也在不断研发新技术进一步发展诈骗手段。最近几年针对于利用AI技术伪造真实人声的声音诈骗事件，再次引起了社会对于数字化时代安全风险的关注。本篇文章就以AI声音合成技术骗子的手段和案例为例，分析其存在的问题和解决办法。

一、AI声音技术是如何伪造人声的

最近新闻报道中提到，骗子们利用AI合成技术实现了语音诈骗，这项技术可以将骗子的话转化为被害人的父母或子女的声音，达到欺骗的目的。如何实现这项技术呢？这主要依赖于人工智能算法中的语音合成技术。所谓语音合成，就是利用计算机自动将文本转化为声音的过程。语音合成除了识别输入语音外，还需要注意模拟入口的嗓音特征，通过模拟声音波动，实现语音合成的效果。AI声音合成技术的基本过程就是——先准备好伪造者需要转化为目标语音的声音模型，然后将要素读入到模型中，再实现合成，最终输出声音波动来模拟真实人声。

二、AI声音技术诈骗案例分析

利用这种技术，骗子可以更真实地模仿父母、子女的声音，从而通过手机选择操作来诈骗。在一些案件中，骗子自称是被害人的亲戚，以病情急需、生意亏损等各种借口诱骗受害人刷卡或转账，造成财产损失。在某些骗局中，对方甚至会加入背景噪音，声音显得尤为真实，有人不由分说就被骗了。

三、AI声音技术所存在的问题

骗子成功利用AI声音合成技术实施诈骗，说明AI技术不仅可以带来的便捷和前沿科技的创新，但也带来了更大的安全隐患和人身财产风险。当前AI声音技术还存在很多缺陷，如难以复制人类声音的共鸣特征，无法模拟情感表达和音质等问题，导致模拟的语音声音仍无法达到真人的水平。同时，一些诈骗分子仅利用一些网络信息素材，就能生成极为逼真的语音，这也对信息储备、隐私保护产生了极大的冲击，容易引发法涉及法律纠纷和道德争议。

四、防范AI声音技术诈骗的方法和措施

为了预防被骗，大家可以尽量做到以下几点：

1.提高警惕：随时留意陌生电话和肯德基拥挤，一旦接到可疑的电话，记录电话、时间、内容等，并多个电话核实。

2.抹痕迹：避免在网络中留下不必要的个人信息或者轻信一些不能够确切核实的信息，比如说网上销售骗局等。

3.生活安全：如遇该诈骗被骗的情况，请及时向警方报警，多留几个联系方式，尽量避免私人连接等交流方式。

四、技术防范：应用技术手段(如双重验证等)来保证账号安全，防止被盗号等情况。

AI是趋势，AI诈骗也成为现实。如何利用科技赋能人类文明，是一项全球性的任务，也是传媒人核心价值观和职责所在，我们不妨利用传媒和电信科技专家的知识，探讨更完善和有效的解决手段和技术方案，避免了西方文化的科技互联等问题。

#骗子利用AI声音冒充亲人诈骗#

举报/反馈

精彩推荐

极目新闻

2023-04-03 17:19:38楚天都市报官方帐号

实探上海医生杀妻案发小区：事发时家里还有老人和孩子4月3日，上海市公安局闵行分局官方发布了一则警情通报：2023年4月1日10时50分，新龙路某小区内发生一起刑事案件，民警迅速到场将犯罪嫌疑人周某某控制。经查，周某某因家庭矛盾与妻子徐某某发生冲突后，将徐某某杀害。目前，周某某已被依法刑事拘留，案件正在进一步侦办中。另据新京报消息，犯罪嫌疑人周某某是上海某医院医生，遇害者徐某某是一名护士。4月3日中午，极目新闻记者来到位于上海市闵行区新龙路的事发小区，一名附近房产中介的工作人员告诉记者，1日事发当天，特警和救护车到小区时，他们并不知道发生了什么事。3日，他们才听说一名男子在家中将其妻子杀害。极目新闻记者在事发单元的楼梯间看到，这是一栋一梯两户的单元楼，事发业主门口还放着一辆儿童单车。一名住户向记者介绍，事发业主家里已经没有人了，房子是夫妻双方共同出资买的，肯定要两边家里协商如何处理。“有中介打电话来问我这件事。”

ai怎么合成ai怎么合成声音

1、首先打开需要编辑的AI文件，进入到编辑页面中，点击新建一个文档。

2、然后在弹出来的窗口中选择样式，点击右下角的“创建”。

3、然后在弹出来的窗口中点击打开左上角文件中的“置入”。

4、然后在弹出来的窗口中打开图层面板菜单，点击“释放到图层”就可以合成了。

ai和声怎么做ai合成音

AI和声是一种利用人工智能技术来生成和声的方法。以下是创建AI和声的常规步骤：

1.确定和弦进行：首先，需要确定和弦的序列，即每个和弦的构成音。AI可以根据这些和弦进行来生成和声。

2.输入和弦信息：将确定的和弦序列输入到AI和声系统中。通常，需要输入和弦的根音、和弦的组成音以及和弦的调性等信息。

3.生成和声：AI系统会根据输入的信息生成和声。系统会考虑和弦的色彩、和弦之间的协和性等因素，并生成多个可能的和声方案。

4.筛选和声：根据需求，对生成的多个和声方案进行筛选，选择最佳的和声。可以选择根据个人喜好、音乐风格等因素进行筛选。

5.调整和声：如果需要，可以对筛选后的和声进行调整，以满足音乐的具体需求。例如，可以调整和声的音量、音色、织体等参数。

需要注意的是，AI和声是基于人工智能技术的生成方法，并不是完全准确的和声制作方法。因此，在制作音乐时，仍然需要结合个人的经验和音乐知识来进行调整和完善。同时，不同的AI和声系统可能存在差异，应根据具体需求选择合适的系统。

如何看待AI合成生成音

AI语音技术在如火如荼地发展，在另外一个空间维度，一些触动人心的神秘的事件却在悄然发生。

如果你是一名网红、一名演员、一位领导人、一家公司的创始者，或者你在短视频网站上有很多公开的音视频，非法分子就极有可能用它来合成并生成你的声音，业界称为语音欺诈（Deepfake）。

在2019年3月，一家英国某能源公司的高管，接到了德国母公司的“CEO老板”的紧急电话，“CEO老板”要求他将资金汇给匈牙利供应商，来电者表示“该请求非常紧急”，要求行政人员在一小时内付款220000欧元（约1730806人民币）。这位英国高管开始并没有意识到有什么问题，在整个通话过程中，CEO轻微的德国口音都展现得淋漓尽致，该高管完全没有任何的怀疑，直到被要求再次转账时才发觉了事件异常。犯罪分子总共打了三次电话，当第一笔220000欧元转移后，他们打电话说母公司已经转移资金偿还英国公司，然后他们在当天晚些时候进行了第三次电话会议，再次冒充CEO，要求第二次转账。由于第三次电话是来自奥地利的电话号码，英国公司的行政部门开始怀疑，没有再次转账。事后调查发现，这 22万欧元并没有转到所谓匈牙利供应商，而是被转移到了墨西哥等多个国家。警方对这起事件进行调查后发现，诈骗者用了一种 AI语音合成软件来模仿德国母公司 CEO的声音，但至今仍无法找到幕后的诈骗者。

一位科技记者受了前密西根大学社交媒体责任中心CTO Aviv Ovadya言论的影响，做了这样一次实验，他使用AI合成软件模仿了自己的声音，然后打电话给自己的母亲，世界上最熟悉你自己声音的人是谁？最熟悉你声音肯定是你的母亲，但令人后怕的结果是，母亲完全没有听出来有什么异样。

三名蒙特利尔大学博士联合创办的名为“琴鸟”（Lyrebird）的公司开发出了一种“语音合成”技术，只要对目标人物的声音进行1分钟的高质量录音，丢给“Lyrebird”处理，就能得到一个特别的密钥，利用这个密钥可以生成目标人物任何想说的话。“琴鸟”不仅能利用语音模仿演算模仿出任何人的声音，还能在声音中加入“感情”元素，让声音听上去更为逼真。

即使不是名人，我们普通的用户也在手机社交语音平台上留下了数以万计的历史语音。通常APP内语音不能被转发，但网络上出现了“增强版软件”可以留存、转发APP内的对话的语音文件，这样只要盗用了好友的账号，又获得了好友语音声音，非法分子就可以轻易合成听起来熟悉的家人朋友的声音了。

知此知彼：几种主要的语音欺诈、攻击手段

为做到知此知彼，百战不殆，需要要对常见的语音攻击欺诈手段做一个深入的了解和研究。目前常见的语音攻击欺诈手段主要有三种，分别是语音合成（Text-To-Speech，TTS）、语音转换（Voice Conversion，VC）和录音重放（Replay）。在世界顶级赛事ASVspoofing中，将语音合成和语音转换统的场景称为LA(Logical Access)，录音重放的场景称为PA(Physical Access)。

语音合成和语音转换工作原理如图1所示，基于神经网络的Waveform Modelling技术类似WaveNet产生的语音和真人发声已经很接近。在Voice Conversion Challenge 2018挑战赛中的最佳系统产生的语音，已经极大提高了自然度和模拟人声的相似度。

图1语音合成和语音转换工作原理

ASVspoofing挑战赛是近些年来世界级的研究语音攻击、试图解决此问题而设立的大赛，目标是旨在设计出有效的防攻击安全系统，可以准确发现由最新算法或者不同算法、甚至不可见的算法来产生的伪造假语音。迄今为止已经举办了三届，分别是ASVspoofing2015，ASVspoofing2017，ASVspoofing2019。多家顶级研究机构和知名公司都参与到其中。在ASVspoofing2019举办方提供的训练、测试和验证数据集中列举了并囊括了目前业界最新的攻击算法和手段，其中TTS的主流算法10种，VC的主流算法4种，TTS和VC的融合算法 3种，算法及结果如图2所示，可以了解到最新的算法主要使用了神经波形模型(Neural Waveform Models)和波形过滤器(Waveform Filtering)，或者是这些技术的变种。同时TTS/VC的最新的算法也借鉴了一些说话人识别中的核心技术点。这些算法可以基于一些工具包如Merlin，CURRENT，MarryTTS等来生成。同时我们可以观察到另外一些重要的细节，评价一个说话人识别（Automatic Speaker Verification，ASV）系统性能的重要指标是等错率EER，EER越低，ASV识别的性能越好。在没有假语音攻击时，ASV的性能只有2.48%，但当系统受到了TTS和VC合成的假语音的攻击时，性能急速下降，从图2中可以看到，EER最高可以升到64.78%，可见攻击语音对说话人识别、声纹识别这样的语音系统的影响之巨大，以及鉴伪抗攻击安全措施的重大意义。

好了，关于ai声音合成和AI声音合成技术是什么的问题到这里结束啦，希望可以解决您的问题哈！

ai智能写作一键生成？AI一键生成作文不用登录：开启写作魔兽世界黑石深渊，黑石深渊副本入口