3d ai合成主播 全球首位3D版AI合成主播是什么
全球首位3D版AI合成主播是什么
全球首位3D版AI合成主播是通过语音合成、唇形合成、表情合成以及深度学习等技术,克隆出具备和真人主播一样播报能力的“AI合成主播”。
“大家好,我叫新小微,是由新华社联合搜狗公司推出的全球首位3D版AI合成主播,我将为大家带来全新的新闻资讯体验。”
一段“未来感”十足的视频播报画面让人眼前一亮,全球首位3D版AI合成主播在全国两会开幕前夕正式亮相,这是继全球首位AI合成主播、站立式AI合成主播、AI合成女主播、俄语AI合成主播之后,新华社智能化编辑部联合搜狗公司最新研发的智能化产品。
扩展资料:
研发意义:
“AI合成主播”不仅在全球AI合成领域实现了技术创新和突破,更是在新闻领域开创了实时音视频与AI真人形象合成的先河。“AI合成主播”结合新华社“现场新闻”报道,将“AI合成主播”与短视频一体化生产制作。
最新推出的站立式AI合成主播即将投入到2019年新华社全国两会的报道筹备中,并将在搜狗搜索、输入法等平台上与用户见面。
随着“搜狗分身”技术能力的不断提高,AI合成主播的定制周期也降低,合成效果和稳定性也有提升。仅靠少量用户真实音视频数据,即可定制出高逼真度的分身模型,帮助媒体在融媒体转型、新闻时效性、跨语种传播能力等领域升级。
参考资料来源:百度百科-AI合成主播
3D版AI合成主播,是如何诞生的
3D版AI合成主播采用最新人工智能技术“克隆”而成。
“新小微”的原型是新华社记者赵琬微,采用最新人工智能技术“克隆”而成。从外型上看,“新小微”高度还原真人发肤,在立体感、灵活度、可塑性、交互能力和应用空间等方面,较前一代AI合成主播(2D形象)有了大幅跃升。在特写镜头下,甚至连头发丝和皮肤上的毛孔都清晰可见。
“新小微”的研发,经历了极其复杂的过程。研发人员进行了海量数据采集工作。赵琬微戴着数据采集头盔,几百个摄像头对其身体部位360度全方位“打点”扫描,采集每一处细节,并对其多种形态的表情和动作进行细致入微的捕捉记录。
就像拼乐高一样,研发人员对‘新小微’的各个部位和表情进行了模块化处理,然后重新组装。
扩展资料
“新小微”实现的升级进化
和前一代AI合成主播相比,“新小微”实现了从单一景深机位到多机位多景深、微笑播报到多样化精微表情播报等进步,播报形态可通过不同角度全方位呈现,立体感和层次感明显增强。
“前一代AI合成主播只能在坐姿或站姿下做一些简单的手势。‘新小微’不仅能走动和转身,还能摆出各种复杂动作和姿态,灵活性大大提升了。”项目负责人介绍。
此外,“新小微”以其“微模块化”的特性,实现了灵活“变妆”。她的发型、服饰均能根据不同新闻和场景变换,这些功能也是前一代AI合成主播所不具备的。
“可以说,3D版AI合成主播在多方面都更加智能化了,在人工智能的实时驱动下,可实现功能持续自我更迭。”项目负责人说。
参考资料来源:中国网-全球首位3D版AI合成主播将开启怎样的未来想象?
「克隆」新华社女记者,全球首个3D AI合成主播是如何炼成的
全球首个3D AI合成主播「新小微」由搜狗公司联合新华社推出,以新华社记者赵琬微为原型,通过超写实3D数字人建模、多模态识别及生成、实时面部动作生成及驱动、迁移学习等技术实现高度逼真和智能化。
一、「高逼真」的背后:技术熔炉炼就虚拟人超写实3D建模与数据采集
海量数据采集:原型佩戴数据采集头盔,数百个摄像头对其身体各部位进行全方位扫描,捕捉每一处细节,包括发丝、毛孔等。
表情与动作捕捉:通过细致入微的扫描,记录原型多种形态的表情和动作,为后续模型生成提供基础数据。
图:新小微走进虚拟演播室高精度模型生成
扫描还原算法:采用行业领先的算法,结合面部肌肉驱动、表情肢体捕捉等技术,生成高逼真度的3D数字人模型。
肌肉模型驱动:通过符合人体生理结构的肌肉模型,让机器学习肌肉运动规律,使表情和动作过渡更自然。
图:新小微播报时的面部表情实时驱动与渲染
AI算法实时驱动:输入文本后,AI算法生成语音数据和3D肌肉运动参数,通过渲染输出视频,支持360度多机位呈现。
高契合度表现:面部表情、唇动、肢体动作与语言高度同步,特写镜头下发肤细节清晰可见。
图:新小微3D模型细节(头发丝和毛孔清晰可见)二、完全AI驱动的3D数字人:与游戏影视的本质区别AI驱动 vs人工驱动
实时生成能力:3D AI合成主播完全依赖AI算法驱动,输入文本即可输出视频,1分钟视频仅需1分钟生成,近乎实时。
传统3D数字人:游戏、影视行业需人工扫描、动作捕捉、逐帧勾画,耗时耗力(如1分钟动画需动画师工作一天半)。
模型制作技术差异
肌肉模型优势:搜狗采用肌肉绑定技术,使动作更逼真,表情过渡自然;传统方法(如Blendshape)效果粗糙,流畅度不足。
迁移学习应用:通过预训练一般人动作,仅需真人原型1小时数据即可合成新小微,大幅降低数据需求。
成本与效率对比
AI驱动成本:视频产出效率高,成本低;传统3D制作1小时视频需成百上千万人民币。
行业变革潜力:AI技术有望颠覆劳动力密集型的3D制作行业。
三、「进化中」的搜狗分身:从2D到3D的技术跃迁搜狗分身框架
技术定位:搜狗分身是一个技术框架和产品,旨在“克隆”人类声音、表情、动作,生成虚拟助理。
使命契合:延续搜狗“让表达和获取信息更简单”的使命,通过虚拟人提升信息传播效率。
2D与3D的并行发展
2D AI合成主播:以新华社主持人邱浩为原型,逼真度高但灵活性有限,适用于固定场景播报。
3D AI合成主播:灵活性更强,可走动、转身、摆出复杂动作,拓展至媒体、客服、司法等多领域。
图:2D AI合成主播原型(新华社主持人邱浩)技术迭代与应用拓展
能力升级:从表达式到对话交互,支持多语种播报,积累垂直领域知识。
未来方向:形成有形象、多模态的虚拟个人助理,推动人机交互自然化。
总结:全球首个3D AI合成主播「新小微」的诞生,标志着AI技术在虚拟人领域的重大突破。通过超写实建模、肌肉驱动、实时渲染等核心技术,结合迁移学习优化效率,搜狗分身框架实现了从2D到3D的跨越,为媒体、客服等行业提供低成本、高灵活性的解决方案。未来,随着技术迭代,虚拟人将更深度融入人类生活,成为信息传播和交互的重要载体。
ai主播怎么弄
AI主播的制作可通过特定软件工具的虚拟形象功能实现,以B剪软件为例,操作步骤如下:
准备工具与系统设备:VIVOX20(或其他兼容设备)
系统:Funtouch OS3.2(或其他适配系统)
软件:B剪(需支持虚拟形象功能)
进入虚拟形象功能入口打开B剪软件,在主界面找到并点击“虚拟形象”选项,进入虚拟形象功能模块。此步骤是开启AI主播制作的核心入口,需确保软件版本支持该功能。
创建虚拟形象在虚拟形象页面下方,点击“添加虚拟形象”按钮。系统会弹出形象创建选项,用户可选择预设形象模板,或通过上传图片、调整参数(如面部特征、发型、服装等)自定义形象外观。部分软件支持3D建模,可生成更立体的虚拟形象。
通过面捕录制赋予动态效果形象创建完成后,点击页面下方的“面捕录制”功能。此功能通过摄像头捕捉用户面部表情与动作,实时映射到虚拟形象上,使其具备动态表达能力。录制过程中需保持面部清晰可见,录制完成后保存即可生成一个完整的AI虚拟主播。注意事项:
不同软件操作路径可能存在差异,但核心流程均为“创建形象→绑定动作捕捉→生成内容”。部分高级功能(如语音合成、多场景切换)需结合软件其他模块或插件实现。确保设备摄像头与麦克风权限已开启,避免录制失败。
文章分享结束,3d ai合成主播和全球首位3D版AI合成主播是什么的答案你都知道了吗?欢迎再次光临本站哦!