【蒙娜丽莎】蒙娜丽莎唱RAP！微软最新AI模型让静图秒变视频

栏目导航

财经热点 > 财经资讯 > 蒙娜丽莎唱RAP！微软最新AI模型让静图秒变视频

【蒙娜丽莎】蒙娜丽莎唱RAP！微软最新AI模型让静图秒变视频

浏览次数：【349】发布日期:2024-4-25 20:42:28 文章分类：财经资讯

专题：【蒙娜丽莎】【VASA】【AI模型】【RAP】

　　在最新人工智能（AI）技术的加持下，达芬奇名作中的蒙娜丽莎不只是淡淡微笑，还可以喜形于色地唱起RAP。

　　最近，微软推出最新AI模型VASA-1，新技术的亮点是可将人的静态图像和语音音频片段生成真切的视频。

　　之前OpenAI推出的Sora是“文生视频”，VASA-1可以说是“图生视频”。

　　根据微软的说法，VASA-1生成的视频可以做到人物口型与音频完美同步，还能展现丰富的面部脸色和自然的头部动作，使整个视频显得既真实又布满活力。

　　VASA-1不仅能对真人图像或相片施展“魔法”，还能让静态的卡通人物或艺术作品中的人物开口说话、唱歌。

　　好比达芬奇名画《蒙娜丽莎》可以“演绎”RAP说唱。

　　在微软演示的这段视频中，蒙娜丽莎秒变活力四射的歌手，唱起了安妮·海瑟薇在一档脱口秀节目中创作和表演的说唱歌曲。

　　微软科研人员表示，他们用大量人类说话时的面部脸色视频训练新AI模型，包含口型变化、面部脸色、目光凝视和眨眼等，使得生成的视频维妙维肖。另外，新模型还能控制或设定人物的视线方向或特定脸色。

　　不过，VASA-1的“图生视频”被认为仍然留有机器生成的痕迹。例如，眨眼还不够频繁自然，眉毛动作也略显夸张。

　　科研人员承认，该模型和其它AI模型一样，在处理头发等元素方面仍有困难。

　　但微软方面称，VASA-1仍优于其它类似模型，为AI数字人未来能更像真人一样与人实时互动铺平道路。

　　在应用领域，VASA-1还能为有沟通障碍者提供支持，甚至有望为人类创造虚拟伴侣。

　　社交媒体上，很多网友对微软新AI模型生成的视频真切度感到惊讶，形容其“真实得可怕”。还有评论说，“太疯狂、太怪异、太恐怖了”。

　　微软表示，这一最新AI模型的确存在被滥用的危险，好比用来冒充真人进行欺诈或流传虚假信息。

　　为此，微软迄今尚未公开发布VASA-1。科研人员说，需要确定这项技术能根据适当的规定被负责任地使用时才会发布。

手机扫码浏览该文章

● 相关资讯推荐

2024-5-31【蒙娜丽莎】蒙娜丽莎 - 接受国信证券粤西分公司等机构调研

2024-5-29【蒙娜丽莎】蒙娜丽莎 - 接受华源证券等机构调研

● 相关资讯专题

【蒙娜丽莎】【国信证券】【机构调研】【分公司】【002918】【营业收入】【张旗康】

关于我们

关于我们

付款方式

售后服务

主机域名

信息资讯

解决方案

网站建设

服务支持

提交工单
提交BUG
文件柜
实名制认证
会员注册
找回密码

信息资讯

移动网站

网络建设业务咨询

TEl：13626712526

网站首页

主机域名

网站模板

网站开发

软件开发

财经资讯

金融工具

管理中心