2D动漫变脸

作者|肖伟

二月底,各种版本的《蚂蚁嘿》在Tik Tok上映。有网友说,“打开Tik Tok,好像捅了蚂蚁窝。”

通过一款名为Avatarify的APP,用户只需要上传一张照片,照片主人就可以做出各种想要的表情。截至记者发稿时,“嘿蚂蚁”在Tik Tok的视频超过25万条,相关话题的视频播放量达到30亿次。Avatarify在2月25日获得国内App Store应用免费榜第一名,随后连续几天蝉联总榜第一。

相比ZAO走红三天后,Avatarify也难逃变脸软件的命运,仅在七天后就在中国的APP Store下架(目前在国外仍可使用)。

Avatarify是一个俄罗斯程序员开发的,放在GitHub上。它最初是用来为Zoom和Skype等视频会议“解闷”的。比如,你可以在视频会议中把自己的脸换成马斯克的脸,实时互动。到目前为止,这个项目已经在GitHub上获得了近1.2万星。

几个月后,Avatarify推出了APP版本(仅限iOS版本)。原理上,Avatarify借助deepfake等技术,在待交换的人脸图像上训练算法。通过在相似类别的目标图像上训练算法,该模型支持实时的人脸变换操作。

变脸软件屡遭下架的背后是隐私和信息安全问题。很多人会担心自己的人脸信息会被泄露或滥用,但我们也不必一棍子打死背后的AI技术——深度合成。此外,深度合成在许多行业中有许多更有价值的应用。

深度构图第一次被公众注意是在2017 11。当时,美国新闻网站Reddit上一个名为“deepfakes”的用户上传了一段合成后的色情视频,将色情片中一个演员的脸换成了明星的脸。此后,媒体开始用deepfake来形容这种基于AI的视频合成内容。但是很多人误以为深度合成是deepfake,变脸,真的很尴尬。

首先,deepfake是深度合成的子集。但是变脸是最早进入大众视野的,也是最知名的深度合成应用。

深度合成的内涵非常广泛,包括语音、图像、音频、视频、人脸在人工智能算法帮助下的合成和自动生成。其典型应用包括:人脸替换(换脸)、人脸再现(操纵目标对象的面部表情,比如让他们说一些他们从未说过的话)、人脸合成(AI产生一个真实的人脸图像,实际上这个人脸是不存在的)、语音合成、全身合成等等。

其次,deepfake频繁引发的隐私安全和滥用色情场景会让人对深度合成技术产生偏见和误解,甚至认为AI伪造的内容会冲击社会信任等等。但随着深度合成技术在更多领域的应用,大众对深度合成技术的认识也更加成熟。

深度合成背后的AI技术主要包括两个模块:自动编码器和gan(生成对抗网络)。GAN由两组人工神经网络组成,一组是生成器,另一组是鉴别器。在无数次的对抗中,生成器最终使得鉴别器不再能够区分真实数据和合成数据,从而生成高度真实的内容。

业界最先进的图像生成器是NVIDIA的StyleGAN,于2065438+2009年2月在Github上开放。

腾讯研究院和腾讯优图实验室发布的《2020年AI生成内容发展报告——深度合成商业化元年》(以下简称报告)显示,近年来深度合成技术演进加速,并呈现出几大技术趋势:

1.除了单一的音频和图像合成,深度合成技术正在向综合方向发展。

第二,脸型形成后,全身合成会成为新的热点。

3.除了2D合成,三维合成技术(尤其是虚拟数字人)将是下一阶段的重点。

而且随着“深度合成”技术的成熟,已经应用于影视、娱乐、教育、医疗、电子商务、广告营销等多个领域。

在媒体行业,AI主播越来越火。2018年,搜狗联合新华社推出全球首款AI复合主播,2020年,双方推出全球首款3D AI复合主播。3D AI合成主播基于超现实3D数字人体建模、多模态识别与生成、实时面部动作生成与驱动、迁移学习等多项人工智能前沿技术。,使机器能够基于输入的文本生成高保真的3D数字人体视频内容,呈现与真人一样的视频广播。

此外,包括百度、JD.COM和网易在内的互联网巨头也相继推出了虚拟数字人。百度AI云引入的虚拟数字人,成为国内第一个银行的“虚拟员工”。

在自动驾驶领域,深度合成用于开发自动驾驶模拟系统(AADS),创建虚拟道路环境,为自动驾驶系统提供训练和测试。

在医学领域,通过生成与真实医学图像没有区别的医学图像来训练AI系统,可以解决医学数据不足和患者隐私保护的问题。在NVIDIA及其合作伙伴联合发表的论文中,演示了利用GAN算法合成带有肿瘤的脑部MRI图像的方法。在算法训练和生成过程中,只需要10%的真实数据,AI诊断系统就可以在真实图像中检测出肿瘤。

在广告营销领域,AI合成的人脸和虚拟形象可以代替真实模特参与营销活动,没有人会像版权问题。比如Generated Photos就是一个用AI自动生成人脸的网站。其数据库中有超过65438+万张AI生成的人脸,可供免费下载使用,不存在版权问题。这些免费的人脸图片可以用在很多场景,比如广告传单、网站、PPT演示、问卷、用户头像等等。

深度合成的滥用是人工智能治理的重要课题。

色情行业是新技术采用和普及的先锋,AI技术也不例外。目前色情行业是深度合成技术滥用的重灾区。报告显示,2019至12,全网共有14678条深度合成视频,其中96%为色情深度合成视频,主要集中在色情网站。

深度合成技术如何防人作恶?多元化治理是一种公认的理念,包括法律方案、技术方案、行业自律和公众教育。

在法律方面,一些发达国家已经出台了相关法案。但值得注意的是,并没有“一刀切”禁止使用深度合成技术,而是禁止利用深度合成技术从事色情视频合成、虚假新闻、干扰选举等违法行为。比如美国国会的《DeepFakes责任法案》等相关法案,只禁止出于政治干涉、色情报复、冒名顶替等目的的深度合成,并要求制作者在深度合成内容中添加水印等标记。

在技术上,识别技术和溯源技术是两种主流的方法。但是在认证方面,目前还没有通用的视频认证方案,需要针对每一种新兴的合成技术训练有针对性的认证网络。

虽然深度内容合成的门槛已经大大降低,普通人也可以在智能手机等智能终端上完成娱乐深度内容合成,但这样的内容往往更容易被识别。高质量、高仿真的深度合成内容还是需要专业的工具和技巧。所以,我们需要防范风险,不要恐慌。

AI就像是人类非常聪明的学生,而TA只是快速而忠实地学习人类所教的东西。

正如报告所言,“深度合成不是关于‘伪造’和‘欺骗’,而是一种极具创造性和突破性的技术。虽然它和其他技术一样,衍生出了一系列必须面对的问题,但不会抹杀这项技术给社会带来的进步。”