什么是深伪,我应该担心吗?

我们倾向于信任视频和音频记录的内容。但有了人工智能,任何人的脸或声音都可以精确地重现。该产品是深度假冒的,一种可以用于模因、错误信息或色情的冒充。

只要看一眼尼古拉斯·凯奇(Nicholas Cage)的深度假PSA或乔丹·皮尔(Jordan Peele)的深度假PSA,就会清楚地知道,我们正在应对奇怪的新技术。这些例子虽然相对无害,但也提出了关于未来的问题。我们可以信任视频和音频吗?我们能让人们对他们在屏幕上的行为负责吗?我们准备好深造了吗?

Deepfake是新的,易于制造,并且增长迅速

Deepfake技术只有几年的历史,但它已经爆炸式地发展成既迷人又令人不安的东西。2017年在Reddit的一条帖子上创造了一个术语“深度假”,用来描述通过人工智能重现人类的外表或声音。令人惊讶的是,几乎任何人都可以用一台劣质的PC、一些软件和几个小时的工作来创建深度假冒。

与任何新技术一样,围绕深度假货也存在一些困惑。“醉酒佩洛西”视频就是这种困惑的一个很好的例子。Deepfake是由人工智能建造的,它们是用来模仿人的。被称为“深度假”的“扣篮佩洛西”视频实际上只是一段南希·佩洛西的视频,它被放慢了速度,并进行了音调校正,以增加模糊的语音效果。

这也是“深度造假”与“星球大战:流氓一号”中的CGI凯莉·费舍尔不同的地方。虽然迪士尼花了很多钱研究凯莉·费舍尔的脸,并手工重现,但一个拥有一些深度假冒软件的书呆子可以在一天内免费做同样的工作,人工智能让这项工作变得令人难以置信地简单、廉价和令人信服。

如何制作“深伪”(Deepfac)

就像教室里的学生一样,人工智能必须“学习”如何执行它想要的任务。它通过暴力尝试和错误的过程来做到这一点,通常被称为机器学习或深度学习。例如,一款旨在完成超级马里奥兄弟(Super Mario Bros)第一关的人工智能将反复玩这款游戏,直到它找到最好的取胜方式。设计人工智能的人需要提供一些数据来开始工作,以及在过程中出现问题时的一些“规则”。除此之外,所有的工作都是由人工智能完成的。

深度假面部重塑也是如此。但是,当然,重现面孔并不等同于玩电子游戏。如果我们要制作一个尼古拉斯·凯奇主持温迪·威廉姆斯秀的深度赝品,以下是我们需要的:

目的地视频:到目前为止,深伪与清晰、干净的目的地视频效果最好。这就是为什么一些最有说服力的深伪是关于政客的;他们往往在持续的灯光下站在讲台上一动不动。所以我们只需要一段温迪坐着不动说话的视频。 两个数据集:为了让嘴巴和头部的运动看起来更准确,我们需要一个温迪·威廉姆斯(Wendy Williams)面部的数据集和一个尼古拉斯·凯奇(Nicholas Cage)面部的数据集。如果温迪向右看,我们需要一张尼古拉斯·凯奇向右看的照片。如果温迪张嘴,我们需要一张凯奇张嘴的照片。

在那之后,我们让人工智能来做它的工作。它试图一遍又一遍地制造深度假,同时从自己的错误中吸取教训。很简单,对吧?嗯,把凯奇的脸贴在温迪·威廉身上的视频不会愚弄任何人,那么我们还能走得更远吗?

最有说服力(也可能有害)的深度假是全力以赴的模仿。乔丹·皮尔(Jordan Peele)创作的广受欢迎的奥巴马深度假广告就是一个很好的例子。那么,让我们来做一个这样的模仿吧。让我们制作一个马克·扎克伯格(Mark Zuckerberg)宣布他对蚂蚁的仇恨的深度假象-这听起来很有说服力,对吧?这是我们需要的:

目的地视频:这可能是扎克伯格本人的视频,也可能是一个看起来像扎克伯格的演员的视频。如果我们的目标视频是一名演员,我们只需将扎克伯格的脸粘贴到该演员身上即可。 图片资料:我们需要扎克伯格说话、眨眼和摇头的照片。如果我们要把他的脸叠加到演员身上,我们还需要演员面部动作的数据集。 扎克的声音:我们的深度假需要听起来像扎克。我们可以通过录制一个模仿者,或者用人工智能重现扎克伯格的声音来做到这一点。为了重现他的声音,我们只需通过Lyrebird这样的人工智能运行扎克伯格的音频样本,然后键入我们想让他说的话。 假唱人工智能:由于我们正在将假扎克伯格的声音添加到我们的视频中,假唱人工智能需要确保深度假的面部动作与所说的相符。

我们并没有试图淡化深度造假的工作和专业知识。但是,与让奥黛丽·赫本起死回生的数百万美元的CGI工作相比,深度假货简直就是在公园里散步。虽然我们还没有爱上政治或名人的深度假,但即使是最糟糕、最明显的深度假也造成了真正的伤害。

相关:人工智能的问题:机器在学习东西,但不能理解它们

深假已经造成了现实世界的伤害

到目前为止,大多数深度假货只是尼古拉斯·凯奇的表情包、公共服务公告和令人毛骨悚然的名人色情。这些渠道相对无害,容易识别,但在某些情况下,深度假货被成功地用来传播错误信息,伤害他人的生命。

在印度,印度教民族主义者利用深度假来诋毁和煽动针对女记者的暴力行为。2018年,一位名叫拉娜·阿尤布(Rana Ayyub)的记者成为了这样一场错误信息运动的受害者,其中包括在一段色情视频上叠加了一段她面部的深伪视频。这导致了其他形式的在线骚扰和身体暴力的威胁。

在美国,深度假冒技术经常被用来制作非双方同意的复仇色情作品。据“新闻周刊”报道,在现已被禁止的深度假货Reddit论坛上,许多用户询问如何制作前女友、恋人、朋友和同学的深度假货(是的,是的,儿童色情)。这个问题如此之大,以至于弗吉尼亚州现在宣布所有形式的非双方同意的色情作品都是非法的,包括深度假货。

随着深度假货变得越来越有说服力,这项技术无疑会被用于更可疑的目的。但我们有可能反应过度了,对吧?这不是Photoshop之后最自然的步骤吗?

Deepfake是篡改图像的自然延伸

即使在最基本的层面上,深度假也是令人不安的。我们相信视频和音频记录能够捕捉人们的言行,没有任何偏见或错误信息。但在某种程度上,深度假货的威胁并不新鲜。自从我们第一次开始使用摄影以来,它就已经存在了。

以现存的为数不多的亚伯拉罕·林肯的照片为例。这些照片中的大部分(包括一便士和五美元纸币上的肖像)都是由一位名叫马修·布雷迪(Mathew Brady)的摄影师篡改的,目的是改善林肯纤细的外表(特别是他细长的脖子)。其中一些肖像的编辑方式让人联想到深伪,林肯的头像叠加在卡尔霍恩这样“强壮”的人身上(下面的例子是蚀刻,而不是照片)。

这听起来有点奇怪的宣传,但在19世纪60年代,摄影承载了一定数量的“真相”,我们现在为视频和音频记录保留了这些“真相”。它被认为是艺术的两极对立面--一门科学。这些照片是被篡改的,目的是故意诋毁批评林肯身体虚弱的报纸。最终,它奏效了。美国人对林肯的身材印象深刻,林肯本人也声称布雷迪的照片“让我当上了总统”。

深伪和19世纪的照片编辑之间的联系令人奇怪地感到安慰。它告诉我们,虽然这项技术有严重的后果,但它并不是完全不受我们控制的。但遗憾的是,这种说法可能不会持续很长时间。

我们永远也找不到Deepfake了

我们习惯于用眼睛辨别假图像和假视频。我们很容易看到约瑟夫·戈培尔的全家福,然后说,“后面的那个家伙有点奇怪。”看一眼朝鲜的宣传照片就会发现,没有YouTube教程,人们在Photoshop上的表现很糟糕。尽管深伪令人印象深刻,但仅凭一眼就能辨认出深伪。

但我们在很长一段时间内都不会发现深水假货。每年,深度假货都变得更有说服力,甚至更容易创作。你可以用一张照片做深度假,你可以使用像Lyrebird这样的人工智能在不到一分钟的时间里克隆语音。融合了假视频和假音频的高科技深伪令人难以置信地令人信服,即使它们是模仿马克·扎克伯格(Mark Zuckerberg)这样的知名人物。

未来,我们可能会使用AI、算法和区块链技术来打击深度假货。从理论上讲,人工智能可以扫描视频来寻找深度假的“指纹”,而安装在操作系统上的区块链技术可以标记出接触过深度假软件的用户或文件。

如果你觉得这些反深度假冒的方法听起来很愚蠢,那就加入这个俱乐部吧。即使是人工智能研究人员也对深度伪造是否有真正的解决方案表示怀疑。随着检测软件变得越来越好,深度假货也会变得越来越好。最终,我们将到达一个无法发现深度假货的地步,我们将有更多的事情要担心,而不是假的名人色情和尼古拉斯·凯奇(Nicolas Cage)的视频。

相关文章