通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  四级军士长

注册:2010-4-285
跳转到指定楼层
1#
发表于 2024-10-14 11:03:32 |只看该作者 |倒序浏览

这个国庆,雷军应该是最忙且最火的网红。

如果你经常刷视频,可能已经刷到了。

最开始雷军是锐评国庆假期:“老子一眨眼,国庆假期就过去了,真想开着小米 su7 创翻这个世界” 。

紧接着开始搞投资“我准备 50个亿投资安徽农业大学,谁要是阻拦我,我就远程操控小米 su7 创死他”。

尽管言论反常,但从声音、语调、说话习惯上来听,都非常像是雷军本人。

顺着这些片段,我挖掘了“雷军”在国庆前后的经典语录,发现他异常勤快,点评了堵车、调休、游戏、摆烂员工、大学生群体,甚至是曼联。。。

这些视频大体上可以分为三种类型。

第一种,用嘴臭攻击万物。

点评文科生,起手就是嘲讽,“花大笔的学费,并用 4 年时间去学这些垃圾”,还有一些简单粗暴的脏话“文科是狗学的,只有 sb 才会学文科”。

再比如点评曼联,“TMD”、一个“初生”贯穿全场,主打一个极致嘴臭。



而第二种类型,“雷军”成了游戏核心玩家,忙着怒斥各种游戏乱象。

上一秒,满嘴“我他妈”、“脑瘫”、“红温”点评各种 FPS 游戏。

下一秒就在召唤师峡谷暴怒:“老子开局 buff 都被打完,三条路全部被对线单杀”。

《英雄联盟》里玩数值怪铁男的,怒斥。

《金铲铲之战》玩四星波比阵容,怒斥。

《无畏契约》在手枪局赢了不起枪的,怒斥。



这些视频仿佛流水线生产一般,用词非常之脏,点评内容非常之广,更具有流水线特征的,是它形成了一定的范式。

开头就是一句,大家好,我是雷军,随即狂喷骂人的话。

小米手机,解锁小米 SU7 ,创人,成了经典三件套。

如果视频里没有这句,评论区甚至会有人直接发问:



如此种种,第三种类型随之诞生:多形式多场景多类型尝试,拓宽起雷军语音的边界。



有人开始调侃,国庆七天被雷军骂了六天,有人迷惑,怎么突然形象变化这么大,“雷军最近总骂人”这个话题,连同嘴臭版的雷军,也由此一炮而红。

有人甚至溜达去了王化的微博下面,问他最近被雷总骂了嘛?

对了,王化,是小米集团公关部总经理。。。



最开始,看到这种现象时,让人感觉乐呵。

以前雷军也有 Are you ok 的梗,大家都习惯这么玩,恶搞嘛,雷军本人也围绕这事自娱自乐过。

但是仔细想想,感觉这事不对头,不同于鬼畜二创,这事性质已经改变。

因为 Are youok 真是雷军自己说的。

而如今诞生出来的新型恶搞呢?雷军明明没有骂过人,没有说过这些脏话,但不明真相的人却信了,误觉得雷军骂了人,这事让人觉得不太舒服了。



关注我们号时间比较长的差友,对前沿科技资讯多少有些了解,知道这是假的, AI 伪造的,但对于更多人,尤其是以及上了年纪的朋友们来说,这是一个眼见为实,耳听为真的世界。

无论雷军是否愿意,一个跟他本人真实形象相去甚远的嘴臭王,在互联网上冉冉升起。

科技是把双刃剑,这话都说烂了,对于 AI 技术可能带来的负面影响,许多人或早有预期,但可能不曾料到的是,事情的进展如此迅猛。

AI配音初次进入大众视野,可以追溯到2019年前后,当时它的存在更多是一种工具。

在影视行业和娱乐行业,存在配音需求,出于时间和成本考虑,当时很多前沿团队寄希望于 AI 配音来替代真人配音,也有希望由 AI 配音来“复活”已故去的演员的。



声音克隆的技术基础是深度学习,算法通过分析大量声音数据,从中学习他说话的风格和情感,从而复制出特定个体的声音。

在当时,对单一个体的样本需求量大,有一定门槛,而且受限于技术,生成的语音总有一种浓浓的电磁感,更别提自然语调了。

直到近几年,随着 AI 配音技术的进步,才迎来第一次爆火。

这一次它摇身一变成了一个人畜无害的取乐玩具。

利用 AI 配音,人们制造出翻唱周杰伦的张惠妹,翻唱张惠妹的陈奕迅,翻唱陈奕迅的王力宏。



AI 配音的存在,为那些逐渐隐退不再营业的歌手,制造出一个替身,满足了歌迷们耳朵。

当时 AI 配音就展露了实力,无论是从声线、发音还是咬词方式都跟本尊无异,很多 AI 配音出来的歌曲,让无数网友表示好听到要单曲循环。

其中声音极具辨识度的孙燕姿,在短短半个月里,从民谣唱到摇滚再到流行歌曲,几乎干翻了半个华语乐坛,多个视频播放量破百万。



随后有人打开了新世界的大门。

丁真教你背《滕王阁序》。



AI 雷军教你学日语。



还有用 Kristen Stewart (暮光之城女主)教大家学英语。

一点开视频,这位美貌如花的外国明星就用中文亲切的问候你:“甩锅这个词怎么翻译?别再翻译成 throw the pot ,这是中式英语”。

定睛一看,会发现她的嗓音特征和口型都能对上,换本人来看了都得相信。



很快,某一国的语言已不足以满足,大家戏耍 AI 配音的心了。

会七国语言的彪子,横空出世,教育谢广坤。



在兼具一定实用价值的同时,又用咱们所熟知的名人带来了一些娱乐属性, AI 配音成了大众喜闻乐见的玩具。

从中你可能也有这样一个感受,短短数年, AI 配音技术突飞猛进,从一耳假到玩出花来。

而且,技术门槛越来越低,有种我上我也行的感觉。

为什么这么说呢?

如今网络上已经有非常丰富、非常细致的教程,从它们的简介中,你就可以对技术门槛高低有所感受:

完全免费,快到几秒,慢到几分钟,可生成任意内容。



随机点入一个播放量为四百万的视频,这位 up 主向大家教学了如何“偷”走别人的声音,仅需要极少量的音频( 1~2 分钟),就能克隆声音,在视频的开头他展示了对海绵宝宝声音的克隆,令网友直呼“原声”。

2019 年,人们希望 AI 配音帮助影视行业解决真人配音的局限性。

2024 年,某种意义上,这事儿已经实现了,如果你只是玩玩,甚至不需要多专业的商用工具。

在评论区中,有不少网友表示,作为小白,自己成功了。



这些尝试成功的网友,有人复原了刚过世的妈妈的声音,有人复刻了好兄弟的声音,也有人复刻了前女友的,在这些感人故事的背后,也有很多人发出担心,感觉这东西可能被不法分子利用。

是的,每个人都有独一无二的嗓音、声调以及说话习惯,所以声音曾经是一个人的经典标签。

但,从今以后,一个人的声音,或许不再可信。

真假难辨,会有什么后果?有几则新闻可供参考。

阿联酋一家银行的员工,被 AI 克隆出来的客户声音诈骗,向对方指定账户转账了 3500万美元(折合人民币 2.25 亿)。

还有无锡市市民王先生,接到正在英国留学的儿子来电:“爸爸我被人打了,快救我”,随后“绑匪”对他大吼,用他儿子的性命做要挟,勒索 50万。



有人可能会犟嘴:“别人是别人,我是我,肯定骗不到我头上,骗过来了我也会识破”。

那么,近段时间针对公众人物的“声音窃取”新闻,应该会让你有些不一样的感觉。

9 月下旬,直播带货公司“三只羊”在风口浪尖上时,集团创始人卢文波醉酒后的音频流出,内容劲爆,导致大量讨论。

这段音频有方言,有脏话,有醉酒后的情绪,一听就是真的,很多网友信了,义愤填膺。

然而,警方调查后,发现这段引发轩然大波的音频是假的,仅仅由一段 30秒左右的录音进行声音“孵化”而成。



类似的事,还有这次铺天盖地的对雷军的戏耍,同样令人警觉。

因为,AI 配音+口型可以伪造这件事,在社会认知中存在断层。

一部分人能理解到这是伪造的,一听就辨认为假,打开视频,看个乐子,就过去了。

可另一部分人完全无法理解,当他们相信眼见为实,对此深信不疑。



就拿那些“我是乌克兰女人/我是俄罗斯女人,我想要嫁到中国”的视频来说,这些视频小年轻一看就懂,其实只是加了一个外国人滤镜,粗制滥造。

但这并不妨碍它,能收获成千上万条喝彩。

总有人正相信。



这次面对这次脏话连篇,言行离谱的 AI 雷军,你或许会认为,很容易辨别,那下次手法升级,将其进行二次剪辑,或者改变场景,改成雷军在会议室骂人之类的话题,你觉得还有多少人能一眼看破?

而以上种种,更意味着这样一个事实,用极小的成本,就能改变一个公众人物在 50%网友心中的印象。

天天裤子上沾屎,这谁顶得住?



除了对他人的影响之外,更为可怕一点是,这类的事情多了,咱们以后还能相信人的「声音」嘛?

这样的问题也许已经开始困扰人类了。

实际上,如今很多平台也会在 AI 生产技术的视频下打标,通知观众,也有一定的规范推出。

但截止目前,其实并没有什么特别有效的办法规避声音“窃贼”带来的可能影响,对于平台来说,需要时间和进一步努力来完善对 AI 伪造内容的整治。

对于咱们个人来说,目前比较有效的措施就是抹平信息差,让周围的家人知道有这么个技术,它可以达到什么地步,什么水平,不要掉以轻心。

抖音



过去,网络有谣言,只需要上网搜搜,有无对应的声音影像,往往谣言不攻自破。

现在,网络有谣言,你真能找到声音和影像啊,只是是他人所伪造的。

我们已经进入了一个眼见不为实的时代。

今年五月,著名影星“寡姐”斯嘉丽·约翰逊指控 OpenAI ,称对方非法使用其声音。

在长文中,“寡姐”透露 openAI 曾经邀请她为公司新的聊天机器人 ChatGPT-4 配音,在她拒绝后, OpenAI 发布了一个声音与她声音极为相似的声音,以至于她的“最亲密的朋友和媒体都无法分辨出区别”。

她在声明中提出疑问,在一个深度伪造技术容易被创造并日益泛滥的新时代中,如何保护人们的形象和身份?



AI 技术的发展,让人们在信息时代的效率突飞猛进。

但也提出了一个新的问题,当我们建立在信息化技术上的一切真假难辨时,该何去何从?

黑客帝国中,蓝色药丸通常被解读为维持现状、逃避现实的象征,而红色药丸则代表选择知识与真相。

如今的我们如同吞下蓝色药丸,深陷幻像的人,如何捍卫真相和自由,仍需时间追寻。

图片、资料来源

《雷军:关于 Are You OK ,我的看法是这样的。》

《陌生人用变声软件模仿客户声音:成功骗取银行 3500万美元》

《电话里传出“儿子”求救声,市民遭遇“AI 配音”诈骗,警方提醒:这是骗子的圈套》

《你的声音,现在是我的了!-手把手教你用 GPT-SoVITS 克隆声音!》

B站、抖音等


来源:36kr

举报本楼

您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-12-30 02:42 , Processed in 0.282022 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部