大参考

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 1537|回复: 0

戍天九思:抢劫TikTok背后:美国对华数字战争

[复制链接]
发表于 2024-3-18 18:55:17 | 显示全部楼层 |阅读模式
  美国当地时间3月13日,美国众议院以352票对65票、1票弃权的压倒性多数通过法案,将要求字节跳动在180天内出售TikTok,否则将禁止美国的苹果和谷歌应用程式商店提供TikTok。且禁止美国公司和TikTok做生意。

  ▲Tik Tok的支持者在美国国会外表达反对通过法案

  美国前众议院议长佩洛西面对TikTok支持者的抗议,毫不掩饰地说:我们并不是要禁止TiKTok,只是强迫字节跳动将TiKTok 卖给美国!

  那么,为什么TiKTok会像华为一样遭到美国两届政府的持续打压?拜登政府对TiKTok下狠手背后的逻辑是什么?世界发生了什么重大变化让拜登政府作出重大政策调整?

  TikTok的商业逻辑是“用美国人的数据赚美国人的钱”

  TikTok是字节跳动公司经过中国抖音平台这个10亿级用户数据喂养出的超级算法和超级赚钱的商业模式。

  TikTok在美国是一个拥有1.7亿用户、500万人从中赚钱的平台,年营收超过200亿美元。

  由于美国政府的打压而一直未能上市,目前按照市值营收比,其潜在估值可达2000亿至4000亿美元,如果上市成功其市值可突破1万亿美元。

  笔者认为,美国政府公开抢劫TikTok,明面上的原因可能看中它超级好用的算法、超大规模的数据和超级赚钱的商业模式。

  深层的原因是动了美国人的话语霸权和数据蛋糕。过去,在美国一直是政客和资本控制舆论、掌握话语权,但是,TikTok让普通老百姓也可能快速成为大V或著名IP,拥有话语权和摇钱树,影响资本赚钱和控制社会。而TikTok的商业模式本质上是“用美国人的数据赚美国人的钱”!可以说是:中国人动美国人的数据蛋糕。这些是美国人绝对不能容忍的事情!

  马斯克收购推特后,不仅将平台改名为“X”,而且还要把它打造成赢利的数据公司——美国版的“微信”,“用美国人的数据赚美国人的钱”。

  Sora训练数据被质疑非法——说明什么?

  最近,OpenAI 首席技术官(CTO)Murati接受华尔街日报采访,被问及Sora训练数据视频,在全网爆火引起网友热议。

  WSJ女记者问——「Sora是用什么数据训练的?」

  Murati眨了数次眼睛,目光闪烁,思考几秒之后略带迟疑地给出了一个官方味十足的答案——

  「我们使用的是公开可用的数据,以及经过许可的数据。」

  女记者继续出招:「所以,你们是用了YouTube上的视频吗?」

  Murati撇了撇嘴,眼神茫然地望向空中,犹豫了几秒后只得承认——

  「关于这个情况,我不太确定。」

  女记者步步紧逼:「那Facebook和Instagram上的视频呢?」

  Murati的表情仿佛已经在崩溃的边缘——

  「你知道,如果这些数据可以公开使用……对……可以公开使用的话……可能是用了这些数据,但我不确定,真的不太确定。」然后,她无奈地伸开双手,表示差不多得了。

  但女记者还在发问:「Shutterstock呢?我知道你们公司和他们有合作。」Murati摇了摇头表示,「关于使用数据的细节,我是不会详细说的,但我们用的数据肯定是公开的,或者许可使用的。」

  那么,为什么OpenAI要冒着吃官司的风险采用非法数据来训练Sora?

  说明什么?说明现在数据越来越难得到,数据正变得越来越稀缺。

  为什么OpenAI公司会盯上TikTok?

  当地时间3月9日,《华尔街日报》报道:随着美方的“加速打压”,TikTok被封禁或出售的选项似乎也摆到了台面上,这也引起了潜在买家的兴趣甚至“觊觎”。该报还援引知情人士披露称,视频游戏发行商动视暴雪(Activision)前CEO博比·科蒂克(Bobby Kotick),不仅向OpenAI等潜在合作伙伴提出了收购TikTok的想法,还已经接触了字节跳动CEO张一鸣并表达了收购兴趣。

  说明什么?说明通用AI大模型ChatGPT、Sora都是胃口超级好的大数据怪兽,它们的训练几乎吃掉了公开的语料数据和视频数据。以后,可能面临等米下锅,甚至巧妇难为无米之炊的困境。为什么?

  长期以来,由于AI处理数据能力有限,大家感到大数据就像空气一样取之不尽、用之不竭,数据也因此不值钱。但是,由于美国产业空心化、大数据增长缓慢,特别是通用AI大模型ChatGPT和Sora出现,大大提高了数据处理能力,因此彻底打破了原来的数据供需平衡,让数据逐渐成为稀缺资源。

  比如,ChatGPT3.5参数量为1750亿,训练语料高达8000亿个单词、45TB文本数据。ChatGPT4.0参数量高达1.5万亿,据说其数据处理能力比3.5版本强500倍!

  又比如,中国发明的超级光盘单盘容量可达1.6Pb,相当于1万张蓝光光盘、100个普通硬盘,中国2022年全年数据量规模为23.88ZB,只需1.53万个光盘存储,一辆货车就能全部拉走。

  而TikTok就是一个标准的数据金矿,它是全球范围最具标志性最完整、数量最大、单一实体控制下的多模态数据资源,它的用户是活生生的人。这些用户在Tik Tok上互动,上传视频,在视频下面点赞、转发、评论时所发布的文字信息,这些数据具有很大的时间成本和战略价值,是其商业模式的护城河,不是金钱能够买来的。因此,只能通过美国政府干涉强抢强卖。一个大平台就是一座数据大金矿,抢平台就是抢数据金矿,以后这种事情会更多。

  通用AI时代:数据稀缺正引发大国数字战争

  人工智能潜力=知识?算力?算法?数据?网络

  长期以来,美国凭借互联网技术垄断和半导体优势,牢牢垄断着互联网霸权。于是,互联网成为美国颜色革命的工具。2011年5月,美国还出台《网络空间国际战略》,大肆鼓吹“网络自由”和数据自由跨境流动,并利用网络霸权疯狂从全球获得大数据资源。

  但是,随着智能手机和移动互联网的普及,特别是中国数字技术的飞速发展,欧盟不断加大对数据的保护力度,让美国实实在在地感到了网络霸权的威胁,因此围绕知识、算力、算法、数据、网络等人工智能五大要素,引发了一系列数字战争。

  美国对华数字战争,从2015年4月禁止对华超算芯片出口,到2019年5月封杀华为5G,到2020年9月禁止华为芯片代工和对华出售极紫外光刻机,到2022年9月禁止英伟达先进GPU出口,再到2024年抢劫TikTok,正在步步紧逼、步步升级!

  欧盟反击美国数字战争始于2018年5月颁布的《通用数据保护条例》。据此,欧盟对将欧盟用户数据回传美国的亚马逊、“元宇宙”和苹果公司分别罚款7.46亿欧元、12亿欧元、130亿欧元。

  特别是2022年11月Chat GPT发布,2023年3月Chat GPT4.0发布,2024年2月Sora发布,通用AI大模型几乎吃掉了公开的数据,让大数据成为稀缺资源,美国政府对大数据的态度也发生了根本性转变——从过去强调“数据自由跨境流动”转向强调“国家安全”。具体来说,有两大转变:

  一个是,2023年10月底,美国贸易代表办公室在WTO谈判桌上撤回了此前的数字贸易提案。该提案要求WTO电子商务规则允许自由的跨境数据流动,并禁止数据本地化和软件源代码审查的国家要求。

  另一个是,2024年2月28日,拜登政府签署“旨在阻止外国实体获得大量美国人个人数据的行政令”,这是美国政府第一次限制数据自由流动。

  笔者认为,通用AI大模型ChatGPT和Sora的出现,目前正在产生两个后果:一个是,数据作为21世纪的石油,数据正在变得越来越稀缺,数据保护主义将进一步抬头;另一个是,人工智能革命才是真正的第四次工业革命,大国争夺人工智能主导权的数字战争将会更加激烈。

  美国政府抢劫TikTok,正好说明通用AI大模型引发美国政府对数据稀缺的焦虑,数据稀缺加剧数据保护和数字战争——美国政府不仅禁止数据流出美国,也不允许外国公司“用美国人的数据赚美国人的钱”,同时还将不断升级对华数字战争。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则




QQ|手机版|小黑屋|大参考

GMT+8, 2025-7-10 05:13 , Processed in 0.359485 second(s), 17 queries .

 

Powered by 大参考 X3.4 © 2001-2023 dacankao.com

豫公网安备41010502003328号

  豫ICP备17029791号-1

 
快速回复 返回顶部 返回列表