戍天九思：抢劫TikTok背后：美国对华数字战争

lameihua · 发表于 2024-3-18 18:55:17

　　美国当地时间3月13日，美国众议院以352票对65票、1票弃权的压倒性多数通过法案，将要求字节跳动在180天内出售TikTok，否则将禁止美国的苹果和谷歌应用程式商店提供TikTok。且禁止美国公司和TikTok做生意。

　　▲Tik Tok的支持者在美国国会外表达反对通过法案

　　美国前众议院议长佩洛西面对TikTok支持者的抗议，毫不掩饰地说：我们并不是要禁止TiKTok，只是强迫字节跳动将TiKTok 卖给美国！

　　那么，为什么TiKTok会像华为一样遭到美国两届政府的持续打压？拜登政府对TiKTok下狠手背后的逻辑是什么？世界发生了什么重大变化让拜登政府作出重大政策调整？

　　TikTok的商业逻辑是“用美国人的数据赚美国人的钱”

　　TikTok是字节跳动公司经过中国抖音平台这个10亿级用户数据喂养出的超级算法和超级赚钱的商业模式。

　　TikTok在美国是一个拥有1.7亿用户、500万人从中赚钱的平台，年营收超过200亿美元。

　　由于美国政府的打压而一直未能上市，目前按照市值营收比，其潜在估值可达2000亿至4000亿美元，如果上市成功其市值可突破1万亿美元。

　　笔者认为，美国政府公开抢劫TikTok，明面上的原因可能看中它超级好用的算法、超大规模的数据和超级赚钱的商业模式。

　　深层的原因是动了美国人的话语霸权和数据蛋糕。过去，在美国一直是政客和资本控制舆论、掌握话语权，但是，TikTok让普通老百姓也可能快速成为大V或著名IP，拥有话语权和摇钱树，影响资本赚钱和控制社会。而TikTok的商业模式本质上是“用美国人的数据赚美国人的钱”！可以说是：中国人动美国人的数据蛋糕。这些是美国人绝对不能容忍的事情！

　　马斯克收购推特后，不仅将平台改名为“X”，而且还要把它打造成赢利的数据公司——美国版的“微信”，“用美国人的数据赚美国人的钱”。

　　Sora训练数据被质疑非法——说明什么？

　　最近，OpenAI 首席技术官（CTO）Murati接受华尔街日报采访，被问及Sora训练数据视频，在全网爆火引起网友热议。

　　WSJ女记者问——「Sora是用什么数据训练的？」

　　Murati眨了数次眼睛，目光闪烁，思考几秒之后略带迟疑地给出了一个官方味十足的答案——

　　「我们使用的是公开可用的数据，以及经过许可的数据。」

　　女记者继续出招：「所以，你们是用了YouTube上的视频吗？」

　　Murati撇了撇嘴，眼神茫然地望向空中，犹豫了几秒后只得承认——

　　「关于这个情况，我不太确定。」

　　女记者步步紧逼：「那Facebook和Instagram上的视频呢？」

　　Murati的表情仿佛已经在崩溃的边缘——

　　「你知道，如果这些数据可以公开使用……对……可以公开使用的话……可能是用了这些数据，但我不确定，真的不太确定。」然后，她无奈地伸开双手，表示差不多得了。

　　但女记者还在发问：「Shutterstock呢？我知道你们公司和他们有合作。」Murati摇了摇头表示，「关于使用数据的细节，我是不会详细说的，但我们用的数据肯定是公开的，或者许可使用的。」

　　那么，为什么OpenAI要冒着吃官司的风险采用非法数据来训练Sora?

　　说明什么？说明现在数据越来越难得到，数据正变得越来越稀缺。

　　为什么OpenAI公司会盯上TikTok?

　　当地时间3月9日，《华尔街日报》报道：随着美方的“加速打压”，TikTok被封禁或出售的选项似乎也摆到了台面上，这也引起了潜在买家的兴趣甚至“觊觎”。该报还援引知情人士披露称，视频游戏发行商动视暴雪（Activision）前CEO博比·科蒂克（Bobby Kotick），不仅向OpenAI等潜在合作伙伴提出了收购TikTok的想法，还已经接触了字节跳动CEO张一鸣并表达了收购兴趣。

　　说明什么？说明通用AI大模型ChatGPT、Sora都是胃口超级好的大数据怪兽，它们的训练几乎吃掉了公开的语料数据和视频数据。以后，可能面临等米下锅，甚至巧妇难为无米之炊的困境。为什么？

　　长期以来，由于AI处理数据能力有限，大家感到大数据就像空气一样取之不尽、用之不竭，数据也因此不值钱。但是，由于美国产业空心化、大数据增长缓慢，特别是通用AI大模型ChatGPT和Sora出现，大大提高了数据处理能力，因此彻底打破了原来的数据供需平衡，让数据逐渐成为稀缺资源。

　　比如，ChatGPT3.5参数量为1750亿，训练语料高达8000亿个单词、45TB文本数据。ChatGPT4.0参数量高达1.5万亿，据说其数据处理能力比3.5版本强500倍！

　　又比如，中国发明的超级光盘单盘容量可达1.6Pb，相当于1万张蓝光光盘、100个普通硬盘，中国2022年全年数据量规模为23.88ZB，只需1.53万个光盘存储，一辆货车就能全部拉走。

　　而TikTok就是一个标准的数据金矿，它是全球范围最具标志性最完整、数量最大、单一实体控制下的多模态数据资源，它的用户是活生生的人。这些用户在Tik Tok上互动，上传视频，在视频下面点赞、转发、评论时所发布的文字信息，这些数据具有很大的时间成本和战略价值，是其商业模式的护城河，不是金钱能够买来的。因此，只能通过美国政府干涉强抢强卖。一个大平台就是一座数据大金矿，抢平台就是抢数据金矿，以后这种事情会更多。

　　通用AI时代：数据稀缺正引发大国数字战争

　　人工智能潜力=知识？算力？算法？数据？网络

　　长期以来，美国凭借互联网技术垄断和半导体优势，牢牢垄断着互联网霸权。于是，互联网成为美国颜色革命的工具。2011年5月，美国还出台《网络空间国际战略》，大肆鼓吹“网络自由”和数据自由跨境流动，并利用网络霸权疯狂从全球获得大数据资源。

　　但是，随着智能手机和移动互联网的普及，特别是中国数字技术的飞速发展，欧盟不断加大对数据的保护力度，让美国实实在在地感到了网络霸权的威胁，因此围绕知识、算力、算法、数据、网络等人工智能五大要素，引发了一系列数字战争。

　　美国对华数字战争，从2015年4月禁止对华超算芯片出口，到2019年5月封杀华为5G，到2020年9月禁止华为芯片代工和对华出售极紫外光刻机，到2022年9月禁止英伟达先进GPU出口，再到2024年抢劫TikTok，正在步步紧逼、步步升级！

　　欧盟反击美国数字战争始于2018年5月颁布的《通用数据保护条例》。据此，欧盟对将欧盟用户数据回传美国的亚马逊、“元宇宙”和苹果公司分别罚款7.46亿欧元、12亿欧元、130亿欧元。

　　特别是2022年11月Chat GPT发布，2023年3月Chat GPT4.0发布，2024年2月Sora发布，通用AI大模型几乎吃掉了公开的数据，让大数据成为稀缺资源，美国政府对大数据的态度也发生了根本性转变——从过去强调“数据自由跨境流动”转向强调“国家安全”。具体来说，有两大转变：

　　一个是，2023年10月底，美国贸易代表办公室在WTO谈判桌上撤回了此前的数字贸易提案。该提案要求WTO电子商务规则允许自由的跨境数据流动，并禁止数据本地化和软件源代码审查的国家要求。

　　另一个是，2024年2月28日，拜登政府签署“旨在阻止外国实体获得大量美国人个人数据的行政令”，这是美国政府第一次限制数据自由流动。

　　笔者认为，通用AI大模型ChatGPT和Sora的出现，目前正在产生两个后果：一个是，数据作为21世纪的石油，数据正在变得越来越稀缺，数据保护主义将进一步抬头；另一个是，人工智能革命才是真正的第四次工业革命，大国争夺人工智能主导权的数字战争将会更加激烈。

　　美国政府抢劫TikTok，正好说明通用AI大模型引发美国政府对数据稀缺的焦虑，数据稀缺加剧数据保护和数字战争——美国政府不仅禁止数据流出美国，也不允许外国公司“用美国人的数据赚美国人的钱”，同时还将不断升级对华数字战争。

		自动登录	找回密码
密码			立即注册