文/陈根
昨天有篇文章很火,刷屏了社交媒体,文章标题叫《中文互联网正在加速崩塌》。
这篇文章很有意思,文章在开头抛出了这样一个问题:如果我们在百度上搜索“马云”这个名字,把时间范围设定在1998年至2005年之间,能搜出来的信息有多少条呢?是1亿条,还是1000万条,还是100万条?
都不是。作者用百度搜索,选定日期范围为“1998年5月22日到2005年5月22日”,含有马云的信息,总共是1条。
这个答案当然在很多人的意料之外,文章作者紧接着也提到了,说很多互联网内容已经消失不见了,尤其是2005年以前的。这个问题我相信很多人都能感觉到,我们可能昨天才转发了一篇推文,今天点进去就已经显示404。就拿这篇文章来说,昨天早上看到的时候才几千点击,然后是几万阅读,但现在已经不可见了。从某个层面来说,互联网的记忆确实是非常短暂的。
皮尤研究中心的一项分析也曾证实这一结论。数据显示,在2013年至2023年间某一时点存在的所有网页中,有四分之一到2023年10月已无法访问。在大多数情况下,这是因为单个页面被删除或从其他功能正常的网站上移除。对于较旧的内容,这种趋势更加明显。 2013年存在的网页中,有38%到今天不可用,相比之下,2023年存在的页面中只有8%不可用。
这里面有很多角度,技术问题、经济问题、监管问题。作者特别提到了两个点,一是信息储存与运维也是需要成本的,归根结底还是钱的问题,一家互联网公司或者一个网站干不下去了,数据也就随风而去了;二是人为的监管与干预,包括有关部门的处理,以及信息生产者的自我清除。
但其实之所以会产生这个问题,本质上是因为我们所处的互联网时代,也就是Web2.0时代是中心化的。在中心化的互联网模式下,我们的生活几乎是被中心化的平台或者有关部门操控着的。原本互联网的特点是信息的民主化,每个人都可以自由地生产内容,分享内容,但中心化,意味着我们并不拥有我们所生产的内容,甚至我们所生产的内容反过来还会辖制我们。
对于中心化的平台或网站来说,保留信息,或者说替我们“记住”,不是它们的义务,平台看中的,只是我们在互联网行动产生的数据——这对于它们是真正有商业价值的东西。
举个例子,我在平台发了篇文章,收获了上万的点赞、评论和分享。这看起来是为我创造了关注,但事实上,这篇文章的数据所有权并不归于我,我不能用这篇文章置换商品,也不能为我带来任何收益。但平台得到了什么呢?
首先是用户的注意力,每一次点赞、评论和分享都是用户在平台上花费的时间和精力,而这些互动行为都能转化为平台的活跃度数据。高活跃度的数据不仅能够提升平台的用户粘性,还能增加用户的停留时间,这对平台展示广告和推广其他服务非常有利。其次,文章的热度有可能使更多用户涌入平台,不仅是现有用户,还有可能吸引到新用户注册。这些新用户注册后,会进一步增加平台的用户基数,从而提高平台的商业价值。广告商和投资者都会关注平台的用户规模和活跃度,更多的用户意味着更大的广告收入和更高的投资价值。再然后,平台会利用我的文章产生的数据进行深度分析。比如,通过分析用户的评论和分享,平台可以了解用户的兴趣和关注点。这些数据对于平台优化内容推荐算法、提高广告投放的精准度都是非常有价值的。平台可能会将这些数据进行包装和销售,提供给广告商和数据分析公司,帮助他们更好地了解市场需求和用户行为。
换言之,尽管这篇文章是我创作的,但在平台的中心化模式下,平台利用这些数据获利,而我作为创作者,并未直接从中受益。当然,这个问题不是没有解法,事实上,Web3.0的诞生正是为了解决Web2.0这一痼疾。
Web3.0的真正核心,就在于数字时代个人数据的主权化。这包括通过人工智能、量子技术、DNA存储等多项前沿技术,来建立一个对所有用户开放的互联网,在Web3.0中,用户被赋予更大的掌控权,可以拥有并掌控自己的数字身份和数据。甚至这种数字身份与权力完全归属于个人,并且可以随意、自由的参与Web3.0时代的各种网络活动,平台根本就不具备控制权。这与当前的中心化平台模式形成鲜明对比,后者通常通过掌握大量用户数据,以及剥夺用户的数据权力来实现垄断,并从中获得超额回报。而Web3.0的理念旨在打破这种垄断格局,使用户能够更直接地从自己的数据中受益,这与传统商业收益模型截然不同。
从某个层面而言,这也是解决中文互联网崩塌的唯一解法——用技术的发展解决技术的局限性,为人类文明带来福祉,这也正是科技发展的规律和意义。
最后,我们再来讨论一个问题,互联网记忆到底是什么?我们需要互联网为我们记住什么?
我们今天很多人都没有意识到,我们的记忆模式已经被互联网改变了。尤其是在个人记忆方面,存在值得警惕的对互联网记忆依赖的“谷歌效应”。所谓“谷歌效应”,就是指人们对互联网的记忆依赖,消除了人与人之间分享记忆信息的需要,也瓦解了将习得的重要信息存入生物式记忆系统的冲动。
而在集体记忆层面,要知道,互联网时代的集体记忆仍然是一种社会建构,但搜索结果的排序不完全按照网页的访问量、链接量等指标进行,往往受到商业利益、政治利益等因素的影响,并由此形成对集体记忆的另一种宰制方式。
或许,中文互联网真的在崩塌,但这对于我们来说,又未尝不是一个提醒——我们要记住什么,而不是互联网要替我们记住什么。
原文标题 : 陈根:中文互联网崩塌,还剩一个解法