今年5月,由北京市科协和北京市委网信办指导,北京科技记者编辑协会联合有关单位共同发布“科学”流言榜中的“二维码还能用多久”引发社会公众关注。如今在我们的生活中,二维码随处可见。信息获取、网站跳转、优惠促销、结账支付……一扫二维码全部搞定。近期网上突然出现了这样一种说法,说是“据不完全统计,二维码每天的全球使用量高达100亿个,所以很快就会被用完”。这是真的吗?二维码到底是如何产生的?它有多少种版本?人类真的有一天会把二维码用光吗?
天云数据CEO、北京科技记者编辑协会推荐协会理事、吴文俊人工智能科学技术奖获得者雷涛接受中央电视台采访,为公众答疑解惑,在新闻频道《共同关注》栏目播出。
附采访实录:
问:什么是二维码,以及二维码是怎么出现的?
雷涛:二维码的普及让我们看到的一个非常成功的界面,这个界面是我们人和数字世界的一种连接。它的本质是一个服务的入口,我们通过扫描二维码可以访问数字世界里提供的大量服务。比如说扫码支付,替代了使用现金服务;比如博物馆里的画,本是静态的,但只要旁边放上一个二维码,我们通过扫描这个二维码,就可以了解画背后的一系列内容。所以二维码它事实上是我们人和数字世界的桥梁,它的本质是一个标识,带领我们找到相应的信息、相应的服务。无论是支付服务还是一个文件信息,亦或是一段代码,乃至一个链接入口、一个网站,通过二维码这个标识都可以到达。
问:是什么原因让二维码这个需求呈几何级的增长?相信大家都有这种感受,几年前我们还在用钱包、现金、用信用卡,现在几乎就是一个手机可以走遍天下的感觉。
雷涛:二维码的便利本质是服务能力下沉。我国的人口红利决定了如果我们要满足个性化服务,服务种类就会非常多,很难再用门户的方式去连接数字化的世界。不管是PC还是手机APP的连接,都给了我们很多场景性服务的需要,辅助我们获取数字世界的信息。这也是几何级增长的原因。这些服务的入口需要通过一个简单且唯一的标识,这就是二维码。二维码就像给人起名字一样,我们也给服务起一个“名字”。这些数字里零零总总的多样性服务,都有一个标识的“名字”,我们在场景里可以通过“名字”找到服务。
问:那二维码是怎么演进来的?二维码和商品交易上扫码条形码即一维码的区别是什么?
雷涛:在我们这个时代,条形码属于规格化的行业标准,便于商家做商品的分类选择。因此它有一套自己的协议,方便于控制生产流程的控制。但即使一个大超市,种类很齐全,大概就是几千个SKU的品类,所以条形码所覆盖的数量是有限的。
二维码是用数学的方法引入了随机性,通过像素的排列组合可以使二维码的体量更大。而且二维码不需要去定义,就能能够去掉条形码上供应商、产地这些物理意义。通过随机的像素组合来表达唯一性就够了,通过唯一性导向后台提供的实质性服务。就像IP地址一样,没有任何物理意义,通过DNS再解析到网址。
问:所以可以说二维码是条形码升级版吗?
雷涛:可以这么理解。二维码是数字世界标识的一次全面革新。
问:“科学”流言榜的流言提到:据不完全统计,二维码每天的全球使用量高达100多亿。所以,二维码很快就会被用完。我们有一个数据,说微信三个月内可以用掉一千四百亿个二维码,虽然不确定数据的准确性,但听上去很恐怖,二维码是否会用尽?
雷涛:二维码最高像素可以做到177×177,那意味着什么呢?意味着10²ºººº (个),这个体量是非常大的,但是它并不是靠这个体量来支撑,因为我们没有必要做这么一个精细的177×177的二维码,我的结论是二维码不会用尽。刚才说的一千四百亿,才是10的13次,如果是10²ºººº (个),这个体量不可想像。但二维码并不是靠这个体量来支撑,我们也没有必要做这么一个精细的177×177的二维码,二维码不像IP地址一样有全局性。
二维码有两个特点,第一个是实时特性,第二个是时空特性。因为二维码支撑地是我们跟数字世界服务的连接,这个服务都是个性化的,往往都跟空间属性相关。也就是说,我在北京区域使用二维码,生成一个二维码;你在深圳区域使用二维码,再生成一个二维码:它不需要像IP地址一样,需要一个全局属性的时间戳。二维码没有那么强的全局性,所以在北京用使用的二维码和我在深圳使用的二维码重复了,其实对服务没有产生太大影响。除非是互联网的特性,服务本身是跨区域的。首先,二维码的服务多数是本地化的;其次,使用的二维码本身的服务具有时效性,最重要的,已经过期的二维码可以再重复使用。
问:这个观点和我们看到的说法不太一样,市场上说二维码它实际上是有一个总数在那儿的。它有一个确切的数值,但是由于我们人类存在的时间比较短暂,就算用,可能也是用不完,但实际上它是有一个上限的。
雷涛:我们要知道二维码不是一个应用,它是一个标识。就像人类起名字一样,每个人有他一个独特的名字。这些方便于我们在社会连接时使用,就像我其实并不介意跟我同名同姓的人,首先他可能处在不同的领域空间里我们毫无交集,纵使我们在空间上有交集他不影响我跟身边的群的沟通,大家还有身份标签还有其他各种社会性标签在,可以进行区分。
英国牛津大学的人类学家罗宾·邓巴根据猿猴的智力与社交网络提出:受大脑皮层有限性的限制,人类智力允许其拥有的稳定社交关系最大人数是148人,四舍五入后是150人,这就是著名的邓巴数。但是互联网出现极大的扩展了我们的连接属性,比如一些权威的kol、知名网红,他的标识就是不能重复的标识。
从这个角度来讲,二维码是远远不够的,不仅是数量,还有形式。名字是对我们个体的标识,而二维码是对我们人和数字世界连接这种服务所采用的标识。进入智能化社会。数字世界的服务不仅要连接人,更要连接物,还有物与物的链接。随着IoT更多的设备,那就不见得都需要有一个独特的命名,也就是我们需要为每一个需要数字化的物体命名。比如工业里要完成电池质检,需要回溯190多道工序中每一粒电池,数字世界中的信息系统需要识别每一粒电池,就像我们人类起名字一样分配每一粒电池一个标识,一天的增量是1000亿,这大概是我们地球10亿年来所有人类的名字总和,而这些名字的人有92%来到这里又离开了这个星球。
如果都要记住这些事物的名字,那会很困扰我们。事实上,我们是不需要记住身边所有物体在数字世界中的名字的。很多二维码会逐步淡出我们与数字世界的沟通,因为服务会更为多样,之前二维码连接的是数字世界中的一个应用,它是以代码形式存在的。而今天随着人工智能等新兴技术的出现,代码和我们大量的数据结合形成新的智能体,智能体可以人类更容易接受的更自然的方式与人类交互。比如聊天机器人robots智能体会基于人类的意图判断来路由至不同的功能执行器。也就是说智能体会替代我们去记录,这些繁杂冗余的名字。那他会用一种更简单的形式来记录,也就是我们常用的随机数,而不需要使用二维码这样需要复杂处理的图像信号标识。而我们需要命名的也不仅仅是物体,还有这些things的所有行为。每一个智能体的行为也需要一个独特的命名标识,这会产生更为庞大的几何级数增长的数据规模,也就是我们的标识空间会更为庞大,但不用担心这些。我们可以引入量子随机来产生一个更大规模的随机数去完成每一个物和每一个行为的独特标识。
问:您能谈一谈二维码的安全性问题
雷涛:二维码本身是黑白的马赛克拼接,在人类的视觉系统里是没有办法分辨出它所背后带来服务的真假。就像起名字,李逵和李鬼都可以叫二维码,因为二维码本身是一个服务标识而已。因此服务本身的强安全属性由‘谁扫码谁获取’,此外他有双向认证的鉴别机制,服务是在二维码所连接的两者之间完成的。我们从一些支付平台扫码就有一个唯一标识,然后这个标识会在二维码背后的服务主体上再去做二次确认。
问:如果说这二维码真用完了,将来有更高技术出来了,会把它取代吗?
雷涛:那一定的。我相信二维码被替代是一个必然。事实上,我们不用担心二维码是不是会被用完,有一天二维码退出我们人类视野不是因为它的数量不足,而是它的链接形式会被高阶的服务替代。我们和数字世界的连接和交互会以更自然的方式进行,今天GPT大语言模型,用对话的形式连接服务,而且这也仅仅是开始。
语言的效率也很低,一维线性的文字,每秒几个音符比特信息的发音很低效。Figure具身智能机器人已经可以用跨模态处理声音视觉和空间感知,使用的是人类全新的隐式表达方式,是万亿参数空间在神经网络上的分布,远比数百像素排列组合出的二维码图像高级。我们在未来数字世界的生存,会有更多像二维码这样的过渡事物出现和消失,社会会向更文明的方向进步。文明让我们懂得命名人,命名物,命名事件,再彼此连接和协作,创造更大规模的协同。
随着IOT物联网的进入,我们需要有更多的标识分配给不仅仅是服务本身,还要分配给我们身边的物体、资源,甚至于这些物体、资源所产生的一系列的行为。这些数量更庞大,我怎么去标识?这个时候二维码肯定做不到啊。那么在数据库里如何分配这些标识,也就是这些数字标识服务于谁?现在二维码是介于我们人和数字世界之间的一个连接,但未来更多的我们人会用一种更内原生的方式跟数字世界交流。比如我们的语言,我们现在有GPT这样的聊天机器人,它可以代表一个智能体去跟数字世界人和物去做沟通,依然还需要标识但一定不是二维码。
就像我们刚才说的数据,一天一千四百亿,这么大体量的话,我们通常信息化手段是引用随机数来生成一个随机标识,就不再是正经八百起一个名字了,而是用随机数。但随机的算法也是有穷尽的,我们叫伪随机。
标识用尽是一个“焦虑”话题,毕竟互联网经历过IPv4到IPv6的折腾。面向万物互联的智能时代,不仅仅是手机电脑需要标识,每一粒电池,每一颗LED都需要标识来支撑数字化运行,数智化空间需要更庞大的命名机制和空间。传统信息化是基于操作系统的随机函数(dev/urandom)生成一个唯一ID标识UUID,但今天数据库记录已经步入万亿级别,随机函数分配的ID不得已循环使用,重名则会带来复杂业务逻辑错误。天云提早布局,基于量子光栅二相的随机性产生巨大随机数,确保库表内为每一行记录标识的绝对唯一,并已经内嵌于数据库内函数,来代替操作系统伪随机UUID,SQL程序员可以直接调用量子随机来增删记录。不仅仅是数据库记录标识,roadmap也考虑分布式数据库的shading切片策略引入量子随机数,天云Hubble数据库是首个引入量子计算的国产信创数据库,以上已经申请专利保护。
问:人脸识别技术算不算是二维码技术的一种升级?
雷涛:这是一个很好的表达,但其实人脸识别技术和二维码技术不能对标在一个概念上。
二维码更像是一个人的名字一样,人脸识别是对人类面孔、形态的一种表示方法。以前人类的表示方法是文字、公式、语言,我通过语言去描述一个人的面孔,但是面孔细节的差异性,我们用人类的简单的语言体系是没法去穷尽的。人脸识别背后的核心是神经网络,神经网络做了一次表达的升级,它可以用十几亿、几十亿、上万亿的参数去描述语言所不能够涵盖的信息,这个背后的技术叫卷积神经网络。在早期的人脸识别,通过对个人像素照片做池化特征抽取,上下左右像素的连接状态特征表达,通过这样一个空间去记录了人脸的全部信息。我们通过对文本语言文字之间上下左右、前后顺序的表达,是时间序列的表达。因此我们就可以把人类的知识抽象出来,这也就是大模型技术。所以人脸识别是一种表达能力,而二维码是一种标识技术。
问:我们在应用中经常要刷新二维码,否则二维码就过期了,这又是为什么?是一种安全的考虑?这个过期的这个二维码就作废了?当下废掉的这个二维码是否还会被重新使用?
雷涛:在服务的体系里头,这个二维码就过期了。但这个概念并不是对二维码本身的,而是对应这个二维码背后的服务。因为二维码只是连接我们与那个服务之间的一个标识。
问:所以说这个玄机不在二维码本身,而在于扫完之后的服务?
雷涛:二维码只是一个路标而已,它要连接后面的服务,指向了一个我们所需要的个性化服务。在数字世界,个性化服务越来越多越来。大家接触最多的是支付,
我们拥抱数字世界的越来越紧密,数字化服务的渗透和影响就越来越深,我们更多地希望个体会被关注,我们希望有个性化的服务来服务自己。因此国内的互联网的繁荣,其实二维码只是导向个性化服务的一种方式,因此也会有一些限制。
问:您觉得二维码服务会萎缩吗?
雷涛:我自己的看法二维码会逐渐淡出我们的视野,核心是它的形式。如果说二维码的繁荣跟我们的消费习惯有关系,那么二=二维码淡出我们的视野跟我们的消费习惯就没有关系了。我们会接触到更多的智能物体,这些会开始产生新的标识方法,到时候我们就会需要一个新的代理来让我们跟这些智能世界做交流,我们沟通的方式会通过一个个代理来完成。
智能体跟数字世界产生更多的连接,它就会产生一种新的表示方法。就像我刚才说的,引用量子随机来完成对更多事物的唯一标识描述,也就是我们所处理的界面会因为我们所要连接的对象发生变化,我们不再直接获取服务,而是通过我们的个人助理来获取更多服务的时候,二维码一定会退出我们连接的视野。
此外,随着越来越多的智能设备出现,就像我们从浏览器走到Apps再走到现在的扫码入口,它会有更多更直接更本质性的连接方法。
问:二维码的普及可以说是用户用脚投票选出来的,这和它的低成本、便捷直接相关,为什么二维码可以做到这样?二维码的专利在谁手上啊,它的源头在哪里?
雷涛:二维码就是一个随机生成数的图片,一台服务器可以成百上千万地去快速生产二维码。
二维码是数字序列的排列组合,并没有像艺术创造一样有版权,这也是数字世界和工业世界很本质的一个区别。数字世界追求共享的循环螺旋上升,而工业社会为了保护专利发明会有一套体系化的方法。
在数字世界里强调连接、强调共享,所以在信息社会服务里最核心的是算法。比如大模型所使用后台的transformer,就好比人脸识别的卷积神经网络,它都是以科学论文的形式在整个产业界做分享和创造的。所以我们感谢科学家,他为我们创造了数字化世界里里程碑式的财富。这些财富往往会被后人以更大的贡献、成就所导引推动,会继续运用起来,不会像工业时代一样用版权去限制它。