模型化与数字化和结构化的关系

描述

概述

我还没找到一个合适的词汇来描述这个概念,姑且先叫模型化,世界模型是通用智能的核心能力,掌握世界模型,根据实时感知数据立即构建世界模型,并运用世界模型相关的知识和操纵手段即可预测未来,并能及时修正模型。

通用智能的以世界模型为中心的基本流程:

观察未知事物 -> 发现规律 -> 建立世界模型,形成相关的知识和操纵手段 -> 基于感知线索召回世界模型 -> 根据状态进行推理预测、目标求解。

模型化与数字化和结构化的关系

模型化是数字化和结构化中间的一个通用形态

数字化是最初级的信息化手段,物理世界通过传感器编程二进制就算最简单的数字化,当然从数字化这个术语的使用来看,大家往往认为数字化包含了一切信息化手段,我们成为广义的数字化,即计算机处理的一切手段都是数字化手段,因而是包含智能化、结构化这些东西的,是最大的一个圈。狭义的数字化,我们认为就是将没有变成数据的东西变成任意维度的数据就算了,比如文字、图像、视频,这些已经算作狭义的数字化了。

引入智能化之后,就等于引入了算法、计算和处理过程,不能单纯地看数据的存储形态,而要关心其语义、内涵和结构化层级了。

结构化是一个具备非常抽象意义的词汇,即让事物组织的条理有序呈现出清晰结构的方法。结构是一个复杂的词汇,他主要跟组合、关系、构成方式这些含义紧密相关,从通用智能理论上看,他是世界模型的核心组成部分,如语言学中的frame、视觉上的布局、听觉上的和弦构型等等,世界模型的核心构成是概念(包括关系型概念(包括复杂结构概念)),从而衍生出实体、关系(复杂关系亦即结构)、属性用于高级思维的推理预测所使用。

实体关系属性的根在完形化,完形化只是人类智能的符号控制的基础,不是全部智能的控制基础,比如条件反射、大量的运动控制是不依赖完形化的。

通过上面的讨论我们更加清晰,结构化与模型化的大致关系了,两者不是一个等级的概念,结构是隶属于模型的子范畴概念。

那么作为智能处理手段,当代计算机技术是如何解决模型化的问题的呢?

很简单,就是人工建模,首先我们将大脑中对目标物的理解的世界模型,找一种等价方式在计算机中进行数据建模,比如使用关系型数据库,就要借助二维表来等价描述这个世界模型,也可以使用面对对象的方法进行建模,更符合实体关系属性的基本构型,再比如树形数据库模型来进行建模等等,所以程序员们会根据每一个领域的知识(本质就是模型)进行数据建模,代码也将依据对模型的理解进行操作,有的时候他们将持久化的数据还原到内存中,转变成对象,操作完再进行持久化,但更多时候,他们直接将真正模型的操作再转化成对应的数据库操作进行,这个过程是在头脑中发生的。如下图所示:

数字化

那么当代的计算机技术研发的主要路线就是了解业务知识,进行数据建模,开发对应的模型操纵算子,执行各类算法和问题求解,称为面向业务领域的专用代码开发过程。这个过程我们称之为静态模型化。业务模型的变更会引发一系列的新学习和新变更。大量的隐形模型并没有落实到数据模型中,一些并不稳定的模型会以稳定的形式存在计算机世界中,当这些模型发生变更时,对应的映射过程和思维过程就要重新来过。

数字化

这个过程是低效的,主要原因是计算机程序只能面向稳定的数据模型进行工作,而不稳定的业务模型很多时候又是由其他头脑中非常稳定的世界模型和一些半稳定的世界模型以及一些不稳定的世界模型一起作用生成的,推理思维的过程都是在人类头脑中发生的,大脑提供了足够的灵活性来应对这些变化,但由于最重要的思维过程发生在人脑,导致无法实现这个过程的自动化。

那么模型化如何升级以实现无人化呢?

第一、将头脑中的世界模型都实现出来,即类人智能的实现。

第二、将整个思维过程在人脑外重现

最大的难点就是将那些非常机器重要的、基础的、抽象的、不可名状的基础世界模型实现出来。

这个过程本质上就是通用智能的实现过程,那演进路径是什么呢?

试答曰:通用模型化,这是一个大胆的假设,从前面讨论中,灵光乍现想到的,莫非有点先入为主,我们先忘掉它,从头看起。

所有的具有生命力的技术,都是通用技术,通用处理器、数据库技术、搜索技术都是一种普适性的技术,通用处理器抽象出了数据和计算,数据库抽象出了通用结构化数据,搜索技术抽象出了文本的索引和搜索,这些不包含语义的抽象技术,结合社区、互联网形成了巨大的繁荣。

那么什么样的新一代通用技术可以像以上技术以上具有广泛的生命力呢?

当然我们看到了深度学习的广泛通用型,比如卷积网络,NAS,BERT这些具有一定通用性能力的基础模块,那到底未来在向哪个方向进步,哪种更有生命力的技术将会脱颖而出呢,比如我们近期所思索的通用神经网络、神经操作系统,是不是在这个方向下呢?还是会有其他我们还没有想到的一种中间态技术的出现呢?我们如何尝试去看见未来呢?

我充分认识到这个问题的复杂性,通用模型化只是一个大胆的假设的,我们还要忘掉它,回到技术的源头,去看什么样的技术能产生无比巨大的威力,我们甚至要跳出无人化的角度去看这个事情,因为即使有人化,我们很多事情现在都还不能做到,为什么呢?因为智力资源的供给不足。比如电商的超级导购,我们发现人类客服都不能满足,当然产品创新可能会改变这些,但是商业上的掣肘在当下是存在的,比如一个新的创新企业发明了一个类似magic的人类专家助手,帮助用户进行商品选购,但优秀的导购成本是极高的,他无法满足所有商品选购者的个性化需求,正因为如此,现在的商业模式才都是以广播式为中心的导流模式,不是以个性化用户需求为中心的目标求解模式。

无人化的目标不只是解放人类,还有增强人类,因为生产力的极大繁荣将促进社会的进步和人的自由和发展,即使未来人足够的便宜可以做一对一个性化导购了,我们依然希望由机器人来做,更加隐私、不犯错,在长远的路线上看,这都是不可避免毋庸置疑的。

但这个案例很好地告诉我们,人力成本并不是我们往前做无人化的障碍,我们也可以放下成见,认真思考,用机器人来做导购的真正技术障碍在哪里?

正如我们一直所谈论的,商品本身就是一个具有典型丰富知识领域的场景,不同的商品他们的功能目的都是不同的,他们相关的知识也各不相同,因为任何购买者在选购时都不可避免要学习这些知识,导购也必须具有对产品非常清晰的认知才能做好推荐工作,而高级的导购是要以需求为中心的,而不是以说服为中心的,他跳出具体的商品代购,转而变成全领域内寻找最优解决方案,寻找的方法让其必须具有更加广泛的学识和对大量商品的认知,从而做最好的目标求解。

一个掌握知识的机器人,就是我们前面所说的必须将很多模型移入机器人中,而不是人脑中,实现这个有两种手段,一种是使用大量的技术人员,针对领域进行建模,进行产品研发,比如不同的业务领域他的流程是不同的,所以要开发不同的导航,是的,我们可以做成一个生态,让生态上的合作伙伴开发数以亿计的世界模型和伴生交互,最好这些模型之间能够打通,让更为基础的模型来支配这些模型,他们形成层次化的互相作用关系,就像人脑思考时所发生的那样。

这是第一阶段,建模仍由人类来完成,重点是如何构建一个很好的平台和架构。进而我们很容易想到第二个阶段,将这个过程自动化,即有机器来自动建模,这种建模是自动发生的,他自己通过读书学习,掌握元认知,然后进行各类领域模型的构建。这个技术我称之为通用模型化技术,即一种通用的模型构建技术,它只需要有基本的学习和认知构建能力,便可以生成各类领域模型。

那么既然第一种方案就可以构建一个美好世界,为什么我们的世界还没有变得那么美好呢?我认为有三个方面的原因:一、并不是所有的模型都能建模出来,有些模型不适合现有的实体关系属性模型构建,这是类脑智能带给我们的启示,涉及如何构建更加通用的建模技术,另外,有一些基础性模型没有被发现和设计出来,像完形机制、异常监测等等,这是原因一,二、即使有了业务模型,交互也存在障碍,对用户需求的理解仍然涉及模型召回的问题,需要解决基于人机交互的模型召回,当然这个问题跟设计业务模型可以认为是同一件事,可以消解掉,三、建设的成本,不同层次的世界模型,是一个空间换时间的问题,比如直接的KV映射可以获得直接的答案,就是最简单的记忆模型,最底层的世界模型是最基本的元能力模型,解答问题要重零开始学习一切,再进行推理学习,理想情况下的世界模型架构会是两者的这种,一些东西是固有的元世界模型、基础世界模型,也会临时构建一些模型,用于分析推理,从而得出更加可靠的结论。那么采用不同层次的世界模型,建设的成本不一样,用的世界模型越靠近应用端,数量就越巨大,建设成本就高,用的世界模型越靠近元模型端,数量就小,理论难度就大,这是原因二,所以原因一和原因二其实是有统一性的,一个是组合爆炸导致的研发供给不足供给不及时,一个是理论突破能力。四、模型和模型之间的交互尤其是那些元模型和模型之间的操作能力,是传统以数据+算法结构研发的系统所难以实现的,是我认为最大的障碍,所谓的原因三,举个例子,理解用户的语言时,首先要用语言相关的世界模型,才能理解语言的真实语义,这个过程又要依赖其他很多世界模型,比如我说请帮我给小姨预定一个明天早上五点去机场的出租车,这里面除了语言结构相关的世界模型,还涉及人物及关系、了解机场、出行交通相关的知识,才能做出正确的规划和任务执行,现在的实现方案都是人为一个一个去实现的,这个会是一个专门的产品需求实现,还要知道如何调用预定接口,大部分过程是头脑中发生的,之后落实成由若干个简单数据模型实现的功能,但如果问题变成:查询去过东区没去过西区的用户总数,这样一个典型的查询问题,就需要一个十分复杂的业务领域模型,关于商场的东西区、用户的概念、总数的概念,这些概念的定义的确切含义思考所需要的推理和思考能力,最后还要有基于思考出来的一个复杂世界模型,再运用SQL生成知识(SQL相关的一系列世界模型)生成对应的SQL语句,再获得查询结果。整个过程可以涉及几十上百个(难以猜测出来具体数量,太复杂了)世界模型和其相关的知识,这些知识怎么存储在计算机中就面临原因一说的问题,也面临本原因三所说的,这些模型之间如何相互作用也难以进行,尤其是要动态加载知识的时候,只有一个中心化的架构才能解决问题,之前的case by case实现是不具备通用性的,所以我们说这个叫世界模型操作系统,就是一个具有世界模型动态加载合作协同的一个通用型基础设施。

我们前面大肆讨论模型化,本质是指的是世界模型和模型相关的一系列周边,我们现在深入通用智能理论揭示的世界模型所处的地位,再来看整个细节是如何发生作用的。

首先世界模型是一个工作记忆中的概念,是一个即时态的概念,存在于工作空间舞台上,世界模型的构建是依赖于长期记忆中的知识的,这些知识存储了各类概念、各类关系概念、各类概念间的关系,各种操作性概念、以及各类局部推理机制的信息都可能被征用,即如何构建世界模型的知识和如何操作世界模型的知识都要从长期记忆中征调,然后再临时加工处理,临时加工处理过程就是我们的思考过程,思考过程就是推理和目标求解的过程。

所以,当我们说需要大量的人研发世界模型及其周边时,就是将前面所说的关于世界模型的各类知识、对应的操作手段都等价地在计算机世界实现一遍。

通用搜索技术之所以通用,就是因为将所有的文字都变成名词、助词、词频、索引这些概念,他们创建的搜索模型本身是一种十分通用的模型,相应的算法使得搜索技术变得跟关系型数据库一样具有极强的通用性,而且相对于关系型数据库,搜索技术是完全自动化运行的,关系型数据库则必须依赖开发人员。

当我们如此谈论模型化时,我们还忽略了一个特征层的问题,就是很多感觉是不能结构化和模型化的,比如喜欢,我很喜欢这种材质,但她喜欢的内在原因和作用机理是不明的,所以当他问起,给我推荐一件我喜欢的衣服的时候,你没有建模并利用模型进行预测,这个时候你也许会使用概率模型,甚至也有其他的消费者偏好模型,来进行学术分析般得讨论分析,然后用目前所能掌握的最科学的方法,做这件事,这种非常有创造性的事情,并非脱离了世界模型体系,只是他所依赖的世界模型和知识体系非常的底层,难以描述和控制,因为人类再长期的实践中总结了大量的难以名状的世界模型,没法以清晰的知识描述出来。还有很多世界模型需要长期的学习和积累,比如微积分,不是上去就能学会,那些可以指定成简易手册的模型更容易在人群中推广,比如医学就是很典型的例子,什么症状大概什么病,形成诊断手册,从医者就不需要了解真正背后的原理知识,以一个分类器模型取代了更加复杂的人体原理推理模型,这就是简易模型取代复杂模型,低级模型取代高级模型在现代生活中发挥作用的例子,这种模式在我们的世界模型操作系统中也同样存在,我们可以称其中一些为等价降级映射模型,也可以称之为“短路模型”。

诚然,我们看到完全的模型化对应的是完全的通用人类智能,完全模型化的障碍就是通用智能的障碍。作为通往通用智能之路的早期阶段,什么才是更加实际的工作,什么才是有希望的手段,是值得我们深入讨论的。

如何出发?

整个智能化的过程不是现在才开始,正如我们前面所说,模型化早已展开,只是用的是更加初级的等价模型在工作,没有海量模型的学习能力,没有引入高级模型,没有引入认知元模型。

我们知道元模型的重要性是因为他是解决组合爆炸问题的关键,元模型和认知框架的共同作用,可以解决海量世界知识的学习问题。

人类的发展史就是人类的智能应用史,体现的是人类的工具制造和工具使用史,人类创造的工具数量非常巨大,人类生产的商品种类可能高达上千万,但这些东西是由各种要素组合出来的,构成他们的核心要素并没有那么多,这也是我们说掌握核心世界模型的价值,追求本质模型,远离表象模型,能够彻底摆脱外部等价模型。

外部等价模型——前面讲到的为了计算机实现在外部世界建立的一种等价模型,比如关系型数据库模型,我们希望最后不再依靠开发人员建设外部等价模型。

表象模型——就是肤浅的知识,最典型的是字典,当然很多情况下只有字典模型可用,但相当多的情况有更高维度的模型可用,KV问答库,搜索模型都是典型的表象模型,前者是精确匹配获得答案,后者是模糊匹配获得答案,或者无法给出答案,只是提供了一个工具而已

本质模型——是能够反映事物本质的模型,比如自动驾驶的周围环境模型,只要空间建模做的好,自动驾驶就能走的远,还有逻辑模型,逻辑推理能力是问题求解的核心能力,在遇到问题时用于分析问题的,成为本质模型。

关于模型的派生关系,我在通用智能的基本框架阐述时提到过道生一,三生万物的图解,如下

数字化

我们有些非常基础的能力,已经不能叫做模型了,是产生后续能力的基础,更多是一种机制,这些机制具有很强的扩展性,扩展的方式就是我们说的模型(开头说了,这个词不一定准确,我们也许可以重新找到一个更好的词汇,来表示这种表征知识和运作的复合体的内涵)。一些基础型的模型是衍生出高级模型的基础,产生的高级模型慢慢会脱离基础模型独立存在,变成新的基础模型,模型系统展示了复杂系统中很多常见的现象,涌现、派生、分化、扩展、组合、替换、重构、短路。

如图所示,圈1234代表了不同的模型实现领域,有些实现域可能将会深入到元模型腹地,甚至深入到基础机制(如圈3),有些则处于十分肤浅的表层(如圈1和2),通用模型技术要解决的是解决根本性机制问题,基础性模型问题,如果能实现全部的机制和基础模型,那么就达到通用智能水平,可以直接自主学习和研究实现所有表面模型了,那么在此之前,可用演化路径呢?

数字化

这就提到了部分基础机制和基础模型的势力范围问题,比如圈4,我们如何能实现一些基础模型,是不是就可以衍生出非常多的表面模型,这个是可行的,而且现在的创新尤其是工具类和平台类的创新就是这样的方向,比如BERT,里面蕴含了大量的语义信息和关联,就可以衍生出很多表象模型和应用。也许有一天3的继续纵深解决了更深层次的机制和基础模型,就具备了向所有其他业务领域扩张的能力。这点跟历史上的很多科技进步很像,很多技术诞生于某些领域,但由于其通用性扩展到了非常多的其他领域。

所以垂直的领域是可能诞生通用模型化的,比如自动驾驶,无人仓储,RPA,NextG,视觉结构化。

所以迫切需要基础模型化的应用场景比肤浅的表象模型应用领域更有突破的前景,我认为有以下几个工作要做:

1. 去外部等价模型,让计算机系统不面向终端模型而是面对本质内在模型

2. 去命名化,不要凡是模型都要设计,凡是模型都要命名,大量的模型不可名状,这样我们才能深入腹地

3. 切入垂直领域,关注核心模型和核心机制,不要被海量表象模型和等价外部模型的研发成本所拖累。

责任编辑人:CC

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分