关于我们
书单推荐
新书推荐
|
智能工程 全书共10章分别从构建非生物智能体、感知、描述、连接、记忆和理解、学习与交互、智能体运算模式与处理功能、资源和任务功能系统、生存、思维、控制与主体性、智能体生命周期等角度深入讨论了智能体的方方面面,本书讨论一个极为庞大、复杂,且没有先例、没有形成共识的智能体或机器智能系统的实现机理、过程、要点,没有能、也做不到面面俱到,存在作者有意或无意忽略的环节。本书没有在工程细节层面讨论,只是在整体实现的主要环节的可实现性进行了框架性讨论。 前 言 历经两年,本书终于脱稿。在2015年的写作计划中,并没有这一本书。当时的考虑是,将信息和智能这两种客观存在的属性和发生发展规律说清楚,把超越人类智能的非生物智能体的目标、要求、逻辑架构说清楚,我的研究目标就完成了。因此,2018年年初,我的书桌上已经将写作《论信息》和《智能原理》两本书的参考资料撤掉,换上了经济学相关的资料。过了几个月,收到一些读者对两本书的反馈,感到有必要就非生物智能体如何实现再写一本书。原因在于沿着《论信息》和《智能原理》两本书的认识逻辑和理论框架,去设计这种功能上媲美甚至宽于AGI的非生物智能体,方法上还不采用流行的人工智能领域的模式和算法,可能难以达到,需要将实现思路进行系统的介绍。于是我重新回到已经划了句号的领域,开始《智能工程》的写作,并将三本书合在一起,称为“智能三部曲”。 本书的非生物智能体,本质上是机器智能,重点是以生物智能为模板,在既有机器智能的基础上,实现以含义计算为基础,以理解为前提,可以自我积累知识和经验的非生物智能,也就是具有理解、思考、判断、决策行为的思维机器。这种机器能够与人合作,能够集成既有的机器智能,能以持续增长的模式发展。 开始的时候,我低估了写作的难度,以为在理论和逻辑方面已经厘清的问题,只需要具体化就可以了,随着研究和写作的进展,发现这个判断是错误的。难点集中在三个地方:第一,什么样的体系架构能实现《智能原理》中定义的非生物智能体的所有功能和要求;第二,用传统的IT模式形成的软硬件,如何转变为含义—理解—思维—行为的智能处理模式;第三,可实现性应该在什么颗粒度水平描述。 对于第一个问题,本书第1章中的图1.5是回答的总纲。智能体的架构要支持其所有活动过程:认知、任务、生存和控制。智能体的架构要满足智能体的8个原则要求:主体性、多样性、发展性、生存性、交互性、结构性、传承性、整体性。满足这些要求的一种可能架构由图1.5中给出的11个功能体系组成。它的所有构件,从基础的微处理器到此上各个层面的功能集合,均具备自主、自治的独立性,又处于相应功能集合和整体的有效管理和控制之下。11个功能体系是:感知、描述、连接、记忆、学习、交互、处理、任务、资源、生存和控制。 主体性、生存性这两个要求,主要通过四个功能模块实现:资源模块、生存模块、思维模块和控制模块。资源模块联合生存模块保证智能体正常运转,思维模块辨析智能体面临的风险,控制模块决策并主导应急处置。智能体所有构件均被赋予自主、自治的独立性,以避免系统性风险,提高智能体生存性。传承性要求主要通过生命周期的前三个阶段:初始、赋予、培育来体现,并在此后的学习和交互过程中延续。发展性的要求主要通过学习模块实现,学习是发展的主要来源,其他功能模块也会在自身行为中总结成长,或经由学习提升自身功能。交互性的要求主要通过交互功能模块实现,以满足智能体感知、学习、任务、资源和生存各个功能对交互的需求。结构性和整体性这两个既矛盾又统一的要求,主要通过11个功能体系内在的自主结构和相互之间的协同模块,控制功能的整体协调实现。 认知、任务、生存、控制这四个智能过程涵盖了智能体的全部构成要素、功能和行为。每个过程的实现都需要11个功能体系的支持,都在生命周期的全过程发挥作用,全书就是从实现这四个过程的需要去安排11个功能体系的结构、功能、相互关系。本书对这四个过程的功能及其实现有四个特别的安排,这是阅读和使用本书的关键。 第一,认知过程以理解为目的,以智能体可自主发展为中心,以逐步叠加为路径,而智能体所有的功能,包括认知的发展,均基于认知。“知之为知之,不知为不知,是知也”这句2500年前孔子的名言是本书的哲学基础。“不积硅步,何以至千里”是本书实践路径所遵循的原则。以互联网为平台,以交互功能为媒介,一个字接着一个字、一个动作接着一个动作、一个场景接着一个场景,一个主题接着一个主题,将人类智能的进展用愚公移山的精神,大规模自主并行,叠加到智能体的记忆中,形成远远超越一个自然人可理解、可使用的记忆,并在交互和使用中校验、完善。与认知相关的功能体系设计就是按照这样的原则执行的。 第二,任务过程是以认知的积累为基础的,也就是只承担能够做的任务,力所不逮的不承担。智能体认知过程的核心就是先积累常识和基础知识,待达到一定程度后,在拟承担的任务类型方向不断深化,达到专精的程度。所谓专精,就是对所有需要求解的问题在实际工作场景的所有可能形式都已经遍历,所有这些形式的求解过程也已经遍历,而且形成的所有求解过程都是确定的,或即使存在一定的不确定性,也不影响结果可靠性要求。换言之,围绕任务的认知,就是力争穷尽一个个特定任务的问题空间和解空间,任务执行只承担可以判断解的路径是确定的问题。有些人可能认为,穷尽特定问题的问题空间和解空间是一个不可能实现的命题,从抽象的角度,或者从纯逻辑的角度,可以得出这样的结论,但从实际经济社会的工作岗位看,随着发展,绝大部分工作岗位的任务,其问题空间和解空间是可以穷尽的。一个生产线上的工人,一个销售员、一个理财师、管理者,在实际工作中处理的的问题类型及其变形都是有限的。对于智能体来说,从可穷尽的开始,在其庞大、不知疲倦、快速度迭代、相互独立又可以协同的认知功能支持下,可穷尽空间的问题类型会越来越多,在一定的发展阶段,就会超越普通的员工,并能继续发展,超越一群人,直至超越大部分人,直到具有所有人都达不到的新特征或新高度。 第三,生存过程是当智能体成为社会独立主体时,能承担社会责任,能不间断、自主地积累知识、经验、技能、事实、数据,所必需的是在生命周期的某个时间点开始能将生存能力掌控在自己手里。 第四,控制过程更是智能体所有过程能够形成、发展、发挥作用的关键。智能体是由数以千亿到万亿量级的自治构件组成的,这些不同类型、功能、层级的自治构件都有各自和相互之间的控制和协调功能,这是控制过程的基础和重要的组成部分。智能体的控制更重要的是整体的控制,这是控制功能系统的职责。控制功能有两个重要模块,一是意识和思维,对智能体的运行和环境不间断地观察,分析判断是否存在风险,是否存在被局部忽略,控制功能体系处置的事项;二是智能体全局的决策、控制、调度和处置。 对于另一个难点,本书以六个功能系统中的相关功能和规则,解释为什么可以将传统的IT模式组成的软硬件,转变为含义—理解—思维—决策—控制的智能处理模式。 其实,传统的数据库管理系统、数据分析系统、商业智能系统,都能通过严格的数据控制、数据格式、数据字典和确定的处理函数,从数字(符号)得出预期的、具有含义的结论,也可以根据数据结构、函数和数据字典给出解释。这就是从符号中得出了含义的结果,也可以说在这个范畴内,系统可以给出数据库中的特定字段、处理结果的“理解”,因为它可以解释。缺点在于,不能泛化、跨系统积累,只在该系统能达到的范畴和深度。这个例子也给我们一个重要的启示,刚性的符合数字内在含义的结构和处理、解释规则,是可以从符号中导出含义的。尽管另外一些处理模式也可以得出符合所处理符号隐含的含义,但如果不可解释,就不能认为是智能的,智能的基本条件是能解释。 基于这样的分析,我们能将得到信息以一种结构化的、可解释的方式转换感知到的对象(符号),然后以智能体统一的、可理解的符号和标识体系对这些符号进行转换,并保持由传感器决定的感知内容及感知对象的全部结构,以及静态的各种空间关系;动态的则加上时间序列的所有细化对象的空间关系,再与已有的以前感知的同类对象、以前描述的同类符号转换,用连接表述本次感知的全部关系,把感知对象的基本单元与已有的记忆比较,将所有的关系显性表述。经由这样的模式保存起来的感知对象,就转换成了智能体可理解、可利用的记忆。这里有三个关键环节,感知、连接和记忆。感知把关是基础,所有的外部对象(文档、图形、音视频),必须经由唯一的感知器感知,一个感知器感知的结果,都可以由描述功能以智能体可理解的符号表示。实现这个要求的方法就是感知器的单一性,如一个汉字,就是一个传感器;一种声纹特征就是一个传感器,声音是片段声纹的时间序列;图像则以一个个基本形状特征及色彩组合为传感器,视频是图像系列。数以十亿、百亿的逻辑感知微处理器和数量较少的协同的物理感知微处理器与其识别对象的描述处理器直连,将对象中的要素及其连接描述完成后传送到记忆,在记忆与其他可能的相关连接成为智能体所有功能模块可理解、可利用的记忆单元。任务过程在一定意义上是认知过程的逆过程,任务被感知后,进入规定的任务类区域,在该任务类匹配到适用的执行微处理器,通过执行微处理器调用物质资源、记忆单元和确定的处理微处理器,完成任务的执行。生存和控制过程也以类似的模式完成。所有的智能体功能过程或智能行为以感知为起点,用特殊的结构,实现了从符号到含义、从存储到记忆、从计算到理解的转换。 最后一个难点本质上是技术性问题、工作量问题。颗粒度越细,工作量越大,对理论到实践的前瞻性要求越高。本书在写作的初期计划用28章的大篇幅,在类似于概念设计的颗粒度层次上完成,后来发现工作量太大,也没有必要,因为本书的任务不是以具体项目的方式去考虑,而是对可实现性的一种解释,所以尽可能将颗粒度放大,能看到可实现就达到了本书的目的。最粗略的估计,一个通用的非生物智能体是一个大体需要千亿美元或万亿元人民币量级的资金,用6~8年时间,高峰时需要数千人的开发团队及大量基于互联网的志愿者参与的工程。它没有先例,细粒度的讨论缺乏基础。所以,本书没有描述细节,去掉了原计划中对主要功能实现例子的逻辑过程描述。既有篇幅与前两本书一致性的考虑,也有不约束实现模式和细节多样性想象的考虑。 有人说,这个系统太过庞大复杂,热力学第二定律必然使其窒息;有人说这样的系统必然存在计算复杂性,并因此而崩溃。实际上这是在不同维度上的思考。智能体的所有过程都是含义处理,含义处理的基础是理解,在理解上叠加,是1+1+…直至一个个逻辑对象、 1984-2001, 国家信息化中心;2001-2008,国务院信息办;2008-2015,工业和信息化部副部长。研究领域:汉字信息处理,信息系统和网络的设计和开发,信息经济学,信息法学,国家信息化发展战略,人工智能理论等。1981年以来,先后发表了150余篇论文,著有《专家系统及其在管理中的应用》,《知识经济时代的企业技术创新和改造》、《企业信息化建设与管理》、《论信息》《智能原理》等著作。 目 录
你还可能感兴趣
我要评论
|