智研院工业大数据首席专家郭朝晖不久前做了题为“工业互联网平台背景下的工业大数据与智能制造”演讲。内容如下。
各位朋友,大家晚上好!在讲这次内容之前,我的压力很大:前面几位专家已经把问题讲得非常清楚、也非常全面了,我该讲些什么呢?后来想,就向大家汇报我的一点心得:关于工业互联网平台以及相关智能制造、工业大数据、人工智能等概念的关系。我试图用简单的逻辑把这些概念串起来。平心而论,这些观点也不都是有把握的。网友中高人很多,今天把这些观点抛出来,正好请大家帮我指出问题、改正错误。
图1
准备这个报告时,我开始准备了接近40张。后来发现,说的多了反而不容易说清楚。于是决定干脆少几张。今天的话题其实就围绕这张图展开的:里面有我很多曾经的困惑。
这张图可以分成三个部分。左边讲的是相关技术的原理、思想是怎样的,讲这些技术为什么突然一下子突然发力——其实是有了经济潜力;右边讲的是创造经济价值的逻辑,就是技术要与业务场景结合、如何寻找或者创造这样的场景。中间这一部分就是工业互联网平台以及承载的相关技术。它的作用是把技术和业务连接起来,把原理体现出来、把潜力变现、是企业推进智能化的支撑技术。
如果没有这个支撑技术,再好的想法也难以落地。或者说,落地的代价太大、经济性不好。如果有了这个公共的支撑技术,就不要大家各自开发软件了,只要用公用的东西就行了。这样,小企业也有能力来用先进技术了。这个道理和淘宝平台其实是一样的。不过,这个平台承载的是企业自己的专有的知识、经验、诀窍等专用的“私货”,并连接人、机、物、数据等资源。这些“私货”可以自己用,也可以像商品一样“出售”、给别人提供服务。
图2
我们先看图的左边这一部分。这部分回答一个困惑——这些技术为什么突然成了热点了?
大家可能都知道,最近几年出的新概念特别多:从工业4.0、智能制造、大数据、CPS、工业互联网及其平台、人工智能、工业APP......这些概念让很多人觉得很悬,又怕赶不上潮流,于是就到各个地方去看很多文献、听专家报告。到头来还是似懂非懂。
我觉得呢,这些概念不应该特别难以理解。如果觉得难以理解,那是因为陷入了思维误区、把问题想复杂了。想复杂的原因大概有几种:第一种觉得这些概念是牛人提出来的、一定有很多的学问(很多是故弄玄虚);第二个方面就是发现自己不知道怎么做,就以为自己不明白(其实是条件不够);第三个方面是相近的概念太多了,脑袋都搞大了(本来就相近啊!)。
在我看来,这些概念其实很简单,确实是过去一些思想的延伸、相似或者相近是很自然的。我们要解释的是:为什么突然成为热点?
这些概念被热炒的原因,是因为技术条件发生了改变。换句话说,如果过去提出这些概念、却没法实现、只能是空想、至多是写写论文、做个样板。我常举控制论之父维纳的例子:维纳或许有CPS的思想,但他的时代没有计算机和互联网、提出CPS也只能停留在生物控制层面。在前几年,互联网不发达、难以实施掌控资源时,CPS的概念几乎可以用计算机里面的“控制模型”来取代。现在到了工业互联网(智能制造时代),问题变得复杂了,要把众多的模型组织起来,需要一个更加一般性的概念来说事。于是,就有了CPS。总之,没那么悬。
前面提到条件的改变。最重要的一个就是ICT技术的进步:摩尔定律连续发展了50年,量变到质变了。这种变化常常被人提起来,以至于很多人习以为常、当成耳旁风了——其实,如果不是身在其中,有过经历、这种变化的真正意义却难以体会到。曾经有一位年轻博士问我:现在工业上的先进技术一点都不先进、我读书时研究得就比这个深。我就告诉他,理论方法虽然不新、但技术应用是新的啊。比如,20年前,我博士毕业刚工作的时候,一个微分方程求解都没办法实时计算,更不用说CPS、实时图像处理了。所以,理论再好也不能用于实时管控、只能发发论文。
ICT技术让技术成本大大降低。这让相关应用范围大大增加。30年前的宝钢是中国最现代化的工业企业,那时搞信息集成的100台PC机,需要经过中央领导特批!有ICT技术的进步,现在一些小企业都有办法搞了。这就是所谓普遍性、一般性的意义。条件发生变化以后,很多技术搞起来就合算了。于是,概念一下子热起来了。当然,这只是潜力,要把潜力变现还不是那么容易。而这真是我们这代人要做的事情。
下面谈谈我对互联网本质的看法。互联网的本质作用很简单:人类可以通过空间限制获得信息、掌控资源。这句话很简单、很多人都说过类似的话。大家想想看:从雅虎、谷歌、淘宝、微信、滴滴等,这些东西其实都是这个道理啊!
于是问题就来了,为什么最近几年工业互联网才热起来呢?
要回答这个问题呢,就要知道科技发展有个规律:技术往往是从难度最低、收益最大、成本最低的地方产生,然后向难度高、收益相对较少的领域聚散。就像流水的规律一样。在我看来,现在红领制衣的技术,和30年前宝钢搞的按合同组织生产本质上差不多。现在很多所谓的创新,本质上就是技术扩散。比如,现在很多数字化设计的技术,就是从航天、航空、军工扩散过来的。而且,技术成本越低,越容易扩散。
我们看看,互联网的发展过程就会发现的确是难度越来越高的。最初普及的应用只是非实时地发普通的电子邮件,后来从非实时的交换到实时数据交换,从小数据到大数据,从单纯的信息交换到资金产权的交换等等。这里就不展开了。按照这个逻辑来说,工业互联网的应用一定是比较难的。但难在什么地方呢?
理解工业的本质特点:我常说一句话:确定性是工业人追求的目标。工业人追求安全、稳定、可靠。当外行看到技术的性能不断地突破极限(比如高铁越来越快)——其背后是在这种极限条件下解决了安全、稳定、可靠这些问题;而且背后这些工作量极大、难度极高!不理解这个,怎么能叫理解工业呢?有些“砖家”胆子特别大,啥都敢说,就是因为没在现场干过、没干过真正的难事,不了解这个道理。
现代工业系统对可靠稳定要求是非常高的。为什么呢?因为出现一点点的问题就有可能出现危及生命的大事故、会造成非常大的物质损失。这一点和个人消费品很不一样。举个例子:你花了50块钱买个杯子,如果杯子不好,至多损失50块钱。但是,如果你花50块钱给高铁买了一个零件,导致高铁事故:那损失是多少倍啊?所以,“损失放大”很要命。另外,工业技术的个性化很强、默会知识很多,这些都是普通商务活动没法比的。我们会发现搞工业的人往往比较踏实,有经验的人看起来往往胆小,其实都是环境和背景导致的性格。
工厂里面有一种说法:说的好不叫好,用的好才是好。把这句话翻译:单纯用信息描述工业技术是不够的!人们甚至不清楚自己需要什么,只能用实践来证明。所以,即便找到更便宜的,企业一般也不会随意更换供货商:怕出事啊!对互联网来说,这就糟糕了:即便用互联网把信息传过去,人家也不一定敢用。这就是工业特性约束互联网应用的原因。
事实上,工业互联网会把网上的联结对象(如较为封闭的机器)构成一个有机的系统、甚至是动态控制系统(后面有个例子),而不是像淘宝这样松散的、一对一的联系。所谓的系统,就会有“牵一发而动全身”的事情发生。所以,工业互联网对安全、稳定、可靠、实时性的要求更高。
工业互联网领域很多的事情都与这个道理相关。工信部原副部长杨学山说工业互联网姓“工”不姓“网”,工信部信软司安筱鹏副司长说工业互联网平台应用要解决“能力度量问题”。在我看来,就是这个道理。还有些实践表明,工业互联网不像淘宝这样2C的互联网,就是打不掉中间商!也是工业的特点造成的。
总结一下,工业界技术创新的特点是:先进技术在工业企业中能否应用,往往决定于稳定可靠性问题能否解决。打个比方说:车子能跑得快,往往不是车子性能决定的,而是车况和路况所决定、能够保证安全的速度是多快。大数据、智能制造、互联网的工业特色都能用这个道理解释。反映到实际工作中就是:理念先进技术不一定有用、但对安全、稳定、可靠有帮助的技术却往往用处很大。顺便说一句,不展开:这个道理能指导我们创新的方向。
图3
我们现在再来谈一谈对智能的认识。《三体智能革命》中提出了智能的20字箴言:“状态感知、实时分析、自主决策、精准执行、学习提升”。这5个要点中最近本的有三个,就是把感知、决策和执行三个过程统一起来。
我们知道,互联网是智能制造的重要推手。为什么呢?就是感知和控制资源的能力大大加强了! 管控资源的能力加强,为什么会引发智能制造呢?我的逻辑是:管控的资源多了、问题就变得很复杂了,人忙不过来或者容易出错;这个时候,必须要计算机来代替他人决策——注意,我的逻辑是:必要性增加了,而不是技术可行性改变了。
反之,如果问题简单的话,没必要上这些高大上的概念和系统,企业干“高射炮打蚊子”的事情是不划算的。按照智能制造(smart manufacture)的含义,钢铁行业很早就具备了基本特征。那时候,日本人就对我们说:“100万吨产量的时候,靠人管得过来;600万吨的时候,没有计算机就管不过来了!”所以,智能制造是人们不得不把任务交给计算机来完成的。这个时候才有意思。
注意提醒一下刚才说过的逻辑:问题复杂到人没法干,这是负面问题。智能化相关概念,是解决负面问题的!解决负面问题,才有价值。当然,这些负面问题是企业“自找”的:为了更好地满足用户需求。
让我们的感知和执行能力大大拓展了,能干什么呢?我把它总结成了六个字,就是“协同、共享、重用”。这六个字针对各种资源,包括物质资源知识资源,公司内部和外部的资源,人、设备和数据的资源等等。这六个字,既让问题变得复杂,但另一面是能更有效地创造价值,并实现智能制造快速响应的要求。
这个图上,手和眼睛代表互联网带来的感知和执行能力,而脑袋代表计算机的自动决策。要自动决策、体现智能需要知识。对智能化来说,知识这个东西非常重要、是关键所在。有人说大数据很重要,我却觉得:外面看是大数据、里面看其实是大知识。下一页会深入展开。
另外说明一下:要实现这个逻辑呢,需要做很多事情,包括ICT技术之外的事情,如物质条件的准备、组织流程改革、商业模式创新、设备更新换代等等。所以,推进智能制造被称为两化的“深度融合”。我甚至认为,真正的智能制造首先是生产关系的变革。很多企业觉得难,就是这个原因:改变生产关系,关键在领导!
人工智能最近很热。智能制造(Smart Manufacture)和人工智能(AI)有联系,也是有重大区别的。由于时间关系,这里只简单说几句。
我经常给人家打一个比方,工厂里的智能主要是“吴淑珍式的智能”。吴淑珍是中国台湾地区前领导人陈水扁的夫人,内线炒股发财:陈水扁的亲信告诉她哪个股票要涨,她就去买、买了就赚。我把“吴淑珍式的智能”表述为“准确及时的信息+简单的推理”。这种智能不像巴菲特炒股,是“模糊的信息+复杂的推理”。
工业过程智能更多的是“吴淑珍式的智能”而不是“巴菲特式的智能”,为什么是这种呢?
要回答这个问题,还要回到工业的特点说事:人的随意性很强,是工业中不确定性的一个重要来源。所以,工厂里一般要求工人进行标准化操作、抑制随意发挥,在什么场景下做什么样的事情,是有明确规定的。
从程序员的角度说,“吴淑珍式的智能”用的知识其实就是一些“IF语句”。这个听起来有点土,但本质就是这个。而且,这种提法不新鲜、不知道出现多少年了。专家系统理论中有个“学术化”的说法叫“产生式规则”,就是这个东西。20年前我到北京培训一个所谓的人工智能软件,差不多就是这个东西。
我也曾经困惑:这个东西过去为什么用得少呢?现在想来,用得也不少,但直接编程更容易、似乎没必要用那么多专用语言和工具,来“杀鸡用牛刀”。现在为什么不一样了?因为问题复杂了、管理的知识多了、灵活性要求高了,实现的办法就要重新想一想了。我觉得,对于真正复杂的问题,还是要平台来解决。我给人讲创新,常常讲到简单的问题和复杂问题的处理方法不一样,量变到质变,就是这个道理。这里就不展开了。
我们现在再来看看大数据的本质。在我看来,大数据最根本的用途是产生有用的知识、特别是用于智能决策的知识。工业大数据真的有这个潜力!我们知道,人类一切的知识来源于历史,如果大数据能够广泛完整地记录历史发生的痕迹,人们有可能大数据中获得更多的知识。毕竟,在大数据背景下,人的记忆力远不及计算机。
当前,产生知识的“潜力”要转会为现实的“能力”,还需要有其他的前提。其中一个即所谓“样本=全体”。换一种说法就是:这个能力保证,你总能从历史数据中找到你想要的案例。在GE关于飞机发动机实时监控的著名案例中,一个重要的条件就是:一台发动机偶尔出现的故障,很可能在其他发动机上也出现过。诊断和处置的知识就可以直接利用。数据多了,这个前提就容易实现,即所谓:日光之下无新事。
在这个前提下,有一种思维方式特别重要,就是强调相关性。我觉得,这句话很多人理解的有问题、不到位。我的理解是:所谓强调相关性就是找相似的案例。找到这样的案例,直接去模仿就是了,而不必要按照科学的逻辑去思考。就好比我们用高德导航:走一条路要花多长时间,只要看看别人用了多长时间,而不是根据时间、速度来推算时间。我觉得,这未必就是排斥因果性,而是在一定场景和范围内,不需要知道因果性就可以了。这个差别很重要:因为工业大数据强调可靠性,常常需要因果来保证。
大数据还强调“混杂性”。在我看来,强调混杂性就是便于找到“相似的”一种保证。能够让我们能够从多个角度去分析知识、从而得到更加可靠的知识。我们知道,新一代人工智能最近很热。其背后的原因就是大数据智能可以支撑新一代智能制造范式。大数据能够让机器学习“学得好”、“学得对”、“学到本质”,甚至连一些人说不清楚的知识(如感性知识)机器都能自己学会。
1 2 下页