当前,制造过程中所产生的数据的规模、类型和速度正在呈指数级增长,带来了巨大的发展机遇。通过认真分析这些数据,企业可获得竞争优势、快速响应不断变化的市场动态、显著提高制造利润、生产力和效率。工厂车间中的设备会生成成千上万种不同的数据类型,例如多个级别的单位生产数据、设备运行数据、流程数据、人工操作员数据等。这些数据可以在存储后用于数据分析。
尽管大型制造商多年来一直在使用统计流程控制和统计数据分析来优化生产,但当今数据的复杂结构成为部署新方案、基础架构和工具带来了重大机遇。得益于更卓越的计算性能的涌现、开放标准的推出和广泛可用的行业专长,制造业已经准备好充分利用大数据。此外,在学术研究的推动下,技能娴熟的数据科学家数量庞大,他们将能够在使用大数据方面为制造业提供更出色的支持。
借助全新的制造智能特性,制造商能够提高质量,增加产量,更准确地了解制造问题的根本原因,以及减少机器故障和宕机情况。借助新的业务价值和技术能力,制造商将能够改变业务模式和实践,以优化设计,实现出色的可制造性,从而改进供应链管理,并采用定制的制造服务缩短专为各地消费者量身定制的产品的上市时间。
大数据实质上是包含各种数据类型的庞大数据集,可以分为结构化、半结构化或非结构化,如表1所示。结构化数据适合放在格式整齐的表格中,因此相对容易管理和处理。结构化数据的优势是便于输入、存储、查询和分析。相关示例包括关系数据库中存储的制造数据,以及来自制造执行系统和企业系统的数据。另一方面,非结构化数据(例如图片、文本、设备日志文件、人工操作员生成的值班报告和制造社交协作平台文本等)可能为原始格式,需要经过解码才能提取数据值。半结构化数据是结构化数据的一种,其格式不符合关系数据库或其他形式的数据表关联的数据模型标准结构,但包含用于分隔语义要素的标记或其他记号,并且数据中明确了记录和字段层次结构。在制造业,要想发挥大数据技术的强大作用,需要将这些数据集类型进行合并与关联,从中发现新的洞见,从而创造出色的业务价值。大数据技术的另一个价值定位就是,支持制造商以经济高效、可扩展的方式聚合并集中各类数据。
表1 制造数据示例
制造流程存在各种变量,如材料、流程方案和方法以及设备差异,这就要求制造商采用基于可扩展平台的大数据解决方案,这种平台能够随着业务增长和制造要求的提高而扩展。机器数据与产量和质量密切相关,因此能够为主动检测将要失去控制的流程提供重要信息。然而,一些类型的制造流程会产生大量数据文件(每个工具类型几天就可产生GB级数据,如表2所示),限制了使用传统方法从这些数据中分析、提取和存储有用信息的能力。如果不使用大数据技术,直观呈现来源广泛的大型数据集中的信息都非常困难。
表2 数据大小示例