无需数据科学专业知识即可轻松使用机器学习
希望明日保持盈利的公司,必须在今日设定方向。数字化是关键,因为基于数据的服务决定了未来的业务成功。这使得在工业生产中使用人工智能(AI)成为当今机器和工厂面临的主要挑战之一。从检测异常,到分类和预测磨损或损坏,再到质量控制,人工智能解决方案已用于许多领域。
人工智能从何用起?借助自动化机器学习(AML)工具,魏德米勒为用户提供了合适的软件。自动化机器学习工具使行业专家可以根据他们的应用知识独立创建机器学习(ML)模型。如此一来,他们就可以将其对机器和工厂业务的专业知识应用到软件工具中。在建模过程结束时,专家将获得适合其应用的模型。
复杂的建模过程
如今,数据科学家可以分析数据并创建机器学习模型。这个过程主要涉及手动操作并具有探索性。这不仅创建了实际的模型,而且还创建了所谓的机器学习流程,其中,数据经过许多处理步骤,最后显示模型并输出结果。创建模型和机器学习流程的过程非常复杂。总共有多达1040种可能的组合来构建机器学习解决方案。ML-Pipeline的具体设计在每种用例中都是独一无二的。当然,数据科学家可以使用一些软件工具来支持Pipeline的基本结构,从而简化工作。但是,机器学习解决方案的大多数参数必须以创造性的方式手动确定,这是一项艰巨的工作。在Pipeline建模和构建过程中,数据科学家不断与机器和过程专家讨论数据中所体现的关系。共同解释结果,从而最终确定模型参数并构建Pipeline。因此,行业专家的应用知识对于创造一个成功的机器学习解决方案而言至关重要。
使机器学习的使用民主化
魏德米勒的愿景是使机器学习的应用民主化,即,使每一位行业专家都能获得机器学习知识,并且确保机器学习在工业中的应用不为数据科学家数量所限。如此便可充分利用行业专家的现有知识。因此,需要标准化、简化机器学习在工业中的应用,以使行业专家无需数据科学领域的专业知识即可独立创建机器学习解决方案。此外,还需要最大化地实现建模自动化,创建ML-Pipeline,以加快机器学习解决方案的创建。可以用“自动化机器学习”这一术语来描述上述流程背后的技术方法。尽管“自动化机器学习”确实是指完全自动化地创建机器学习解决方案,但行业专家应积极地将其知识与自动化机器学习过程联系起来,以创建出色的机器学习解决方案。
指导分析
借助自动化机器学习软件,行业专家可以创建机器学习模型。自动化机器学习软件指导用户完成模型开发过程,这就是为什么需要指导分析的原因。专家专注于研究机器和过程行为知识,并将这些知识链接到后台运行的机器学习过程。这意味着自动化机器学习软件巧妙地查询现有知识并将其与后台运行的机器学习过程结合起来,从而将现有的和有价值的应用知识传输到可靠的机器学习应用中并存档。
行业专家独立开发机器学习解决方案
自动化机器学习解决方案本质上由两个模块组成,这些模块用于模型的创建、执行和优化,以及在模型整个生命周期中对其进行管理。
使用建模模块,行业专家可以基于训练数据及其在异常检测、分类和故障预测方面的应用知识,创建机器学习解决方案。
仅基于“良好数据”(即所谓的“无监督”培训)的异常检测是目前较为先进的方法。这是一种根据历史数据学习正常机器行为的典型数据模式的算法。在运行时,可以识别出实际情况与典型数据模式之间的偏差。检测到的异常可能是由于效率低下、轻微故障或重大错误。借助这种方法,系统甚至可以在发生完全未知的错误情况时立即检测到它们。建模过程的结果是一个完整配置的ML-Pipeline,包括模型。
此外,模型构建器用于在运行期间优化机器学习模型。只需轻击几下鼠标,就可以将训练数据中未包含的新事件(例如某些运行情况,机器运行时发生的异常或错误)包含在模型中。这使得模型可以在其生命周期中不断改进。
自动化机器学习模型的第二个模块是执行环境,在云短或现场应用中运行机器学习模型。自动化机器学习工作室不依赖于某个平台,而是根据要执行的模型数量自动调整。 另外,执行环境以易于理解的方式呈现模型结果,便于用户采取具体行动,例如避免错误。由于模型在生命周期中不断改进,因此创建了新的模型版本,所以模型管理是执行环境的另一个组成部分。其中,模型管理负责模型版本控制,模型恢复和模型监控。
应用知识具有决定性意义
在自动建模中,首先根据应用知识以及用于分析任务的训练数据的结构,自动选择合适的机器学习过程。这样,最多为原始数据中的每个数据磁道生成300个特性,从而覆盖了相对较大的解决方案空间。然后,训练具有不同特性组合的替代机器学习模型并优化其超参数。最后,验证模型并将其集成到并行生成的ML-Pipeline中。所有这些步骤都将完全自动运行。根据复杂程度,计算模型可能需要几分钟或几小时。只需数分钟就可使用第一个模型,以便用户可以及时获得有关模型质量的反馈,继而决定是继续还是终止模型构建过程。
对于成功模型构建而言至关重要的是行业专家的应用知识,可利用这些知识来改进训练数据集。基于机器和过程知识,行业专家可以标记数据,例如,在数据中标记期望的和不期望的机器行为。根据相同的原理,标记某些过程或生产步骤,比如典型的机器启动行为。用户还可以创建自己的特性,这些特性不包含在原始数据中,但仍有助于评估制造过程。
含有丰富应用知识的数据集为后续自动生成机器学习模型提供输入变量。这样得出的机器学习解决方案与数据科学家手动创建的解决方案相当。在建模过程结束时,用户根据某些标准(例如模型质量或执行时间)选择最适合其应用的模型。可以将偏爱的模型导出并保存或集成到执行环境中。
重点在于用户的应用专有技术
用户的应用专有技术对于专注于机器学习应用的行业做出了巨大贡献,这对于欧洲经济的成功至关重要。来自第一批机器制造商和操作员试点用户的反馈表明,自动化机器学习工具对用户友好,并且在功能和用户指导方面最能满足用户的需求。
魏德米勒自动化机器学习工具:使用人工智能(AI)辅助创建模型。
无需数据科学领域的专业知识即可轻松应用机器学习——自动建模
易于操作,模型持续优化——该软件工具可指导用户完成模型开发和优化过程