http://m.casecurityhq.com 2022-10-14 13:44 來源:羅克韋爾
大數(shù)據(jù)時代,數(shù)據(jù)已經(jīng)滲透到各個行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。但對于企業(yè)而言,只有數(shù)據(jù)是遠(yuǎn)遠(yuǎn)不夠的,企業(yè)還需要學(xué)會從海量的數(shù)據(jù)(Data)中提取有用的信息(Information),隨后轉(zhuǎn)變?yōu)槟転榧河玫闹R(Knowledge),最終做出智慧(Wisdom)的決策。
數(shù)據(jù)分析的流程
面對旺盛且復(fù)雜的數(shù)據(jù)分析需求,企業(yè)可以借助 PPDAC 閉環(huán)體系對數(shù)據(jù)進行高效的分析。
這些結(jié)論能為企業(yè)提供有效解決痛點問題的解決方案。
在數(shù)據(jù)分析過程中,根據(jù)程度的不同,可分為四個分析階段:描述性分析、診斷性分析、預(yù)測性分析和規(guī)范性分析。這四個階段的難度與分析所獲得的價值都是逐次遞增的,并且每個階段采用的技術(shù)手段也不盡相同。本文重點介紹描述性分析與預(yù)測性分析的過程。
獲取數(shù)據(jù)
首先,企業(yè)要明確生產(chǎn)過程中的痛點問題,制定相應(yīng)的計劃,而后再進行相關(guān)數(shù)據(jù)的采集工作。數(shù)據(jù)存在于工業(yè)企業(yè)的各個層級之中,擁有各種表現(xiàn)形式。例如,通過 CIP、Profibus 等各種通訊協(xié)議在總線中流動的實時數(shù)據(jù);存儲在文件、數(shù)據(jù)庫、歷史數(shù)據(jù)庫等軟件中的歷史數(shù)據(jù);通過 MQTT, HTTP 等協(xié)議傳輸?shù)奈锫?lián)網(wǎng)信息;還有通過 REST API 從云端傳來的信息等。
不同層級的信息特點各不相同:越往底層,通訊頻率越快,節(jié)點越多,對時效性的要求越高;越往高層,通訊信息量越大,對時效性要求則相對低一些。
為了從大范圍的場景獲取所有的數(shù)據(jù),數(shù)據(jù)獲取軟件需要具備以下強大功能:
描述性分析
在獲取足夠的數(shù)據(jù)之后,企業(yè)就可進入不同層級的數(shù)據(jù)分析階段,其中以描述性分析為基礎(chǔ)。描述性分析旨在了解數(shù)據(jù)“已經(jīng)發(fā)生了什么”,主要是通過計算數(shù)據(jù)的基本統(tǒng)計特征值,例如,最大值、最小值、方差、標(biāo)準(zhǔn)差、中位數(shù)、頻數(shù)等,來了解已有數(shù)據(jù)的集中趨勢、分布情況及離散程度等信息。
此外,描述性分析作為企業(yè)最常用的數(shù)據(jù)分析手段,能夠快速指出要查找的內(nèi)容,預(yù)先定義計算模式,而后通過現(xiàn)在或者歷史數(shù)據(jù)進行計算,最后可用報表或儀表盤視圖將分析結(jié)果呈現(xiàn)出來,大大節(jié)省數(shù)據(jù)分析時間。下方展示的設(shè)備綜合效率(OEE)就是如此。
預(yù)測性分析
正如前文提到,描述性分析主要對數(shù)據(jù)的過去進行總結(jié),而預(yù)測性分析則需了解“將來會發(fā)生什么”。它將歷史數(shù)據(jù)與統(tǒng)計建模、數(shù)據(jù)挖掘技術(shù)和機器學(xué)習(xí)相結(jié)合,找出數(shù)據(jù)之間存在的關(guān)系,并基于數(shù)據(jù)對未來的設(shè)備情況通過建立模型進行預(yù)測。這樣能夠幫助管理人員預(yù)測將來可能會發(fā)生的情況,進而提前計劃及決策,而非被動地只能針對已經(jīng)發(fā)生的事件作出回應(yīng)。
在預(yù)測性分析中,企業(yè)需要運用機器學(xué)習(xí)算法進行建模預(yù)測,其中算法的種類多樣,常用的基本算法包括決策樹、線性回歸、K 均值、樸素貝葉斯等,此外還有諸如神經(jīng)網(wǎng)絡(luò)之類的高級算法。想要徹底地理解這些算法并不容易,需要豐富的數(shù)學(xué)、概率論等交叉學(xué)科的知識。好在目前研究成熟,我們只需模塊化地使用即可。
以監(jiān)督學(xué)習(xí)為例,利用機器學(xué)習(xí)進行預(yù)測性分析時,其使用流程與工業(yè)傳統(tǒng)的PID算法流程大致相同,具體步驟如下:
第一步,選擇數(shù)據(jù)
從歷史數(shù)據(jù)中找出相關(guān)數(shù)據(jù),并且標(biāo)識出其中的特征值與輸出
第二步,選擇模型
依據(jù)待處理的問題選擇合適的回歸或分類算法
第三步,調(diào)試優(yōu)化
使用80%的數(shù)據(jù)對模型進行訓(xùn)練,隨后利用剩下20%的數(shù)據(jù)對模型進行測試,觀察預(yù)測的準(zhǔn)確率是否達到預(yù)期。如果準(zhǔn)確率不夠,則調(diào)整相關(guān)參數(shù),再次進行測試
第四步,部署
將考核通過的模型部署到系統(tǒng)中,接收新的數(shù)據(jù),輸出預(yù)測結(jié)果
數(shù)據(jù)可視化
在數(shù)據(jù)分析后,數(shù)據(jù)可視化成為企業(yè)快速解決痛點問題的關(guān)鍵所在。用于數(shù)據(jù)可視化的圖形多種多樣(如下圖所示),只要選擇合適的圖形來展示合適的數(shù)據(jù)就可以起到事半功倍的效果。例如:用餅狀圖展示不同數(shù)據(jù)的占比情況;用散點圖展示數(shù)據(jù)的分布情況及相關(guān)性(Correlation),再用曲線擬合,做一些簡單的預(yù)測;用表格展示匯總信息;用氣泡圖展示三個變量之間的關(guān)系等,在工業(yè)行業(yè)中,由于諸多數(shù)據(jù)是時間序列數(shù)據(jù)(Time series data),因此選用折線圖(Line chart)進行展示,便能夠高效地了解數(shù)據(jù)的趨勢(Trend)??偠灾瑢τ诓煌臄?shù)據(jù),選擇最佳的展現(xiàn)方式能夠讓數(shù)據(jù)可視化發(fā)揮出最優(yōu)效果。
但是,僅僅從一個視角對數(shù)據(jù)進行觀察是遠(yuǎn)遠(yuǎn)不夠的,為了能夠更加全面地了解數(shù)據(jù)情況,我們需要將多個視角產(chǎn)生的圖表整合在同一個數(shù)據(jù)展板上。同時,對數(shù)據(jù)進行不同層次的展示也是必不可少的,數(shù)據(jù)鉆取就能很好地完成這項任務(wù),它能夠針對不同層級、結(jié)構(gòu)或條件對數(shù)據(jù)進行細(xì)分呈現(xiàn),讓用戶得以縮小數(shù)據(jù)范圍,逐步下鉆并聚焦到小點上,為用戶節(jié)省更多時間與精力,同時優(yōu)化數(shù)據(jù)可視性的效果。
羅克韋爾自動化 FactoryTalk® Analytics™
羅克韋爾自動化 FactoryTalk® Analytics™ 為工業(yè)制造從業(yè)人員提供了從描述性分析到規(guī)范性分析的完整解決方案,能夠改善整體設(shè)備效率 (OEE) 、減少停機時間,以及改善質(zhì)量或流程。
FactoryTalk® Analytics™ 具體功能如下:
可以使用 FactoryTalk® Edge Gateway 從工業(yè)企業(yè)的各個環(huán)節(jié)將數(shù)據(jù)引入
可以借助 FactoryTalk Analytics® DataView 和 FactoryTalk® Metrics 對數(shù)據(jù)進行描述性分析、整體設(shè)備效率 (OEE) 及可視化展示
可以依靠 FactoryTalk® Analytics LogixAI、FactoryTalk® Analytics Edge ML 、Pavilion8® 在企業(yè)的不同層面對數(shù)據(jù)進行預(yù)測性分析
FactoryTalk® Analytics™ 現(xiàn)可為流程工程師、數(shù)據(jù)科學(xué)家等提供全面且簡潔的數(shù)據(jù)分析技術(shù),使數(shù)據(jù)分析準(zhǔn)備工作量減少70% 。FactoryTalk® Analytics™ 還可與 InnovationSuite 增強現(xiàn)實和制造執(zhí)行系統(tǒng) (MES) 解決方案無縫集成,將切實可行的見解帶至車間,優(yōu)化企業(yè)級供應(yīng)鏈運作。
小羅有話說
大數(shù)據(jù)之于企業(yè)而言,既是機遇,也是挑戰(zhàn)。羅克韋爾自動化憑借先進的自動化、數(shù)字化和智能化技術(shù),為客戶提供以數(shù)據(jù)分析為主線的全方位數(shù)字解決方案,幫助企業(yè)解決數(shù)據(jù)分析、可視化等難題,讓數(shù)據(jù)會“說話”,進一步為企業(yè)節(jié)省決策時間,贏得獨特競爭優(yōu)勢,逐步實現(xiàn)從節(jié)流、開源到顛覆的價值突破。