云端和邊緣端需互相補充,協(xié)同訓練推理,構建云端和邊緣端連續(xù)的學習循環(huán),保證業(yè)務長期可靠穩(wěn)定地運行。云邊協(xié)同訓練推理,解決工業(yè)邊端算力不足;數(shù)據無需上傳云端,解決工業(yè)客戶數(shù)據隱私問題;AI協(xié)同服務按需定制,解決工業(yè)智能化場景碎片化問題。
邊云協(xié)同平臺、邊緣智能、協(xié)同推理、模型優(yōu)化
中國電信:丁鵬,dingpeng6@chinatelecom.cn
瑞斯康達:提供智能工廠典型應用場景環(huán)境,參與現(xiàn)場測試床驗證
基于柔性制造PCB焊點質量檢測驗證:已有大量PCB焊點質量檢測數(shù)據集,在此基礎上建立PCB焊點質量檢測模型,通過測試床進行模型的持續(xù)優(yōu)化,為柔性制造PCB焊點質量檢測提供基于5G MEC+邊緣智能的AI跨邊云協(xié)同訓練推理測試床。
定制化AI協(xié)同服務驗證:基于智能邊緣設備,實現(xiàn)基于5G MEC+邊緣智能的AI邊云協(xié)同訓練和協(xié)同推理,就近為端側提供算力支持和模型持續(xù)優(yōu)化支持,保護數(shù)據隱私,為用戶持續(xù)提升智能化品質。
保障企業(yè)保密數(shù)據本地化:保障企業(yè)數(shù)據不出邊緣節(jié)點即可參與模型訓練。
讓服務可定制,降低資源消耗:提供適合業(yè)務需求的智能邊緣設備AI協(xié)同服務,即裝即用,降低資源消耗。
提升模型效果:云邊協(xié)同,循環(huán)促進的訓練推理模式,保證模型的長期可靠運行。
測試床在企業(yè)本地部署通用服務器或MEC,也可使用運營商云主機或公用MEC平臺,作為測試床云端,使用定制化的智能邊緣設備作為邊緣端,兼容現(xiàn)有的AI框架,提供跨云邊協(xié)同訓練推理框架,并使用增量學習、聯(lián)邦學習和遷移學習等能力提供可優(yōu)化的AI模型服務。使用模型壓縮等技術實現(xiàn)云邊協(xié)同推理,保證業(yè)務的穩(wěn)定可靠運行。
測試床適用于支撐智能工廠中的工業(yè)智能應用場景,例如焊點檢測、產品質量檢測、工人非法越界檢測、安全帽檢測、工服檢測、人臉識別等。
1. 在體系架構的位置
本測試床在工業(yè)互聯(lián)網功能視圖平臺體系框架中的位置如下圖所示,通過邊緣層的數(shù)據接入、數(shù)據預處理和智能分析實現(xiàn)邊緣側的數(shù)據處理和分析,通過PaaS層和應用層的資源部署與管理、數(shù)據管理與服務、模型管理與服務和工業(yè)創(chuàng)新應用實現(xiàn)模型優(yōu)化和更新、協(xié)同推理。過程實現(xiàn)數(shù)據的優(yōu)化閉環(huán),形成云邊模型連續(xù)的學習循環(huán)。
2. 在實施框架的位置
工業(yè)互聯(lián)網平臺實施框架中,本測試床內容包含邊緣層的數(shù)據預處理和邊緣智能應用部分,企業(yè)層在企業(yè)MEC上部署平臺的云端包括數(shù)據模型、工業(yè)模型的管理等。在產業(yè)層提供多企業(yè)MEC協(xié)同接口,支撐開展資源配置優(yōu)化和產業(yè)生態(tài)的構建。實施架構如下圖所示:
3. 本測試床架構
本測試床主要提供低成本、高性能、易使用、隱私保護的邊緣智能,滿足企業(yè)數(shù)據本地化(數(shù)據不出廠區(qū))和即裝即用的定制化服務。測試床架構如下圖所示:
基于5G MEC+邊緣智能的AI跨邊云協(xié)同訓練推理測試床功能架構如下圖所示:
1. 自動化異構邊緣適配
定制化邊緣AI服務與邊緣智能設備、邊緣智能硬件廠商進行適配,實現(xiàn)自動化的邊緣資源適配。
2. 實現(xiàn)邊緣AI基礎框架
實現(xiàn)邊緣AI 管理,數(shù)據集管理,數(shù)據預處理,跨云邊數(shù)據同步,配置管理等。
3. 云邊協(xié)同訓練和協(xié)同推理
高效利用云邊各類資源。利用模型壓縮、困難樣本發(fā)現(xiàn)等技術實現(xiàn)協(xié)同推理;利用遷移學習、增量學習、聯(lián)邦學習技術實現(xiàn)邊緣AI可長期可靠穩(wěn)定的使用 。實現(xiàn)高性能、低成本、隱私安全的邊緣AI系統(tǒng)。基于5G MEC+邊緣智能的AI跨邊云協(xié)同訓練推理測試床技術實施方案如下圖所示:
? 模型優(yōu)化技術:解決邊緣AI模型的訓練優(yōu)化問題,保證模型長期穩(wěn)定運行。
? 邊云協(xié)同訓練、協(xié)同推理技術:基于現(xiàn)有的邊云協(xié)同平臺打造邊云協(xié)同訓練和協(xié)同推理框架,保證業(yè)務對時間延時和精度的需求。
? 輕量化模型分割技術:通過DNN模型壓縮技術和模型拆分技術,實現(xiàn)輕量化的邊緣模型,適用邊緣算力較低的設備
4.5. 應用場景
測試床應用:
基于5G+AI的零部件質量檢測,可在復雜紋理圖像及背景干擾下,對零部件外觀進行精準分類,大幅減少漏檢誤檢,同時對檢測結果數(shù)據實時回傳訓練,形成模型高效迭代閉環(huán),提升檢測準確率,解決傳統(tǒng)管理痛點,助理提升企業(yè)效能。
本測試床將5G MEC、AI工業(yè)視覺能力與產線結合,構建了一套基于5G MEC云邊協(xié)同+工業(yè)視覺檢測的柔性制造SMT產線。PCB板進入產線后,分別通過錫膏印刷、SMT貼片焊接、波峰回流焊接等流程后,最終與其他零部件一起通過裝配、成品測試以及包裝行程成品。流程包括SPI視覺檢測、爐前/爐后AOI 視覺檢測、產品裝配工序視覺檢測、產品質量視覺檢測和包裝貼標視覺檢測。
1. 協(xié)同推理
在焊點質量檢測場景中如何使用跨云邊協(xié)同推理服務。由于邊緣資源有限,焊點質量檢測性能較低。但是,協(xié)同推理服務可以提高整體性能,將通過困難樣本挖掘識算法將困難樣板上傳到云并進行推理。
協(xié)同推理對延時要求較高,5G網絡與MEC,實現(xiàn)推理結果的超高速率和超低時延。
2. 聯(lián)邦學習
充分利用5G海量機器連接特性滿足大量的5G工業(yè)網關和工業(yè)攝像頭的接入,為聯(lián)邦學習提供可靠的網絡基礎。
隱私保護、數(shù)據安全:不同工廠的焊接技術是屬于加密技術,焊點成像采集的圖像不能用于共享訓練數(shù)據,通過聯(lián)邦學習技術,無需分享本廠的成像數(shù)據,保證數(shù)據的隱私性和安全性。
解決數(shù)據孤島問題:單一工廠的數(shù)據數(shù)量有限,焊點技術單一,不能包括多種質量問題的類型,通過云上的參數(shù)服務模塊對全局模型進行優(yōu)化合并,充分利用各節(jié)點資源,提高模型的精度。
云邊聯(lián)邦學習通信開銷問題:真邊緣端和云端之間經由網絡連接和傳輸數(shù)據(模型、參數(shù))所造成的。
上行通信成本:邊緣端將本地計算得到的模型更新傳遞到云端。
下行通信成本:云端到邊緣端傳遞全局模型。
客戶端和中央服務器之間要進行多次通信。在工業(yè)的邊緣計算場景中,通過有大量設備與云端進行通信。對帶寬有較高的要求,要求大量節(jié)點能同時將其消息上傳到云端。帶寬問題會導致訓練速度大大減慢,模型的收斂速度較慢。
5G網絡中通信速率和帶寬得到了極大的提升。依托5G網絡,解決聯(lián)邦學習中的通信開銷問題,推動聯(lián)邦學習在工業(yè)領域的應用,是本測試床需要解決的問題之一。
3. 遷移增量學習
條件允許的情況下,使用全部數(shù)據重新訓練模型的效果是最佳的。真實的生產環(huán)境是開放并且復雜多變的,在訓練模型之前無法獲得所有可能情形的有效信息作為訓練數(shù)據。隨著終端運行不斷生產數(shù)據,新的類別不斷產生,已有類別的新實例不斷出現(xiàn),智能邊緣能夠在獲得新數(shù)據時,重新訓練數(shù)據,保證不斷優(yōu)化學習的能力。
利用5G MEC的計算、存儲能力,實現(xiàn)模型的自優(yōu)化、自更新。
技術創(chuàng)新:平臺兼容現(xiàn)有的AI框架,通過遷移學習、聯(lián)邦學習、增量學習和模型壓縮等技術實現(xiàn)協(xié)同訓練和協(xié)同推理,解決邊緣數(shù)據樣本少,冷啟動、邊緣數(shù)據隱私問題等,讓模型越用越精確。
模式創(chuàng)新:5G MEC下沉,降低業(yè)務時延;平臺在產業(yè)層實現(xiàn)多企業(yè)MEC協(xié)同接口,匯聚產業(yè)資源,優(yōu)化資源配置,有助于構建產業(yè)生態(tài)。
應用創(chuàng)新:結合不同層級不同環(huán)境的計算設備承擔不同算力需求的任務,結合企業(yè)需求,提供定制化的AI協(xié)同服務。
本測試床實施分為三個階段:
? 第1階段:2021.02-2021.03
開展測試床場景梳理、可行性評估、測試床架構設計等工作。
? 第2階段:2021.04-2021.07
開展測試床實施方案設計、設備選型與環(huán)境建設、測試床平臺功能測試等工作。
? 第3階段:2021.08-2022.01
開展測試床部署、典型應用場景驗證、輸出針對焊點檢測常間的實施方案等工作。
本測試床參與方分工協(xié)作,共同支撐與保障本測試床的實施工作:
中國電信股份有限公司研究院負責基于5G MEC+邊緣智能的AI跨邊云協(xié)同訓練推理測試床部署與驗證。
瑞斯康達科技發(fā)展股份有限公司負責提供智能工廠典型應用場景環(huán)境,參與現(xiàn)場測試床驗證等工作。
本測試床實施各項關鍵技術均為自主研發(fā),具有良好的自主可控性。
1. 適配異構邊緣AI設備適配
實施前:目前的模型在某些硬件平臺上無法直接運行,與硬件環(huán)境有強依賴。
實施后:與硬件設備廠商開展合作,適配設備環(huán)境,實現(xiàn)自動化資源適配。
2. 邊緣AI協(xié)同基礎框架實現(xiàn)
實施前:目前平臺的云邊協(xié)同平臺未支持各種AI框架、未實現(xiàn)對數(shù)據集和模型的管理。
實施后:云邊支持TensorFlow、pytorch等AI端框架、數(shù)據集管理、模型管理、跨云邊數(shù)據同步等。
3. 跨邊云協(xié)同訓練推理構建
實施前:云端訓練,邊緣推理,邊端不支持大模型的運行。
實施后:合理利用云邊資源,根據負載,對應用類型實時調度,實現(xiàn)高性能、低成本、數(shù)據安全。
4. 增量學習、聯(lián)邦學習和遷移學習驗證
實施前:缺少跨邊云AI協(xié)同優(yōu)化框架實施情況
實施后:支持多種模型優(yōu)化方案,保證AI模型長期穩(wěn)定可靠運行。
首個具有增量學習、聯(lián)邦學習、遷移學習框架、協(xié)同訓練推理的平臺:解決邊緣智能跨云邊協(xié)同訓練推理落地推廣中遇到的AI模型訓練等棘手問題。
讓工廠用得方便的邊緣智能:提供定制化的服務,實現(xiàn)企業(yè)的智能化生產與監(jiān)控,持續(xù)優(yōu)化提升工廠的智能化水平,節(jié)約資源,提升效率。
1. 形成可推廣解決方案
可基于5G定制網,以邊緣智能為核心,形成面向智慧工廠的AI定制協(xié)同服務解決方案:
l 邊緣智能AI跨邊云協(xié)同服務框架
l AI跨邊云協(xié)同服務產品:工業(yè)智能邊緣設備+定制化AI跨邊云協(xié)同服務
l 面向智慧工廠集成產品:端+網+云+AI協(xié)同管理
2. 可推廣垂直行業(yè)
以瑞斯康達測試床為基礎,向柔性制造行業(yè)推廣,如網關設備制造、MEC設備制造等。
以焊點檢測場景實施為基礎,向其他工業(yè)智能場景推廣,如產品質量檢測、防靜電服檢測、人臉識別、安全模識別檢測等。
3. 推廣路徑
? 技術推廣:牽頭制定行業(yè)標準、測試床推廣、典型案例推廣
? 產品推廣:不斷豐富邊云協(xié)同訓練推理框架在智慧工廠場景的實施部署
? 服務推廣:打造面向智慧工廠邊云協(xié)同平臺培訓/展示服務,帶動更多行業(yè)和企業(yè)部署
本測試床部署在工廠車間內,在此進行測試床成果的測試與驗證。具體時間計劃見測試床實施規(guī)劃時間表。
1. 邊緣智能服務部署驗證內容
? 適合工廠特定場景的自研輕量級邊緣模型和云模型
? 實現(xiàn)模型管理和數(shù)據集管理
? 具有與邊緣模型相匹配算力的智能邊緣設備
2. 跨云邊協(xié)同訓練推理平臺驗證內容
? 兼容現(xiàn)有的AI框架
? 具備聯(lián)邦學習、遷移學習、增量學習模型的協(xié)同訓練框架
? 具備云邊協(xié)同推理框架
? 具備可定制的邊緣智能AI跨邊云協(xié)同服務,適用于企業(yè)/園區(qū)等特定場景的需求
? 自研跨邊云協(xié)同訓練推理平臺,普遍適用于工廠智能生產,智能監(jiān)控等場景
? 典型工廠焊點檢測、安全帽識別和人臉識別等場景的跨云邊協(xié)同訓練和協(xié)同推理的智能AI邊緣部署方案
本測試具有較好的復制推廣性。一方面以瑞斯康達測試床為基礎,向柔性制造行業(yè)復制推廣,如網關制造、MEC設備制造等;另一方面,以焊點檢測場景實施為基礎,向其他場景推廣,如產品質量檢測、防靜電服檢測、人臉識別、安全帽識別等。
本測試床可開放給更多通訊提供商、運營商和制造企業(yè)共同參與測試床驗證與推廣工作。
歡迎所有的AII成員企業(yè)參與和使用本測試床項目。然而,在初始階段,由于試驗站點的訪問權限有限,本測試床將僅限于現(xiàn)有的合作伙伴。之后,本測試床將逐步開放給更多AII成員企業(yè)使用。
中國電信與瑞斯康達科技發(fā)展股份有限公司共同對測試床的建設、運營以及使用擁有產權。
測試床的部署和運營將在瑞斯康達工廠進行。現(xiàn)階段訪問控制和管理權限僅限于測試床參與企業(yè)。
測試床的資金將來自于測試床參與企業(yè)。
第1階段(2021.01-2021.03):完成測試床場景梳理、可行性評估、測試床架構設計等工作。
第2階段(2021.01-2021.07):完成測試床實施方案設計、設備選型與環(huán)境建設、測試床平臺功能測試等工作。
第3階段(2021.08-2022.01):完成測試床部署、測試床典型應用場景驗證、輸出針對焊點檢測場景的實施方案等工作。
測試床當前進展:
1. 測試床輸出成果:
? 具備可定制的邊緣AI智能跨邊云協(xié)同服務,適用于企業(yè)/園區(qū)等特定場景的需求
? 自研跨邊云協(xié)同訓練和協(xié)同推理平臺,普遍適用于工廠智能生產,智能監(jiān)控等場景
? 典型工廠焊點檢測、安全帽識別和人臉口罩識別等場景的跨云邊協(xié)同訓練推理的智能邊緣AI部署方案
2. 測試床地點:瑞斯康達北京工廠
3. 參與者分工:
中國電信:基于5G MEC+邊緣智能的AI跨邊云協(xié)同訓練推理測試床部署與驗證
瑞斯康達:提供智能工廠典型應用場景環(huán)境,參與現(xiàn)場測試床驗證
4. 部署方案:
5. 輸出PCB焊點檢測數(shù)據集
? 輸出標記不同產線的PCB焊點檢測數(shù)據集一套,并開源發(fā)布到華為雅努斯,鏈接為https://github.com/kubeedge/ianvs
? 該開源數(shù)據集用于5G環(huán)境下,協(xié)同訓練和推理平臺的測試驗證。
? 本次pcb檢測共使用原始圖片集共有484張,其中80張作為測試集,訓練集和測試集的比例為5比1,在使用水平翻轉,豎直翻轉,90度旋轉,180度旋轉,270度旋轉以及縮放后,圖片總集合為2904張。



6. PCB焊點檢測數(shù)據集下協(xié)同訓練模型1套
? 輸出針對PCB焊點檢測數(shù)據集下, 增量學習模型代碼。
? 包括協(xié)同訓練的難例檢測算法1套。
? 測試結果:
1)單機訓練時間:
ü 硬件配置:CPU類型2路6230N(Intel Xeon Gold 6230N 20C 125W 2.3GHz處理器)4x10GEGPU:Tesla V100 32G
ü 2904張圖片訓練時間:1609分
2)5G工廠生產環(huán)境4個邊緣節(jié)點云邊協(xié)同增量訓練測試結果:
增量訓練次數(shù) | 圖片數(shù)量 | 訓練耗時 |
1 | 126 | 47min |
2 | 178 | 64min |
3 | 123 | 47min |
4 | 199 | 59min |
3)單機測試推理結果:
坡度 | 翹腳 | |
測試目標個數(shù) | 708 | 153 |
正確識別目標個數(shù) | 623 | 133 |
準確率 | 88.6% | 87.3% |
平均準確率 | 87.95% | |
4)5G工廠生產環(huán)境測試結果:
坡度 | 翹腳 | |
測試目標個數(shù) | 396 | 284 |
正確識別目標個數(shù) | 342 | 240 |
準確率 | 86.5% | 84.8% |
平均準確率 | 85.6% | |