數(shù)字報(bào)
      小程序
      公眾號(hào)
      《工業(yè)高質(zhì)量數(shù)據(jù)集研究報(bào)告》正式發(fā)布
      2025-09-09 15:41:08
      來(lái)源:新華網(wǎng) 

      9月6日,中國(guó)工業(yè)互聯(lián)網(wǎng)研究院院長(zhǎng)魯春叢在2025全球工業(yè)互聯(lián)網(wǎng)大會(huì)開(kāi)幕式上發(fā)布《工業(yè)高質(zhì)量數(shù)據(jù)集研究報(bào)告》,對(duì)工業(yè)高質(zhì)量數(shù)據(jù)集的理論體系、建設(shè)路徑、評(píng)估體系、流通應(yīng)用進(jìn)行總結(jié)歸納。

      數(shù)據(jù)作為新型生產(chǎn)要素,是實(shí)體經(jīng)濟(jì)數(shù)智化進(jìn)程中的基礎(chǔ)資源,是培育壯大智能產(chǎn)業(yè)的關(guān)鍵驅(qū)動(dòng)力量。我國(guó)是工業(yè)大國(guó),門(mén)類(lèi)齊全、體系完整、場(chǎng)景豐富,近年來(lái),企業(yè)數(shù)字化轉(zhuǎn)型進(jìn)程加速推進(jìn),為工業(yè)數(shù)據(jù)的匯聚與應(yīng)用奠定了良好基礎(chǔ)。工業(yè)高質(zhì)量數(shù)據(jù)集是從研發(fā)、生產(chǎn)、供應(yīng)、銷(xiāo)售、服務(wù)等全生命周期各環(huán)節(jié)產(chǎn)生和采集,經(jīng)過(guò)清洗、標(biāo)注等專(zhuān)業(yè)化處理,用于分析、建模、訓(xùn)練的數(shù)據(jù)集合。加快建設(shè)工業(yè)高質(zhì)量數(shù)據(jù)集,是將我國(guó)龐大的數(shù)據(jù)資源優(yōu)勢(shì)和完備的產(chǎn)業(yè)體系優(yōu)勢(shì),轉(zhuǎn)化為賦能新型工業(yè)化核心競(jìng)爭(zhēng)力的關(guān)鍵舉措。

      當(dāng)前,人工智能對(duì)產(chǎn)業(yè)變革的賦能正從試驗(yàn)探索邁向?qū)嶋H應(yīng)用。以工業(yè)智能體為例,部分頭部工業(yè)企業(yè)已經(jīng)在產(chǎn)線(xiàn)質(zhì)檢、車(chē)間注塑、工廠(chǎng)運(yùn)營(yíng)等環(huán)節(jié)廣泛部署智能體應(yīng)用,極大提升了生產(chǎn)制造效率,而高質(zhì)量數(shù)據(jù)集正是實(shí)現(xiàn)這一切的重要前提。可以說(shuō),“沒(méi)有工業(yè)數(shù)據(jù),就沒(méi)有工業(yè)智能;沒(méi)有工業(yè)高質(zhì)量數(shù)據(jù)集,就沒(méi)有高水平工業(yè)智能”。許多智能化改造項(xiàng)目中,數(shù)據(jù)工程的投入占比高達(dá)50%~60%,這說(shuō)明數(shù)據(jù)要素報(bào)酬遞增、低成本復(fù)用的特點(diǎn)已成為業(yè)界的廣泛共識(shí)。我們認(rèn)為,應(yīng)按照“分類(lèi)分級(jí)、標(biāo)準(zhǔn)引導(dǎo)、集中管理、分布部署”的思路,加快建設(shè)工業(yè)高質(zhì)量數(shù)據(jù)集,為人工智能賦能新型工業(yè)化夯實(shí)數(shù)據(jù)根基。

      一、工業(yè)高質(zhì)量數(shù)據(jù)集的理論體系

      建設(shè)工業(yè)高質(zhì)量數(shù)據(jù)集,需要一套科學(xué)、系統(tǒng)的理論體系作為指引。核心在于把握工業(yè)數(shù)據(jù)集的多元、分級(jí)、融合三大特征,推動(dòng)工業(yè)數(shù)據(jù)在“更廣范圍”“更深程度”和“更高水平”上實(shí)現(xiàn)價(jià)值創(chuàng)造。

      (一)把握工業(yè)數(shù)據(jù)集的多元特征。工業(yè)數(shù)據(jù)的復(fù)雜性與多元化,集中體現(xiàn)在工業(yè)行業(yè)繁多、業(yè)務(wù)環(huán)節(jié)復(fù)雜、數(shù)據(jù)模態(tài)多樣等方面,要求數(shù)據(jù)集建設(shè)要在“更廣范圍”上拓展邊界。工業(yè)門(mén)類(lèi)多元,我國(guó)工業(yè)門(mén)類(lèi)齊全,涵蓋41個(gè)工業(yè)大類(lèi)、207個(gè)中類(lèi)、666個(gè)小類(lèi),不同行業(yè)的數(shù)據(jù)蘊(yùn)含著獨(dú)特的工藝機(jī)理與知識(shí)。數(shù)據(jù)集建設(shè)在深耕本行業(yè)專(zhuān)業(yè)性的同時(shí),也為跨領(lǐng)域知識(shí)遷移與價(jià)值創(chuàng)造提供可能。業(yè)務(wù)環(huán)節(jié)多元,工業(yè)數(shù)據(jù)貫穿研發(fā)設(shè)計(jì)、生產(chǎn)制造、運(yùn)維服務(wù)等產(chǎn)品全生命周期,并縱向延伸至產(chǎn)業(yè)鏈上下游。數(shù)據(jù)集建設(shè)需要打通過(guò)去散落在不同業(yè)務(wù)系統(tǒng)的“數(shù)據(jù)孤島”,實(shí)現(xiàn)業(yè)務(wù)協(xié)同。數(shù)據(jù)模態(tài)多元,工業(yè)現(xiàn)場(chǎng)存在大量結(jié)構(gòu)化與非結(jié)構(gòu)化、時(shí)序與非時(shí)序等形態(tài)屬性交織的原始數(shù)據(jù)。數(shù)據(jù)集建設(shè)要具備強(qiáng)大的異構(gòu)數(shù)據(jù)融合和處理能力,形成貼合場(chǎng)景的高價(jià)值數(shù)據(jù),構(gòu)建完整的數(shù)字畫(huà)像,實(shí)現(xiàn)深度賦能。

      (二)把握工業(yè)數(shù)據(jù)集的分級(jí)特征。工業(yè)場(chǎng)景存在從“設(shè)備、產(chǎn)線(xiàn)、工廠(chǎng)、企業(yè)”到“產(chǎn)業(yè)生態(tài)”的多重層級(jí)。不同層級(jí)的數(shù)據(jù),其融合程度與決策價(jià)值各不相同,尤其當(dāng)數(shù)據(jù)應(yīng)用需要打通產(chǎn)業(yè)鏈上下游、實(shí)現(xiàn)跨主體協(xié)同時(shí),會(huì)面臨數(shù)據(jù)共享意愿低、權(quán)屬不清、信任缺失等現(xiàn)實(shí)挑戰(zhàn)。這要求數(shù)據(jù)集建設(shè)需遵循分級(jí)分類(lèi)的原則,在“更深程度”上逐級(jí)深化。基礎(chǔ)層(設(shè)備與產(chǎn)線(xiàn)級(jí)),從業(yè)務(wù)執(zhí)行的最小單元出發(fā),匯聚設(shè)備運(yùn)行、工藝參數(shù)等高質(zhì)量數(shù)據(jù),實(shí)現(xiàn)故障診斷、能耗優(yōu)化等局部效率提升,為數(shù)字化轉(zhuǎn)型奠定堅(jiān)實(shí)的數(shù)據(jù)基石。核心層(工廠(chǎng)與企業(yè)級(jí)),聚合生產(chǎn)計(jì)劃、成本投入、經(jīng)營(yíng)管理等數(shù)據(jù),驅(qū)動(dòng)生產(chǎn)調(diào)度、資源配置等核心業(yè)務(wù)流程的系統(tǒng)性?xún)?yōu)化,提升企業(yè)整體運(yùn)營(yíng)水平。生態(tài)層(產(chǎn)業(yè)生態(tài)級(jí)),通過(guò)聚合跨主體、跨領(lǐng)域的數(shù)據(jù),賦能供應(yīng)鏈柔性與韌性、產(chǎn)品全生命周期綠色低碳、產(chǎn)業(yè)風(fēng)險(xiǎn)監(jiān)測(cè)預(yù)警等應(yīng)用,創(chuàng)造生態(tài)協(xié)同的增量?jī)r(jià)值。這種分級(jí)推進(jìn)的數(shù)據(jù)集開(kāi)發(fā)與利用路徑,為企業(yè)在不同發(fā)展階段深化數(shù)據(jù)應(yīng)用、獲取數(shù)據(jù)價(jià)值提供了清晰的指引。

      (三)把握工業(yè)數(shù)據(jù)集的融合特征。工業(yè)數(shù)據(jù)必須與工業(yè)機(jī)理、專(zhuān)家知識(shí)、先進(jìn)算法深度融合,才能發(fā)揮應(yīng)用價(jià)值。這決定了數(shù)據(jù)集建設(shè)要從單純的數(shù)據(jù)積累轉(zhuǎn)向“知識(shí)資產(chǎn)”的沉淀,在“更高水平”上融合應(yīng)用。面向“工業(yè)生產(chǎn)控制”,實(shí)現(xiàn)實(shí)時(shí)的工藝優(yōu)化、閉環(huán)控制與異常處置,其所需的數(shù)據(jù)集具有高頻、實(shí)時(shí)、參數(shù)聚焦的特點(diǎn)。這種融合將數(shù)據(jù)與控制算法結(jié)合,使物理設(shè)備和生產(chǎn)過(guò)程變得更加智能、更具智慧,提升整體運(yùn)行效率。面向“工業(yè)知識(shí)傳承”,將專(zhuān)家的隱性知識(shí)進(jìn)行顯性化、模型化與軟件化復(fù)用,加速信息技術(shù)(IT)、通信技術(shù)(CT)、控制技術(shù)(OT)和數(shù)字技術(shù)(DT)的“4T融合”。工業(yè)知識(shí)所需的數(shù)據(jù)集呈現(xiàn)出多模態(tài)、大跨度、知識(shí)密集的特點(diǎn),不僅包含運(yùn)行數(shù)據(jù),還需融合設(shè)計(jì)圖紙、工藝文件、操作規(guī)程、維修記錄等非結(jié)構(gòu)文本與圖像數(shù)據(jù)。這種融合將數(shù)據(jù)與行業(yè)知識(shí)結(jié)合,使組織和個(gè)人的經(jīng)驗(yàn)得以傳承和放大。

      二、工業(yè)高質(zhì)量數(shù)據(jù)集的建設(shè)路徑

      中國(guó)工業(yè)互聯(lián)網(wǎng)研究院聯(lián)合行業(yè)龍頭與“專(zhuān)精特新”企業(yè),在實(shí)踐中探索出一套從需求規(guī)劃到應(yīng)用驗(yàn)證全鏈條的工業(yè)高質(zhì)量數(shù)據(jù)集建設(shè)方法論,通過(guò)系統(tǒng)化工程,將分散無(wú)序的原始數(shù)據(jù)重塑為驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)的“戰(zhàn)略資產(chǎn)”。

      一是需求規(guī)劃。需求規(guī)劃是數(shù)據(jù)集建設(shè)的首要環(huán)節(jié),核心任務(wù)是從復(fù)雜的業(yè)務(wù)問(wèn)題中,精準(zhǔn)識(shí)別并錨定能產(chǎn)生最大回報(bào)的核心價(jià)值場(chǎng)景,明確所需的數(shù)據(jù)類(lèi)型、來(lái)源和規(guī)模,以制定出具備前瞻性和可執(zhí)行性的技術(shù)方案。如,某鋼鐵企業(yè)在中厚板生產(chǎn)中,面臨傳統(tǒng)機(jī)理模型預(yù)測(cè)精度不足(僅84%)、非穩(wěn)態(tài)工況下失準(zhǔn)率高(20%)的痛點(diǎn)。通過(guò)需求規(guī)劃,將目標(biāo)設(shè)定為研發(fā)“融合冶金知識(shí)的自主高精度軋制力預(yù)測(cè)模型”,提出構(gòu)建覆蓋全工序鏈的高質(zhì)量數(shù)據(jù)集。通過(guò)對(duì)技術(shù)方案和預(yù)期效益的綜合研判,預(yù)計(jì)該數(shù)據(jù)集完成后,可將軋制力預(yù)測(cè)準(zhǔn)確率提升至95%以上,非計(jì)劃停機(jī)率降低3%,板材成材率提升0.2%。

      二是數(shù)據(jù)采集。數(shù)據(jù)采集是確保數(shù)據(jù)集質(zhì)量的源頭環(huán)節(jié)。該環(huán)節(jié)依據(jù)需求規(guī)劃,運(yùn)用機(jī)器視覺(jué)、傳感器、工業(yè)總線(xiàn)、MES系統(tǒng)等多重手段,系統(tǒng)性地獲取“高保真、高信噪比”的原始數(shù)據(jù)。數(shù)據(jù)采集的廣度、精度和同步性,直接影響后續(xù)分析與建模的質(zhì)量。如,某企業(yè)在構(gòu)建礦山全場(chǎng)景要素?cái)?shù)據(jù)集時(shí),為破解安全預(yù)警滯后的難題,深入350多座煤礦的一線(xiàn)場(chǎng)景進(jìn)行數(shù)據(jù)采集。采集范圍不僅覆蓋了人員、車(chē)輛、設(shè)備、環(huán)境四大要素的57個(gè)場(chǎng)景,更特別針對(duì)煙霧、黑暗、粉塵等11類(lèi)極端工況進(jìn)行了專(zhuān)項(xiàng)采集。

      三是數(shù)據(jù)處理。數(shù)據(jù)處理是提升數(shù)據(jù)質(zhì)量、挖掘數(shù)據(jù)價(jià)值的關(guān)鍵一步,通過(guò)清洗、對(duì)齊、降噪、歸一化等手段,解決工業(yè)原始數(shù)據(jù)普遍存在的缺失、異常、冗余和不一致等問(wèn)題。如,某風(fēng)電裝備龍頭企業(yè)在風(fēng)機(jī)葉片上安裝了上千個(gè)傳感器數(shù)據(jù)點(diǎn),通過(guò)數(shù)據(jù)清洗、對(duì)齊和特征降維等技術(shù)手段,解決了原始數(shù)據(jù)25%缺失、10%異常的問(wèn)題,并將上千個(gè)特征簡(jiǎn)化至300個(gè)核心特征,使數(shù)據(jù)有效性從70%提升至99%以上,缺陷預(yù)測(cè)準(zhǔn)確率達(dá)到97%。

      四是數(shù)據(jù)標(biāo)注。數(shù)據(jù)標(biāo)注是為數(shù)據(jù)注入“監(jiān)督信息”和“工業(yè)知識(shí)”的核心環(huán)節(jié),也是構(gòu)建高精度模型訓(xùn)練標(biāo)簽體系的關(guān)鍵。工業(yè)場(chǎng)景的標(biāo)注任務(wù)專(zhuān)業(yè)壁壘高,必須深度結(jié)合專(zhuān)家知識(shí),建立清晰的標(biāo)注規(guī)范和嚴(yán)格的質(zhì)檢流程。如,某企業(yè)對(duì)圖像進(jìn)行數(shù)據(jù)標(biāo)注時(shí),采用了“預(yù)標(biāo)注—人工校驗(yàn)—模型迭代”的智能輔助標(biāo)注流程,基于自研智能標(biāo)注平臺(tái)先進(jìn)行預(yù)標(biāo)注,再結(jié)合人工交叉復(fù)核,精準(zhǔn)標(biāo)注了53個(gè)子類(lèi)目標(biāo)標(biāo)簽,保證標(biāo)注一致性波動(dòng)≤5%,分割掩碼誤差<2%。

      五是數(shù)據(jù)合成。數(shù)據(jù)合成與增強(qiáng)是破解工業(yè)場(chǎng)景中“關(guān)鍵樣本稀缺”這一痛點(diǎn)的重要手段。通過(guò)幾何變換、生成對(duì)抗網(wǎng)絡(luò)、三維仿真等技術(shù),可在不改變語(yǔ)義標(biāo)簽前提下,低成本、高效率地?cái)U(kuò)充數(shù)據(jù)集規(guī)模、拓展數(shù)據(jù)集多樣性。如,某汽車(chē)發(fā)動(dòng)機(jī)缸體、輪轂等零部件表面缺陷數(shù)據(jù)集,其原始樣本圖片3000張,缺陷樣本僅600張,類(lèi)別嚴(yán)重不均衡。通過(guò)幾何變換、顏色變換、噪聲添加等數(shù)據(jù)變換增強(qiáng)技術(shù),并利用生成對(duì)抗網(wǎng)絡(luò)(GAN)來(lái)合成1500張高質(zhì)量缺陷樣本圖片,提升了稀缺樣本數(shù)量,使判別器準(zhǔn)確率提升至85%。

      六是應(yīng)用驗(yàn)證。應(yīng)用驗(yàn)證是檢驗(yàn)數(shù)據(jù)集最終價(jià)值和驅(qū)動(dòng)數(shù)據(jù)集持續(xù)優(yōu)化的關(guān)鍵環(huán)節(jié)。通過(guò)模型在真實(shí)工業(yè)場(chǎng)景中的表現(xiàn),反向評(píng)估數(shù)據(jù)集的覆蓋度、平衡性和泛化能力,識(shí)別數(shù)據(jù)短板,形成“應(yīng)用—評(píng)估—優(yōu)化—再應(yīng)用”迭代閉環(huán)。如,基于某航空發(fā)動(dòng)機(jī)運(yùn)行狀態(tài)數(shù)據(jù)集,利用行業(yè)大模型遷移學(xué)習(xí)來(lái)訓(xùn)練關(guān)鍵部件剩余壽命小模型,實(shí)驗(yàn)調(diào)測(cè)準(zhǔn)確率92%,但實(shí)際裝機(jī)測(cè)試準(zhǔn)確率下降至85%。在應(yīng)用驗(yàn)證環(huán)節(jié)發(fā)現(xiàn),數(shù)據(jù)集稀疏樣本覆蓋度與平衡性存在嚴(yán)重不足,通過(guò)對(duì)數(shù)據(jù)進(jìn)行增強(qiáng)處理、重新標(biāo)注和訓(xùn)練驗(yàn)證,模型準(zhǔn)確率穩(wěn)定提升至98%,誤報(bào)率降低70%。

      三、工業(yè)高質(zhì)量數(shù)據(jù)集的評(píng)估體系

      工業(yè)高質(zhì)量數(shù)據(jù)集的評(píng)估不能照搬通用標(biāo)準(zhǔn),中國(guó)工業(yè)互聯(lián)網(wǎng)研究院緊密?chē)@工業(yè)場(chǎng)景的獨(dú)特性,結(jié)合實(shí)際場(chǎng)景實(shí)踐經(jīng)驗(yàn),提出七大核心指標(biāo)。

      規(guī)范性:指數(shù)據(jù)集符合數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)模型、業(yè)務(wù)規(guī)則、元數(shù)據(jù)或權(quán)威參考數(shù)據(jù)的程度,包括數(shù)據(jù)集的格式、標(biāo)注、單位和元數(shù)據(jù)的規(guī)范性等方面。特別是在化工、核電、航空航天等領(lǐng)域,存在高溫、高壓或易燃易爆等場(chǎng)景,數(shù)據(jù)規(guī)范性直接決定“產(chǎn)線(xiàn)是否正常運(yùn)行、風(fēng)險(xiǎn)是否及時(shí)預(yù)警”,任何偏差都可能引發(fā)爆炸、泄漏、設(shè)備損毀等重大安全事故。

      完整性:指數(shù)據(jù)集按照建設(shè)規(guī)則要求,應(yīng)采集的數(shù)據(jù)元素被有效獲取和記錄的程度,包括特征完整性、分布完整性、標(biāo)注完整性、文檔完整性與樣本數(shù)據(jù)充足性等方面。例如,在壓縮機(jī)預(yù)測(cè)性維護(hù)場(chǎng)景中,一個(gè)同時(shí)覆蓋振動(dòng)、溫度、電流、轉(zhuǎn)速等多維參數(shù),并囊括啟停、滿(mǎn)負(fù)荷、部分負(fù)荷等所有工況的數(shù)據(jù)集,才能訓(xùn)練出具備較強(qiáng)泛化能力的模型。

      準(zhǔn)確性:指數(shù)據(jù)集包含的信息真實(shí)、精確地反映其所描述的物理實(shí)體或?qū)嶋H狀態(tài)的程度,包括數(shù)據(jù)集的內(nèi)容、精度、誤差、標(biāo)注信息、文檔描述等方面。基于工業(yè)設(shè)備的運(yùn)行參數(shù)數(shù)據(jù)集、生產(chǎn)過(guò)程中的工藝指標(biāo)數(shù)據(jù)集所形成的機(jī)理模型,會(huì)因數(shù)據(jù)的微小偏差導(dǎo)致預(yù)測(cè)失準(zhǔn),進(jìn)而對(duì)產(chǎn)品質(zhì)量、生產(chǎn)安全產(chǎn)生決定性影響。

      一致性:指數(shù)據(jù)集內(nèi)部及與其他數(shù)據(jù)源之間的統(tǒng)一程度,包括數(shù)據(jù)單位與格式的一致性,數(shù)據(jù)集樣本分布與真實(shí)世界數(shù)據(jù)分布的一致性,不同樣本間數(shù)據(jù)標(biāo)注基準(zhǔn)的一致性等方面。若不同標(biāo)注人員對(duì)相同類(lèi)型產(chǎn)品缺陷的判定標(biāo)準(zhǔn)不一致,將導(dǎo)致標(biāo)簽歧義,影響模型訓(xùn)練的穩(wěn)定性與預(yù)測(cè)精度。

      時(shí)效性:指數(shù)據(jù)集能夠反映當(dāng)前或指定時(shí)間窗口內(nèi)的真實(shí)狀態(tài)程度,包括是否涵蓋所需的時(shí)效區(qū)間、是否包含過(guò)時(shí)信息等方面。在預(yù)測(cè)風(fēng)機(jī)發(fā)電量時(shí),十年前的環(huán)境數(shù)據(jù)與當(dāng)前相比已出現(xiàn)明顯差異,使用過(guò)時(shí)數(shù)據(jù)構(gòu)建模型可能導(dǎo)致預(yù)測(cè)結(jié)果與實(shí)際不符。

      專(zhuān)業(yè)性:指數(shù)據(jù)集涵蓋的信息內(nèi)容和工業(yè)場(chǎng)景的匹配程度,包括知識(shí)的專(zhuān)業(yè)性、業(yè)務(wù)流程的適配性、工業(yè)機(jī)理的關(guān)聯(lián)性等方面。例如,在晶圓缺陷識(shí)別場(chǎng)景中,若數(shù)據(jù)集僅標(biāo)注缺陷圖像的表面特征,而未關(guān)聯(lián)對(duì)應(yīng)的工藝環(huán)節(jié)、工序類(lèi)型,模型則難以區(qū)分光刻工序的“邊緣劃傷”與刻蝕工序的“側(cè)壁損傷”,導(dǎo)致缺陷識(shí)別準(zhǔn)確率低,且無(wú)法支撐根因分析與工藝優(yōu)化。

      均衡性:指數(shù)據(jù)集中各類(lèi)別樣本和數(shù)據(jù)來(lái)源分布的合理性、均勻性,包括數(shù)據(jù)類(lèi)別均衡性和數(shù)據(jù)來(lái)源均衡性等方面。例如,在鋼鐵表面質(zhì)量檢測(cè)中,若數(shù)據(jù)集以大量無(wú)缺陷或常見(jiàn)劃痕樣本為主,“裂紋”“夾雜”等關(guān)鍵缺陷樣本數(shù)量過(guò)少,模型在訓(xùn)練后將難以有效識(shí)別高風(fēng)險(xiǎn)缺陷,影響產(chǎn)品質(zhì)量控制和產(chǎn)線(xiàn)安全。

      四、工業(yè)高質(zhì)量數(shù)據(jù)集的流通應(yīng)用

      工業(yè)高質(zhì)量數(shù)據(jù)集的最終價(jià)值必須通過(guò)流通與應(yīng)用得以實(shí)現(xiàn)。中國(guó)工業(yè)互聯(lián)網(wǎng)研究院正在推進(jìn)構(gòu)建從數(shù)據(jù)登記、可信流通到應(yīng)用服務(wù)的業(yè)務(wù)閉環(huán),破解工業(yè)數(shù)據(jù)共享難題,培育多方共贏(yíng)的數(shù)據(jù)服務(wù)生態(tài)。

      (一)構(gòu)建工業(yè)可信數(shù)據(jù)空間。依托國(guó)家工業(yè)互聯(lián)網(wǎng)大數(shù)據(jù)中心,構(gòu)建工業(yè)可信數(shù)據(jù)空間,促進(jìn)工業(yè)高質(zhì)量數(shù)據(jù)集的有序流通、安全共享與高效利用。一是技術(shù)賦能可信流通。基于隱私計(jì)算、安全沙箱、身份可信認(rèn)證、數(shù)據(jù)使用控制及全鏈路追溯等核心技術(shù),構(gòu)建“數(shù)據(jù)集可用不可見(jiàn)、用途可控可追溯”的信任機(jī)制,打通數(shù)據(jù)集供給方、需求方及服務(wù)方協(xié)同鏈路,在“數(shù)據(jù)集物理不出域”前提下,通過(guò)“可用不可見(jiàn)”模式滿(mǎn)足多主體的數(shù)據(jù)集使用需求,實(shí)現(xiàn)數(shù)據(jù)集主權(quán)不轉(zhuǎn)移、價(jià)值可流轉(zhuǎn)。二是構(gòu)建三級(jí)聯(lián)動(dòng)架構(gòu)。通過(guò)“國(guó)家—產(chǎn)業(yè)集群—企業(yè)”三級(jí)互聯(lián)部署架構(gòu),形成規(guī)模化覆蓋、層級(jí)化運(yùn)營(yíng)的可信數(shù)據(jù)空間管理體系。企業(yè)層面,通過(guò)鏈接生產(chǎn)制造、設(shè)備運(yùn)維等數(shù)據(jù)源頭,利用數(shù)據(jù)采集、清洗及標(biāo)注等技術(shù)手段,構(gòu)建高質(zhì)量“數(shù)據(jù)集原材料”;產(chǎn)業(yè)集群層面,聚焦先進(jìn)制造業(yè)產(chǎn)業(yè)集群,通過(guò)數(shù)據(jù)可信流通與協(xié)作,整合優(yōu)化企業(yè)級(jí)數(shù)據(jù)集,形成具備產(chǎn)業(yè)特色或行業(yè)共性的數(shù)據(jù)集;國(guó)家層面,構(gòu)建全國(guó)工業(yè)高質(zhì)量數(shù)據(jù)集目錄體系,實(shí)現(xiàn)數(shù)據(jù)集資源的有序整合與優(yōu)化配置。三是促進(jìn)數(shù)據(jù)集供需匹配。支撐設(shè)備、產(chǎn)線(xiàn)、生態(tài)等全層級(jí)工業(yè)高質(zhì)量數(shù)據(jù)集產(chǎn)品的注冊(cè)、審核、上架及安全可信共享,通過(guò)需求側(cè)畫(huà)像與供給側(cè)標(biāo)簽的精準(zhǔn)匹配,滿(mǎn)足不同層級(jí)工業(yè)模型對(duì)數(shù)據(jù)集的差異化需求,推動(dòng)數(shù)據(jù)集價(jià)值從單點(diǎn)應(yīng)用向全局賦能延伸。

      (二)開(kāi)展數(shù)據(jù)確權(quán)登記。厘清企業(yè)數(shù)據(jù)底數(shù)、明確權(quán)屬關(guān)系,是推動(dòng)工業(yè)數(shù)據(jù)流通與應(yīng)用的首要環(huán)節(jié)。通過(guò)建立“國(guó)家—產(chǎn)業(yè)集群—企業(yè)”三級(jí)工業(yè)數(shù)據(jù)登記體系,幫助企業(yè)梳理數(shù)據(jù)并完成登記,積累工業(yè)數(shù)據(jù)目錄,提升工業(yè)數(shù)據(jù)供給能力。一是企業(yè)級(jí),幫助企業(yè)梳理數(shù)據(jù)資產(chǎn)。企業(yè)通過(guò)部署輕量化登記工具,能夠在數(shù)據(jù)不出企業(yè)數(shù)據(jù)庫(kù)的前提下,生成標(biāo)準(zhǔn)化數(shù)據(jù)目錄,并獲得登記證書(shū);二是集群級(jí),繪制產(chǎn)業(yè)數(shù)據(jù)資源地圖。產(chǎn)業(yè)集群、園區(qū)或地方政府聚合其轄區(qū)內(nèi)企業(yè)數(shù)據(jù)目錄,形成區(qū)域性的數(shù)據(jù)資源地圖;三是國(guó)家級(jí),匯聚企業(yè)和集群數(shù)據(jù)目錄,構(gòu)建覆蓋全國(guó)的工業(yè)數(shù)據(jù)資源地圖。以紡織行業(yè)為例,企業(yè)在本地部署可信登記軟件,自主選擇織機(jī)運(yùn)行參數(shù)、原材料消耗、庫(kù)存等數(shù)據(jù)進(jìn)行登記,相關(guān)信息上傳至確權(quán)平臺(tái)。平臺(tái)審核通過(guò)后,為企業(yè)頒發(fā)登記證書(shū)。不同區(qū)域的紡織企業(yè)數(shù)據(jù)登記不斷積累,將最終形成全國(guó)紡織行業(yè)數(shù)據(jù)目錄。截至2025年8月,中國(guó)工業(yè)互聯(lián)網(wǎng)研究院工業(yè)數(shù)據(jù)資產(chǎn)登記平臺(tái)已在蘇州、北京、沈陽(yáng)等地試點(diǎn),累計(jì)注冊(cè)企業(yè)2200余家,發(fā)放登記證書(shū)超1700張,為高質(zhì)量數(shù)據(jù)集建設(shè)提供了有效支撐。

      (三)推進(jìn)工業(yè)數(shù)據(jù)應(yīng)用。基于工業(yè)高質(zhì)量數(shù)據(jù)集的應(yīng)用探索正加速演進(jìn),逐漸形成三類(lèi)商業(yè)化服務(wù)模式:一是工業(yè)場(chǎng)景訓(xùn)練語(yǔ)料服務(wù)。數(shù)據(jù)服務(wù)商通過(guò)平臺(tái)化訂閱或私有化定制,向模型廠(chǎng)商提供精加工的工業(yè)場(chǎng)景數(shù)據(jù)集,提升其模型在細(xì)分領(lǐng)域的專(zhuān)業(yè)精度。如,某數(shù)據(jù)服務(wù)商為頭部模型廠(chǎng)商提供的定制化工業(yè)語(yǔ)料服務(wù),單個(gè)項(xiàng)目金額可達(dá)近千萬(wàn)元,體現(xiàn)了高質(zhì)量工業(yè)語(yǔ)料作為“AI燃料”的巨大商業(yè)價(jià)值。二是AI一體機(jī)定制化服務(wù)。數(shù)據(jù)服務(wù)商結(jié)合數(shù)據(jù)集、模型、算力以一體機(jī)部署方式為工業(yè)應(yīng)用企業(yè)提供安全、高性?xún)r(jià)比的智能服務(wù)。如,某龍頭企業(yè)打造的工業(yè)AI一體機(jī),極大降低了AI技術(shù)在工業(yè)現(xiàn)場(chǎng)的應(yīng)用門(mén)檻,實(shí)現(xiàn)了數(shù)千萬(wàn)元的產(chǎn)品服務(wù)收入。三是數(shù)據(jù)處理工具應(yīng)用服務(wù)。數(shù)據(jù)服務(wù)商以云化API或定制化服務(wù)等方式為人工智能應(yīng)用企業(yè)提供數(shù)據(jù)“采、洗、標(biāo)、測(cè)、用”等一站式數(shù)據(jù)處理服務(wù)。如某企業(yè)自研的數(shù)據(jù)標(biāo)注平臺(tái),最高可提升6倍標(biāo)注效率,平均降低數(shù)據(jù)處理40%成本。隨著高質(zhì)量數(shù)據(jù)集與人工智能在各垂直細(xì)分行業(yè)的深入應(yīng)用,將催生出更多高效、自適應(yīng)、智能的工業(yè)數(shù)據(jù)應(yīng)用新模式,加速產(chǎn)業(yè)智能化轉(zhuǎn)型升級(jí)。

      中國(guó)工業(yè)互聯(lián)網(wǎng)研究院將聚焦工業(yè)高質(zhì)量數(shù)據(jù)集的建設(shè)與應(yīng)用,在技術(shù)研發(fā)、設(shè)施布局、標(biāo)準(zhǔn)研制、應(yīng)用推廣和生態(tài)培育等方面持續(xù)發(fā)力。遼寧是我國(guó)工業(yè)的搖籃和重要基地,中國(guó)工業(yè)互聯(lián)網(wǎng)研究院將在遼寧率先試點(diǎn),依托遼寧四大先進(jìn)制造業(yè)集群,加速推動(dòng)工業(yè)高質(zhì)量數(shù)據(jù)集的規(guī)模化供給與高水平應(yīng)用,加快推進(jìn)人工智能賦能新型工業(yè)化。

      編輯:韓夢(mèng)晨
      相關(guān)閱讀:
      高新視頻 更多
      高新熱榜 全部本月
      編輯推薦 更多

      友情鏈接: 政府 高新園區(qū)合作媒體

      Copyright 1999-2025 中國(guó)高新網(wǎng)chinahightech.com All Rights Reserved.京ICP備14033264號(hào)-5

      電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證060344號(hào)主辦單位:《中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào)》社有限責(zé)任公司

      久久久久亚洲av无码专区蜜芽| 国产精品久久久亚洲| 亚洲大香伊人蕉在人依线| 国产精品亚洲精品日韩动图| 亚洲人成电影网站色| 亚洲国产日韩精品| 久久久久亚洲国产AV麻豆| 亚洲人成电影网站色| 亚洲GV天堂无码男同在线观看| 亚洲色大成网站www永久| 亚洲男人都懂得羞羞网站| 亚洲精品成人无码中文毛片不卡| 亚洲国产人成精品| 亚洲av无码乱码在线观看野外| 亚洲AV无码成人精品区日韩| 亚洲AV无码专区亚洲AV桃| 亚洲精品天堂成人片AV在线播放| 成人亚洲国产va天堂| 亚洲精品天堂无码中文字幕| 韩国亚洲伊人久久综合影院| 亚洲不卡无码av中文字幕| 亚洲综合精品网站| 亚洲人精品午夜射精日韩 | 亚洲国产精品一区二区成人片国内 | 亚洲国产香蕉人人爽成AV片久久 | 亚洲无码精品浪潮| 亚洲女初尝黑人巨高清| 亚洲AV美女一区二区三区| 99亚洲精品高清一二区| 亚洲国产精品乱码在线观看97| 国产成人精品日本亚洲专一区 | 亚洲av色福利天堂| 亚洲高清视频免费| 成人亚洲国产va天堂| 亚洲av乱码中文一区二区三区| 亚洲日本韩国在线| 亚洲国产成人片在线观看无码| 亚洲黄色片免费看| 在线观看亚洲AV日韩A∨| 精品亚洲成A人在线观看青青| 久久亚洲中文字幕精品一区|