在2025年WAIC現(xiàn)場中國人工智能產(chǎn)業(yè)創(chuàng)新成果展區(qū),中國聯(lián)通展出了數(shù)據(jù)產(chǎn)業(yè)底座。作為中國通信行業(yè)的國家隊(duì),中國聯(lián)通不僅坐擁海量通信數(shù)據(jù),更在數(shù)據(jù)治理、安全流通與行業(yè)賦能上走出了一條特色道路。
中國聯(lián)通軟件研究院副院長趙亞暉在此接受了鳳凰網(wǎng)科技的專訪,介紹了中國聯(lián)通數(shù)據(jù)底座的核心能力與產(chǎn)業(yè)實(shí)踐。
一直以來,軟件研究院都是中國聯(lián)通集團(tuán)總部自主研發(fā)的主要力量,在內(nèi)部也被稱為“數(shù)字與智能創(chuàng)新中心”。而成長于河南聯(lián)通的趙亞暉,在2020年正式加入軟件研究院任副院長,技術(shù)出身的他負(fù)責(zé)業(yè)務(wù)、管理和大數(shù)據(jù)等系統(tǒng)的建設(shè)與運(yùn)營支撐。
煉好AI時(shí)代的核心燃料
中國聯(lián)通此次入選人工智能產(chǎn)業(yè)創(chuàng)新成果展正是自主打造的數(shù)據(jù)產(chǎn)業(yè)底座。趙亞暉介紹,入選成果覆蓋算力、算法、數(shù)據(jù)三大能力融合,尤其聚焦于高質(zhì)量數(shù)據(jù)集的建設(shè)成果,具體包括數(shù)據(jù)基礎(chǔ)設(shè)施產(chǎn)品、具備行業(yè)特色高質(zhì)量數(shù)據(jù)集及場景化應(yīng)用等。
“中國聯(lián)通一直非常重視人工智能技術(shù)研究與應(yīng)用,加快推進(jìn)算、網(wǎng)、數(shù)、模、用融合發(fā)展”趙亞暉強(qiáng)調(diào),“從底層算網(wǎng)基礎(chǔ)設(shè)施到數(shù)據(jù)基礎(chǔ)設(shè)施,從高質(zhì)量數(shù)據(jù)集和大模型應(yīng)用,都有相應(yīng)規(guī)劃布局。”在AI時(shí)代,高質(zhì)量數(shù)據(jù)集被稱為“核心燃料”,是數(shù)智融合應(yīng)用的核心基石。聯(lián)通作為行業(yè)率先實(shí)現(xiàn)全國數(shù)據(jù)集約化的電信運(yùn)營商,沉淀700PB企業(yè)海量數(shù)據(jù)資源,在此基礎(chǔ)上聯(lián)合行業(yè)伙伴共建、共享、共創(chuàng),形成大規(guī)模、多模態(tài)、高質(zhì)量通信領(lǐng)域數(shù)據(jù)集和行業(yè)數(shù)據(jù)集超過400TB。
同時(shí),面向高質(zhì)量數(shù)據(jù)集的研發(fā)運(yùn)營,根據(jù)豐富的實(shí)踐經(jīng)驗(yàn)總結(jié)提煉形成了“三個(gè)一”的體系框架,即“一套治理運(yùn)營方法論、一套平臺工具、一套高質(zhì)量數(shù)據(jù)集”。
一套數(shù)據(jù)集治理運(yùn)營方法論,通過構(gòu)建數(shù)據(jù)集分級分類管理框架,建立常態(tài)化質(zhì)量評估與動態(tài)優(yōu)化機(jī)制,實(shí)現(xiàn)數(shù)據(jù)集全生命周期的規(guī)范化運(yùn)營。在此過程中,聯(lián)通還聯(lián)合國家數(shù)字標(biāo)準(zhǔn)委員會、信通院等權(quán)威機(jī)構(gòu)參與國家級、行業(yè)級標(biāo)準(zhǔn)制定,為高質(zhì)量數(shù)據(jù)集的標(biāo)準(zhǔn)化體系建設(shè)提供堅(jiān)實(shí)技術(shù)支撐。
一套數(shù)據(jù)集平臺工具,打造了覆蓋 “數(shù)據(jù)采集、清洗預(yù)處理、標(biāo)注加工、質(zhì)量檢測、場景應(yīng)用、效果評估” 的全流程閉環(huán)處理鏈路,形成了自主研發(fā)的全流程工具鏈。該工具鏈集成了多模態(tài)數(shù)據(jù)智能處理算法、自動化標(biāo)注引擎及智能質(zhì)檢算子,能實(shí)現(xiàn)從原始數(shù)據(jù)到高質(zhì)量訓(xùn)練數(shù)據(jù)的端到端智能化生產(chǎn),創(chuàng)新成果榮獲了首屆 DataOps 工具產(chǎn)品創(chuàng)新獎。
一套高質(zhì)量數(shù)據(jù)集,圍繞大模型訓(xùn)練與數(shù)智化應(yīng)用場景,建成網(wǎng)絡(luò)運(yùn)營、客戶服務(wù)、電信反詐等8個(gè)領(lǐng)域的專業(yè)化數(shù)據(jù)集,支撐27個(gè)大模型場景的訓(xùn)練與微調(diào)。其中,信息通信領(lǐng)域數(shù)據(jù)集成功入選國務(wù)院國資委首批央企高質(zhì)量數(shù)據(jù)集優(yōu)秀建設(shè)成果,成為行業(yè)內(nèi)的標(biāo)桿典范。
“人工智能+走到哪里,高質(zhì)量數(shù)據(jù)集就建設(shè)到哪里,通過”三個(gè)一”體系,不斷驅(qū)動數(shù)據(jù)集質(zhì)量和應(yīng)用效果的提升。”趙亞暉總結(jié)道。這一模式從內(nèi)部實(shí)踐出發(fā),逐步延伸到行業(yè)數(shù)據(jù)應(yīng)用,打通了數(shù)據(jù)價(jià)值落地的關(guān)鍵路徑。
高質(zhì)量數(shù)據(jù)才是AI時(shí)代的差異化優(yōu)勢
隨著DeepSeek的出圈,千行百業(yè)加速用AI改造現(xiàn)有平臺與業(yè)務(wù)的進(jìn)程。
但在趙亞暉看來,“要實(shí)現(xiàn)AI重塑企業(yè)生產(chǎn)經(jīng)營的各類場景,要對系統(tǒng)應(yīng)用的體系架構(gòu)與業(yè)務(wù)流程進(jìn)行重構(gòu),在實(shí)踐中我們更深刻的認(rèn)識到,羅馬不是一日建成的,這是一個(gè)系統(tǒng)性的智能化改造工程。”
中國聯(lián)通的策略是從場景切入,特別是聚焦于特定行業(yè)。對內(nèi)增強(qiáng)智慧運(yùn)營新動能,高效推進(jìn)數(shù)字化細(xì)分場景全面融智,聚焦辦公管理、市場營銷、政企發(fā)展等七大領(lǐng)域開展AI轉(zhuǎn)型,構(gòu)建上千個(gè)智能體,覆蓋千余項(xiàng)細(xì)分場景,累計(jì)超萬人參與其中。對外拓展行業(yè)發(fā)展新空間,聯(lián)合行業(yè)合作伙伴構(gòu)建了裝備制造、消費(fèi)品、原材料、醫(yī)療健康等上百個(gè)行業(yè)智能化應(yīng)用,賦能千行百業(yè)數(shù)智化轉(zhuǎn)型。
“比如一線基層晨會籌備場景中,告別手工查報(bào)表,語音提問即秒得經(jīng)營數(shù)據(jù),從 "埋頭查數(shù)" 到 "張口要數(shù)",數(shù)據(jù)報(bào)表制作時(shí)間從小時(shí)級縮短至分鐘級。”趙亞暉告訴鳳凰網(wǎng)科技。
相比其他行業(yè)來說,通信數(shù)據(jù)更聚焦于實(shí)時(shí)性、準(zhǔn)確性、可靠性等硬指標(biāo)。這種差異化優(yōu)勢,正成為聯(lián)通賦能行業(yè)的獨(dú)特基礎(chǔ)。目前,中國聯(lián)通的數(shù)據(jù)服務(wù)已經(jīng)面向千行百業(yè)開放,尤其是前述提及的工業(yè)、金融場景。
“面向ToB、ToC客戶,最終會發(fā)現(xiàn),大模型的場景要落地、要做好,關(guān)鍵在于數(shù)據(jù)與大模型場景的結(jié)合上。”趙亞暉告訴鳳凰網(wǎng)科技,隨著國內(nèi)算力供給能力的不斷提升,大模型普惠平權(quán)的發(fā)展,現(xiàn)階段,數(shù)據(jù)集已成為各行各業(yè)關(guān)注的另一焦點(diǎn),建好用好高質(zhì)量數(shù)據(jù),有助于企業(yè)在AI產(chǎn)業(yè)化應(yīng)用中打造自身的差異化優(yōu)勢。
智能革命背后的安全博弈
數(shù)據(jù)要素價(jià)值的釋放和產(chǎn)業(yè)發(fā)展,離不開數(shù)據(jù)要素的高效流通。但數(shù)據(jù)流通是把雙刃劍,它在釋放價(jià)值的同時(shí),也面臨著安全與隱私的挑戰(zhàn)。聯(lián)通對此有著深刻的認(rèn)識,在數(shù)據(jù)安全方面建立了多重防線。
我們在內(nèi)部建設(shè)了數(shù)據(jù)分類分級平臺、4A 金庫等工具,數(shù)據(jù)使用控制全程上鏈,嚴(yán)格管控敏感數(shù)據(jù)訪問權(quán)限,確保數(shù)據(jù)流通全過程可管可控。” 趙亞暉介紹道,對外,聯(lián)通也構(gòu)建了多重技術(shù)防護(hù)體系,打造了數(shù)據(jù)安全態(tài)勢、安全威脅檢測預(yù)警等多款技術(shù)產(chǎn)品。
在跨域、跨主體數(shù)據(jù)流通上,聯(lián)通積極參與國家可信數(shù)據(jù)空間建設(shè),推動數(shù)據(jù) “可用不可見、可控可計(jì)量、可管可回溯” 的高效、安全、可信流通。同時(shí)充分發(fā)揮產(chǎn)學(xué)研優(yōu)勢,在隱私計(jì)算、數(shù)據(jù)沙箱、區(qū)塊鏈等領(lǐng)域開展前沿性技術(shù)探索。“國家在規(guī)劃布局建設(shè)城市、行業(yè)、企業(yè)可信數(shù)據(jù)空間,聯(lián)通也在積極參與國家數(shù)據(jù)流通基礎(chǔ)設(shè)施的建設(shè),保障數(shù)據(jù)要素供的出、流的動、用得好”趙亞暉說,“數(shù)據(jù)流通過程需要解決的核心問題就是安全問題,同時(shí)還要進(jìn)一步完善數(shù)據(jù)確權(quán)、交易、收益分?jǐn)偟纫幌盗信涮讬C(jī)制,這需要政府、行業(yè)、企業(yè)共同努力,協(xié)同打造全國一體化數(shù)據(jù)市場。”
從新型數(shù)據(jù)基礎(chǔ)設(shè)施的建設(shè)到高質(zhì)量數(shù)據(jù)集的打造,從內(nèi)部大模型創(chuàng)新實(shí)踐到賦能千行百業(yè)智能化升級,聯(lián)通正用創(chuàng)新的技術(shù)和實(shí)踐,在 AI 時(shí)代探索著央企特色的數(shù)據(jù)價(jià)值化之路,讓 “數(shù)據(jù)燃料” 持續(xù)驅(qū)動智能革命向前邁進(jìn)。