能源行業(yè)AI大模型工程化實踐研究
王宇航 史翔 申一彤
(中電信數(shù)智科技有限公司,北京 100035)
摘要:隨著全球能源轉(zhuǎn)型加速,低碳化、智能化成為能源行業(yè)發(fā)展的核心方向。人工智能(Artificial Intelligence,AI)技術(shù)憑借強大的數(shù)據(jù)分析、預(yù)測優(yōu)化和智能決策能力,正在深刻改變能源行業(yè)的生產(chǎn)、傳輸與消費模式。近年來,AI大模型(如GPT、BERT等)在自然語言處理、圖像識別等領(lǐng)域取得突破性進展,在能源行業(yè)的應(yīng)用潛力逐漸顯現(xiàn),然而其在工程化落地方面仍面臨技術(shù)適配性、數(shù)據(jù)質(zhì)量、算力成本等多重挑戰(zhàn)。聚焦AI大模型在能源行業(yè)工程化落地關(guān)鍵環(huán)節(jié),結(jié)合行業(yè)趨勢、技術(shù)應(yīng)用、典型案例等研判分析,提出系統(tǒng)化的實踐路徑解決方案。
關(guān)鍵詞:能源行業(yè);人工智能;大模型;工程化實踐
0 引言
傳統(tǒng)能源行業(yè)面臨管理粗放、系統(tǒng)協(xié)同低效和新能源消納不足等挑戰(zhàn),亟需技術(shù)創(chuàng)新推動全要素生產(chǎn)率躍升。以ChatGPT、DeepSeek為代表的人工智能(Artificial Intelligence,AI)大模型正重塑能源系統(tǒng)決策邏輯,為產(chǎn)業(yè)智能化轉(zhuǎn)型提供新范式。構(gòu)建能源領(lǐng)域垂直大模型,可整合地質(zhì)勘探、設(shè)備運維和電網(wǎng)調(diào)度等多源數(shù)據(jù),實現(xiàn)生產(chǎn)精準預(yù)測、故障智能診斷和供需動態(tài)優(yōu)化等突破。然而,能源數(shù)據(jù)具有異構(gòu)性強、實時性高和安全要求嚴等特點,現(xiàn)有大模型在適配性、可解釋性和部署效率方面仍存在局限。當前,能源企業(yè)對AI大模型的應(yīng)用能力差異顯著,政策與市場支撐體系尚不完善,其工程化應(yīng)用仍處于初期探索階段。
1 政策引領(lǐng)及技術(shù)突破驅(qū)動AI發(fā)展演進
1.1 政策引領(lǐng)AI產(chǎn)業(yè)發(fā)展新征程
在國家戰(zhàn)略層面,AI已成為驅(qū)動產(chǎn)業(yè)變革的核心引擎。中央經(jīng)濟工作會議將“人工智能+”行動納入2025年重點任務(wù),通過頂層設(shè)計推動產(chǎn)業(yè)深度轉(zhuǎn)型。政策體系構(gòu)建圍繞三大維度展開。標準引領(lǐng)層面,計劃到2026年制定50項以上國家/行業(yè)標準,參與20項國際標準制定,推動中國AI標準體系與國際接軌,并培育超1 000家標準實施示范企業(yè)[1];基礎(chǔ)設(shè)施方面,深圳開放智算中心于2024年建成運營,具備4 000 PFLOPS算力規(guī)模及30 000 PFLOPS調(diào)度能力[2],為大規(guī)模AI研發(fā)提供算力支撐;場景落地方面,重點推進40個“城市+AI”示范項目,涵蓋智能電網(wǎng)、智慧醫(yī)療等垂直領(lǐng)域,加速技術(shù)產(chǎn)業(yè)化進程。國務(wù)院國資委實施“雙219”部署,要求央企將AI納入“十五五”規(guī)劃核心,2024年首批10家央企開放應(yīng)用場景,2025年聚焦芯片、框架等“根技術(shù)”突破,強化算力基建與行業(yè)數(shù)據(jù)集建設(shè)。政策導(dǎo)向明確從“規(guī)模擴張”轉(zhuǎn)向“價值創(chuàng)造”,重點賦能新能源、半導(dǎo)體等戰(zhàn)略行業(yè),推動AI從輔助工具升級為決策系統(tǒng)。
1.2 技術(shù)驅(qū)動AI場景融合新涌現(xiàn)
AI技術(shù)突破正重構(gòu)產(chǎn)業(yè)生態(tài)格局,從“感知理解世界”向“感知理解世界”演進。第一次浪潮以符號主義和邏輯推理為標志,AI正式誕生,但受限于描述能力,實際應(yīng)用乏力;第二次浪潮通過專家系統(tǒng)與機器學(xué)習(xí)步入產(chǎn)業(yè)化,卻因泛化能力不足而遇瓶頸;第三次浪潮深度學(xué)習(xí)的突破顯著提升泛化能力,推動AI技術(shù)爆發(fā);第四次浪潮以AI內(nèi)容生成為核心,AI從感知理解躍遷至生成創(chuàng)造,如ChatGPT展現(xiàn)的自然語言與多模態(tài)能力,2025年DeepSeek、Manus等技術(shù)產(chǎn)品的出現(xiàn)正引發(fā)新一輪的產(chǎn)業(yè)革命。在大模型性能躍升方面,DeepSeek憑借其低成本、高性能特點,在全球AI市場嶄露頭角,DeepSeek-R1開源模型綜合性能比肩GPT-4,技術(shù)性任務(wù)準確率超人類水平,其訓(xùn)練和推理成本僅為GPT-4的1%和1/30[3],美國麻省理工學(xué)院(Massachusetts Institute of Technology,MIT)開源協(xié)議推動技術(shù)普惠化;智能體技術(shù)革新領(lǐng)域,Manus通過自主進化機制實現(xiàn)跨場景泛化,在多行業(yè)實現(xiàn)效率躍升與成本變革,根據(jù)投行季度財報數(shù)據(jù),Manus可將分析響應(yīng)效率提升至原來的36倍[4],例如在人機協(xié)同領(lǐng)域?qū)崿F(xiàn)“決策-執(zhí)行”閉環(huán),汽車工廠生產(chǎn)線故障響應(yīng)時間從3 h縮短至5 min[5];成本結(jié)構(gòu)上,1個Manus年度成本相當于4.2名全職員工,但產(chǎn)出效率是其5倍,重構(gòu)行業(yè)生產(chǎn)力體系,成為行業(yè)發(fā)展的核心輔助力量[6]。
2 AI大模型行業(yè)應(yīng)用現(xiàn)狀分析
當前,AI大模型已在金融、醫(yī)療、教育、交通等領(lǐng)域?qū)崿F(xiàn)深度滲透,展現(xiàn)出顯著的產(chǎn)業(yè)價值與技術(shù)潛力。如表1所示,在金融領(lǐng)域,智能客服與風控系統(tǒng)的高效運作體現(xiàn)了多模態(tài)整合與思維鏈技術(shù)的成熟應(yīng)用,但核心決策仍依賴人工。醫(yī)療領(lǐng)域通過聯(lián)邦學(xué)習(xí)等技術(shù)突破,在影像診斷、藥物研發(fā)等方面取得成果,但數(shù)據(jù)隱私與模型可解釋性仍是關(guān)鍵瓶頸。教育領(lǐng)域依托離線算力中心與多模態(tài)工具,實現(xiàn)教學(xué)效率躍升,而本地化算力需求成為規(guī)?;瘧?yīng)用的制約因素。交通領(lǐng)域借助數(shù)字孿生技術(shù)顯著提升運維效率,但全鏈路智能化整合仍需突破。
表1 AI大模型典型行業(yè)應(yīng)用分析
能源行業(yè)AI大模型應(yīng)用進入初步工程化落地實踐探索階段,主要聚焦生產(chǎn)優(yōu)化、電網(wǎng)管理、勘探開發(fā)及客戶服務(wù)四大方向,例如國家電網(wǎng)部署千億級光明電力大模型優(yōu)化電網(wǎng)調(diào)度與故障預(yù)測,中國石油700億參數(shù)昆侖大模型覆蓋勘探開發(fā)全流程。在實踐路徑上,企業(yè)普遍采用“AI大模型+場景”模式,但在探索過程中面臨以下瓶頸:數(shù)據(jù)層面存在“跨企業(yè)孤島”與高質(zhì)量樣本不足問題,約62%企業(yè)受限于數(shù)據(jù)治理能力[14];算力層面存在高性能圖形處理單元(Graphic Processing Unit,GPU)短缺與能耗矛盾,單次AI大模型訓(xùn)練耗電達600 MWh[15];技術(shù)層面存在模型可解釋性差與安全風險,能源交易等關(guān)鍵場景對決策透明度要求嚴苛。這些挑戰(zhàn)阻礙AI大模型在能源系統(tǒng)的深度滲透,亟需通過關(guān)鍵技術(shù)支撐構(gòu)建數(shù)據(jù)治理及共享機制、突破算力瓶頸、完善可信AI體系等,以深化推進AI大模型從擴展工具向核心應(yīng)用的跨越式發(fā)展。
3 能源行業(yè)AI大模型工程化核心技術(shù)支撐
3.1 數(shù)據(jù)治理與預(yù)處理
在能源行業(yè)中,數(shù)據(jù)的多源異構(gòu)特性尤為顯著,這既為AI大模型的應(yīng)用提供了豐富的信息資源,同時也帶來了數(shù)據(jù)處理上的挑戰(zhàn)。由于數(shù)據(jù)來源廣泛,包括傳感器網(wǎng)絡(luò)、物聯(lián)網(wǎng)設(shè)備、企業(yè)資源規(guī)劃系統(tǒng)(Enterprise Resource Planning,ERP)等,數(shù)據(jù)的格式、質(zhì)量和時效性差異巨大。因此,構(gòu)建統(tǒng)一的數(shù)據(jù)標準和清洗機制成為確保AI大模型性能的關(guān)鍵步驟。通過數(shù)據(jù)標準化,可以實現(xiàn)不同數(shù)據(jù)源之間的互操作性,而數(shù)據(jù)清洗則能有效去除噪聲、重復(fù)和錯誤數(shù)據(jù),保證數(shù)據(jù)的準確性和完整性。此外,能源行業(yè)對數(shù)據(jù)隱私和安全的要求極高,因為數(shù)據(jù)泄露可能導(dǎo)致嚴重的安全事故或經(jīng)濟損失。采用多方計算、聯(lián)邦學(xué)習(xí)等隱私計算技術(shù)可以在不直接共享數(shù)據(jù)的情況下進行模型訓(xùn)練,通過合理選擇協(xié)議和凍結(jié)策略,聯(lián)邦學(xué)習(xí)可在保證隱私的前提下提升模型性能,是保障分布式訓(xùn)練效率與模型收斂的關(guān)鍵,實際應(yīng)用中可根據(jù)數(shù)據(jù)分布、資源限制等靈活調(diào)整。通過在本地設(shè)備上進行模型訓(xùn)練,然后將模型參數(shù)上傳至中央服務(wù)器進行聚合,這樣既保證了數(shù)據(jù)的隱私性,又實現(xiàn)了數(shù)據(jù)資源的有效利用[16]。
3.2 模型適配與優(yōu)化
通用AI大模型雖然在許多領(lǐng)域表現(xiàn)出色,但在面對能源行業(yè)的特殊需求時,往往需要進行定制化改造。能源行業(yè)的數(shù)據(jù)特點和應(yīng)用場景要求模型不僅要具備高精度的預(yù)測能力,還要能夠在有限的計算資源下高效運行。因此,開發(fā)輕量化模型成為一種有效的解決方案。輕量化模型通過減少模型的復(fù)雜度和參數(shù)數(shù)量,降低了算力需求,同時保持了較高的性能。除此之外,增強模型的可解釋性和魯棒性也是模型適配與優(yōu)化的重要方面。在能源行業(yè)中,模型的決策過程需要透明可解釋,以便工程師和管理人員能夠理解和信任模型的輸出。通過引入局部可解釋模型(Local Interpretable Model-agnostic Explanations,LIME)和SHapley可加性解釋模型(SHapley Additive exPlanations,SHAP)等可解釋性AI技術(shù),可以使模型的決策過程更加透明[17]。同時,提高模型的魯棒性,使其能夠抵抗輸入數(shù)據(jù)的擾動和噪聲,對于確保模型在實際應(yīng)用中的穩(wěn)定性至關(guān)重要。另外結(jié)合強化學(xué)習(xí)和遷移學(xué)習(xí)技術(shù),可以使模型更好地適應(yīng)能源系統(tǒng)的動態(tài)變化。強化學(xué)習(xí)通過與環(huán)境的交互來學(xué)習(xí)最優(yōu)策略,適用于需要實時決策的能源管理系統(tǒng)。遷移學(xué)習(xí)則可以利用在一個領(lǐng)域?qū)W到的知識來改善另一個領(lǐng)域的模型性能,有助于處理能源行業(yè)中不同場景和任務(wù)之間的共性問題。
3.3 算力基礎(chǔ)設(shè)施
AI大模型的訓(xùn)練和推理過程對算力的需求極大,尤其是在處理復(fù)雜的能源系統(tǒng)模型時。為滿足這一需求,能源企業(yè)需要構(gòu)建高效的算力基礎(chǔ)設(shè)施。邊緣計算和云計算的結(jié)合提供了一種靈活的解決方案。邊緣計算節(jié)點可以部署在靠近數(shù)據(jù)源的地方,進行實時的數(shù)據(jù)處理和分析,減少了數(shù)據(jù)傳輸?shù)难舆t,提高了系統(tǒng)的響應(yīng)速度。云計算平臺則提供了強大的計算資源,適用于大規(guī)模的數(shù)據(jù)處理和模型訓(xùn)練。隨著全球?qū)Νh(huán)境保護的重視,利用綠色算力技術(shù)減少碳足跡也成為算力基礎(chǔ)設(shè)施建設(shè)的一個重要方向。通過采用可再生能源供電(如太陽能和風能),不僅可以降低能源消耗,還能減少溫室氣體排放,實現(xiàn)經(jīng)濟效益和環(huán)境效益的雙贏[18]。
3.4 安全與可靠性保障
能源系統(tǒng)的安全性直接關(guān)系到社會的穩(wěn)定和人民的生活質(zhì)量,確保AI大模型的安全性和可靠性至關(guān)重要。對抗樣本檢測和模型審計是提升模型安全性的有效手段。對抗樣本檢測可以識別和防御針對AI模型的惡意攻擊,而模型審計則可以對模型的訓(xùn)練過程和結(jié)果進行審查,確保模型的決策過程符合安全規(guī)范。此外,建立容錯機制和備份系統(tǒng)是保障模型運行可靠性的重要措施。容錯機制可以在模型出現(xiàn)故障時自動切換到備用方案,保證系統(tǒng)的連續(xù)運行。備份系統(tǒng)則可以防止數(shù)據(jù)丟失和模型損壞,確保在發(fā)生意外情況時能夠迅速恢復(fù)服務(wù)。通過這些技術(shù)手段,可以提高AI大模型在能源行業(yè)應(yīng)用中的安全性和可靠性,為能源系統(tǒng)的穩(wěn)定運行提供堅實的技術(shù)支撐[19]。
4 能源行業(yè)AI大模型工程化實踐關(guān)鍵環(huán)節(jié)
AI工程化整體流程涵蓋規(guī)劃設(shè)計、訓(xùn)練推理和應(yīng)用落地三個階段(如圖1所示)。在規(guī)劃設(shè)計階段,首要關(guān)注企業(yè)戰(zhàn)略和業(yè)務(wù)目標選擇,圍繞全鏈路規(guī)劃展開需求分析,包括業(yè)務(wù)目標分析、AI應(yīng)用場景分析、數(shù)據(jù)需求分析、技術(shù)可行性及算力需求分析等。同時,基于AI原生(AI Native)的系統(tǒng)方案設(shè)計強調(diào)業(yè)務(wù)需求理解、數(shù)據(jù)治理、模型優(yōu)化與部署以及監(jiān)控與運維的重要性,遵循以AI為核心、數(shù)據(jù)優(yōu)先、持續(xù)學(xué)習(xí)與迭代、自適應(yīng)與個性化等設(shè)計原則。在訓(xùn)練推理階段,針對通用AI大模型存在的“有幻覺、成本高”等問題,行業(yè)、領(lǐng)域AI大模型成為落地“人工智能+”的有效手段,企業(yè)需根據(jù)自身情況選擇開發(fā)L1行業(yè)模型或L2場景模型,并依托成熟工具平臺支撐數(shù)據(jù)集工程交付能力,同時注重模型體系設(shè)計與選擇、訓(xùn)練及調(diào)優(yōu)以及推理優(yōu)化及評估等關(guān)鍵環(huán)節(jié)。在應(yīng)用落地階段,智能體應(yīng)用為AI大模型應(yīng)用落地提供技術(shù)化手段,通過構(gòu)建檢索增強生成(Retrieval-Augmented Generation,RAG)知識庫解決私域數(shù)據(jù)利用及實時性問題,同時智能體構(gòu)建的技術(shù)方法手段多樣,包括通過開發(fā)框架直接開發(fā)和基于智能體使能平臺構(gòu)建應(yīng)用,且智能體全生命周期可觀測體系和集群全生命周期管理體系為企業(yè)AI應(yīng)用的穩(wěn)定運行和持續(xù)優(yōu)化提供保障。
圖1 AI大模型工程化實踐流程與環(huán)節(jié)
4.1 規(guī)劃設(shè)計階段
4.1.1 需求分析
需求分析是AI大模型工程化的起點,需圍繞能源企業(yè)戰(zhàn)略目標展開全鏈路規(guī)劃。首先明確業(yè)務(wù)目標,例如通過AI大模型優(yōu)化能源生產(chǎn)調(diào)度,目標是提升發(fā)電效率提升、降低能耗成本;通過預(yù)測性維護減少設(shè)備故障率,目標是減少非計劃停機時間。其次,深入分析AI大模型應(yīng)用場景,細化需求清單,例如在智能巡檢中需支持無人機+傳感器多模態(tài)數(shù)據(jù)融合,日均處理上萬條設(shè)備運行數(shù)據(jù);在能源交易中需實現(xiàn)動態(tài)價格預(yù)測,預(yù)測準確率提升至90%[20]。數(shù)據(jù)需求分析需確認數(shù)據(jù)類型、來源及質(zhì)量標準,確保數(shù)據(jù)全面且無偏差,尤其關(guān)注數(shù)據(jù)時效性。技術(shù)可行性分析需評估AI大模型是否支持能源行業(yè)特定功能,如時間序列預(yù)測、設(shè)備故障診斷等,并驗證其在現(xiàn)有IT環(huán)境中的兼容性。算力需求分析需綜合考慮中央處理單元(Central Processing Unit,CPU)、GPU、通用算力與現(xiàn)場可編程門陣列(Field-Programmable Gate Array,F(xiàn)PGA)、專用集成電路(Application-Specific Integrated Circuit,ASIC)異構(gòu)算力的配置,結(jié)合能源生產(chǎn)峰谷特性制定彈性擴展方案,例如在用電低谷期進行批量訓(xùn)練任務(wù)。最后進行成本與安全分析,估算數(shù)據(jù)采集、模型訓(xùn)練、推理部署等全流程成本,并開展數(shù)據(jù)加密、訪問控制等合規(guī)性審查,確保符合能源行業(yè)數(shù)據(jù)安全標準。
4.1.2 方案設(shè)計
方案設(shè)計以AI Native理念為指導(dǎo),構(gòu)建端到端的能源行業(yè)AI系統(tǒng)架構(gòu)。其中算力基礎(chǔ)設(shè)施設(shè)計應(yīng)采用混合云架構(gòu),核心訓(xùn)練任務(wù)部署在高性能計算集群,推理任務(wù)遷移至邊緣節(jié)點。數(shù)據(jù)集建設(shè)方案需涵蓋數(shù)據(jù)采集、清洗、標注、增強全流程,重點解決能源數(shù)據(jù)稀缺問題,例如通過生成對抗網(wǎng)絡(luò)(Generative Adversarial Network,GAN)擴充設(shè)備故障樣本集,或利用時序插值技術(shù)補全缺失數(shù)據(jù)。模型選擇與優(yōu)化需根據(jù)業(yè)務(wù)場景匹配模型類型,例如在負荷預(yù)測中選用長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)/Transformer架構(gòu),在設(shè)備故障診斷中采用Vision Transformer(ViT)模型,并通過模型蒸餾、剪枝等技術(shù)壓縮模型體積。智能應(yīng)用構(gòu)建需集成多模態(tài)交互能力,例如通過語音+圖像雙模態(tài)技術(shù)實現(xiàn)巡檢機器人自主識別設(shè)備異常。安全與隱私保護設(shè)計需貫穿全鏈路,采用聯(lián)邦學(xué)習(xí)實現(xiàn)跨區(qū)域數(shù)據(jù)協(xié)作,根據(jù)參與方協(xié)作方式、數(shù)據(jù)分布及場景應(yīng)用特點,選擇橫向聯(lián)邦、縱向聯(lián)邦、聯(lián)邦遷移學(xué)習(xí)等不同協(xié)議類型,從而制定動態(tài)凍結(jié)、靜態(tài)凍結(jié)、客戶端自適應(yīng)凍結(jié)等凍結(jié)策略;敏感數(shù)據(jù)通過同態(tài)加密技術(shù)保護,同時建立動態(tài)權(quán)限管控機制,防止數(shù)據(jù)泄露。
4.2 訓(xùn)練推理階段
4.2.1 數(shù)據(jù)集構(gòu)建
構(gòu)建高質(zhì)量數(shù)據(jù)集是能源行業(yè)AI大模型性能的基礎(chǔ)保障,需遵循“全面性-一致性-可解釋性”原則。數(shù)據(jù)收集階段需整合多源異構(gòu)數(shù)據(jù),例如匯聚數(shù)據(jù)采集與監(jiān)視控制(Supervisory Control And Data Acquisition,SCADA)系統(tǒng)實時運行數(shù)據(jù)、氣象站歷史天氣數(shù)據(jù)、地質(zhì)勘探報告等多模態(tài)數(shù)據(jù),形成跨模態(tài)數(shù)據(jù)池。數(shù)據(jù)清洗需去除噪聲與冗余信息,例如通過規(guī)則引擎過濾異常傳感器數(shù)據(jù),利用聚類算法剔除重復(fù)設(shè)備運行記錄。數(shù)據(jù)標注需引入主動學(xué)習(xí)機制,優(yōu)先標注不確定性高的樣本,將標注成本降低40%以上[21]。針對特定任務(wù)構(gòu)建專用數(shù)據(jù)集,例如在光伏發(fā)電場景中需包含光照強度、溫度、陰影遮擋等多維特征數(shù)據(jù),在輸電線路巡檢中需標注桿塔缺陷的像素級位置。預(yù)訓(xùn)練數(shù)據(jù)集注重規(guī)模與多樣性,需覆蓋不同能源類型和氣候條件;微調(diào)數(shù)據(jù)集強調(diào)領(lǐng)域特異性,例如在核電站安全監(jiān)控中需包含典型事故案例庫。數(shù)據(jù)動態(tài)更新機制需定期引入增量數(shù)據(jù),例如每日同步新能源電站發(fā)電量預(yù)測數(shù)據(jù),確保模型對環(huán)境變化的敏感性。
4.2.2 模型訓(xùn)練與推理
模型訓(xùn)練需根據(jù)任務(wù)特性選擇優(yōu)化策略,預(yù)訓(xùn)練階段采用大規(guī)模分布式訓(xùn)練框架,支持百億級參數(shù)模型的高效訓(xùn)練;微調(diào)階段應(yīng)用大模型的低秩自適應(yīng)(Low-Rank Adaptation,LoRA)技術(shù)凍結(jié)主干網(wǎng)絡(luò),僅更新少量參數(shù),即可實現(xiàn)顯存占用大幅度降低。推理優(yōu)化需結(jié)合能源行業(yè)硬件特性選擇框架,如云端推理采用TensorRT加速,推理延遲降至毫秒級別,滿足實時性需求;邊緣端部署開放神經(jīng)網(wǎng)絡(luò)交換(Open Neural Network Exchange,ONNX)推理引擎,支持INT8量化,能耗顯著降低,適應(yīng)智能終端的低功耗要求。針對特定場景開發(fā)定制化推理引擎,例如在光伏電站故障診斷中集成梯度加權(quán)類激活映射(Gradient-weighted Class Activation Mapping,Grad-CAM)可視化模塊,解釋模型決策依據(jù)。模型評估需建立多維度指標體系,分類任務(wù)采用F1分數(shù),回歸任務(wù)使用均方根誤差(Root Mean Square Error,RMSE),同時引入業(yè)務(wù)相關(guān)性指標。持續(xù)學(xué)習(xí)機制通過在線學(xué)習(xí)框架實現(xiàn)模型動態(tài)更新,例如在電力市場價格波動時自動調(diào)整預(yù)測模型參數(shù),確保模型在數(shù)據(jù)分布變化時保持性能穩(wěn)定。在AI大模型落地過程中,選擇先做L1行業(yè)模型還是先做L2場景模型,需根據(jù)業(yè)務(wù)目標、資源分配、市場需求和技術(shù)能力進行綜合評估。
4.3 應(yīng)用落地階段
4.3.1 RAG知識庫構(gòu)建
RAG知識庫通過整合結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),解決能源行業(yè)AI大模型的實時性與專業(yè)性問題。知識預(yù)處理階段需構(gòu)建領(lǐng)域本體庫,定義實體關(guān)系,并開發(fā)數(shù)據(jù)清洗規(guī)則,去除冗余文檔。數(shù)據(jù)處理采用雙軌制流程:結(jié)構(gòu)化數(shù)據(jù)通過ETL工具抽取特征,非結(jié)構(gòu)化數(shù)據(jù)經(jīng)BERT分詞后生成向量索引,存儲于Milvus向量數(shù)據(jù)庫。檢索模塊采用混合索引技術(shù),支持百億級文檔的秒級檢索,召回準確率提升至95%[22]。知識增強模塊集成Function Call接口,調(diào)用外部應(yīng)用程序編程接口(Application Programming Interface,API)獲取最新資訊,例如接入氣象預(yù)報服務(wù)實時更新風能/太陽能發(fā)電預(yù)測模型。版本管理機制記錄知識庫更新日志,支持A/B測試驗證知識有效性,典型應(yīng)用場景包括智能調(diào)度系統(tǒng)日均處理上萬條設(shè)備運行數(shù)據(jù),故障診斷助手覆蓋90%以上常見設(shè)備故障模式[23]。
4.3.2 智能體構(gòu)建
智能體通過多主體協(xié)作實現(xiàn)能源行業(yè)復(fù)雜任務(wù)分解與執(zhí)行。架構(gòu)設(shè)計采用“中心化調(diào)度+去中心化執(zhí)行”模式,中央控制器基于強化學(xué)習(xí)算法優(yōu)化任務(wù)分配策略,邊緣智能體自主完成子任務(wù)。大語言模型(Large Language Model,LLM)核心引擎支持上下文感知推理,通過記憶網(wǎng)絡(luò)模塊存儲歷史交互信息,實現(xiàn)跨輪次對話連貫性。開發(fā)框架提供低代碼接口,支持拖拽式創(chuàng)建智能體,典型應(yīng)用包括新能源電站巡檢機器人集群,單日處理設(shè)備異常報警量達1萬次[23]。全生命周期管理體系涵蓋需求分析、模型訓(xùn)練、部署監(jiān)控、退役回收4階段,建立健康檢查指標體系。安全管控機制通過沙箱環(huán)境隔離敏感操作,日志審計系統(tǒng)記錄所有API調(diào)用行為,符合ISO 27001合規(guī)要求。集群擴展采用Kubernetes自動伸縮策略,根據(jù)流量波動動態(tài)調(diào)整資源池規(guī)模,支撐百萬級并發(fā)訪問。
5 大型能源集團AI大模型平臺建設(shè)案例
為適應(yīng)技術(shù)發(fā)展趨勢,大型能源集團緊盯油氣行業(yè)智能化應(yīng)用發(fā)展趨勢,積極規(guī)劃AI建設(shè)。采用軟硬件一體化模式開展AI大模型平臺建設(shè)項目,涵蓋算力、存儲、網(wǎng)絡(luò)與安全4方面資源。算力資源方面,通算云主機用于通用辦公業(yè)務(wù),智算服務(wù)器承載AI大模型訓(xùn)練;存儲資源方面,通算固態(tài)硬盤(Solid State Drive,SSD)塊存儲掛載國產(chǎn)云主機,智算提供充足獨立存儲空間,滿足特定帶寬與每秒輸入/輸出操作次數(shù)(Input/Output Operations Per Second,IOPS)需求;網(wǎng)絡(luò)資源方面,云上互聯(lián)網(wǎng)帶寬供應(yīng)用訪問,高速專線實現(xiàn)智算資源池與內(nèi)網(wǎng)互通,智算服務(wù)器計算節(jié)點及計算與存儲節(jié)點有高速互聯(lián);安全資源方面,滿足國家等級保護2.0三級標準,從多個維度提供多種安全保障。圍繞智能油氣田、智能工程、智能工廠、智能貿(mào)銷、智能供應(yīng)鏈、智能管理、智能辦公等8大類100多個業(yè)務(wù)場景模型,聚力實現(xiàn)小模型和大模型兼?zhèn)?、專業(yè)場景和通用場景兼容、生產(chǎn)和經(jīng)營管理全覆蓋,支持集團上中下游業(yè)務(wù),如圖2所示。
圖2 大型能源集團AI大模型平臺架構(gòu)
5.1 典型專業(yè)場景
注采聯(lián)動模型:以穩(wěn)油控水為目標,基于油田20余年積累的海量數(shù)據(jù),融合AI與專家經(jīng)驗,通過“智能診斷-方案制定-遠程調(diào)控”閉環(huán)管理,實現(xiàn)精準注水、故障預(yù)防和油藏優(yōu)化,提升油田采收率、延長設(shè)備周期推動降本增效。
安全鉆井模型:運用機器視覺技術(shù)構(gòu)建智能化安全監(jiān)控體系,可快速識別海洋鉆完井作業(yè)風險,顯著降低不安全行為發(fā)生率,替代傳統(tǒng)人工巡檢、緊盯監(jiān)控畫面的傳統(tǒng)模式,有效保障作業(yè)人員安全,同時提升作業(yè)效率與質(zhì)量,為海洋油氣開發(fā)提供智能化支撐。
油氣貿(mào)銷模型:融合AI技術(shù),實現(xiàn)液化天然氣(Liquefied Natural Gas,LNG)價格智能預(yù)測、進口通關(guān)提速、物流運輸智能監(jiān)管和油氣銷售精準營銷,在資源采購環(huán)節(jié),率先研發(fā)LNG現(xiàn)貨價格智能預(yù)測系統(tǒng),采購效率多維度提升,返稅周期顯著縮短、違規(guī)情況大幅減少。
5.2 典型通用場景
智能招采場景:聚合內(nèi)外部數(shù)據(jù),實現(xiàn)企業(yè)實力評估與風險篩選,幾分鐘內(nèi)生成招標文件初稿,支持標書比對與自動評分,快速識別異常行為,顯著提升招標編制和評標效率。
智能寫作場景:通過自然語言處理技術(shù),實現(xiàn)素材搜索、智能排版、輔助創(chuàng)作、精準校對等功能,對于在多類型文章寫作方面需求大的員工可極大提升文檔處理效率和準確性。
智能會議場景:利用語音識別、聲紋識別和AI大模型等技術(shù),實現(xiàn)實時轉(zhuǎn)寫與翻譯、錄音轉(zhuǎn)寫、智能摘要和紀要生成等功能,有效解決了會議記錄難整理和效率低下的問題,確保會議紀要的及時輸出和質(zhì)量提升。
6 結(jié)束語
AI大模型工程化落地是能源行業(yè)轉(zhuǎn)型升級的核心驅(qū)動力,也是AI產(chǎn)業(yè)縱深發(fā)展的關(guān)鍵環(huán)節(jié),但目前仍面臨多重挑戰(zhàn)。技術(shù)層面,能源數(shù)據(jù)因多源異構(gòu)、隱私性高需構(gòu)建標準化治理體系,通用AI大模型難以適配行業(yè)特殊場景,亟需開發(fā)輕量化、可解釋的定制化模型;政策層面,專項激勵政策與標準規(guī)范缺失,導(dǎo)致技術(shù)轉(zhuǎn)化動力不足;市場層面,企業(yè)接受度低、投資回報機制模糊制約規(guī)?;瘧?yīng)用。破解路徑包括通過聯(lián)邦學(xué)習(xí)等技術(shù)強化數(shù)據(jù)安全,開發(fā)融合物理規(guī)律的行業(yè)AI大模型;制定財稅補貼、場景開放等政策,建立能源AI標準體系;構(gòu)建“政產(chǎn)學(xué)研用”協(xié)同生態(tài),推動技術(shù)-產(chǎn)業(yè)閉環(huán)。未來,AI大模型工程化將從單點創(chuàng)新轉(zhuǎn)向全鏈條落地,以多模態(tài)AI大模型加速跨領(lǐng)域融合、邊緣計算提升實時決策能力、綠色算力降低應(yīng)用成本為主要趨勢,AI大模型將深度賦能能源生產(chǎn)優(yōu)化、助力碳達峰碳中和目標實現(xiàn),同時為智能制造、智慧城市等領(lǐng)域提供范式參考,釋放萬億級經(jīng)濟社會價值。
Research on engineering practices of large-scale AI models in energy sector
WANG Yuhang, SHI Xiang, SHEN Yitong
(China Telecom Digital Intelligence Co., Ltd., Beijing 100035, China)
Abstract: Amidst the accelerating global energy transition, decarbonization and digitalization have emerged as central priorities for the energy industry. Artificial Intelligence (AI) technologies, leveraging their robust capabilities in data analytics, predictive optimization, and intelligent decision-making, are profoundly transforming production, transmission, and consumption patterns in the energy sector. While recent breakthroughs in large-scale AI models (such as GPT, BERT, etc.) for natural language processing and computer vision demonstrate growing potential for energy applications, their industrial deployment faces multifaceted challenges including technical compatibility, data quality, and computational costs. This study investigates critical implementation aspects of large-scale AI models in energy systems, integrating analysis of industry trends, technological applications, and representative case studies to propose systematic solutions for practical adoption.
Keywords: energy sector; artificial intelligence; large-scale models; engineering practices
本文刊于《信息通信技術(shù)與政策》2025年 第6期
作者簡介
王宇航:中電信數(shù)智科技有限公司智慧城市研究院解決方案專家,工程師,長期致力于人工智能、大數(shù)據(jù)、數(shù)字孿生等新一代信息技術(shù)在數(shù)字政府、智慧城市的應(yīng)用研究。
史翔:中電信數(shù)智科技有限公司智慧城市研究院解決方案部門負責人,主要從事數(shù)字政府、智慧城市及新技術(shù)、新業(yè)務(wù)的研究與咨詢工作。
申一彤:中電信數(shù)智科技有限公司智慧城市研究院院長助理,長期負責城市及企業(yè)數(shù)字化轉(zhuǎn)型研究及市場推廣工作。
論文引用格式:
王宇航, 史翔, 申一彤. 能源行業(yè)AI大模型工程化實踐研究[J]. 信息通信技術(shù)與政策, 2025, 51(6): 52-59.
評論