奔馳即將在中國開展自動駕駛L4級測試、文遠知行獲準在美國進行自動駕駛汽車載客測試、英偉達和聯(lián)發(fā)科合作開發(fā)的AI PC芯片……生成式AI在多個領域正在加速融合與快速迭代。
中國AI大模型
作為生成式AI核心技術(shù)之一的大模型,在我國多個領域的融合應用正呈現(xiàn)出前所未有的活躍態(tài)勢,尤其是在工業(yè)等產(chǎn)業(yè)應用場景應用中,中國AI大模型不止會聊天,也正在突破傳統(tǒng)行業(yè)的技術(shù)瓶頸,帶來顛覆性的變革。
而“中國AI大模型的應用落地方向究竟在哪里?”這個話題成為當下最核心的關注點。
日前,中國信息通信研究院人工智能所專家在8月初召開的“AI大模型應用場景”產(chǎn)學研融通創(chuàng)新活動——產(chǎn)業(yè)問題專家研討會上談到AI大模型應用方向時表示:“大模型的實際應用價值正在受到多方關注,市場希望大模型能夠解決工業(yè)化問題,推動生態(tài)力和新型工業(yè)化發(fā)展,而不是僅僅停留在聊天、生成視頻和圖片的層面。”
火山引擎生態(tài)合作專家也提到:“大模型C端應用產(chǎn)品用量最大,而企業(yè)級客戶對模型精準度要求最高,B端企業(yè)級應用還沒跑出來,如何將模型適配到產(chǎn)業(yè)發(fā)展上是個難題。”
那么問題來了,中國的AI大模型想要將AI大模型適配到產(chǎn)業(yè)發(fā)展上,有效轉(zhuǎn)化為實際的產(chǎn)業(yè)價值,在其實際應用落地過程中會遇到多少挑戰(zhàn)?
技術(shù)方面
首先是模型幻覺問題,大模型幻覺問題是一直存在的,生成的一些看上去比較合理,但其實是不正確的答案。對于生產(chǎn)制造企業(yè)來說,這個風險隱患是不能有的。
其次是基礎通用大模型能力不足,模型迭代較慢,關鍵技術(shù)依賴國外,多訴求下的專業(yè)模型建模存在技術(shù)困難。例如三峽提出的問題,安全角度出發(fā),要求水位盡量降低,水位過高當洪水發(fā)生時會有安全隱患,發(fā)電需求角度出發(fā),要求水位越高越好,水位高、水頭高發(fā)電量就大,這時兩方的需求是矛盾的。在這種多訴求目標下進行基礎建模,大模型廠商的能力可能還是不足的。
最后是數(shù)據(jù)質(zhì)量的問題,例如,國產(chǎn)模型生成視頻經(jīng)常出現(xiàn)外國人臉的現(xiàn)象,分析其背后的原因發(fā)現(xiàn),一是國內(nèi)的視頻資源不夠豐富,所以必須用國外的影視資料來進行訓練,二是即使能夠獲取國內(nèi)視頻數(shù)據(jù),企業(yè)也會擔心肖像安全隱私問題,不敢使用。
智源研究院專家表示:“國家一直在倡導數(shù)據(jù)先行。數(shù)據(jù)雖然看似特別多,但是真正用起來的高質(zhì)量的數(shù)據(jù)非常非常少。行業(yè)數(shù)據(jù)、專業(yè)數(shù)據(jù)等高質(zhì)量數(shù)據(jù)難以獲取,這些數(shù)據(jù)大量都掌握在企業(yè)端和專業(yè)的機構(gòu)端,渠道的打通是問題。”
此外還有多模態(tài)的、異構(gòu)的數(shù)據(jù)的整理和處理是目前工作的難點之一,它需要花大量的時間和精力。清華大學計算機系原系主任、教授周立柱表示:“創(chuàng)建人工智能大模型,建模和算法占20%,數(shù)據(jù)準備占80%。建立不同的模型,需要選擇不同的數(shù)據(jù)。數(shù)據(jù)選擇以后進行數(shù)據(jù)清洗,數(shù)據(jù)清洗完以后數(shù)據(jù)增強之后數(shù)據(jù)混合,最后再數(shù)據(jù)集成。但這一系列的步驟需要大量的人力,需要這個生態(tài)系統(tǒng)里面的很多工具進行支持。”
算力方面
國內(nèi)算力缺口不斷擴大,尤其智能算力。清華大學計算機系原系主任、教授周立柱還表示:“高端算力尚未實現(xiàn)自主可供,關鍵就是只能自主發(fā)展了。比如算力中心的安全運營需要相關設備場上的創(chuàng)新支持,算力中心安全涉及的問題很多。”
科智咨詢研究總監(jiān)弓瑞峰表示:“算力方面主要是高端算力不足,工信部數(shù)據(jù)顯示,總算力美國35%,中國31%,差距較??;智能算力美國45%中國28%,中美差距較大,高端算力的不足導致的直接后果就是中國千億以上參數(shù)大模型訓練算力不足,大模型能力受到影響。”
此外,如果要建千億以上的大模型,訓練數(shù)據(jù)需要包括上萬塊卡,智算中心運營壓力非常大。在智算中心,一臺GPU一臺服務器可能要上千瓦的耗電量,功耗非常大,有時候普通機柜跟一個GPU服務器機柜耗電量可能相差十倍,電費也可能相差十倍。
不僅如此,大模型在應用落地過程還缺乏場景需求,一方面企業(yè)行業(yè)有需求,另一面行業(yè)熱度也在降溫,到底算力支持跟不跟得上,業(yè)務本身到底能不能做大模型,技術(shù)到底可不可達以及安全性,數(shù)據(jù)歸屬等問題都有不確定性,所以企業(yè)場景落地還在摸索。
業(yè)內(nèi)專家還表示,在新能源行業(yè)很關心這個大模型是怎么發(fā)揮它的價值,在落地過程中發(fā)現(xiàn),很多生產(chǎn)單位其實對于問答用大模型來做問答不是特別感興趣,更關心成本問題。
其次是技術(shù)人才,在大模型場景落地中,會遇到技術(shù)方懂技術(shù)不懂業(yè)務,客戶懂業(yè)務不懂技術(shù),雙方溝通成本較高,懂技術(shù)又懂業(yè)務交叉型的人才少,例如醫(yī)療領域,有醫(yī)療背景又懂技術(shù)的人是能幫助技術(shù)大模型落地重要環(huán)節(jié)。
現(xiàn)誠邀AI大模型應用場景解決方案及數(shù)字化轉(zhuǎn)型企業(yè)踴躍申報參與由中國科協(xié)企業(yè)創(chuàng)新服務中心主辦的"產(chǎn)學研融通創(chuàng)新活動"——《AI大模型應用場景》案例集評選。
“AI大模型應用場景”產(chǎn)學研融通創(chuàng)新活動
2024年6月,率先啟動“產(chǎn)學研融通創(chuàng)新活動”,本活動由中國科協(xié)企業(yè)創(chuàng)新服務中心主辦,中關村產(chǎn)業(yè)技術(shù)聯(lián)盟聯(lián)合會、中國通信工業(yè)協(xié)會數(shù)據(jù)中心委員會(CIDC)承辦,數(shù)字開物、中國IDC圈協(xié)辦,聚焦AI大模型場景應用上中下游企業(yè),面向產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的央國企及行業(yè)龍頭企業(yè)、中國優(yōu)秀大模型企業(yè)及大模型解決方案企業(yè)、支撐AI大模型的算力基礎設施領域企業(yè)全面征集優(yōu)秀企業(yè)案例,全方位彰顯國內(nèi)外數(shù)字領域領先企業(yè)在中國產(chǎn)業(yè)數(shù)字化進程中的突出成就。