7月以來,數(shù)字開物已收集超過百份"AI大模型應(yīng)用場景"案例報名申請及產(chǎn)業(yè)問題,聚焦這些大模型應(yīng)用落地的真實產(chǎn)業(yè)問題,8月6日順利召開了"AI大模型應(yīng)用場景"產(chǎn)學(xué)研融通創(chuàng)新活動——產(chǎn)業(yè)問題專家研討會。
與會期間,中國科協(xié)企業(yè)創(chuàng)新服務(wù)中心、中關(guān)村產(chǎn)業(yè)技術(shù)聯(lián)盟聯(lián)合會與中國通信工業(yè)協(xié)會數(shù)據(jù)中心委員會相關(guān)領(lǐng)導(dǎo),中國信息通信研究院人工智能所、北京智源人工智能研究院、清華大學(xué)、北京服裝學(xué)院繼續(xù)教育學(xué)院等科研機構(gòu)及院校專家,以及中國三峽集團武漢科創(chuàng)園、電信安全、西云算力、火山引擎、科大訊飛、靈汐科技等各領(lǐng)域領(lǐng)軍企業(yè)代表展開了深入探討,20多位各專家及企業(yè)代表從算力、數(shù)據(jù)、算法、產(chǎn)業(yè)生態(tài)和人才等多個維度,深入剖析當前AI大模型應(yīng)用發(fā)展面臨的機遇與挑戰(zhàn)。
總的來看,我國大模型發(fā)展面臨著多方面的挑戰(zhàn):
算力層面
國內(nèi)算力缺口問題依然存在,尤其智能算力。隨著技術(shù)的不斷迭代,算力需求持續(xù)增加,導(dǎo)致算力缺口不斷擴大。與此同時,通信、能源等相關(guān)領(lǐng)域的瓶頸也進一步加劇了這一問題。
國內(nèi)算力缺口問題
從技術(shù)方面來看,高端算力的自主可控是一個關(guān)鍵問題。盡管中國在總體算力規(guī)模上已位居世界前列,但在高端芯片等核心硬件方面仍存在較大差距,這直接影響了大模型的訓(xùn)練效率和規(guī)模。此外,國內(nèi)大模型在某些關(guān)鍵技術(shù)上依賴國外,缺乏原創(chuàng)性算法模型,導(dǎo)致產(chǎn)品技術(shù)水平出現(xiàn)同質(zhì)化競爭。
從成本方面來看,盈利壓力對大模型發(fā)展構(gòu)成了挑戰(zhàn)。企業(yè)出于盈利考慮,難以將所有算力投入大模型研發(fā)。如果短期內(nèi)無法從大模型業(yè)務(wù)中獲得盈利,企業(yè)可能會放棄這條產(chǎn)業(yè)線,轉(zhuǎn)而發(fā)展其他業(yè)務(wù)。即使企業(yè)意識到算力缺口的存在,但為了保證盈利,他們也不可能無限投入到大模型研發(fā)中。
數(shù)據(jù)層面
當前我國在行業(yè)數(shù)據(jù)積累方面還存在明顯不足,現(xiàn)有的數(shù)據(jù)質(zhì)量普遍不高,結(jié)構(gòu)化的高質(zhì)量數(shù)據(jù)相對匱乏,特別是專業(yè)領(lǐng)域高質(zhì)量數(shù)據(jù)不足。
高質(zhì)量數(shù)據(jù)相對匱乏
例如,國產(chǎn)模型生成視頻經(jīng)常出現(xiàn)外國人臉的現(xiàn)象,分析其背后的原因發(fā)現(xiàn),一是國內(nèi)的視頻資源不夠豐富,所以必須用國外的影視資料來進行訓(xùn)練,二是即使能夠獲取國內(nèi)視頻數(shù)據(jù),企業(yè)也會擔心肖像安全隱私問題,不敢使用。
多模態(tài)異構(gòu)數(shù)據(jù)的整理和處理是面臨挑戰(zhàn),尤其是海量歷史數(shù)據(jù)的人工標注工作非常耗時。
數(shù)據(jù)安全與隱私保護問題,數(shù)據(jù)脫敏與安全管理能力不足,個人隱私數(shù)據(jù)買賣等問題依然存在。
數(shù)據(jù)確權(quán)和流通問題,缺乏統(tǒng)一的數(shù)據(jù)安全分類標準,不同行業(yè)數(shù)據(jù)交易存在認可度和安全性問題,數(shù)據(jù)分散在不同機構(gòu)手中,由于缺乏有效的流動和共享機制,企業(yè)數(shù)據(jù)共享意愿低。
應(yīng)用層面
模型在復(fù)雜業(yè)務(wù)場景中的應(yīng)用存在挑戰(zhàn)。當前大模型在處理多步驟、多變量的復(fù)雜業(yè)務(wù)流程時,仍存在理解和執(zhí)行上的局限性。
行業(yè)垂直應(yīng)用落地難題不斷。不同行業(yè)有其特殊的知識體系和業(yè)務(wù)邏輯,如何將通用大模型有效地適配到特定行業(yè),實現(xiàn)從技術(shù)到價值的轉(zhuǎn)化,仍然面臨諸多挑戰(zhàn)。
例如,在特定領(lǐng)域如醫(yī)藥、新能源等行業(yè),構(gòu)建專業(yè)知識圖譜和智能問答系統(tǒng)面臨技術(shù)挑戰(zhàn),需要深度融合行業(yè)專業(yè)知識與AI技術(shù)。
再比如,大語言模型問答形式在一些傳統(tǒng)制造業(yè)落地應(yīng)用中難以得到生產(chǎn)單位認可。一些生產(chǎn)單位決策者會關(guān)心成本的問題、人力的問題,僅僅是問答應(yīng)用意愿度不高,例如,有傳統(tǒng)制造業(yè)上產(chǎn)單位認為一線的巡檢人員,能把業(yè)務(wù)要求流程背得滾瓜爛熟,為什么還要用這個問答系統(tǒng)。
大模型應(yīng)用
產(chǎn)業(yè)生態(tài)層面
模型廠商方面,缺應(yīng)用缺場景。算力、模型做差不多了,應(yīng)用場景目前看不到爆發(fā)點,展開來說,廠商在探索場景時面臨一系列問題,如算力能否支持、業(yè)務(wù)本身是否能做大模型、技術(shù)是否可達以及、數(shù)據(jù)歸屬問題、安全性等因素都具有不確定性。
尤其是B端大模型應(yīng)用推廣效果不如預(yù)期,企業(yè)級客戶對模型精準度要求最高,如何將模型適配到產(chǎn)業(yè)發(fā)展上?
企業(yè)客戶方面,一些B端客戶在引入大模型時候,對AI大模型能做什么,不能做什么,能做到什么階段沒有清楚的認知,企業(yè)在實際部署模型時不能清晰提出需求,是否需要進行教育培訓(xùn)?
此外,整個產(chǎn)業(yè)還面臨人才供需不平衡的問題。一是人才短缺,高端人才嚴重不足。例如,技術(shù)方懂技術(shù)不懂業(yè)務(wù),客戶懂業(yè)務(wù)不懂技術(shù),懂技術(shù)又懂業(yè)務(wù)交叉型的人才少,再比如在算力方面萬卡集群調(diào)優(yōu)高端人才短缺。二是行業(yè)人才有動態(tài)需求,企業(yè)很難能在一個時段找到合適的人。
關(guān)于人才短缺的問題是需要教育口來培養(yǎng)人才還是產(chǎn)業(yè)端自己培養(yǎng)人才來完成供給也面臨著矛盾。
針對研討會所探討的一系列算力瓶頸、數(shù)據(jù)困境、模型開發(fā)落地挑戰(zhàn)、產(chǎn)業(yè)生態(tài)創(chuàng)新不足等問題和挑戰(zhàn),誠摯邀請各企業(yè)參與“AI大模型應(yīng)用場景解決方案”征集活動,歡迎能提供創(chuàng)新解決方案的企業(yè)踴躍報名。
“AI大模型應(yīng)用場景解決方案”征集活動
-掃碼申報-
“AI大模型應(yīng)用場景”產(chǎn)學(xué)研融通創(chuàng)新活動流程
解決方案征集:2024年8月8日-8月28日
解決方案專家論證會:2024年8月30日
供需對接洽談會:2024年9月3日
發(fā)布/參會時間:2024年9月26日