●四川已經匯聚了30多個行業垂直大模型,涉及智能制造、文化旅游、醫學診療等領域,成為四川發展人工智能產業的重要引擎
●與通用大模型相比,垂直大模型更像一個“專才”,需要足夠豐富和高質量的垂直行業訓練數據
●四川有130多家大模型相關企業,但超過九成都分布在產業鏈的基礎層,涉及技術層和應用層的上下游供應商相對缺乏
2022年底,一則“AI創業公司Open AI推出ChatGPT”的消息讓成都明途科技有限公司首席技術官嚴帥徹夜難眠。
“很久沒這麼激動過了。”嚴帥說,這款叫大模型的應用不像搜索引擎這樣耗費大量時間去拆解信息,而是具備了一定的抽象思維能力。“與以往任何一款人工智能應用不同,大模型更像科幻電影裡的人工智能,它將引領未來產業的發展。”
預感很快成為現實,在ChatGPT問世不久,谷歌、Meta、亞馬遜、百度、阿裡等企業先后加入,成百上千個大模型如雨后春筍般涌現,生成式人工智能遍地開花,一時間,文本生成、文生圖、語音處理、代碼處理、視頻處理等應用產品海量井噴。
搶佔人工智能發展機遇,企業忙著“百模大戰”,各地也開啟大模型競速賽,北京、上海、廣東、浙江等地推出大模型扶持政策,完善發展所需的配套支持。
在這場競速中,四川的企業也沒有置身其外。不過,它們大多沒有選擇通用大模型、基礎大模型作為切入賽道,而是立足自身基礎和產業優勢,聚焦行業垂直大模型發展。近兩年時間過去了,這些分布在智能制造、文化旅游、醫學診療等領域的大模型成長情況如何?遇到哪些問題?未來又該如何發展?近日,記者走進這些大模型企業,一探究竟。
如果有一個投資未來的機會,你願不願意“賭”一把?這是較早一批進入大模型賽道川企面臨的選擇。
成立於2017年的成都考拉悠然科技有限公司是其中之一,走進該企業的辦公大樓,牆面上標語簡單明了:構建萬物AI的美好世界。企業首席架構師謝治宇介紹,自成立以來,企業便聚焦人工智能核心領域成果實現轉化。
“我們差不多在2020年進入大模型賽道。”謝治宇說,在傳統人工智能模式下,如果研發一個應用,需要開發一個模型,這樣成本太高,效果也不好。他以城市交通道路管理舉例,如果要研發一個抓闖紅燈的應用,那麼它很可能不具備抓超速、違規變道的能力。“當時我們就在想,有沒有一種可能,開發一個多模態的工具,可以同時解決幾十到上百個任務,讓AI研發從碎片走向集成化。”
與謝治宇有著相同感受的是嚴帥,他所在的明途科技在2019年研發了一款辦公輔助機器人,方便用戶在不同場景下的咨詢工作。“但也有一些不足。”嚴帥說,在面對用戶提問時,這款機器人會從數據庫裡面找尋對應答案,從而進行匹配,如果用戶的意圖表達不明確,或者需要更加定制化的答案時,機器人就很難滿足用戶的需求。“我們希望能夠打造一款既能懂客戶需求,又能根據客戶需求給出定制化答案的智能機器人。”
2022年11月30日,ChatGPT橫空出世,其強大的生成能力和廣泛的應用前景,讓更多人看到了人工智能產業躍升的可能。幾乎同一時間,2022年11月25日,國家互聯網信息辦公室、工業和信息化部、公安部聯合發布《互聯網信息服務深度合成管理規定》,為人工智能信息服務劃出“底線”和“紅線”。
技術的突破和法律制度逐漸規范,讓更多企業看到了未來發展方向。嚴帥說,ChatGPT出現不久,企業召開了一場內部會議,決定將此前的工作全部遷移到大模型上,后來他們推出了一款政府服務大模型MT-WorkGPT。“我們現在的很多產品都是基於這個模型打造,比如在自貢燈會期間,我們推出一款數字人,小到哪個入口人少,大到本屆燈會有哪些亮點,它都知道。”
如同自貢燈會數字人一樣,四川多個行業垂直大模型正在行業舞台上嶄露頭角,不斷破解行業痛點。
走進成都數之聯科技股份有限公司,一台台看似並不起眼的機器正在對各類工業品進行缺陷檢測。“這是我們基於工業缺陷檢測領域大模型打造的智能檢測產品,可以幫助企業對工業品進行缺陷檢測。”該企業董事長傅彥表示,這些產品檢測准確率高達99%,可以幫助生產企業節約超八成的人力成本。
“請幫我規劃一條看雪景的線路。”文旅大會上,游客向數字化大熊貓“安逸”咨詢,不到3秒鐘,“安逸”就根據用戶需求定制了游玩路線。該產品的制作方,四川川投智勝數字科技有限公司工作人員介紹,這款數字化大熊貓基於AI文旅大模型打造,不僅可以完成線路規劃,還可以提供交通安排、住宿預訂等服務。
7月28日,由國家超級計算成都中心、中國地震局地球物理研究所與清華大學聯合開發的“諦聽”地震波大模型正式發布。這款大模型的特別之處在於,它是一款“聽”地震的“神獸”,可以用於地震信號識別、地震活動監測、大地震快速響應等環節,還將拓展到礦震檢測、地下空間結構探測、海底地震檢測等領域。
“行業垂直大模型的故事才剛剛開始。”科技廳相關負責人說,目前,四川已經匯聚了30多個行業垂直大模型,涉及智能制造、文化旅游、醫學診療等領域,未來,將結合市場需求和資源優勢,支持研發更多細分領域大模型。
大模型發展如火如荼,但機遇和挑戰並存。茁壯成長中的四川垂直大模型也有成長中的“煩惱”。
“貧窮限制了你的想象,這句話放在大模型中再合適不過了。”一些受訪者提到,不管是通用大模型還是行業垂直大模型,其邏輯都是一樣,就是給人工智能投喂一波學習資料,讓它自己學習,訓練出一個初始模型,然后讓它做題,再用“標准答案”來檢驗,碰到做錯的題就反向微調模型的參數,通過“預訓練+精調”提升模型的准確率,當參數和數據規模達到一個質變的閾值,大模型會猛然“醒悟”,出現了“涌現”效應。
為此,一些企業不得不將大部分成本投入算力之中,以實現“大力出奇跡”。“大模型訓練的時長或者創新的快慢,根本上取決於算力的大小。”一位從事智能制造行業垂直大模型的負責人告訴記者,他們訓練成本七成用於算力,推理成本九成用於算力,每年光花在算力的成本就有上百萬元。“但即使這樣,我們的算力還是緊缺。”
比算力更讓人頭疼的是數據。“與通用大模型相比,垂直大模型更像一個‘專才’,需要足夠豐富和高質量的垂直行業訓練數據。”“本草智庫”中藥全產業鏈大模型技術負責人陳偉介紹,他們花了10多年的時間,建立了含2000余萬個實體和超20億個關系對的知識圖譜,生成了一系列覆蓋中藥全產業鏈關鍵環節的數據,讓大模型在中藥種植、質量控制、藥物研發等中藥全產業鏈關鍵環節中具備了決策支持能力。
“但如果要實現問診等交互功能,還需要對知識更深度的挖掘。”一位從事醫學診療大模型的企業代表說,醫療行業的大量知識並沒有在互聯網上呈現,甚至很多都是醫生經驗性的認知積累,行業內擅長復雜推理的專家,其最具價值的思維框架、思維模式遠未形成文檔化或者數字化。“行業垂直大模型瞄准特定的行業和需求,但目前訓練的數據來源主要來自互聯網、社交、搜索等渠道,如果沒法挖掘出這些‘隱性’數據,將限制大模型的訓練效果和應用性能。”
如果說數據和算力是大模型的基礎設施,那麼訓練則體現了更多“人”的因素。謝治宇認為,就訓練大模型而言,參數的數量並不是最重要的,工程化過程中的調優才是真正的考驗。“這些垂直領域不同類型的數據進來之后,需要人類專家總結成不涉及隱私信息的領域知識,‘合成’為大模型的‘專業教材’,才能研發出更有針對性的產品。”
經歷了幾年發展,從業者們既感到興奮,又感到焦慮,興奮的是,他們正在參與一場新的產業變革,焦慮在於行業真的太“卷”了。
從“卷”技術到“卷”價格再到“卷”應用,一個“卷”字背后,折射出的是大模型正從“星星之火”走向“燎原之勢”,企業不斷拓展創新邊界,催生出新的消費需求。根據國家網信部門官網公示的信息,自2023年8月31日我國首批通過備案的人工智能大模型名單出爐以來,截至今年8月,全國已有188款大模型完成備案。
科研和產業力量“卷”進去,是為了在市場中贏得先機,渴望捕捉先機的城市“卷”起來,看中的則是大模型等技術突破所帶來的生產力飛躍。
“爭奪大模型,就是爭奪下一個技術時代的基礎平台。”四川省人工智能行業協會秘書長陳章說,從去年開始,北京、上海、廣東等傳統數字重鎮紛紛入局,打響“大模型之都”的爭奪戰。他同時注意到,各地發展側重各有不同:作為“大模型第一城”的北京,重點突破基礎理論研究,鼓勵開展大模型的創新算法和關鍵技術研發﹔算力硬件是上海的強項,正在加快建成具有區域乃至全國影響力的智能算力創新及應用示范區﹔廣東則更聚焦大模型對實體經濟的賦能。
對於四川,不少受訪者提到,要立足產業基礎和場景優勢,深耕垂直領域,形成在細分賽道的獨特競爭優勢。“從2014年成立以來,我們就專注於電商和線上零售領域人工智能客服這一細分賽道。”成都曉多科技有限公司政企業務總監宋建說,他們通過10年時間在細分賽道的堅持和發展,積累了關於商品、行業上下游、行業政策以及產品使用場景相關的海量領域經驗和知識,這些經驗和知識可以更好地為用戶提供智能化和個性化的服務,進一步提升服務效率,降低服務成本。“我們比客戶更懂AI,比大廠更懂業務。”
除了明細路徑,還要搭建好生態平台。陳章注意到一個細節,四川有130多家大模型相關企業,但超過九成都分布在產業鏈的基礎層,涉及技術層和應用層的上下游供應商相對缺乏。
但完整的產業鏈對企業至關重要。“四川各個環節都能做,但是能做精的不多。”嚴帥以上游技術舉例,比如數字人形象,能做到高仿真級別的,四川很難找到。
從下游應用來看,數之聯的市場也主要在省外。“作為一家四川企業,我們90%以上的客戶都不是四川的,這不到一成的省內客戶中,有些總部還不在四川。”傅彥呼吁,四川應聚焦應用層推出更多引導政策。
針對企業的成長“煩惱”和行業的短板,四川作出了一系列部署。比如針對算力成本問題,四川支持成都智算中心、超算中心擴容升級,加快建設阿裡雲等智算中心,在加快推動算力基礎設施建設的同時,還構建算力調度體系,提升算力資源利用率。再比如在高質量數據集“供不應求”問題上,四川正推動政務、教育、醫療、交通等領域公共數據搜集建設,並鼓勵企業基於業務數據積累,威斯尼斯平台開發智能制造、智慧文旅、清潔能源等重點領域高質量數據集,推動不涉及隱私和公共利益的數據市場化交易。
“此外,我們也要在產業鏈上做文章。”科技廳相關負責人表示,在技術層方面,四川將圍繞重點行業應用需求,推動主流通用大模型全國軟件工程總部、生態產業中心等項目在川加快落地﹔在下游應用層上,將推動大模型在制造業、服務業各環節融合應用,賦能千行百業轉型提質。“定個目標,力爭在2027年,打造超過10個具有全國影響力的行業標杆大模型。”
人民日報社概況關於人民網報社招聘招聘英才廣告服務合作加盟供稿服務數據服務網站聲明網站律師信息保護聯系我們
人 民 網 股 份 有 限 公 司 版 權 所 有 ,未 經 書 面 授 權 禁 止 使 用