伴隨著數字經濟的快速發展,人工智能技術持續突破,智能時代正加速到來。在人工智能浪潮席卷下,以生成式人工智能、大模型為代表的算力應用落地開花,也引發了算力需求的進一步增長。一直以來,我國東部地區特別是上海深入挖掘算力融合應用場景,各類大模型應用不斷推出,加速釋放算力資源服務潛能。面對新一輪人工智能發展熱潮,上海如何乘勢而上加速推進算力在更多場景的應用落地?如何促進算力更好融合實體經濟?
上海市日前印發的《立足數字經濟新賽道推動數據要素產業創新發展行動方案(2023—2025年)》明確提出,建設高效協同的算力體系,建設“E級”超算載體、人工智能公共算力平臺,因地制宜部署邊緣計算資源池,對接“東數西算”國家戰略,建設樞紐型算力調度平臺,到2025年,算力總規模較“十三五”時期末翻兩番。
上海迅速布局算力這一新基建,正是基于當前以大模型為代表的算力應用的落地開花。最近1年,人工智能成為全球科技產業的熱門焦點領域。爆款產品ChatGPT(自然語言處理大模型)以其強大的對話輸出功能,讓人工智能有效輔助生產生活,人工智能產業隨之向前邁進一大步,迅速成為資本青睞的“香餑餑”。
隨著全球科技巨頭紛紛入局,人工智能應用在大模型領域打開新局面。普遍觀點認為,上游算力基礎設施的持續建設、算力規模的不斷擴大、數據處理能力的迅速提升,造就了下游算力應用端ChatGPT等大模型的成功崛起,讓人工智能發展迎來“拐點”。
在這場全球參與的科創競技中,我國緊跟趨勢走在前沿。其中,以上海為代表的生成式人工智能(AIGC)探索將人工智能帶到新高度,國家也出臺了《生成式人工智能服務管理暫行辦法》,及時規范AIGC的開發及應用。作為算力落地場景的最大突破口,國內AIGC的發展態勢如何?應用效果如何?面臨哪些挑戰?記者走訪了諸多業內企業與專家,探尋在算力支撐下,人工智能到底怎樣“為我所用”。
大模型火爆
今年的中考、高考結束后,ChatGPT、文心一言、復旦MOSS、訊飛星火等大模型緊跟熱點,紛紛下場寫起作文??戳薓OSS寫的上海中考語文作文《會心之樂》后,上海市市南中學語文高級教師陶璐說:“我覺得MOSS總體上寫得不錯,但大模型沒有自我意識,它怎么能真正理解‘會心之樂’呢?”上海復旦五浦匯實驗學校校長、語文特級教師黃玉峰更是笑言,“如果要我打分,它肯定不及格”。
盡管人們對生成式人工智能抱有不同態度,但它已經進入我們的生產生活。
“大模型是指具有大量參數的機器學習模型,可以在訓練過程中處理大規模的數據集。ChatGPT就是具有超大規模參數的大模型。要實現大模型的訓練,必須有強有力的算力支撐。”天風全球前瞻產業研究院聯席院長孔蓉表示,按照國內的發展速度,預計今年國內大模型可以達到GPT3.5的技術水平;得益于海外開源大模型的技術,會有一批國內企業達到這一水平。
國內大模型的涌現速度,也印證了孔蓉的判斷。3月16日,百度推出搭載文心大模型的文心一言;4月8日,華為更新盤古大模型;4月10日,商湯科技推出商量SenseChat;4月11日,阿里巴巴推出通義千問;此后,360、字節跳動、科大訊飛、京東、騰訊等公司也紛紛推出了自己的大模型??萍疾咳斯ぶ悄馨l展研究中心5月底發布的《中國人工智能大模型地圖研究報告》顯示,當前國內10億參數規模以上的大模型已發布79個,“百模大戰”并非戲言。7月份在上海舉辦的第六屆世界人工智能大會上,國內通用型大模型頂尖產品悉數到位,集中展示國內外總計30多款大模型。
國內大模型發展火爆,離不開國內算力資源作為基礎。
燧原科技創始人、董事長兼CEO趙立東表示,在大模型的技術萌芽期,訓練一個GPT3參數規模的大模型成本極為高昂。根據谷歌的經驗,用大模型來代替谷歌每秒32萬個查詢,將新增約360億美元推理成本。此后,發展到應用加速膨脹期,大模型應用賦能千行百業,所需算力又會是一波乘數效應。
上海市集成電路行業協會會長張素心表示,“為解決算力需求問題,國產芯片應匯聚合力,擴大開發者群體,形成生態閉環,繼而加速產業發展乃至國際化之路”。
東浩蘭生會展集團董事長陳小宏告訴記者,在第六屆世界人工智能大會上,圍繞大模型的訓練需求,沐曦曦思N100、瀚博SG100、昆侖芯2代AI芯片等大模型應用芯片集中亮相,夯實了國內算力資源的底氣??梢哉f,隨著大模型的火爆,算力領域既感到壓力,也充滿動力。
應用突圍
無論是實現大模型落地應用,還是提升算力供應,都需要努力構建自主創新架構、滿足市場多元需求。當前無疑是一個極佳的時間窗口。
孔蓉在美國硅谷調研發現,相比國內企業爭相布局大模型,美國科技企業的研發已經以AI應用為主。在美國企業中,AI應用已相當普遍,寫文章、寫郵件、數據分析、發布招聘廣告等都離不開AI。“國內大模型井噴之后,當務之急是應用落地。畢竟大模型研發出來就是要為生活和工作服務的。”孔蓉表示。
“歷經4年技術深耕和研發迭代,百度現已升級到文心大模型3.5。”百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰表示,文心大模型3.5在效果、功能、性能等方面有了明顯提升。“凡是與語言文字或程序代碼打交道的應用場景,都可能有文心一言的用武之地。”王海峰表示,不少行業如能源、金融、教育等,已經成為文心一言的應用場景。
要把通用大模型應用到不同行業中,仍存在不少突破口。對此,垂直的行業大模型應運而生。這類行業模型、專屬模型脫胎于通用大模型,經過有針對性的專業數據精調后,就可適用于垂直領域,為某些特定行業服務。
不久前,星環信息科技(上海)股份有限公司發布了為金融領域量身定做的大模型“無涯”。作為業界首款面向金融智能量化投研的領域大模型,它將在金融投研、量化投資和智能推理等領域有力輔助分析師、研究員和投資經理的日常工作,對股票、債券、基金、商品等各類市場事件進行復盤、傳播和推演。同時,基于大模型的事件驅動與深度圖引擎,其可實現對事件語義刻畫、定價因子挖掘、時序編碼、異構關系圖卷積傳播等功能,幫助企業更好應對復雜的市場環境和業務需求。
不過,目前來看,大模型應用仍存在一些問題。星環科技創始人孫元浩表示,大模型有時會一本正經“胡說八道”,原因之一在于訓練大模型至少用時半年,這導致實時新聞資訊、市場行情等快速變化的信息難以內置到模型中,因此需要各類大模型發布商不斷更新語料與數據,這是一個不小的挑戰。
北京中關村科金技術有限公司專注于垂直行業和細分領域的大模型應用,瞄準新一代得助對話引擎,他們推出了全新的AIGC應用——“超級員工”,如智能客服、外呼機器人、智能陪練、智能質檢、坐席助手等。該公司副總裁張杰介紹,“超級員工”以助手的形式在金融、零售、政務等多個行業頭部企業試用,原先需要10分鐘完成的營銷文案,現在10秒即可完成;外呼客服話術師助手讓原來30個話術師的工作量如今由2人即可完成,且語義理解準確度從85%提升至94%。“大模型具備的超強語言理解能力,讓‘最后一公里’的銷售過程實現數字化轉型成為可能。這既能幫助企業通過智能對話服務實現降本增效,也能有效提升用戶體驗、拓展服務外延。”張杰說。
眾多通用大模型和垂直大模型同臺競技,結果必然是優勝劣汰。張杰表示,在成本約束以及充分的市場競爭環境下,眾多大模型產品必然面臨“洗牌”。
面臨“洗牌”的不僅是大模型,算力領域同樣如此。“百模大戰”可喜亦可憂,必須直面算力“燒不燒得起”的課題。大模型訓練和推理最終要回歸商業邏輯,實現經濟效益而非“不計代價”,這就涉及算力能否像水電煤一樣“普惠”。
燧原科技創始人兼COO張亞林表示,“隨著大模型間的競爭逐漸展開,大模型在數量上會收斂,生態也會相應濃縮和集約,這對于建立AI芯片新生態來講,是非常有利的機會”。
上海天數智芯半導體有限公司不久前宣布,天垓100加速卡的算力集群,基于北京智源人工智能研究院70億參數的Aquila語言基礎模型,使用代碼數據進行訓練,已穩定運行19天,且模型收斂效果符合預期,測試證明天數智芯已經具備支持百億級參數大模型訓練的能力。天垓100加速卡的算力集群率先完成百億級參數大模型訓練,邁出了自主通用GPU大模型應用的重要一步。這一成果證明天垓產品可以支持大模型訓練,打通了國內大模型創新發展的關鍵“堵點”,對于我國大模型自主生態建設、產業鏈安全保障具有重要意義。
孔蓉說,“像ChatGPT這樣級別的大模型需要上萬張芯片和加速卡支持,就目前國內一些商業化應用來看,不需要比拼最高算力,而是應比拼實際效率,因此性價比會是重要的影響決策因素”。趙立東也認為,“芯片是‘用進廢退’,越用才能越好用。在漸進式過程中培育算力生態、迭代算力產品,這個過程是我們必須經歷的”。
提升競爭力
不久前印發的《上海市推進算力資源統一調度指導意見》提出,開展上海全市算力基礎設施及算力資源輸出能力摸排,形成算力清單?;谒懔Y源底數,推動頭部企業接入上海市人工智能公共算力服務平臺,構建一體化算力調度服務體系和平臺基礎框架,實現算力資源統一編排。
“某種程度上,算力決定了市場競爭力。”商湯科技董事長兼CEO徐立說,在AI大模型時代,模型參數量將以指數級速率提升,數據量隨著多模態的引入將大規模增長,由此帶來算力需求劇增。
上海市經信委副主任湯文侃表示,“十四五”期間,上海將加強全市算力資源統籌、調度和共享,提升算力資源利用率,加速數據要素流通,全面釋放數據價值。
上海臨港新片區6月份發布的《臨港新片區加快算力產業集聚發展三年行動方案》提出,到2025年,臨港新片區將形成以智算算力為主、基礎算力和超算算力協同的多元算力供給體系,總算力超過5EFLOPS(FP32),AI算力占比達到80%,算力產業總體規模突破100億元,集聚相關企業及機構超過100家,打造具有全國影響力的算力產業集聚區,建設一批算力示范應用標桿場景。
一系列算力布局,是為了夯實大模型應用的底座。隨著AIGC深度應用的展開,不僅對算力、數據、算法提出了更高要求,也對安全、隱私、倫理提出更多挑戰。只有在確保數據安全和隱私保護、健全人工智能倫理與安全的前提下,才能讓AI技術真正釋放出應用價值。
針對算力問題,華為輪值董事長胡厚崑表示,華為已在內蒙古烏蘭察布市建設數據中心,初期階段部署了數千卡規模的人工智能集群,在同等算力下,計算效率提升10%以上。
不久前,UCloud優刻得AIGC算力底座正式亮相。優刻得董事長兼CEO季昕華表示,優刻得推出涵蓋數據中心、計算平臺、管理平臺、網絡服務、應用服務、生態接口的一系列產品和解決方案,可為用戶提供完全物理隔離的獨享機柜、服務器、網絡、存儲資源,結合完整的安全方案和專家服務,確保用戶的大模型平穩運行。
“歷史的機遇、技術的變革,將數據智能推向了前所未有的高潮,也帶來了更加嚴峻的數據安全挑戰,數據流通邁向密態化是未來趨勢。數據密態要求下,隱私計算的方法體系、平臺框架、技術標準都面臨全新變革。”螞蟻集團副總裁兼首席技術安全官韋韜呼吁更多同行參與到開源和生態建設工作中。“開源隱私計算核心產品一直是我們對行業的態度,未來將進一步加大隱私計算的開放力度和廣度,與行業一道構筑AI智能時代數據安全護城河。”韋韜說。
盡管挑戰不少,但不可否認,以大模型為核心的人工智能時代正加速到來。“未來10年,新一輪科技周期將啟動。”孔蓉認為,在AI推動下,XR、機器人、自動駕駛、影視內容等行業將進入爆發式變革時期。
騰訊研究院、同濟大學、騰訊云共同發布的《人機共生——大模型時代的AI十大趨勢報告》明確指出,通過建設可控、可用的安全生態,推動模型落地和應用,AI技術將為各行業帶來更多機遇。大模型時代帶來的創新和發展,將推動人工智能走向更廣闊的未來。
正如工業和信息化部副部長徐曉蘭所言,以深度學習為代表的新一代人工智能和以大模型為代表的通用人工智能不斷取得技術突破,將成為智能產業的根技術和智能經濟的基礎設施。這意味著人工智能產業生態將醞釀一個又一個“爆點”,并等待著創業者去把握與挖掘。