近年來,大模型技術(shù)飛速發(fā)展,極大提升了全球人工智能技術(shù)發(fā)展和應(yīng)用迭代速度,被認(rèn)為是“邁向通用人工智能的里程碑技術(shù)”。面對新一輪大模型引領(lǐng)的人工智能變革,加快推進(jìn)大模型賦能數(shù)智化應(yīng)用健康發(fā)展具有重要意義。
作為最成功的一類大模型,大語言模型是一種包含大規(guī)模參數(shù)、使用大量文本數(shù)據(jù)訓(xùn)練出來的深度學(xué)習(xí)模型,展現(xiàn)了大模型的能力和基本技術(shù)框架。目前,這一技術(shù)思路和框架已被用來處理圖像、視頻等多模態(tài)數(shù)據(jù),并被推廣應(yīng)用于機(jī)器人控制與智能決策等場景。各類大模型正處于迅猛發(fā)展之中,眾多高科技企業(yè)紛紛投身大模型建設(shè),圍繞大模型已經(jīng)形成相對成熟的技術(shù)框架,但產(chǎn)品和生態(tài)尚在發(fā)展形成之中。總體而言,大模型的技術(shù)發(fā)展歷程相比以往任何人工智能技術(shù)都更迅猛,其影響力也是史無前例的。
大模型的“大”主要體現(xiàn)在3個方面,即模型參數(shù)規(guī)模大、訓(xùn)練數(shù)據(jù)規(guī)模大和算力消耗需求大。模型參數(shù)方面,當(dāng)前主流大模型的參數(shù)規(guī)模通常在千億甚至萬億級別,遠(yuǎn)遠(yuǎn)大于以往的各類深度學(xué)習(xí)模型。訓(xùn)練數(shù)據(jù)方面,大模型在前期訓(xùn)練階段和后期調(diào)優(yōu)階段都需要海量的數(shù)據(jù)支撐,例如引爆大模型范式的聊天機(jī)器人ChatGPT,預(yù)訓(xùn)練數(shù)據(jù)量達(dá)到了45TB,其研發(fā)公司還在拉丁美洲等地區(qū)招募了約1000名員工,專門從事與大模型相關(guān)的訓(xùn)練數(shù)據(jù)標(biāo)注工作。算力需求方面,根據(jù)有關(guān)市場調(diào)查機(jī)構(gòu)估計(jì),ChatGPT的運(yùn)行需要上萬片最先進(jìn)的圖形處理芯片同時工作,耗電量巨大。
大模型已經(jīng)展現(xiàn)出驚人的能力,基于大語言模型的聊天機(jī)器人是以人機(jī)對話為接口的高效信息獲取、智能處理和內(nèi)容生成工具,能夠?qū)崿F(xiàn)高質(zhì)量的信息整合、翻譯和簡單的問題求解與規(guī)劃。其受到全社會廣泛關(guān)注,主要是它已經(jīng)初步具備通用人工智能的部分特性,包括通順的自然語言生成、全領(lǐng)域的知識體系覆蓋、跨任務(wù)場景的通用處理模型、通暢的人機(jī)交互接口。當(dāng)然,聊天機(jī)器人只是大模型的起點(diǎn),大模型未來的發(fā)展趨勢也已初見端倪。
第一,大模型有望引領(lǐng)諸多行業(yè)的數(shù)智化創(chuàng)新發(fā)展。大模型的學(xué)習(xí)模式類似人類大腦,通過學(xué)習(xí)不同的數(shù)據(jù),能夠形成多樣化的能力,不需要按照任務(wù)開發(fā)定制化的算法。通過自然的人機(jī)交互,智能化地解決復(fù)雜問題和實(shí)現(xiàn)輔助決策,推動各行業(yè)體系變革和生態(tài)發(fā)展。例如,未來的信息系統(tǒng)可以由領(lǐng)域用戶通過與大模型的交互直接搭建和維護(hù),“用戶即程序員”,顛覆信息系統(tǒng)研發(fā)和應(yīng)用范式。
第二,領(lǐng)域?qū)S煤洼p量化大模型是當(dāng)前技術(shù)研究的重點(diǎn)。大模型雖然已經(jīng)展現(xiàn)出諸多優(yōu)勢,但依然存在可靠性差、訓(xùn)練數(shù)據(jù)依賴、因果推理能力弱、搭建成本高等短板,在部分領(lǐng)域深度應(yīng)用上的表現(xiàn)弱于專用小模型。為了更充分地發(fā)揮大模型優(yōu)勢,金融、教育、醫(yī)療等領(lǐng)域?qū)S么竽P鸵讶〉昧穗A段性成果,有望促進(jìn)各項(xiàng)專業(yè)能力的涌現(xiàn)。
第三,大模型有望發(fā)展成為更加通用的人工智能。大模型起步于文本信息處理,現(xiàn)已涵蓋圖片、音視頻等多模態(tài)數(shù)據(jù)。在不久的將來,大模型將超越信息域,結(jié)合硬件設(shè)施,發(fā)展成為與物理和人類世界互動的具象智能,逐步縮小與真正的“通用人工智能”的差距。
雖然大模型展現(xiàn)的能力已經(jīng)讓全社會看到了通用人工智能的曙光,但當(dāng)前大模型也有一定的局限性。一方面,由于大模型自身結(jié)構(gòu)和機(jī)制漏洞,有被惡意攻擊的風(fēng)險;另一方面,大模型自身的知識表達(dá)和學(xué)習(xí)模式還存在缺陷,導(dǎo)致其回答中經(jīng)常出現(xiàn)“幻覺”,如常識性錯誤、杜撰內(nèi)容等。
推進(jìn)大模型賦能數(shù)智化應(yīng)用健康發(fā)展,應(yīng)堅(jiān)持規(guī)劃引領(lǐng)、需求帶動、應(yīng)用導(dǎo)向、安全為基,引導(dǎo)、扶持和監(jiān)督大模型在更廣泛的領(lǐng)域應(yīng)用中長計(jì)遠(yuǎn)慮、扎實(shí)落地、穩(wěn)步推進(jìn)。
首先,掌握技術(shù)主動權(quán),加快自主可控的國產(chǎn)大模型全鏈條建設(shè)。依托我國現(xiàn)有的人工智能人才基礎(chǔ),構(gòu)建面向大模型與通用人工智能技術(shù)的平臺和隊(duì)伍。加大芯片、大數(shù)據(jù)、人工智能等產(chǎn)業(yè)的投入與整合力度,保障“海量數(shù)據(jù)”“頂尖人才”“算力支撐”的落地,推進(jìn)我國全階段自主可控大模型建設(shè),掌握大模型技術(shù)發(fā)展的主動權(quán)和話語權(quán)。大力支持國產(chǎn)大模型的下游技術(shù)攻關(guān)和產(chǎn)品推廣,促進(jìn)國產(chǎn)大模型產(chǎn)品的應(yīng)用落地和迭代升級。
其次,深化大模型應(yīng)用生態(tài)建設(shè),構(gòu)建“通用大模型+專用小模型”的成熟應(yīng)用生態(tài)。早在大模型產(chǎn)生之前,基于領(lǐng)域經(jīng)驗(yàn)歸納和業(yè)務(wù)知識構(gòu)建的“小模型”已經(jīng)廣泛應(yīng)用于各行業(yè)。應(yīng)充分認(rèn)識并應(yīng)用好大模型和傳統(tǒng)小模型各自的特性,在推廣大模型產(chǎn)品的同時進(jìn)一步推進(jìn)小模型技術(shù)的升級和應(yīng)用,發(fā)揮好小模型輕量級、高效率、善于解決特定問題的優(yōu)勢,逐步推進(jìn)大小模型融合的應(yīng)用生態(tài)。
最后,建立健全大模型安全審查制度與法律體系,從源頭規(guī)避大模型發(fā)展風(fēng)險。推動建立行之有效的數(shù)據(jù)審查機(jī)制和接入許可規(guī)范,從源頭把控大模型內(nèi)容安全性,并主動參與全球人工智能模型使用規(guī)范的標(biāo)準(zhǔn)制定。同時,對于大模型可能產(chǎn)生的風(fēng)險進(jìn)行合理評估與審核,如歧視、仇恨言論、私人信息泄露、虛假信息、協(xié)助犯罪等。