以ChatGPT為代表的生成式人工智能掀起新一輪熱潮。與此同時(shí),數(shù)據(jù)泄露、隱私竊取、算法歧視等數(shù)字安全風(fēng)險(xiǎn)不斷顯現(xiàn),迫切需要尋找共享與監(jiān)管并重的動(dòng)態(tài)平衡范式,守住人工智能時(shí)代的數(shù)字安全底線。
縱觀全球,中國(guó)、美國(guó)和歐盟作為探索數(shù)字安全和數(shù)字治理的先行者,無(wú)論是技術(shù)創(chuàng)新還是立法規(guī)范都走在世界前列,同時(shí)也存在差異。在相同點(diǎn)方面,均高度重視算法治理,將算法安全嵌套在數(shù)據(jù)安全中,實(shí)行數(shù)據(jù)與算法協(xié)同治理;在差異性方面,雖然同樣強(qiáng)調(diào)個(gè)人隱私安全,美國(guó)以鼓勵(lì)創(chuàng)新為核心,更注重?cái)?shù)據(jù)自由流動(dòng),傾向于以行業(yè)自律進(jìn)行治理。歐盟注重個(gè)人隱私保護(hù)和立法,探索和引入人工智能監(jiān)管沙盒機(jī)制,并發(fā)布首部人工智能監(jiān)管法案。這些經(jīng)驗(yàn)做法,對(duì)我國(guó)數(shù)字安全治理具有一定參考價(jià)值。
我國(guó)加快推動(dòng)人工智能發(fā)展,需形成政府、企業(yè)、社會(huì)組織和個(gè)人合力,在協(xié)同數(shù)據(jù)和算法治理、保障生成式人工智能安全等方面實(shí)現(xiàn)重點(diǎn)突破。
第一,啟動(dòng)國(guó)家人工智能數(shù)據(jù)和算法工程。建立安全標(biāo)準(zhǔn),分門別類對(duì)數(shù)據(jù)和算法進(jìn)行管理,提升數(shù)據(jù)互操作性以及算法透明度,改變過(guò)去個(gè)人或企業(yè)單打獨(dú)斗的局面。
自動(dòng)檢索風(fēng)險(xiǎn)指標(biāo)。開(kāi)發(fā)針對(duì)人工智能應(yīng)用網(wǎng)絡(luò)的早期預(yù)警系統(tǒng),對(duì)網(wǎng)絡(luò)資源進(jìn)行常規(guī)監(jiān)控和過(guò)濾,對(duì)于不符合政策要求的危險(xiǎn)因素、劣質(zhì)數(shù)據(jù)和不良信息,及時(shí)清除或屏蔽。通過(guò)該預(yù)警系統(tǒng)自動(dòng)檢索關(guān)鍵風(fēng)險(xiǎn)指標(biāo),及時(shí)補(bǔ)救,防止再出現(xiàn)類似安全漏洞。
甄別人工智能生成內(nèi)容。從源頭上,為人工智能生成內(nèi)容打上標(biāo)記。深度合成服務(wù)提供者提供深度合成服務(wù),可能導(dǎo)致公眾混淆或者誤認(rèn)的,應(yīng)在生成或編輯的信息內(nèi)容的合理位置、區(qū)域進(jìn)行顯著標(biāo)識(shí),向公眾提示深度合成情況。
加大人工智能生成內(nèi)容檢測(cè)工具開(kāi)發(fā)和優(yōu)化。目前針對(duì)人工智能生成的圖像、文本等已出現(xiàn)相應(yīng)檢測(cè)工具,用于區(qū)分人工智能生成的內(nèi)容和人類創(chuàng)造的內(nèi)容,但準(zhǔn)確率不高。亟需加大對(duì)數(shù)據(jù)、算法、模型的研究,開(kāi)發(fā)精準(zhǔn)的生成式人工智能檢測(cè)工具,真正實(shí)現(xiàn)“以AI測(cè)AI”。
加強(qiáng)人工智能數(shù)據(jù)共享。數(shù)據(jù)、算法、算力是驅(qū)動(dòng)人工智能發(fā)展的“三駕馬車”,其中數(shù)據(jù)是人工智能發(fā)展的養(yǎng)料,例如僅GPT-4的訓(xùn)練數(shù)據(jù)集就包含約13萬(wàn)億個(gè)詞元。如果缺乏足夠的數(shù)據(jù),人工智能發(fā)展無(wú)異于“無(wú)米之炊”。
推動(dòng)中文數(shù)據(jù)集共享。由于語(yǔ)言特點(diǎn)、獲取成本、開(kāi)源程度以及數(shù)據(jù)集質(zhì)量要求等原因,相較于英文數(shù)據(jù),目前中文數(shù)據(jù)集規(guī)模較小。基于中文的人工智能開(kāi)發(fā),可通過(guò)國(guó)家人工智能數(shù)據(jù)工程匯總高質(zhì)量中文數(shù)據(jù)集,并促進(jìn)數(shù)據(jù)分類分級(jí)有序共享,使安全性和服務(wù)質(zhì)量得到大幅提升。
第二,加強(qiáng)生成式人工智能監(jiān)管。推進(jìn)全球溝通和探討,通過(guò)網(wǎng)絡(luò)數(shù)據(jù)安全管理、個(gè)人信息保護(hù)、數(shù)據(jù)審計(jì)等法律法規(guī)進(jìn)一步完善生成式人工智能監(jiān)管。統(tǒng)籌數(shù)據(jù)安全與算法治理,針對(duì)金融、醫(yī)療等不同行業(yè)領(lǐng)域以及算法歧視、算法黑箱等問(wèn)題,開(kāi)展多層次和精細(xì)化監(jiān)管。開(kāi)展多模態(tài)智能分析,在大模型領(lǐng)域引入文本、圖像、語(yǔ)音等,在訓(xùn)練和應(yīng)用過(guò)程中細(xì)化對(duì)不同元素的監(jiān)管,通過(guò)功能模塊設(shè)計(jì),及時(shí)發(fā)現(xiàn)問(wèn)題并防范風(fēng)險(xiǎn)。
切實(shí)保障數(shù)據(jù)安全。使用生成式人工智能產(chǎn)品過(guò)程中,也在同步收集用戶數(shù)據(jù)和信息,可能引發(fā)潛在隱私安全問(wèn)題。對(duì)此,應(yīng)擴(kuò)大安全使用指南宣傳。例如,不主動(dòng)分享敏感信息、關(guān)閉聊天記錄等,基于專門的云服務(wù)運(yùn)行,從訪問(wèn)控制、數(shù)據(jù)加密、網(wǎng)絡(luò)連接等方面加強(qiáng)保護(hù)。對(duì)于數(shù)據(jù)敏感度較高的用戶,通過(guò)敏感信息過(guò)濾一體機(jī)進(jìn)行識(shí)別篩選,可有效避免大模型產(chǎn)品在提供服務(wù)時(shí)產(chǎn)生不可控信息。
構(gòu)建特定知識(shí)庫(kù)。基于特定知識(shí)庫(kù)提供人工智能服務(wù),可在一定程度上避免虛假錯(cuò)誤信息,提升準(zhǔn)確性和安全性。建議借助大模型訓(xùn)練推理一體機(jī),通過(guò)本地化訓(xùn)練和推理,在保護(hù)用戶數(shù)據(jù)隱私的前提下構(gòu)建特定知識(shí)庫(kù)。
第三,在國(guó)際層面,積極與聯(lián)合國(guó)及主要國(guó)家溝通交流,達(dá)成全球規(guī)避人工智能風(fēng)險(xiǎn)共識(shí),推動(dòng)對(duì)所有大型人工智能科研項(xiàng)目實(shí)施備案和風(fēng)險(xiǎn)評(píng)估制度。在國(guó)家層面,組織專家團(tuán)隊(duì)潛心進(jìn)行人工智能風(fēng)險(xiǎn)評(píng)估和研究相關(guān)立法,加強(qiáng)網(wǎng)絡(luò)安全關(guān)鍵技術(shù)研發(fā),加快人工智能安全技術(shù)創(chuàng)新,提升網(wǎng)絡(luò)安全產(chǎn)業(yè)綜合競(jìng)爭(zhēng)力。
(作者系中國(guó)大數(shù)據(jù)應(yīng)用聯(lián)盟人工智能專家委員會(huì)主任)