【摘要】數據作為自動駕駛技術應用及產業發展的基點與支點,其收集、使用和管理的各環節關系著自動駕駛的健康發展。目前,自動駕駛場景下數據治理面臨的主要問題表現為安全與聯通的平衡。通過對自動駕駛數據特征與治理現狀的評析,可從平衡數據權益分配,建立健全算法記錄留存、公開與備案,規范數據共享等方面健全自動駕駛下數據治理規范化、法治化架構,保障和推動自動駕駛技術及產業的健康發展。
【關鍵詞】自動駕駛 數據安全 數據聯通 法治化
【中圖分類號】D92 【文獻標識碼】A
數據是自動駕駛的重要基礎
自動駕駛不僅是技術飛速發展的產物,更在車聯網乃至于工業互聯網中占據著關鍵地位,推動著交通智能化的又一次升級換代。自動駕駛技術及產業作為新一輪科技革命和產業變革的典型代表,成為各大研究機構、互聯網巨頭公司的重要競爭方向。自動駕駛涉及的問題廣泛且深入,隨著自動駕駛和智能網聯技術的不斷升級與改革,其中所潛在的問題與現實的碰撞越來越尖銳化,然而無論是運行安全問題還是制度規范問題,其問題的關鍵點就在于數據安全與聯通,只有架構可信可靠、利益平衡的數據安全與聯通的原則規則、實施機制及保障制度,才能推動自動駕駛真正發揮作用,促進物聯智能化的進一步整合升級。
自動駕駛汽車依靠人工智能、視覺計算、雷達、監控裝置和全球定位系統協同合作,讓電腦系統可以在無需人為主動操作的情況下,自動操控機動車輛行駛。自動駕駛技術實施的關鍵在于通過算法判斷路程和行駛速度,從而精準輸出車輛控制措施,將數字控制下的自動駕駛汽車合理地安置于公共交通秩序中。而算法運行的基礎是海量的行駛數據收集和運用,以大規模、高質量的數據為算法模型提供決策參考。數據作為自動駕駛技術及行為展開的起點,其收集和使用的過程關系著自動駕駛技術在應用中的安全與發展。
從數據計算及機器自動決策的維度看,自動駕駛的過程就是機器不斷收集行駛數據并進行數據分析和自我學習從而達到自動駕駛的系統工程。伴隨自動駕駛技術及車輛制造技術的發展,每輛汽車將從過去的封閉轉向開放,融入到聯網的平臺中進行實時的信息交互,此時每輛車可以認為是一個數據實時采集、計算及分享的移動終端,其與車聯網的中臺做好鏈接,調取數據的同時也回傳數據,在更好地做好自身深度學習的同時,也支撐整個車聯網系統的算法訓練。不法分子可通過網絡對車輛進行遠程攻擊,使車輛做出熄火、剎車、加減速、解鎖等操作,也可通過截獲通訊信息、攻擊云端服務器,達到竊取用戶信息和車輛數據的目的,嚴重的還會威脅駕駛員和乘客的生命安全。
同時,在自動駕駛產業鏈中,數據的采集、存儲、處理、傳輸、共享等生命周期各環節潛在的安全威脅也會給自動駕駛數據防護帶來全新挑戰,故要實現自動駕駛產業規模化、商業化落地,必須確保數據安全。當然,也不能因為強保護而妨礙了數據必要且高效的流動和共享需求,否則車聯網無法有效建立和更新發展,最終也會影響自動駕駛技術及產業的長遠健康發展。然而,事實情況是現行立法尚未針對自動駕駛數據規制系統提供充足制度供給,為此應在現有數據安全與數據聯通的法律基礎上出臺相關規范,形成自動駕駛數據安全保護與數據聯通發展的相互支撐和良性互動。
自動駕駛數據的主要特征
自動駕駛的基礎是海量數據的分析與應用,前提是數據收集,同時對數據共享也有著較大的需求。數據的收集有可能侵害消費者的隱私,收集是否合規、保護措施是否完善至關重要。在保障數據安全的同時,促進數據流通也十分重要。自動駕駛汽車不可能僅靠一家企業或單位支撐起其數據要求,除必要的技術外,數據的開放共享亦是自動駕駛技術及應用不斷完善的必由之路。為此,有必要從自動駕駛數據的特性入手,評估其采集、使用與管理中存在的主要問題,以此為問題導向和治理進路來推動和保障自動駕駛技術運用及產業發展能夠行穩致遠。
自動駕駛數據具有多樣性和規模性。自動駕駛系統主要依賴感知、決策和執行三大模塊來實現,每個模塊在工作過程中會產生一系列數據,即為自動駕駛數據。感知數據通過激光雷達、攝像頭、車載互聯網系統等設備對外界的環境進行感知識別產生;在融合多方面感知信息的基礎上,通過智能算法學習外界場景信息,預測場景中交通參與者的軌跡規劃車輛軌跡,從而產生決策與控制數據,由此實現車輛擬人化控制;測試與仿真數據能夠跟蹤決策規劃的軌跡目標,控制車輛的油門、剎車和轉向等駕駛動作,調節車輛行駛速度、位置和方向等狀態,以保證汽車的安全性和穩定性。自動駕駛汽車生產企業和自動駕駛技術研發創新企業都可以通過道路測試和仿真測試積累海量數據,優化和提升車輛自動駕駛性能,同時在這一過程中也會出現數據泄露和污染等風險,嚴重威脅車輛安全。
自動駕駛數據具有流動性。在自動駕駛整個系統的運作過程中,需要多方數據的相互傳輸,在不同設備、系統、云服務器等對數據采集、分析并相互之間形成數據交互來完成整個數據系統從采集到傳輸、分析、使用等全過程,自動駕駛本身是無法單純通過本機的數據即可形成自動化決策操作,由此表現出數據的流動性,其風險就存在于多方交互的采集、傳輸、分析及使用等多個環節之中。在數據流動的過程中,譬如,自動駕駛汽車在數據采集、傳輸、分析、使用時,系統數據存在被竊取、丟失或篡改破壞的可能,也面臨數據流動時遭受污染,算法無法識別或識別錯誤會對決策的可靠性和安全性產生影響等。可見,對自動駕駛中數據流動性帶來的風險及其由此產生的數據風險的聚集擴散效應應予以高度重視。
自動駕駛數據安全存在的主要隱患
私人汽車通常是被認為是隱私場所,除公交車、出租車等具有公共屬性的汽車之外,多數汽車在預期中應是可以達到保護隱私的效果。但自動駕駛汽車則完全顛覆了這一點,自動駕駛汽車需要完全收集車輛內外的絕大多數數據信息,以之作為其輸出行使指令的原料,故每一部自動駕駛汽車都裝備著傳感器、激光雷達、攝像頭以及其他微型信息收集裝置,這意味著自動駕駛汽車的駕駛人、乘車人的信息,包括車內行為、日常行蹤、開車習慣等,都將盡數傳輸到汽車企業,這將會引起消費者對于隱私的擔憂。
數據安全在信息和通信技術(ICT)領域已做得較為成熟,然而自動駕駛汽車數據安全產品并非把傳統ICT信息安全技術直接平移到汽車端那么簡單,自動駕駛汽車對數據實時性、可靠性的要求要比傳統互聯網高得多,且收集的數據數量、類型、隱秘程度也遠遠超過傳統互聯網,這就對完善自動駕駛汽車相關的數據安全技術提出了挑戰,怎樣收集數據、數據收集的程度、數據保護的手段以及數據的留存與保護,都是維護數據安全的關鍵點。
此外,生產經營自動駕駛汽車的車企通過算法吞噬和隱瞞自動駕駛數據,影響法律糾紛中的舉證,也是數據安全的一大隱患或現實威脅。在目前涉及自動駕駛交通事故的相關案件中,一方面存在著嚴重信息不對稱,車輛數據集中于車企及其運營一方,導致使用者處于十分不利的地位;另一方面由于技術的先進性、復雜性與算法黑箱的影響,車企及其運營者對相關證據具有相當的控制力,這也對數據的安全性和可信性造成了威脅。
自動駕駛數據聯通存在的主要障礙
相較于自動駕駛下的數據安全,我國對自動駕駛的數據聯通方面的規定較缺乏。實際上,自動駕駛數據互聯互通的重要性不亞于數據安全,而其治理難度甚至超過數據安全問題。
首先,各車企及其運營者無法獨自、全面地獲得使用中的自動駕駛車輛的完整數據,自動駕駛車輛行駛的安全性和高性能不僅需要精密的算法和強大算力,更需要實時的海量數據收集。各車企及其運營者需要通過不斷的測試才能收集自動駕駛算法對氣候、環境、路況等的決策數據(信息)。然而,由于不同車企主要測試的區域不同,比如特斯拉主要在美國加州進行測試、百度主要在中國北京進行測試,導致其收集的數據也具有相應的地域性,一旦超出該地域,其系統則會遇到數據不足的風險,繼而引發行駛安全問題。但自動駕駛汽車如果只能在限定區域行使則會使其價值大大降低,其作為交通工具的屬性也被削弱。因此,除非一家車企能在全國或全世界進行完整測試,否則數據的共享與互聯就是自動駕駛汽車企業必要的選擇。但問題的關鍵恰恰在于,測試數據的稀缺性與高價值使得數據互聯的難度被大大拔高,如何在保護車商私益的同時,完成數據互聯體制的初步架構,是更甚于數據安全體制建設的挑戰。
其次,交通管理、公安等政府部門也需要自動駕駛場景下的數據來維護道路交通安全、調查事故原因、實現執法目的,司法部門亦需要自動駕駛數據來判斷事故的規則和賠償情況。除卻數據可能會因為算法黑箱而無法完整讀取和有效識別,政府部門如想同步其數據,也存在技術問題、風險保障問題以及企業的私益保護方面的挑戰。
最后,科研機構需要自動駕駛汽車的數據來改進相關技術、評估環境和社會影響、提出立法和政策建議。然而,科研機構由于既沒有巨大的商業共享利益驅動,又無國家公權力或準公權力的支持,在獲得相關自動駕駛數據上的難度可想而知。可見,由于缺乏相關的規范和支持數據聯通方面的制度和機制,自動駕駛場景下數據的收集、使用和管理一定程度上仍處在各自為政的數據封鎖狀態,不利于自動駕駛技術系統創新和整個產業的發展。
自動駕駛數據安全與聯通治理現狀
我國尚未出臺專門適用于自動駕駛數據治理的基礎性法律,與其相關的規范散見在不同的法律法規、部門管理意見、指南之中(參見表1和表2),特別是在以工信部為自動駕駛、智能駕駛技術及產業發展的主管部門所發布的部門管理意見、建設指南中予以了綜合性規定,然而,由于效力位階不高,在實踐中發揮的規范作用不夠充足,且存在與遵從高位階法律,進行細化解釋適用,以及與其他部門或地方所發布的同位階規范文件協同適用的問題。
自動駕駛技術及產業發展作為新興領域,所涉及的領域很多,關涉的部門和法律關系也遠比現行的認識復雜,故此,從長遠發展看,十分有必要從國家層面統一、系統、規范地制定并施行有關自動駕駛領域數據安全與聯通治理的基礎性法律,以避免各部門、各地區間各自為政、規則不聯通,甚至規則打架,提高治理效能本身也是推動自動駕駛技術及產業長期健康發展的應有之義和關鍵基礎。
目前已經初步建立起了關于自動駕駛領域數據安全與聯通使用的基本制度架構,然而由于上述規范性文件的制定主體、關切重點以及制定技術等方面的差異,自動駕駛技術及產業發展欲行穩致遠,規范有序發展,還需要做進一步精細化應對,特別是從實踐反饋中去及時修正、補充或升級相關規范文件,更好地平衡好自動駕駛領域數據安全與數據共享的關系,從而使自動駕駛的安全得以保障、技術得以發展。概言之,針對當前自動駕駛領域數據安全規范性文件位階不高、較為分散、技術性強及操作性弱,容易導致執法司法部門難識別,形成“一刀切”的結果,過于嚴格限制自動駕駛領域數據流轉與共享并非是最優的安排,也不利于自動駕駛技術的創新及產業的長遠發展。
自動駕駛數據治理構想
平衡自動駕駛下多方主體數據權益。實踐中維護自動駕駛場景下數據安全的關鍵在于合理厘定數據權益歸屬以及平衡多主體間數據權益與責任,在確保數據安全的基礎上,推動自動駕駛場景下數據的開放共享,實現數據聯通,提高數據使用效能。
首先,應以數據動態流轉中的權益配置為基準縱向分配與數據相關的權益。數據要素唯有在高效和有序的動態流轉中才能激活生產力,加速經濟社會價值創造。需結合數據要素在收集、存儲、加工、傳輸等各流轉環節中數據運行機理進行數據權益鏈上的縱向權益分配,能夠更清晰地呈現數據要素在流轉過程中的價值增進,展現數據要素在不同場景下不同主體間發生權益讓渡的現實及效果。《中共中央 國務院關于構建數據基礎制度更好發揮數據要素作用的意見》提出建立數據資源持有權、數據加工使用權、數據產品經營權等分置的產權運行機制,可依此探索自動駕駛場景下數據的開放共享機制。
其次,應平衡隱私讓渡與便利獲得之間的關系,合理地分配各參與主體之間的數據權益。在適用《中華人民共和國個人信息保護法》中最小必要原則時,前提需明確該項技術所必要的信息數據,而對自動駕駛汽車技術之類的新技術、新產品和新服務,在實踐中很難明確哪些信息是必要,故難以界定車企收集數據信息的范圍是否過當、是否違法,在此場景下很難準確平衡用戶、車企及第三方程序或軟件及服務提供者的數據權益。自動駕駛汽車所收集的數據與一般數字企業所收集的數據有所不同,其收集的數據更具多歸屬性、強技術性、持續交互性等特征,故在數據動態流轉過程中分配數據資源持有權、數據加工使用權、數據產品經營權時,也需考慮在自動駕駛場景下多主體數據權益的橫向分配問題,特別是對駕駛數據持續交互性特征的關注,做好數據的解析和離散分析,妥當配置駕駛數據的權益分配。
以數據采集為例,雖然自動駕駛場景下收集數據具有廣泛性,但是其目的主要是服務于駕駛需要,故應以功能作為區分基準,可將數據大致分為三類:環境與路況數據、狀態與行為數據以及用戶個人數據。
環境與路況數據主要包括自動駕駛汽車正常行駛所必要的、為學習型算法所提供的路面障礙、天氣情況、交通狀況、交通攝像頭等該地域的行駛信息,此時自動駕駛車輛只扮演收集器的作用。狀態與行為數據包括駕駛員的狀態、車輛本身的發動機、剎車等信息,為特殊狀態下的算法提供數據。用戶個人數據則包括個人行程、網絡、娛樂等除行駛信息以外的數據,主要用以判斷用戶的舒適度。
可以看到,通過對自動駕駛場景下數據功能進行類型化區分,可以較為清晰地劃分各類數據權益歸屬邊界。具體來講,對與車輛行駛有關的數據,車商與用戶在簽署購買或使用協議時可以作為一般條款,然而,如涉及個人信息且與駕駛情況無關的隱私數據,則應單獨征得用戶同意,并且以上整個數據采集、使用及管理過程都需讓用戶明確知情。以此,便可較好地平衡車企、用戶及其他合法的第三方的數據權益,統籌數據保護與數據共享聯通的利益需要。
建立健全算法記錄留存、公開與備案制度。鑒于目前多數圍繞自動駕駛汽車的糾紛與爭議來自于車商是否通過算法吞噬了事故發生時的數據以及算法記錄是否存在缺陷,對于算法記錄的留存、公開與備案工作應予跟進,至少包括以下方面:
其一,自動駕駛算法記錄應當得到妥善保管,在保證算力與維護運行周期的前提下,為交通肇事的裁判提供完整的依據,不允許擅自篡改、刪除相關記錄數據,并設置平臺向主管機關傳輸保存數據的義務。
其二,建立健全披露算法記錄及備案制度,不僅在爭議案件中需向執法司法機構及時提供相關算法記錄及備案情況,還應引入公平、公正、專業化的第三方監督機構對自動駕駛算法記錄進行監督。這一點《互聯網信息服務算法推薦管理規定》第24條中已有提及,該條規定“具有輿論屬性或者社會動員能力的算法推薦服務提供者應當在提供服務之日起十個工作日內通過互聯網信息服務算法備案系統填報服務提供者的名稱、服務形式、應用領域、算法類型、算法自評估報告、擬公示內容等信息,履行備案手續”。
然而,由于該條款僅提及“具有輿論屬性或者社會動員能力的算法推薦服務提供者”,并未涉及自動駕駛場景下涉及駕駛功能的算法服務,故很難要求車企就其駕駛場景下的算法及記錄進行主動備案,下一步還需要解決好自動駕駛算法治理的問題。
規范數據共享治理推動自動駕駛場景下數據聯通。自動駕駛數據,需要通過共享和流轉,才能釋放其最大價值。《中共中央 國務院關于構建數據基礎制度更好發揮數據要素作用的意見》為數據要素市場化的建設提供了基礎性指導,同時還需要通過完善豐富法律法規文件中對于數據互聯互通的規定,推動各車商最大限度地進行合作。與此同時,特別要注意的是,自動駕駛車商所收集的數據不僅致力于研發汽車,更是意在與自動駕駛配套的智慧路網,而道路交通屬于基礎設施的范圍,如果其數據不及時與政府、監管者進行同步,在利益驅使下一些超大型平臺企業有可能在社會公共基礎設施領域建立起數據圍墻。為此,政府需盡快推動并規范公私主體間的數據共享,在保證公共數據服務安全的基礎上,推動數據要素市場化配置。
自動駕駛技術的不斷發展及產業化、商業化運用,推動著智能交通的高速建設與發展,在這一過程中保障和推動自動駕駛行穩致遠的關鍵在于自動駕駛場景下數據的安全與聯通。在做好自動駕駛數據合規收集和使用的前提下,完善數據的保護與聯通,才能為自動駕駛技術及產業的健康發展奠定堅實的制度基礎,著實有效推動我國在車聯網、物聯網深度融合乃至整個社會智能交通領域的安全發展。
(作者為南開大學法學院副院長、教授、博導,南開大學競爭法研究中心主任,中國新一代人工智能發展戰略研究院特約研究員)
【注:本文系教育部人文社會科學重點研究基地重大項目“全球數據競爭中人權基準的考量與促進研究”(項目編號:19JJD820009)及2023年度最高人民法院司法研究重大課題“數據權益知識產權司法保護問題研究”(課題編號:ZGFYZDKT202317-03)階段性成果】
【參考文獻】
①鄭戈:《數據法治與未來交通——自動駕駛汽車數據治理芻議》,《中國法律評論》,2022年第1期。
②陳禹衡:《〈數據安全法〉下自動駕駛算法數據的分類、保全與合規》,《科技與法律(中英文)》,2022年第3期。
③葉強:《德國自動駕駛立法評析》,《國外社會科學》,2022年第2期。
責編/于洪清 美編/宋揚
聲明:本文為人民論壇雜志社原創內容,任何單位或個人轉載請回復本微信號獲得授權,轉載時務必標明來源及作者,否則追究法律責任。