南開大學哲學系教授、博士生導師 賈向桐
【摘要】大數據時代的來臨,意味著人類歷史上發生了一場新的科學技術革命,同時這也預示著一次新哲學變革的孕育與發展。這場新技術的變革,深刻改變著當代整個人類社會的生活狀態,并在無形中影響著人們的認知和思維模式。當代科學哲學研究由此也發生了一系列的新變化,這主要表現在存在論、認識論和價值論三個層面上。其中,科學認識論和價值論是對大數據革命的直接哲學回應,“數字化生存”則是大數據時代新存在論的基本形式,它決定著大數據時代科學認識論和價值論的深層變化邏輯與特征。
【關鍵詞】大數據 數字化生存 數據監控 相關性
【中圖分類號】B0 【文獻標識碼】A
進入新世紀以來,“大數據”(Big Data)一詞正在迅速沖擊著人們的傳統視野和思維,并由此掀起了一場全新的數據技術革命。這場新的大數據變革正在以前所未有的深度和廣度改變著我們的日常生產、生活、教育、思維等諸多領域。以大數據為基礎的技術革命,同時也是一場新的文化和思維革命,對當代科學哲學產生著全方位的影響。本文將結合這場科學革命的發展特征,具體探討與之相關的科學哲學研究在存在論、認識論和價值論三個層面變革的邏輯、特點與意義問題。
大數據信息技術與人類的“數字化生存”
在大數據時代,“數據”以及“數字化”信息深入社會生活的方方面面,海量的數據與人類的生存狀態直接密切聯系起來。正是借助于網絡計算機作為云計算的新技術平臺,大數據通過虛擬化的數字形式實現了人與人之間的新式交往這一實踐活動方式,從此,人類的生活逐步被數字化。這一狀況是傳統人類生活和生存方式所從來不具備的,這是我們前所未有過的生活狀況。在傳統意義上的社會生活中,信息以及經驗數據總是有限的和可控的,經驗數據起著自然實體存在的顯現以及證據的作用。①這些所謂的信息和數據,仍然無外乎于物質實在的自然屬性的表現,也即我們通常所理解的數據僅僅是物理實體的現象或顯現。這樣,信息數據的存在形式以及運動過程(如信息的產生、傳遞、加工、交換、存儲和接收利用)都是物質化和實體化的。但大數據技術的發展徹底改變了這種信息數據的實體存在模式,也就此進一步改變了整個人類的存在狀態和生活形式。
與傳統數據具有的屬性相比,大數據相對于個人的認識和把握而言則是接近于無限,甚至是不可控的。具體來說,這就是人們通常所概括的大數據的幾個基本特征:海量性(volume)、多樣性(variety)、高速度(velocity),“大數據就是超出傳統數據庫系統的處理能力的數據”,這些數據數量巨大,傳輸速度極快,“必須選擇替代性方法處理這些數據”。②并且,這些方面的特征決定了“大范圍(large-scale)數據集在算法上的對照與分析產生了預料到的新洞見和對信息的有價值的來源,巨量的信息儲存和計算力需求使得數據的物理顯示(在傳統框架中這屬于個人所有)研究和分析成為必要。”③在后信息技術時代,大數據技術進一步將人們的存在推向“數字化生存”,而且,這種“數字化”生存狀態有著許多新特征。
這種轉變首先表現為人類生存實踐從實在轉向數字模擬化生存。“我們在日常生活中所體驗的世界其實是非常‘模擬化’的。從宏觀的角度看,這個世界一點也不數字化,反而具有連續性的特點”,但“從微觀的角度看也許不是這么回事,因為和我們相互作用的物體都是相互分離的單位。”④這一特征意味著人們傳統生活方式和交往方式的根本改變,信息交流的實在性和物理性為信息技術的虛擬化所逐步取代。實現這一轉變的基本單位就是所謂的“比特”(Bite),它構成了虛擬世界(Virtual world)的DNA,大數據技術進一步強化了信息傳播和管理的重要性,數據信息以數字“比特”的形式最有效地把現實實在與虛擬世界溝通起來。這是信息社會人類生活的一大特點,大數據革命帶動著整個人類生活的一次巨大的變革。
其次,人類社會生活的虛擬化是以數據化和數字化技術為基礎的。大數據之所以成為現實的一個重要原因在于其存在形式的簡單性—數字化,這超越了傳統信息存在的物理局限性。包括計算機、物聯網等新信息技術的發展,使得海量數據的獲得、處理和分析成為可能,這是信息革命的物質基礎。在傳統社會中信息的加工和處理相對簡單,人們的認識活動也較為單一,主要局限于相對孤立、靜止的經驗現象,只要從實體、局域出發認識世界即可。但在大數據環境下,大量經驗數據的處理超出了單個人的能力范圍,云計算、大數據模型分析系統才能探究經驗數據的“相關性”,建構數字化的科學模型。在這一復雜的過程中,數據成為人們認識和分析世界存在和規律的基本單位,世界的客觀規律表現在數據結構的邏輯關系上,畢達哥拉斯的數為萬物本源的思想得以展現。
再者,大數據的虛擬化特征在人類開創的這個具有虛擬和實在相統一的新空間里,構建起來一個全新的數字交往和虛擬溝通的以視覺為中心的網絡社會。在大數據社會中,通過海量數據和數字的傳輸和交流,人們的生存實踐活動空間大大擴展,虛擬空間具有了流動性和跨越性特征,這是一種人類前所未有的存在方式。無可否認的一點是,數字化決定著人們的生產和生活,這就是當代“數字化生存”的基本含義。在整個虛擬化和實在性相統一的世界里,人類生活的一切都幾乎被數據化了,轉化成了簡單的數據信息,甚至人的社會地位、財富的差異等,也主要表現在信息控制和掌控的差別上,信息鴻溝的產生在某種意義上決定了人們不同的社會階層和生活狀態。不止如此,社會組織和團體也同樣具有了以上特征,例如數據資產越來越成為企業核心競爭價值,并引導著社會產業升級和經濟的發展。
當然,有利有弊,人類數字化生存也出現了“數據監控”現象,因為每一個人的活動都日益被電子信息化,我們的所言所行、所思所想都離不開強大的人工智能、計算機網絡、電子信息等等數字代碼形式的控制。數字化生存的這種集虛擬性和實在性于一體的狀況,構成了科學認識論和價值論研究的重要思考來源。概而言之,大數據意味著信息資源的社會化,大數據共享為全球范圍人類的生活提供了統一性的基礎。數字化使得全球作為地球村徹底成為可能,迅捷的信息網絡遍布于地球的各個角落,大數據的迅速與便捷實現了人與人之間的超距離、超時間交往,人們對世界的理解隨之延伸和擴展,他們的思想、觀念實踐和思維等都有了前所未有的自由發展。所以,大數據技術的發展極大擴展和深化了人類的實踐存在形式、認知能力和交往能力,數據的“數字化”和“海量化”滲透和影響著我們的日常行為,沖擊和拓展著我們的生活方式和價值觀念的變化。
“密集數據”中的新認識論范式
相對于傳統數據的疏散和零散,大數據時代的數據表現為“密集型數據”(Data-intensive),以至于對大數據的處理被人們稱為“密集數據科學”。密集數據科學面對海量的經驗數據,數據挖掘工作成為大數據時代科學認識和研究的重中之重,這種密集型數據的出現,使得傳統科學方法論和認識論的研究方法面臨巨大挑戰,為此凱林(Steve Kelling)等人將傳統認識論界定為“以專家為中心”(expert-centered)的認識論范式:傳統科學方法論的研究依賴于以“專家為中心的參量分析”,“其完成需要實驗設計以獲取所需的數據來檢驗假說的有效性”,經驗證據和理論模型之間的關系成為方法論研究的中心。但在大數據條件下,這種方法論有了“內在的局限性”,由于時間、空間范圍等的局限,大數據分析“對單個專家來說已經是不可行的了”。⑤科學哲學經驗—理論的單線理解模式難以應對大數據時代的認識論這種新情況,數據的密集型特征使得單個專家甚至更廣泛意義上的科學共同體也難以短時間完成數據的挖掘工作。
所以,傳統認識論對經驗或數據地位的經典界定,在大數據哲學背景下已經不適用了。因為大數據中的數據不再是簡單靜止、孤立的、不變的所予(The Given),它們具有無限性和開放性,即這些數據是動態的、變化的,甚至是可錯的和矛盾的。大數據的復雜性和不確定性特征意味著邏輯經驗主義以來的“概率—統計模型”和“演繹—歸納模型”失效了。與此相應,經驗主義以及歷史主義的各自觀念(觀察中立說和觀察負載理論)均受到質疑,新的科學哲學觀念有待提出。而且,以大數據為基礎的科學研究范式關注的重點也不再是“因果”問題,面對海量數據的存在,科學家更多開始關注于相對弱化的“相關性”分析。以物理學為代表的傳統自然科學研究模式對事物線性因果關系的探求方法,被相對模糊化的模型推理方式替代了。
以上認識論觀念的變化還表現為對傳統還原論思維方式的超越。因為大數據強調的是對事物和信息整體的把握和分析,它更多著眼于集多樣態、復雜性于一體的信息集合本身,這是一種整體論的思維方法。而古希臘直到近代工業時代,可以說都是原子式思維模式的時代,“它給我們帶來了機器化大生產的觀念,以及在任何—個特定的時間和地點以統一的標準化方式重復生產的經濟形態。信息時代,也就是電腦時代,顯現了相同的經濟規模,但時間和空間與經濟的相關性減弱了。”⑥為此,有機論、模糊性和系統論的思維方法愈發重要。
這樣,傳統認識論從以機械論、因果論為基礎的方法論過渡到了有機論、復雜論為內容的方法論研究,其研究的對象是密集型數據。作為與以往具有巨大差異的方法論,⑦“這種數據密集型科學采用的是‘數據—驅動’進路(data-driven approach),其中的信息源自于數據,這與傳統的‘知識驅動’進路(knowledge-driven)相反(從數據預期檢驗假說模型)。”⑧這種新范式的數據探究“一般還包括需要及時處理的、未經組織的大量信息(大數據會帶來發現各種新價值的機會),這有助于我們對其背后深層結構的理解,并推動如何對這些數據的有效組織和管理。”⑨這就是前面我們剛剛分析到的模型推理的特點,與傳統認識論對精確性的追求相比,大數據時代的哲學研究不得不重新處理認識論中的精確性與模糊性的關系,強調統計和概率在科學預測和解釋中的意義和作用。而且,他們還試圖再次闡釋科學中的精確性和模糊性辯證關系。
由此以來,大數據不僅是一種科學研究和認識的存在形式,也是科學研究的一種方法和途徑。這種新的認識論范式表現為數據模型的思維模式,“其基本目標有兩個:描述(descriptive)與預測(predictive)。通過描述以刻畫海量數據中潛在的模式,并根據數據中潛在的模式來進行預測,從而發現數據中有價值的模型和規律。”⑩從方法論層面看,大數據的探究和處理工作已非傳統私人科學研究模式所能勝任的,這是一項復雜的社會工程,一種社會化的認識論事業。當然,“可視性(Visualization)仍是強密度數據科學工作研究和分析的本質部分”,以“可視性”為基礎,虛擬化的全方位感官體會成為信息和大數據處理問題的核心和關鍵。這也要求大數據處理技術空前的系統化,為此,科學與技術研究方法和科學技術的管理和運作模式結合起來,大數據處理要被置于全社會平臺之上,信息數據的收集、管理、分析和儲存都是社會認知勞動的有機程序之一。正因如此,傳統科學認識論和方法論的理論至上觀念進一步破產,自然科學方法還需要社會組織的分工合作,即科學社會實踐的優先性問題突顯出來。正是大數據的混亂性和無序性徹底顛覆了人們對經驗基礎的迷戀,以此為條件的個體主義(individualism)認識論受到質疑,而數據和信息的處理與認知問題更多和互動主義的社會認識論(Interactionist Socialism)聯系起來。還不止如此,在大數據技術的社會建構背景下,自然科學研究與人文社會科學研究的界限進一步被打破,信息數據作為所有學科(包括自然科學和社會科學在內)所共享。數據處理等工作既是科學研究的方法,也是社會管理活動的一部分,而且,數據密集型科學、公眾科學(Citizen Science)和信息化科學(E-Science)的結合成為未來學科和方法論發展的趨勢。
大數據技術理性與價值論的融合
我們在大數據的科學哲學分析中往往會忽略掉科學技術的價值論這一層面問題,或者僅僅只是從工具(實用)價值角度來看待大數據革命。例如,我們在分析大數據基本特征時就特別強調海量數據的“價值”屬性,很多人還把“價值性”(value)列為大數據的基本屬性之一,但這主要是一種實用的、經濟學意義上的價值。但這種價值只是大數據革命產生的一部分內容,實用價值只是整個人類生活世界的一個維度,科學技術革命帶來的是我們現實生活全方位的變革:人類思維和認識的價值、審美的價值、經濟實用的價值、倫理道德的價值等等。在這里,我們要強調的價值論是指大數據革命引起人類實踐和存在形式變化之后隨之而來的人文價值和意義問題,以及人文精神與科學精神的價值論融合問題。
如前所述,大數據以信息技術為平臺實現了海量信息的快速傳遞、多維度交流以及潛在與實在信息價值的社會互通。由此,數據和信息資源構成了一個統一而仿真的全新信息空間。大數據系統以網絡、技術構造的數字虛擬世界為中心真正實現了社會時空的伸縮,大量數據和信息轉瞬即可獲得,這為人們的日常生活帶來巨大的便捷。但這種便捷是以信息技術的數字化、虛擬化為中轉的,與傳統信息交流方式,如言語的溝通、肢體的動作、眼神的交換等相比,巨量信息以網絡技術為媒體的傳播只是間接性的、數字符號化的,這種虛擬化的實踐交往模式缺乏傳統人與人直接交往所帶有的情感溫情,語言和行為也通過數據形式轉化為了冰冷的信息符號。這就是大數據時代人類生存實踐中的非人性化和工具化問題,這一狀況進一步加劇了現代社會以來的技術異化現象。可見,在定位上,大數據信息技術的異化仍是傳統技術異化問題的延伸,科學技術的人文化和價值論批判還是適用于對信息技術的反思的。
這種信息技術異化具體表現為信息與大數據的無限量擴張和滲透在實現服務于人的需要的同時,使得人們不得不面對過量的信息轟炸和數據監控等技術的自然屬性和社會屬性問題。面對鋪天蓋地的海量信息數據,人們往往會無所適從,“信息主體失去了對信息的控制能力并為信息所奴役和支配,陷入“信息崇拜”的異化盲區,正是信息作為“技術”的異化結果。”由于大數據技術將人們的生活信息數據化,數據監控、數據安全、網絡失范、信息倫理等問題均是依存于技術異化現象的,所以大數據技術異化的技術控制和相關倫理問題,我們還需要將之還原到人的數字化生存這一基礎上,反思技術理性的片面發展問題,結合人生的意義和價值問題來綜合解決。
大數據代表著近代以來技術理性精神在當代世界的支配性發展,這導致了工具(技術)理性進一步擴張到了人類社會生活的各個方面。相比于傳統科學技術,數字化和數據化的信息技術革命更具抽象特色,它在無形之中就改變了整個人類的生活形式。在大數據的控制下,人的一切存在屬性,甚至包括人的身份、財富和地位等都被量化和數字化,每個人的言行也要與數字化生存相適應。大數據技術帶來的數字化生存形式支配了人們的日常生活,形式化和單一化的生活成為許多人的普遍生活狀態,人們在這一數字加工廠中被生產成為了同樣屬性的五花八門的電子產品。但這種多樣性只是形態和種類的形式多樣性,精確加工廠中的人是沒有個性精神的單向度人,是名副其實的負載數據的電子產品。但是,相對于形式多樣性的實質多樣性卻被統一的數字一筆抹平了,可以說,不僅近代科學革命造成的自然界“祛魅”被徹底合理化,自然界被數字化。而且,人類生活世界本身也進一步被“祛魅”,本來充滿意義和價值的人的世界在數字化的技術控制下同樣數字化了,在技術功利性取向的引導下人類社會效率大大提高,但同時必定會消減人及其存在和生活的意義和價值維度,即人活生生的存在和實踐的形式化和數字化使得“生活世界”失去了原有的意義和價值。
但大數據時代也孕育著新的文化超越性,新的技術發展和哲學思想的轉變為融合事實與價值的分離提供了可能性。在傳統上,自然科學將自然界數據化,使得畢達哥拉斯“數是萬物本源”思想得以實現,而大數據時代的技術革命進一步使得人類社會的數據化成為可能,在此意義上,自然世界和人類社會又重新統一起來。所以,大數據革命帶來的信息與數字化生存狀態既帶來人類未來命運的危機問題,但又是超越這種危機的一次機遇。從近代理性原則這一現代社會的核心價值觀來看,技術現代性的實現表現在大數據時代,同樣是作為主體的人對圖像世界的重構過程,信息數據作為技術平臺蘊含著人本主義和技術理性主義二者的雙重邏輯。只有在關注于人類生存這一根本價值的前提下,才能恢復生活價值于科學認識和科學實踐的標尺地位,從而實現技術理性與價值理性的有機統一,這表現在人與自然關系上就是人與自然關系的和諧。所以說,人類生活的價值和意義問題是我們處理好科學哲學認識論以及科學倫理問題的總出發點,人類的這種新的存在狀態決定了大數據時代科學認識論和價值論問題的提出與問題解決的基本邏輯。
余論
大數據意味著人類數字化生活時代的來臨,在這場科學技術變革中,人們的生活方式、認知模式和價值觀念都在發生著深遠的轉變。人類符號化的社會實踐活動將我們的生活推進到了一個無限廣闊的領域,數字化生存狀態成為科學認識論和價值論研究的新視角。就此,在大數據語境下,科學實踐這一存在論維度于科學認識論和價值論中的重要性更加突出,傳統認識論研究范式發生了重大變化:信息和數據的密集化使得認識論個體主義的基礎地位急劇下降,而“互動主義”的社會論的理論地位上升,如此以來,認識論和方法論的個體認知和社會建構模式綜合起來。同時,科學認知社會維度也彰顯了科學實踐的基礎性地位,這為事實與價值的溝通提供了確實可靠的橋梁。一方面,科學事實即是人們在感性科學實踐中打交道的經驗數據,這些信息數據必然具有屬人的性質;另一方面,科學價值更是以科學實踐為中介而形成的,這并非純粹的主觀判斷,它具有科學實踐的客觀依據。簡言之,大數據奠定的新的科學實踐形式,為科學哲學觀念的變革和發展提供了新的研究視野和研究內容,在這一探索過程中,我們只有將其中的存在論、認識論以及價值論三重維度統一起來,才能使得具有超越性的大數據時代的科學哲學研究擁有新的發展前景。
(本文系教育部新世紀優秀人才支持計劃項目與國家社科基金項目階段性成果,項目編號:14Bzx020)
【注釋】
①Peter Machamer. Phenomena, data and theories: a special issue of Synthese .Synthese,2011(1) :1.
②David Feinleib. Big Data Bootcamp. Apress L. P,2014:1.
③Mél Hogan and Tamara Shepherd. Information Ownership and Materiality in an Age of Big Data Surveillance. Journal of Information Policy, 2015(5):7.
④T. Hey, S. Tansley, and K. Tolle, The Fourth Paradigm: Data-Intensive Scientific Discovery,Proceeding of the IEEE,2011(8):1334.
⑤⑧Steve Kelling,W.Hochachka,D.Fink,M.Riedewald,R.Caruana,G.Ballard,G.Hooker. Data-intensive Science: A New Paradigm for Biodiversity Studies, BioScience,2009(7):613-617.
⑥[美]尼葛洛龐帝:《數字化生存》,海口:海南出版社,1997年,第191頁。
⑦格瑞爾(Jim. Gray)、海爾(T. Hey)和陶利(K. M. Tolle)等人都認為數據密集型科學研究為一種新的,繼實驗科學、理論推演、計算機仿真方法以來的第四種科學研究范式。
⑨Min Chen, Shiwen Mao, Yin Zhang, Victor C. M. Leung. Big Data:Related Technologies, Challenges and Future Prospects.Springer International Publishing,2014:1
⑩張曉強,楊君游,曾國屏:“大數據方法:科學方法的變革和哲學思考”,《哲學動態》,2014年第8期。
Philip Kitcher. The Third Way: Reflections on Helen Longino’s The Fate of Knowledge. Philosophy of Science, 2002(1):550.
賈向桐:“論信息異化的技術根源與調控”,《信息系統工程》,2010年第2期。
責編 /王坤娜