
隨著技術(shù)的不斷普及,學(xué)者們對(duì)人們的行為研究也從線下開(kāi)始走向線上。毫無(wú)疑問(wèn),他們的研究方法對(duì)于我們理解與研究用戶行為有極大的幫助。12月13日,普林斯頓大學(xué)的社會(huì)學(xué)家Matt Salganik出版了新書(shū)《Bit by Bit: Social Research in the Digital Age》,介紹了數(shù)據(jù)與社會(huì)科學(xué)研究的方法?!哆B線》雜志對(duì)Matt Salganik進(jìn)行了專(zhuān)訪。
搞清楚人類(lèi)是如何做人類(lèi)的事情是社會(huì)科學(xué)(包括心理學(xué)、社會(huì)學(xué)、經(jīng)濟(jì)學(xué)、人類(lèi)學(xué)等等)能夠做到的最令人興奮的事情之一,同樣,這也是最難的一個(gè)。我們通常說(shuō),可靠、有意義的方法可以將現(xiàn)實(shí)世界的行為轉(zhuǎn)化為可以用來(lái)實(shí)驗(yàn)的變量,但這是難以捉摸的。這可能是“再現(xiàn)性危機(jī)”的部分原因,即由于統(tǒng)計(jì)方法和研究方法上的壓力,一些科學(xué)研究有效性引起了人們的擔(dān)憂,這就是所謂的“軟科學(xué)”首先要解決但也是最困難的。
普林斯頓大學(xué)的社會(huì)學(xué)家Matt Salganik,正試圖解決這個(gè)難題。他想知道人類(lèi)怎樣,以及為什么會(huì)做出一些行為,尤其是在一個(gè)由社會(huì)媒介構(gòu)成的世界里。為了做到這一點(diǎn),Salganik已經(jīng)成為了一名硬核數(shù)據(jù)的癡迷者。他說(shuō),現(xiàn)在每個(gè)人在服務(wù)器上留下的數(shù)字痕跡,為人類(lèi)行為科學(xué)研究提供了取之不盡的燃料,而且學(xué)會(huì)明智地使用它們也能解決社會(huì)科學(xué)目前在其自身實(shí)踐中遇到的各種危機(jī)。Salganik在12月3日發(fā)布的新書(shū)《Bit by Bit: Social Research in the Digital Age》中,為數(shù)據(jù)和社會(huì)科學(xué)的融合奠定了新的規(guī)則。
以下是《連線》雜志對(duì)Matt Salganik教授的專(zhuān)訪。
這本書(shū)有一個(gè)有趣的起源故事。
早前,我的一篇論文研究的是在線進(jìn)行的實(shí)驗(yàn)。我們創(chuàng)建了一個(gè)網(wǎng)站,讓人們可以下載新音樂(lè),但我們可以控制人們能夠獲取的別人在做什么的信息。這讓我們有了一種能夠創(chuàng)造和測(cè)試社會(huì)風(fēng)尚的能力。通過(guò)在網(wǎng)站上而不是在傳統(tǒng)的校園實(shí)驗(yàn)室里進(jìn)行實(shí)驗(yàn),我們獲得了27000名參與者,是后者情況下的100倍。
論文發(fā)表于2006年11月,從那以后,我一直在用數(shù)字時(shí)代的技術(shù)做研究,并把它教給學(xué)生。這本書(shū)是這段經(jīng)歷的結(jié)果。我想幫助其他人開(kāi)始做這樣的研究,并幫助那些已經(jīng)在一個(gè)領(lǐng)域做這件事的人看到與其他領(lǐng)域的聯(lián)系。
當(dāng)這本書(shū)進(jìn)入傳統(tǒng)的同行評(píng)審時(shí),它同時(shí)也在網(wǎng)上進(jìn)行了一個(gè)公開(kāi)審查。我把這本書(shū)變成了一系列的網(wǎng)站,任何人都可以過(guò)來(lái)閱讀并注釋它們。我能夠收集到大量的對(duì)這本書(shū)有幫助的反饋,同時(shí),我也收集了大量有關(guān)人們?nèi)绾闻c這本書(shū)互動(dòng)的數(shù)據(jù)。我們也在使用一些大媒體和科技公司使用的所有大數(shù)據(jù)技術(shù)。現(xiàn)在我們發(fā)布了一個(gè)開(kāi)放的評(píng)論工具包,其他作者也可以使用。
你通過(guò)公開(kāi)評(píng)論獲得的反饋與更正式的同行評(píng)審有很大不同嗎?
我從同行評(píng)審中得到的反饋來(lái)自于一些專(zhuān)家,他們想法通常是,他們認(rèn)為這本書(shū)應(yīng)該如何寫(xiě)。
哈哈。
不,有些是好主意。這很有用。我從公開(kāi)評(píng)論中得到的反饋是不同的。他們并不是所有人都是專(zhuān)家,我希望我的書(shū)能讓非專(zhuān)業(yè)人士讀懂并為他們提供幫助。所以這對(duì)“診斷”書(shū)中的一些問(wèn)題很有幫助。有一個(gè)關(guān)于我“跳過(guò)一個(gè)步驟”的注釋引發(fā)了爭(zhēng)論,我看著它,然后想,“哦,是的,我跳過(guò)了一步。”對(duì)同行的評(píng)審和我來(lái)說(shuō),這是顯而易見(jiàn)的一步,但對(duì)非專(zhuān)業(yè)人士來(lái)說(shuō),事實(shí)并非如此。
你認(rèn)為誰(shuí)能使用這本書(shū)?誰(shuí)是讀者?
我希望讀者會(huì)很廣泛。比如正面臨著一系列問(wèn)題的社會(huì)科學(xué)領(lǐng)域的人。比如數(shù)據(jù)科學(xué)領(lǐng)域的人。在大學(xué)之外,許多公司都有計(jì)算機(jī)科學(xué)、工程學(xué)、統(tǒng)計(jì)學(xué)等專(zhuān)業(yè)的數(shù)據(jù)科學(xué)家,他們也正在研究社會(huì)數(shù)據(jù)。他們本質(zhì)上是社會(huì)科學(xué)家,但他們沒(méi)有受到過(guò)社會(huì)科學(xué)家方面的訓(xùn)練。對(duì)于這些人,我希望這本書(shū)能向他們介紹一些社會(huì)科學(xué)的觀點(diǎn),以及社會(huì)科學(xué)家的工作方式。我在微軟研究院休假,那里有一些非常不錯(cuò)的工程師,但他們對(duì)社會(huì)科學(xué)不太了解。
在一些地方,你對(duì)數(shù)據(jù)科學(xué)家和社會(huì)科學(xué)家之間的差異提出了一些觀點(diǎn)。這些文化差異具體體現(xiàn)在在哪里?
我認(rèn)為各個(gè)領(lǐng)域有很多東西可以互相學(xué)習(xí),互相幫助。過(guò)去,社會(huì)科學(xué)家通常會(huì)研究專(zhuān)門(mén)為研究目的而創(chuàng)建的數(shù)據(jù)。在書(shū)中,我把這稱為“定制數(shù)據(jù)”。而數(shù)據(jù)科學(xué)家則傾向于使用“現(xiàn)成數(shù)據(jù)”,這些數(shù)據(jù)最初是為了某個(gè)目的而被用于研究。舉個(gè)例子,如果社會(huì)科學(xué)家想要研究公眾輿論,他們本能的第一個(gè)想法是看一份像GSS(美國(guó)綜合社會(huì)調(diào)查)這樣的調(diào)查,由研究人員為其他研究人員做的。但數(shù)據(jù)科學(xué)家不一樣,他們的第一站可能是Twitter。
其中一些差異來(lái)自于這些不同領(lǐng)域?qū)<业膬r(jià)值取向。對(duì)于社會(huì)科學(xué)家來(lái)說(shuō),他們經(jīng)常需要做的是能夠?qū)σ恍└蟮睦碚撟龀鰧?shí)證的陳述。對(duì)于數(shù)據(jù)科學(xué)家來(lái)說(shuō),更重要的是,用數(shù)據(jù)來(lái)做一些簡(jiǎn)潔、有趣或新奇的事情。這些價(jià)值觀上的差異可能導(dǎo)致采取的方法不同。
此外,所受的訓(xùn)練方面也存在差異。社會(huì)科學(xué)家在收集調(diào)查數(shù)據(jù)和如何分析數(shù)據(jù)方面受到了訓(xùn)練;數(shù)據(jù)科學(xué)家通常沒(méi)有這種培訓(xùn),但他們接受過(guò)其他方面的培訓(xùn),比如如何使用非常大的數(shù)據(jù)集。因此,社會(huì)科學(xué)可以從數(shù)據(jù)科學(xué)家的技術(shù)和觀點(diǎn)中學(xué)到很多東西,同樣,數(shù)據(jù)科學(xué)家也可以從社會(huì)科學(xué)家那里學(xué)到很多東西。如果你想研究公眾輿論,那么說(shuō)GSS比Twitter好是沒(méi)有意義的。你必須要問(wèn),哪個(gè)數(shù)據(jù)源對(duì)我們的問(wèn)題最有用。
有一章特別吸引我的是道德問(wèn)題。你寫(xiě)道,社會(huì)科學(xué)家在面對(duì)看似棘手的官僚體制時(shí),大多只考慮道德與倫理問(wèn)題,而數(shù)據(jù)科學(xué)家根本就不考慮道德問(wèn)題。
在與我交談過(guò)的研究人員中,沒(méi)有人愿意從事不道德的工作,但許多模擬時(shí)代的社會(huì)科學(xué)研究——校園實(shí)驗(yàn)、調(diào)查研究、人種學(xué)研究——的倫理道德已經(jīng)或多或少地得到了解決。一般來(lái)說(shuō),你能做什么和不能做什么是一致的。我認(rèn)為,在利用大量數(shù)據(jù)開(kāi)始研究之前,社會(huì)科學(xué)家們關(guān)于倫理道德的方式已經(jīng)變得有些常規(guī)化了。
現(xiàn)在我們有可能做完全不同的事情。我們有能力在未經(jīng)同意或不知情的情況下觀察數(shù)以百萬(wàn)計(jì)的人,我們有能力在未經(jīng)同意或不知情的情況下讓人們參與實(shí)驗(yàn),這些都是我們可以做的新事情,我不認(rèn)為我們作為學(xué)者已經(jīng)找到了如何負(fù)責(zé)任地使用這種權(quán)力的方法。在行業(yè)和政府中也出現(xiàn)了類(lèi)似的問(wèn)題。在數(shù)字時(shí)代,我們面臨的一個(gè)重大挑戰(zhàn)是,如何以一種負(fù)責(zé)任的方式利用這些機(jī)會(huì)。在這本書(shū)中,我試圖列出一些可以幫助人們思考和談?wù)摰脑瓌t。
尊重個(gè)人,善意,公正,法律和公共利益。
是的,這些想法并不是我創(chuàng)造出來(lái)的。我相信它們?cè)谖磥?lái)可能會(huì)有用的一個(gè)原因是,它們一直存在。其中有一些原則是我從40多年前發(fā)表的《貝爾蒙特報(bào)》中得出的。采用以原則為基礎(chǔ)的方法而非規(guī)則為基礎(chǔ)方法的其中一個(gè)原因是,我們可以確信我們的能力將會(huì)發(fā)生改變。為了解釋這些新能力,我們需要有一些抽象的原則。
與人打交道最多的研究人員必須遵守的一個(gè)原則是知情同意,確保與你共事的人知道他們?cè)谧鲂┦裁础?/span>
這是我列出的四項(xiàng)原則的關(guān)鍵部分。這些都比單純的知情同意更廣泛。目前,我們非常重視知情同意,這顯然很重要,但我們可能會(huì)過(guò)分強(qiáng)調(diào)某一特定的事情,而忽視了更廣泛的尊重他人的理念,這是由知情同意的原則中衍生出來(lái)的。
有趣的是,你正在向社會(huì)科學(xué)家提出一種數(shù)據(jù)驅(qū)動(dòng)的方法,而此時(shí)社會(huì)科學(xué)正在應(yīng)對(duì)一場(chǎng)與數(shù)據(jù)有關(guān)的危機(jī)——再現(xiàn)性問(wèn)題和統(tǒng)計(jì)操縱,這讓我們對(duì)該領(lǐng)域的一些關(guān)鍵研究結(jié)論產(chǎn)生了疑問(wèn)。
我想說(shuō)的是,從模擬時(shí)代到數(shù)字時(shí)代的轉(zhuǎn)變,正是推動(dòng)大量新數(shù)據(jù)產(chǎn)生的因素,也使社會(huì)科學(xué)家有了新的工作實(shí)踐。它讓我們更容易地分享我們的數(shù)據(jù)和代碼,這讓我們更容易向所有人提供我們的研究,而不僅僅是那些有幸在大學(xué)里訂閱昂貴期刊的人。數(shù)字時(shí)代有可能幫助我們改變和改進(jìn)我們的社會(huì)科學(xué)實(shí)踐,我認(rèn)為人們會(huì)對(duì)此感到興奮并開(kāi)始接受。
在向數(shù)字時(shí)代過(guò)渡的過(guò)程中,具體發(fā)生了哪些變化?
當(dāng)我開(kāi)始讀研究生時(shí),研究人員所使用的數(shù)據(jù)通常是研究人員為研究人員創(chuàng)造的數(shù)據(jù)(比如大型的問(wèn)卷調(diào)查數(shù)據(jù))。這里面有一些好東西,因?yàn)檫@些數(shù)據(jù)通常和科學(xué)興趣有關(guān)。它通常對(duì)所有的研究人員開(kāi)放,這很重要。
現(xiàn)在有很多數(shù)據(jù)都是日常行為的副產(chǎn)品。這被稱為是“數(shù)字追蹤數(shù)據(jù)”或“數(shù)字廢氣”。它的規(guī)模更大,創(chuàng)造了很多有趣的研究機(jī)會(huì),但也帶來(lái)了一些問(wèn)題。這些數(shù)據(jù)通常都有公司或政府的隱含意圖。這被稱為“算法混淆”。
這是什么意思?
從Facebook的數(shù)據(jù)中了解人類(lèi)行為就像是在賭場(chǎng)里觀察人們的行為。你當(dāng)然可以從賭場(chǎng)里的人那里學(xué)到東西,但賭場(chǎng)是一個(gè)高度工程化的環(huán)境,旨在鼓勵(lì)某些行為,并阻止其他行為。Facebook也類(lèi)似。當(dāng)人們看到Facebook時(shí),他們會(huì)想,“哦,這是人們的自然行為。”但這根本不是事實(shí)。在許多情況下,系統(tǒng)設(shè)計(jì)師的目標(biāo)并不是研究人員的目標(biāo)。
然后是訪問(wèn)權(quán)限。Facebook和Twitter擁有大量的數(shù)據(jù),而這些數(shù)據(jù)對(duì)于每一位研究人員來(lái)說(shuō)都是不可用的,這其中有很好的理由——復(fù)雜的倫理、法律和商業(yè)原因。但如果有一種情況,一些研究人員可以使用,而另一些人則沒(méi)有,這可能會(huì)引發(fā)對(duì)再現(xiàn)性的擔(dān)憂。
但社會(huì)科學(xué)不僅僅只局限于社交媒體。
我的兩個(gè)孩子,分別是8歲和4歲,正在和Alexa交談。他們將以一種不同于我的方式與世界互動(dòng)。這些心理影響將需要一段時(shí)間才能觀察和理解,但我們已經(jīng)開(kāi)始看到行業(yè)和社會(huì)關(guān)系的重大變化。
在任何類(lèi)型的交易記錄中,都有很多機(jī)會(huì)。Facebook和Twitter,其中很多都是人們有意創(chuàng)建的數(shù)據(jù),但在更隱晦的數(shù)據(jù)中有很大的可能性。比如說(shuō),我的手機(jī)創(chuàng)建的位置數(shù)據(jù)。比特幣是另一個(gè)很好的例子。在經(jīng)濟(jì)交易的過(guò)程中,這個(gè)分類(lèi)帳就被創(chuàng)造出來(lái)了。我有一位同事正在為研究人員制作工具,以了解比特幣賬簿上的情況。
對(duì)于很多人來(lái)說(shuō),通過(guò)公司的平臺(tái)或分布式的點(diǎn)對(duì)點(diǎn)系統(tǒng)相互交流變得越來(lái)越容易。在某種程度上,所有這些交互都是通過(guò)數(shù)字媒介進(jìn)行的,它們創(chuàng)造了記錄。這些記錄對(duì)研究人員來(lái)說(shuō)都是非常令人興奮的。