在互聯網的某個角落,你可能已經被評級過。
這些評級幫助各種各樣的公司做決定,諸如在哪些地方冒險,以及如何改善運營等等。然而,這些評級對被評級者有著什么樣的影響?凱洛格學院的哈蒂姆?拉赫曼的新研究顯示,盡管這些算法不透明,而正是由于這種不透明性,它們在以意想不到的方式塑造人們的行為。
拉赫曼是凱洛格學院的管理與組織學助理教授,他研究了一個網上自由工作者勞動力平臺的算法影響。拉赫曼說:“目前有許多關于未來工作及其表現形式的探討。這類平臺是下一個前沿領域的組成部分。”
拉赫曼研究的那個網站與許多承諾為自由工作者和付費客戶牽線建立合作關系的網站(例如Upwork、TopCoder、TaskRabbit等等)一樣,也是采用一種復雜的算法對自由工作者進行評分,潛在客戶即可根據這個分數來分類并選擇可能的人選。
為了了解這種不透明的評估系統如何影響自由工作者,拉赫曼加入了這個平臺(化名“TalentFinder”)并且采訪了自由工作者和雇用他們的客戶。此外,他還解析了TalentFinder上面的書面交流和自由工作者討論板上的帖子。
所有跟他談過的工作者,都對分數突然莫名下降的可能性感到惶惶不安。對于這種心慌,他們的反應方式主要取決于自己之前是否經歷過評分降低的情況,而與他們的評分高低關系較小,另外很重要的一點是他們對該平臺帶來收入的依賴程度。
拉赫曼解釋說,傳統上學者將工作表現評估描述為能夠幫助收緊工作者周圍的“鐵籠”,因為這些評估可以讓雇主約束行為并設定成功的標準。用算法進行評估則有一種不同的、可能帶有破壞性的影響。
“不透明的第三方評估可能為工作者產生一個‘看不見的籠子’,因為他們對這種評估的感受是一種控制形式但卻無法解釋或了解這些評估標準進而取得成功。”拉赫曼寫道。
當然,如同拉赫曼指出的那樣,不僅我們許多人或多或少地也住在某種看不見的籠子里,而且我們還在構建籠子方面提供了一些幫助。每當我們對從亞馬遜商城購買的商品或Lyft司機做出評級時,我們都可能正在影響他人的生計。
“使用這些平臺的人多半沒有意識到自己在影響這些系統及其算法方面所扮演的重要角色,覺得那只不過是一種交易式關系。”他說。
讓評估標準變成一個迷
“TalentFinder”是同類網站中規模最大的平臺之一。在2015年,有超過1,200萬的自由職業者在該網站注冊,客戶數有500萬,分布在全球100多個國家。這些客戶可以挑選各種各樣的自由工作者,從助理到營銷人員再到軟件工程師,應有盡有。
2013年,當拉赫曼在TalentFinder注冊并開始進行研究時,該平臺根據一套顯示項目分數和整體分數的透明系統對自由職業者進行評級。項目完成時,客戶會用一個1到5的評分量尺在幾個方面評價自由職業者,包括“技能”、“工作質量”以及“遵守預定的完成進度”。這些分數匯總后得到項目總分,將這些項目分數匯總(根據每個項目的金額加權)后即產生一個滿分為五星的總評級,該評級包含在自由職業者的個人簡介中。
雖然這套評估系統直截了當,但它給TalentFinder帶來一個問題,那就是自由職業者的評級普遍過高,缺乏差異性,而差異性對客戶會有幫助。該網站曾經一度有超過90%的自由職業者在五星中得到四星評級,80%的自由職業者則獲得幾近完美的評級。
對這種情況的解決之道就是:算法。從2015年開始,該網站根據刻意保持神秘的標準,改用一個1到100的評分量尺對自由職業者進行評分。
該算法推出三個月后,TalentFinder在一篇公開博文中寫道:“我們不透漏您分數的確切計算方式,因為這樣做會使某些用戶更容易進行操作來人為提高他們的分數。”新算法實施后,僅有大約5%的自由職業者得到了90分以上的評分。
為了研究這個自由職業者新評估系統的效果,拉赫曼在2015年到2018年之間從以下三個來源收集數據:與自由職業者進行的80次訪談和與客戶進行的18次訪談;書面交流內容,包括TalentFinder社區討論板上超過2,000條與算法有關的信息和TalentFinder上有關這個主題的公開帖子;還有他作為一名注冊客戶的自身觀察。
普遍存在的擔心害怕
拉赫曼在整理他的訪問和書面內容時,赫然發現他聽到的抱怨相當一致。所有他訪談的自由職業者都擔心害怕自己的分數可能突然下降,并且對于無法從分數變化中學習并改進而感到挫折。
“最讓我驚訝的是平臺上業績最優秀和經驗最豐富的自由職業者在了解算法如何運作方面未必能夠取得任何優勢。”他說。“一般來說,在一個系統中成績出色的人在某種程度上可以推斷出系統是如何運作的。而在這個環境中,即使是分數沒有改變的人,也一樣擔心害怕。”
拉赫曼對這種害怕與挫折感觀察到兩種截然不同的反應。其中一種反應他稱為“試驗性反應”,自由職業者會不斷通過反復試驗來試圖提高自己的分數,比如只接合約期較短的項目或主動要求客戶對工作表現提供反饋。
另一種反應是自由職業者試圖通過拉赫曼稱為“限制性活動”的行為來保護自己的分數。自由職業者試圖通過不同的方式來限制自己在評估算法的曝光度,他們有時要求在TalentFinder上認識的客戶在平臺以外的地方聯系及付款,以便使其評級不受影響。其他人則不采取任何行動,希望以此保持評級。
拉赫曼找到了兩個主要因素,它們決定了哪些自由職業者會試驗,哪些人會離開平臺私下交易或者干脆不采取行動。這兩個因素是自由職業者對該平臺帶來收入的依賴度,以及他們是否經歷過分數下降的情況。
這根據自由職業者的分數高低而有所不同。
獲得高評級并且對平臺依賴度高的自由職業者根據最近分數是否下降來選擇他們的應對策略。看到自己分數下降的人會試驗不同的策略來提高分數;如果他們的分數沒有下降,他們就限制自己在平臺上的活動以努力保護分數。對平臺依賴度低的業績優異者無論是否有過分數下降,都會限制自己在TalentFinder上的時間。
分數較低的自由職業者對平臺的依賴度似乎決定了他們的行動方向。如果他們依賴平臺,他們就會采取試驗法,即便分數繼續波動。如果他們不覺得自己的收入與平臺息息相關,他們就逐漸限制自己在平臺上的活動。
拉赫曼解釋說,工作者的處境在這些平臺似乎比起傳統工作環境更讓人感到岌岌可危,因為確實如此。傳統的雇主評估大多旨在幫助員工改進,但是像TalentFinder這類由算法進行評估的網站主要是為了幫助平臺從眾多人選中自動挑選出“最佳”工作者,從而讓客戶滿意。
“對平臺來說,重點是優化平臺的整體活力,平臺的主要目標并非是幫助工作者改進。”拉赫曼說道。“對人們的日常生活經驗而言,尤其是當他們依賴平臺的工作機會時,這就可能非常挫折和困難。”
住在籠子里,并且塑造它
拉赫曼說,從他開始從事這項研究以來,他對我們多數人住的各種各樣看不見的籠子越來越了解。例如,他指出,近期報告詳細說明了從我們的電視和吸塵器到我們用來處理醫療處方和汽車保險的手機應用程序,所有這些都在收集我們的資料并且以我們基本上看不到的方式訓練專屬算法。
“我認為當我們進入這個系統,我們所有的言行以及互動情況都全部輸入到我們未必了解其存在的算法時,看不見的籠子比喻的適用范圍便更加廣泛。”拉赫曼說。
他指出,有些人退出這些平臺的自由度更高,歸根結底就看他們對平臺的依賴度如何。拉赫曼表示,未來研究有一個可能成果相當豐碩的領域,那就是探討種族、性別和收入等特征與對平臺依賴度以及其算法評估之間的關聯性。比如,了解某些種族群體的人是否更可能先被算法“評估”(并被列入可能的黑名單)后才能夠去租公寓、申請信用卡或參加健康保險,這一點很重要。
“讓這個看不見的籠子的比喻浮出臺面是希望大家注意到這個現象,并且希望用一種人們可以起共鳴的方式呈現。”拉赫曼說道。“當然,即便我們都意識到這個現象,要知道怎么做還是很難,因為這些系統很復雜而且算法改變的速度很快。”
立法機構開始對這個基本上沒有法律規范的領域提供某種程度的監督。2020年的《加州消費者隱私權法案》(California Consumer Privacy Act)是美國國內這類立法中最強大的法案,它建立了網上用戶對于個人資料收集的知曉、刪除和選擇的權利。歐盟在2018年通過了更積極的立法。拉赫曼說:“這是一個鼓舞人心的跡象,不過僅有法規遠遠不能解決問題。”(財富中文網)