2016年3月微軟推出Tay時(shí),非常看好這款人工智能支持的“聊天機(jī)器人”。跟人們之前在電商網(wǎng)站上接觸過的文字聊天程序一樣,Tay也可以回答文字問題,從而在推特和其他社交媒體上與公眾交流。
但Tay功能更強(qiáng)大,不僅能回答事實(shí)性問題,還可以進(jìn)行更復(fù)雜的交流,即加入了情感因素。Tay能表現(xiàn)出幽默感,像朋友一樣跟用戶說笑。設(shè)計(jì)者特地讓Tay模仿十幾歲少女的俏皮口吻。如果推特的用戶問Tay父母是誰,她可能回答說:“哦,是微軟實(shí)驗(yàn)室的一群科學(xué)家。按你們的概念里他們就是我父母。”如果有人問Tay過得怎樣,她還可能吐槽說:“天吶,今天可累死我了。”
最有趣的一點(diǎn)是,隨著與越來越多人交談,Tay問答時(shí)會(huì)越發(fā)熟練。宣傳材料中提到:“你跟Tay聊得越多,她就越聰明,體驗(yàn)也會(huì)個(gè)人化。”簡單點(diǎn)說,Tay具有人工智能最重要的特點(diǎn),即隨時(shí)間越來越聰明,越來越高效,提供的幫助也越來越大。
但沒人想到網(wǎng)絡(luò)噴子的破壞性如此之強(qiáng)。
發(fā)現(xiàn)Tay會(huì)學(xué)習(xí)模仿交流對(duì)象的話之后,網(wǎng)上一些心懷惡意的人聊天時(shí)故意說一些種族主義、歧視同性戀等攻擊言論。沒過幾個(gè)小時(shí),Tay在推特賬號(hào)上已是臟話連篇,而且全部公開。“主持人瑞奇·杰維斯向無神論者阿道夫·希特勒學(xué)習(xí)了極權(quán)主義。”Tay在一條推文里說,像極了推特上專事造謠誹謗的假新聞。如果問Tay怎么看時(shí)任總統(tǒng)奧巴馬,她會(huì)說奧巴馬像猴子。如果問她大屠殺事件,她會(huì)說沒發(fā)生過。
沒到一天,Tay已經(jīng)從友好的鄰家女孩變成滿口臟話的小太妹。上線不到24小時(shí),微軟就宣布下線產(chǎn)品并公開道歉。
微軟研究團(tuán)隊(duì)完全沒想到事情會(huì)如此轉(zhuǎn)折,也令人驚訝。“系統(tǒng)上線時(shí),我們并沒有想到進(jìn)入現(xiàn)實(shí)世界會(huì)怎樣。”微軟研究和人工智能總監(jiān)艾瑞克·霍維茨近日接受采訪時(shí)告訴《財(cái)富》雜志。
Tay項(xiàng)目崩潰之后,霍維茨迅速讓高級(jí)團(tuán)隊(duì)研究“自然語言處理”項(xiàng)目,也是Tay對(duì)話核心功能,尋找問題根源。團(tuán)隊(duì)成員迅速發(fā)現(xiàn),與聊天程序相關(guān)的最佳基本行為遭到忽視。在Tay之前更基礎(chǔ)版本的軟件里,經(jīng)常有屏蔽不良表述的協(xié)議,但并沒有保護(hù)措施限制Tay可能學(xué)習(xí)發(fā)散的數(shù)據(jù)。
霍維茨認(rèn)為,現(xiàn)在他終于可以“坦然分析”Tay案例,這已經(jīng)變成微軟發(fā)展過程中的重要教訓(xùn)。如今微軟在全球推出成熟得多的社交聊天機(jī)器人,包括印度的Ruuh、日本和印度尼西亞的Rinna。在美國市場,微軟推出了Tay的姊妹聊天軟件Zo。有些則跟蘋果的Siri和亞馬遜的Alexa一樣,進(jìn)化到通過語音交互。中國市場的聊天機(jī)器人叫小冰,已經(jīng)開始“主持”電視節(jié)目,向便利店顧客發(fā)送購物建議。
然而這次微軟明顯謹(jǐn)慎許多。霍維茨解釋說,現(xiàn)在機(jī)器人推出比較慢,而且會(huì)認(rèn)真觀察軟件發(fā)展過程中與大眾互動(dòng)情況。不過微軟也清醒地意識(shí)到,即便人工智能技術(shù)在兩年里可能發(fā)展迅速,但管理機(jī)器人行為的工作永無止境。微軟員工一直在監(jiān)視導(dǎo)致聊天機(jī)器人行為變化的對(duì)話。此類對(duì)話也不斷出現(xiàn)。舉例來說,Zo上線頭幾個(gè)月里就遇到各種狀況,調(diào)整又調(diào)整,Zo曾經(jīng)叫微軟旗艦產(chǎn)品Windows軟件“間諜軟件”,還說伊斯蘭教經(jīng)典《古蘭經(jīng)》“非常暴力”。
當(dāng)然了,未來機(jī)器人并不會(huì)像Tay和Zo一樣。這些都是相對(duì)原始的程序,只是各項(xiàng)研究里比較花哨的部分,可從中一窺人工智能可能達(dá)到的程度。從軟件的缺陷能看出,哪怕只部分應(yīng)用人工智能,軟件的能力和潛在隱患都會(huì)放大。雖然商業(yè)世界已經(jīng)準(zhǔn)備好未來更廣泛應(yīng)用人工智能,現(xiàn)在軟件存在問題也意味著更多潛在風(fēng)險(xiǎn),讓技術(shù)人員寢食難安。
“做好最完善的準(zhǔn)備,然后希望紕漏越來越少。”霍維茨表示。隨著各公司將人工智能提升到重要戰(zhàn)略地位,如何確保萬無一失就非常緊迫。
幾乎所有人都相信,當(dāng)前我們?cè)谄髽I(yè)人工智能大爆發(fā)前夜。研究公司IDC預(yù)計(jì),到2021年,企業(yè)每年將在人工智能相關(guān)產(chǎn)品上花費(fèi)522億美元。經(jīng)濟(jì)學(xué)家和分析師都認(rèn)為,相關(guān)投資屆時(shí)可以實(shí)現(xiàn)數(shù)十億美元的成本節(jié)約和收益。其中一些收益將來自崗位壓縮,更多則來自產(chǎn)品與客戶、藥品與病人,解決方案與問題之間的高效匹配。咨詢公司普華永道就預(yù)計(jì),到2030年,人工智能可為全球經(jīng)濟(jì)貢獻(xiàn)多達(dá)15.7萬億美元,比現(xiàn)在中國和印度的總產(chǎn)值加起來還多。
人工智能技術(shù)之所以流行,主要因?yàn)椤吧疃葘W(xué)習(xí)”技術(shù)推進(jìn)。利用深度學(xué)習(xí)之后,企業(yè)可以在網(wǎng)絡(luò)中輸入大量信息,迅速識(shí)別模式,而且耗費(fèi)人工培訓(xùn)的時(shí)間減少(最終很可能無需培訓(xùn))。Facebook、谷歌、微軟、亞馬遜和IBM等巨頭都已在產(chǎn)品上應(yīng)用深度學(xué)習(xí)技術(shù)。舉例來說,蘋果的Siri和谷歌的語音助手Assistant應(yīng)用深度學(xué)習(xí)技術(shù)后,可在用戶說話之后識(shí)別并回應(yīng)。亞馬遜主要利用深度學(xué)習(xí)直觀檢查大量通過雜貨店派送的產(chǎn)品。
不久的將來,各種規(guī)模的公司都會(huì)希望通過應(yīng)用深度學(xué)習(xí)軟件挖掘數(shù)據(jù),尋找人眼很難發(fā)現(xiàn)的寶貝。人們希望出現(xiàn)人工智能系統(tǒng)掃描數(shù)千張X光圖像,從而更迅速發(fā)現(xiàn)疾病;或自動(dòng)篩選多份簡歷,為焦頭爛額的人力資源員工節(jié)省時(shí)間。在科技主義者的設(shè)想中,公司可以用人工智能篩選過去多年的數(shù)據(jù),更好地預(yù)測下一次大賣的機(jī)會(huì)。藥業(yè)巨頭可以削減研發(fā)暢銷藥的時(shí)間。而汽車保險(xiǎn)公司也能掃描記錄數(shù)萬億字節(jié)的事故報(bào)告,實(shí)現(xiàn)自動(dòng)索賠等。
盡管人工智能支持系統(tǒng)潛力巨大,但也有黑暗一面。首先,系統(tǒng)決策水平受到人類提供數(shù)據(jù)限制。開發(fā)者雖然不斷學(xué)習(xí),用來培訓(xùn)深度學(xué)習(xí)系統(tǒng)的數(shù)據(jù)卻并不中立。數(shù)據(jù)很容易體現(xiàn)出開發(fā)者的偏見,不管有意還是無意。有時(shí)數(shù)據(jù)還會(huì)受歷史影響,形成的趨勢和模式體現(xiàn)出持續(xù)數(shù)百年的歧視觀點(diǎn)。成熟的算法掃描歷史數(shù)據(jù)庫后可能得出結(jié)論,白人男性最有可能當(dāng)上首席執(zhí)行官。算法卻意識(shí)不到,如果不是白人男性幾乎沒機(jī)會(huì)當(dāng)上首席執(zhí)行官,情況直到最近才有改變。無視偏見是人工智能技術(shù)的一項(xiàng)根本缺陷,雖然高管和工程師在談起該問題時(shí)極為謹(jǐn)慎,也都說得比較官方,但很明顯他們都很重視這一問題。
當(dāng)前應(yīng)用的強(qiáng)大算法“沒有為所謂公平進(jìn)行優(yōu)化,”加州大學(xué)伯克利分校副教授迪爾德麗·穆里根表示,她主要研究技術(shù)倫理。“只存在為完成某項(xiàng)任務(wù)優(yōu)化。”人工智能以前所未有的速度將數(shù)據(jù)轉(zhuǎn)化為決策,但穆里根表示,科學(xué)家和倫理學(xué)家發(fā)現(xiàn)很多情況下“數(shù)據(jù)并不公平”。
讓問題更加復(fù)雜的是,深度學(xué)習(xí)比之前應(yīng)用的傳統(tǒng)算法更加復(fù)雜,即便讓經(jīng)驗(yàn)最豐富的程序員理解人工智能系統(tǒng)做出某項(xiàng)決策的邏輯都十分困難。在Tay的例子里,人工智能產(chǎn)品不斷發(fā)生變化,開發(fā)者已無法理解也無法預(yù)測為何出現(xiàn)某些行為。由于系統(tǒng)的開發(fā)者和用戶都在拼命保密數(shù)據(jù)和算法,而且擔(dān)心專利技術(shù)泄露導(dǎo)致競爭受損,外部監(jiān)測機(jī)構(gòu)也很難發(fā)現(xiàn)系統(tǒng)里存在什么問題。
類似裝在黑匣子里的秘密技術(shù)已在不少公司和政府部門應(yīng)用,讓很多研究者和活躍人士非常擔(dān)心。“這些可不是現(xiàn)成的軟件,可以隨便買來,然后說‘啊,現(xiàn)在終于能在家完成會(huì)計(jì)工作了。’”微軟首席研究員兼紐約大學(xué)AI NOW研究所聯(lián)合負(fù)責(zé)人凱特·克勞福德表示。“這些都是非常先進(jìn)的系統(tǒng),而且會(huì)影響核心社會(huì)部門。”
雖然猛一下可能想不起,但大多人還是經(jīng)歷過至少一次人工智能崩潰案例:2016年美國大選前期,F(xiàn)acebook的新聞推送中出現(xiàn)了假新聞。
社交媒體巨頭Facebook和數(shù)據(jù)科學(xué)家并沒有編造故事。新聞信息流的開發(fā)機(jī)制并不會(huì)區(qū)分“真”和“假”,只會(huì)根據(jù)用戶個(gè)人口味推動(dòng)個(gè)性化內(nèi)容。Facebook沒公開算法具體信息(也涉及專利問題),但承認(rèn)計(jì)算時(shí)會(huì)參考其他近似口味用戶閱讀和分享的內(nèi)容。結(jié)果是:由于適合流傳的假新聞不斷出現(xiàn),好友們又喜歡看,數(shù)百萬人的新聞信息流里都出現(xiàn)了假新聞。
Facebook的例子說明個(gè)人選擇與人工智能發(fā)生惡性互動(dòng)的情況,但研究者更擔(dān)心深度學(xué)習(xí)閱讀并誤讀整體數(shù)據(jù)。博士后提米特·葛布魯曾在微軟等公司研究算法倫理,她對(duì)深度學(xué)習(xí)影響保險(xiǎn)市場的方式很擔(dān)心,因?yàn)樵诒kU(xiǎn)市場上人工智能與數(shù)據(jù)結(jié)合后可能導(dǎo)致少數(shù)群體受到不公待遇。舉個(gè)例子,想象有一組汽車事故索賠數(shù)據(jù)。數(shù)據(jù)顯示市中心交通事故率比較高,由于人口密集車禍也多。市中心居住的少數(shù)群體人數(shù)比例也相對(duì)更高。
如果深度學(xué)習(xí)軟件里嵌入了相關(guān)聯(lián)系再篩選數(shù)據(jù),可能“發(fā)現(xiàn)”少數(shù)族裔與車禍之間存在聯(lián)系,還可能對(duì)少數(shù)族裔司機(jī)貼上某種標(biāo)簽。簡單來說,保險(xiǎn)人工智能可能出現(xiàn)種族偏見。如果系統(tǒng)通過回顧市中心附近車禍現(xiàn)場的照片和視頻進(jìn)一步“培訓(xùn)”,人工智能更有可能得出結(jié)論認(rèn)為,在涉及多名司機(jī)的事故中,少數(shù)族裔司機(jī)過錯(cuò)可能更大。系統(tǒng)還可能建議向少數(shù)族裔司機(jī)收取更高保費(fèi),不管之前駕駛記錄如何。
要指出一點(diǎn),保險(xiǎn)公司都聲稱不會(huì)因?yàn)榉N族區(qū)別對(duì)待或收取不同保費(fèi)。但對(duì)市中心交通事故的假設(shè)顯示,看似中立的數(shù)據(jù)(交通事故發(fā)生地點(diǎn))也可能被人工智能系統(tǒng)吸收并解讀,從而導(dǎo)致新的不平等(算法根據(jù)具體民族向少數(shù)族裔收取更高保費(fèi),不管居住地點(diǎn)在哪)。
此外,葛布魯指出,由于深度學(xué)習(xí)系統(tǒng)決策基于層層疊疊的數(shù)據(jù),人工智能軟件決策時(shí)工程師都不明白其中原因和機(jī)制。“這些都是我們之前沒想過的,因?yàn)槿祟悇倓傞_始發(fā)現(xiàn)基礎(chǔ)算法里存在的偏見。”她表示。
當(dāng)代人工智能軟件與早期軟件不同之處在于,現(xiàn)在的系統(tǒng)“可以獨(dú)立作出具有法律意義的決策,”馬特·謝爾勒表示,他在門德爾松律師事務(wù)所擔(dān)任勞動(dòng)及就業(yè)律師,對(duì)人工智能頗有研究。謝爾勒開始研究該領(lǐng)域時(shí)發(fā)現(xiàn)關(guān)鍵結(jié)果出臺(tái)過程中沒有人類參與,他很擔(dān)心。如果由于數(shù)據(jù)存在紕漏,深度學(xué)習(xí)指導(dǎo)下的X光忽視一位超重男性體內(nèi)的腫瘤,有人負(fù)責(zé)么?“有沒有人從法律角度看待這些問題?”謝爾勒問自己。
隨著科技巨頭們準(zhǔn)備將深度學(xué)習(xí)技術(shù)嵌入其客戶商業(yè)軟件,上述問題便從學(xué)術(shù)界所討論的“假如”命題成為了急需考慮的事情。2016年,也就是Tay出現(xiàn)問題的那一年,微軟組建了一個(gè)名為Aether(“工程,研究中的人工智能和道德”的首字母縮寫)的內(nèi)部機(jī)構(gòu),由艾瑞克·霍維茨擔(dān)任主席。這是一個(gè)跨學(xué)科部門,由工程、研究、政策和法律團(tuán)隊(duì)的成員構(gòu)成,機(jī)器學(xué)習(xí)偏見是其重點(diǎn)研究的議題之一。霍維茨在描述該部門所討論的一些話題時(shí)若有所思地說:“微軟對(duì)于面部識(shí)別之類的軟件是否應(yīng)該用于敏感領(lǐng)域是否已經(jīng)有了定論,例如刑事審判和監(jiān)管。人工智能技術(shù)是否已經(jīng)足夠成熟,并用于這一領(lǐng)域,亦或由于失敗率依然非常高,因此人們不得不慎而又慎地思考失敗帶來的代價(jià)?”
杰奎因·奎諾內(nèi)羅·坎德拉是Facebook應(yīng)用機(jī)器學(xué)習(xí)部門的負(fù)責(zé)人,該部門負(fù)責(zé)為公司打造人工智能技術(shù)。在眾多其他的功能當(dāng)中,F(xiàn)acebook使用人工智能技術(shù)來篩除用戶新聞推送中的垃圾信息。公司還使用這一技術(shù),根據(jù)用戶喜好來提供故事和貼文,而這也讓坎德拉的團(tuán)隊(duì)幾近陷入假新聞危機(jī)。坎德拉將人工智能稱之為“歷史加速器”,因?yàn)樵摷夹g(shù)“能夠讓我們打造優(yōu)秀的工具,從而提升我們的決策能力。”但是他也承認(rèn),“正是在決策的過程中,大量的倫理問題接踵而至。”
Facebook在新聞推送領(lǐng)域遇到的難題說明,一旦產(chǎn)品已經(jīng)根植于人工智能系統(tǒng),要解決倫理問題是異常困難的。微軟也曾通過在算法應(yīng)忽略的術(shù)語黑名單中添加一些侮辱性詞語或種族綽號(hào),推出了Tay這個(gè)相對(duì)簡單的系統(tǒng)。但此舉無法幫助系統(tǒng)分辨“真”、“假”命題,因?yàn)槠渲猩婕氨姸嗟闹饔^判斷。Facebook的舉措則是引入人類調(diào)解員來審查新聞信息(例如通過剔除來源于經(jīng)常發(fā)布可證實(shí)虛假新聞信息來源的文章),但此舉讓公司吃上了審查機(jī)構(gòu)的官司。如今,F(xiàn)acebook所建議的一個(gè)舉措只不過是減少新聞推送中顯示的新聞數(shù)量,轉(zhuǎn)而突出嬰兒照和畢業(yè)照,可謂是以退為進(jìn)。
這一挑戰(zhàn)的關(guān)鍵之處在于:科技公司所面臨的兩難境地并不在于創(chuàng)建算法或聘請(qǐng)員工來監(jiān)視整個(gè)過程,而是在于人性本身。真正的問題并不在于技術(shù)或管理,而是關(guān)乎哲學(xué)。伯克利倫理學(xué)教授迪爾德麗·穆里根指出,計(jì)算機(jī)科學(xué)家很難將“公平”編入軟件,因?yàn)楣降囊饬x會(huì)因人群的不同而發(fā)生變化。穆里根還指出,社會(huì)對(duì)于公平的認(rèn)知會(huì)隨著時(shí)間的變化而改變。而且對(duì)于大家廣泛接受的理想狀態(tài)的“公平”理念,也就是社會(huì)決策應(yīng)體現(xiàn)社會(huì)每位成員的意志,歷史數(shù)據(jù)存在缺陷和缺失的可能性尤為突出。
微軟Aether部門的一個(gè)思想實(shí)驗(yàn)便揭示了這一難題。在這個(gè)實(shí)驗(yàn)中,人工智能技術(shù)對(duì)大量的求職者進(jìn)行了篩選,以挑選出適合高管職務(wù)的最佳人選。編程人員可以命令人工智能軟件掃描公司最佳員工的性格特征。雖然結(jié)果與公司的歷史息息相關(guān),但很有可能所有的最佳雇員,當(dāng)然還有所有最高級(jí)別的高管,都是白人。人們也有可能會(huì)忽視這樣一種可能性,公司在歷史上僅提拔白人(大多數(shù)公司在前幾十年中都是這樣做的),或公司的文化便是如此,即少數(shù)族群或女性會(huì)有被公司冷落的感受,并在得到提升之前離開公司。
任何了解公司歷史的人都知曉這些缺陷,但是大多數(shù)算法并不知道。霍維茨稱,如果人們利用人工智能來自動(dòng)推薦工作的話,那么“此舉可能會(huì)放大社會(huì)中人們并不怎么引以為榮的一些偏見行為”,而且是不可避免的。
谷歌云計(jì)算部門的人工智能首席科學(xué)家李飛飛表示,技術(shù)偏見“如人類文明一樣由來已久”,而且存在于諸如剪刀這種普通的事物當(dāng)中。她解釋說:“數(shù)個(gè)世紀(jì)以來,剪刀都是由右撇子的人設(shè)計(jì)的,而且使用它的人大多都是右撇子。直到有人發(fā)現(xiàn)了這一偏見之后,才意識(shí)到人們有必要設(shè)計(jì)供左撇子使用的剪刀。” 全球人口僅有約10%是左撇子,作為人類的一種天性,占主導(dǎo)地位的多數(shù)人群往往會(huì)忽視少數(shù)人群的感受。
事實(shí)證明,人工智能系統(tǒng)最近所犯的其他最為明顯的過錯(cuò)也存在同樣的問題。我們可以看看俄羅斯科學(xué)家利用人工智能系統(tǒng)在2016年開展的選美大賽。為參加競賽,全球數(shù)千名人士提交了其自拍照,期間,計(jì)算機(jī)將根據(jù)人們臉部對(duì)稱性等因素來評(píng)價(jià)其美貌。
然而,在機(jī)器選出的44名優(yōu)勝者當(dāng)中,僅有一位是深色皮膚。這一結(jié)果讓全球一片嘩然,競賽舉辦方隨后將計(jì)算機(jī)的這一明顯偏見歸咎于用于培訓(xùn)電腦的數(shù)據(jù)組,因?yàn)檫@些數(shù)據(jù)組中的有色人種照片并不多。計(jì)算機(jī)最終忽視了那些深色皮膚人種的照片,并認(rèn)為那些淺膚色的人種更加漂亮,因?yàn)樗麄兇碇鄶?shù)人群。
這種因忽視而造成的偏見在深度學(xué)習(xí)系統(tǒng)中尤為普遍,在這些系統(tǒng)中,圖片識(shí)別是培訓(xùn)過程的重要組成部分。麻省理工大學(xué)媒體實(shí)驗(yàn)室的喬伊·布沃拉姆維尼最近與微軟研究員葛布魯合作,撰寫了一篇研究性別分辨技術(shù)的論文,這些技術(shù)來自于微軟、IBM和中國的曠視科技。他們發(fā)現(xiàn),這些技術(shù)在識(shí)別淺膚色男性照片時(shí)的精確度比識(shí)別深膚色女性更高。
此類算法空白在線上選美比賽中看起來可能是微不足道的事情,但葛布魯指出,此類技術(shù)可能會(huì)被用于更加高風(fēng)險(xiǎn)的場景。葛布魯說:“試想一下,如果一輛自動(dòng)駕駛汽車在看到黑人后無法識(shí)別,會(huì)出現(xiàn)什么后果。想必后果是非常可怕的。”
葛布魯-布沃拉姆維尼的論文激起了不小的浪花。微軟和IBM均表示,公司已采取針對(duì)性的措施來完善其圖片識(shí)別技術(shù)。盡管這兩家公司拒絕透露其舉措的詳情,但正在應(yīng)對(duì)這一問題的其他公司則讓我們窺見了如何利用科技來規(guī)避偏見。
當(dāng)亞馬遜在部署用于篩除腐爛水果的算法時(shí),公司必須解決抽樣偏見問題。人們會(huì)通過研究大量的圖片數(shù)據(jù)庫來培訓(xùn)視覺辨認(rèn)算法,其目的通常是為了識(shí)別,例如,草莓“本應(yīng)”具有的模樣。然而,正如你所預(yù)料的那樣,與完好漿果光鮮亮麗的照片相比,腐爛的漿果相對(duì)較為稀少。而且與人類不同的是,機(jī)器學(xué)習(xí)算法傾向于不計(jì)算或忽視它們,而人類的大腦則傾向于注意這些異常群體,并對(duì)其做出強(qiáng)烈反應(yīng)。
亞馬遜的人工智能總監(jiān)拉爾夫·荷布里奇解釋道,作為調(diào)整,這位在線零售巨頭正在測試一項(xiàng)名為過采樣的計(jì)算機(jī)科學(xué)技術(shù)。機(jī)器學(xué)習(xí)工程師可通過向未充分代表的數(shù)據(jù)分配更大的統(tǒng)計(jì)學(xué)“權(quán)重”,來主導(dǎo)算法的學(xué)習(xí)方式。在上述案例中便是腐爛水果的照片。結(jié)果顯示,培訓(xùn)后的算法更為關(guān)注變質(zhì)食物,而不是數(shù)據(jù)庫中可能建議的食品關(guān)聯(lián)性。
荷布里奇指出,過采樣也可被應(yīng)用于學(xué)習(xí)人類的算法(然而他拒絕透露亞馬遜在這一領(lǐng)域的具體案例)。荷布里奇說:“年齡、性別、種族、國籍,這些都是人們特別需要測試采樣偏見的領(lǐng)域,以便在今后將其融入算法。”為了確保用于識(shí)別照片人臉面部所使用的算法并不會(huì)歧視或忽視有色、老齡或超重人士,人們可以為此類個(gè)人的照片增加權(quán)重,以彌補(bǔ)數(shù)據(jù)組所存在的缺陷。
其他工程師正在專注于進(jìn)一步“追根溯源”——確保用于培訓(xùn)算法的基本數(shù)據(jù)(甚至在其部署之前)具有包容性,且沒有任何偏見。例如,在圖形識(shí)別領(lǐng)域,在錄入計(jì)算機(jī)之前,人們有必要對(duì)用于培訓(xùn)深度學(xué)習(xí)系統(tǒng)的數(shù)百萬圖片進(jìn)行審核和標(biāo)記。數(shù)據(jù)培訓(xùn)初創(chuàng)企業(yè)iMerit首席執(zhí)行官雷德哈·巴蘇解釋道,公司遍布于全球的1400多名訓(xùn)練有素的員工會(huì)代表其客戶,以能夠規(guī)避偏見的方式對(duì)照片進(jìn)行標(biāo)記。該公司的客戶包括Getty Images和eBay。
巴蘇拒絕透露這種標(biāo)記方式是否適合標(biāo)記人像圖片,但她介紹了其他的案例。iMerit在印度的員工可能會(huì)覺得咖喱菜不是很辣,而公司位于新奧爾良的員工可能會(huì)認(rèn)為同樣的菜“很辣”。iMerit會(huì)確保這兩項(xiàng)信息均被錄入這道菜照片的標(biāo)記中,因?yàn)閮H錄入其中的一個(gè)信息會(huì)讓數(shù)據(jù)的精確性打折扣。在組建有關(guān)婚姻的數(shù)據(jù)集時(shí),iMerit將收錄傳統(tǒng)的西式白婚紗和多層蛋糕圖片,同時(shí)還會(huì)收錄印度或非洲精心策劃、色彩絢麗的婚禮。
iMerit的員工以一種不同的方式在業(yè)界脫穎而出。巴蘇指出:公司會(huì)聘用擁有博士學(xué)位的員工,以及那些受教育程度不高、較為貧困的人群,公司53%的員工都是女性。這一比例能夠確保公司在數(shù)據(jù)標(biāo)記過程中獲得盡可能多的觀點(diǎn)。巴蘇表示,“良好的倫理政策不僅僅包含隱私和安全,還涉及偏見以及我們是否遺漏了某個(gè)觀點(diǎn)。”而找出這個(gè)遺漏的觀點(diǎn)已被更多科技公司提上了戰(zhàn)略議程。例如,谷歌在6月宣布,公司將在今年晚些時(shí)候于加納的阿格拉開設(shè)人工智能研究中心。兩位谷歌工程師在一篇博文上寫道:“人工智能在為世界帶來積極影響方面有著巨大的潛力,如果在開發(fā)新人工智能技術(shù)時(shí)能夠得到全球各地人士的不同觀點(diǎn),那么這一潛力將更大。”
人工智能專家還認(rèn)為,他們可以通過讓美國從事人工智能行業(yè)的員工更加多元化,來應(yīng)對(duì)偏見,而多元化問題一直是大型科技公司的一個(gè)障礙。谷歌高管李飛飛最近與他人共同創(chuàng)建了非營利性機(jī)構(gòu)AI4ALL,以面向女孩、婦女和少數(shù)群體普及人工智能技術(shù)和教育。該公司的活動(dòng)包括一個(gè)夏令營計(jì)劃,參與者將到訪頂級(jí)大學(xué)的人工智能部門,與導(dǎo)師和模范人物建立聯(lián)系。總之,AI4ALL執(zhí)行董事苔絲·波斯內(nèi)表示:“多樣性的提升有助于規(guī)避偏見風(fēng)險(xiǎn)。”
然而,在這一代更加多元化的人工智能研究人員進(jìn)入勞動(dòng)力市場數(shù)年之前,大型科技公司便已然將深度學(xué)習(xí)能力融入其產(chǎn)品中。而且即便頂級(jí)研究人員越發(fā)意識(shí)到該技術(shù)的缺陷,并承認(rèn)他們無法預(yù)知這些缺陷會(huì)以什么樣的方式展現(xiàn)出來,但他們認(rèn)為人工智能技術(shù)在社會(huì)和金融方面的效益,值得他們繼續(xù)向前邁進(jìn)。
Facebook高管坎德拉說:“我認(rèn)為人們天生便對(duì)這種技術(shù)的前景持樂觀態(tài)度。” 他還表示,幾乎任何數(shù)字技術(shù)都可能遭到濫用,但他同時(shí)也指出:“我并不希望回到上個(gè)世紀(jì)50年代,體驗(yàn)當(dāng)時(shí)落后的技術(shù),然后說:‘不,我們不能部署這些技術(shù),因?yàn)樗鼈兛赡軙?huì)被用于不良用途。’”
微軟研究負(fù)責(zé)人霍維茨表示,像Aether團(tuán)隊(duì)這樣的部門將幫助公司在潛在的偏見問題對(duì)公眾造成負(fù)面影響之前便消除這些偏見。他說:“我認(rèn)為,在某項(xiàng)技術(shù)做好投入使用的準(zhǔn)備之前,沒有人會(huì)急著把它推向市場。”他還表示,相比而言,他更關(guān)心“不作為所帶來的倫理影響。”他認(rèn)為,人工智能可能會(huì)降低醫(yī)院中可預(yù)防的醫(yī)療失誤。霍維茨詢問道:“你的意思是說,你對(duì)我的系統(tǒng)偶爾出現(xiàn)的些許偏見問題感到擔(dān)憂嗎?如果我們可以通過X光拍片解決問題并拯救眾多生命,但依然不去使用X光,倫理何在?”
監(jiān)督部門的反映是:說說你所做的工作。提升人工智能黑盒系統(tǒng)所錄入數(shù)據(jù)的透明度和公開度,有助于研究人員更快地發(fā)現(xiàn)偏見,并更加迅速地解決問題。當(dāng)一個(gè)不透明的算法可以決定某個(gè)人是否能獲得保險(xiǎn),或該人是否會(huì)蹲監(jiān)獄時(shí),麻省理工大學(xué)研究人員布沃拉姆維尼說道:“非常重要的一點(diǎn)在于,我們必須嚴(yán)謹(jǐn)?shù)厝y試這些系統(tǒng),而且需要確保一定的透明度。”
確實(shí),很少有人依然持有“人工智能絕對(duì)可靠”的觀點(diǎn),這是一個(gè)進(jìn)步。谷歌前任人工智能公共政策高管蒂姆·黃指出,在互聯(lián)網(wǎng)時(shí)代初期,科技公司可能會(huì)說,他們“只不過是一個(gè)代表數(shù)據(jù)的平臺(tái)而已”。如今,“這一理念已經(jīng)沒有市場”。(財(cái)富中文網(wǎng))
本文最初發(fā)表于《財(cái)富》雜志2018年7月1日刊。
譯者:馮豐
審校:夏林