人口普查的安全問題
對于即將到來的人口普查,美國政府采取了最先進的隱私保護技術。
?
美國人口普查局(U.S. Census Bureau)每十年進行一次全國性的調查,為美國的民主格局確立條件。調查問卷可以產生大量數據,包括人名、街道地址、年齡、種族、民族和其他細節。這就產生了一個棘手的問題:別有用心者可以通過公開記錄知道某個人的詳細個人信息。
人口普查局既負責發布普查結果摘要,同時還要保護人們的隱私,不禁陷入兩難境地?!爸灰l布了統計數據,就會泄漏該機密數據庫的有關信息?!比丝谄詹榫值囊晃挥嬎銠C科學家西姆森·加芬克爾(Simson Garfinkel)在今年5月向人口普查咨詢委員會表示。如果人們認為他們的回答無法得到保密,他們可能會選擇不回答問卷。而目前政府建議在2020年人口普查問卷中增加一個敏感問題—詢問受訪者是否是美國公民,因此,對隱私的保護變得尤其重要。
但是這里存在一個問題:保護人們隱私的常用方法已經無法提供足夠的保護。2016年11月,一個研究小組利用統計工具和公開數據將2010年人口普查的機密數據庫成功地進行了部分重建,重建比例達46%。如果允許年齡有一年的浮動空間,該比例躍升至71%。通過將人口普查局公布的表格和其他商業數據集相結合,研究人員發現他們可以重新識別17%的人口。
美國人口普查局的首席科學家、2016年研究的負責人約翰·阿博德(John Abowd)說,舊的隱私保護措施是無效的?!笆聦嵶C明,沒有誰的信息可以藏得像大海里的針一樣好?!彼f。為了解決這個問題,阿博德在2020年人口普查中實施了“差分隱私”的尖端技術。這種做法故意將干擾信息或隨機變量加入系統中,這是谷歌(Google)等科技巨頭對用戶數據匿名化的常用方法,其結果就是:想要揭秘數據庫的人只靠人口普查數據無法獲取詳細的個人記錄。
這是在精確性和隱私之間的權衡。雖然一些社會科學研究人員抱怨新方法會妨礙他們的工作,但如果不采用這種方法,大規模數據泄露帶來的嚴重抵制將會影響到未來的人口普查工作。(財富中文網)
譯者:Agatha