美國運通(American Express)正在測試利用一項新技術打擊金融欺詐。這項技術以能夠幫助制作深度偽造視頻而著稱,這些視頻里的人說過的話事實上根本不存在。
美國運通希望利用這項技術創建虛假的財務數據,例如信用卡交易等,并將這些數據輸入到機器學習算法當中,從而幫助他們更有效地發現信用卡欺詐等問題。公司的目標是,一旦客戶的賬戶被盜,在犯罪分子大肆消費之前更快提醒客戶。
美國運通的研究其核心是名為生成對抗網絡(GAN)的人工智能技術,這種技術被用于創作深度偽造視頻。最近幾年,這項技術不斷完善,可以幫助創作讓觀眾們信以為真的視頻。
例如,兩年前,華盛頓大學(University of Washington)的研究人員利用GAN技術創作了一條美國前總統貝拉克·奧巴馬發表演講的逼真視頻,但這次演講根本是子虛烏有。最近,麻省理工學院(MIT)的高級虛擬技術中心(Center for Advanced Virtuality)創作了一條美國前總統理查德·尼克松在“阿波羅11號”登月任務失敗之后發表演講的深度偽造視頻,視頻中的演講同樣是不存在的。
在創作這條視頻時,麻省理工學院的研究人員使用尼克松演講的音頻片段對GAN軟件進行訓練,使其能夠學會調整演員的聲音,讓其聽起來更接近前總統的聲音。美國運通的研究人員則利用正常情況下用于計算消費者信用積分等任務的內部數據對GAN軟件進行訓練,從而使該軟件可以自行生成財務數據。
美國運通的機器學習研究副總裁德米特里·埃菲莫夫表示,公司的目標是GAN軟件能夠創造出“看起來正常的”虛假交易。存在明顯異常的數據效果會大打折扣,比如某一天在紐約市多次購買廁紙,第二天在加利福尼亞州貝克斯菲爾德買了一臺割草機。
關于美國運通如何利用人工合成的財務數據完善欺詐識別這個問題,埃菲莫夫拒絕置評,他說犯罪分子可能利用相關信息牟利。但一般來說,公司掌握的財務數據越多,就可以進一步完善其網絡安全系統。
還有一些公司也在研究利用GAN技術創建人工合成財務數據,比如在線零售業巨頭亞馬遜(Amazon)。2018年,亞馬遜發布了一份利用軟件創建人工合成電商交易數據的報告,這些數據最終能夠用于“產品推薦、鎖定交易和模擬未來事件等”。
密歇根大學(University of Michigan)的研究人員也發表了一篇使用GAN技術創建虛假股市訂單的論文。密歇根大學的計算機科學系博士候選人王欣曈解釋說,這些信息可以用于揭露股市操縱行為。
然而,美國運通的研究人員今年在年度神經信息處理系統大會(Conference on Neural Information Processing Systems)上發表的一篇論文中表示,使用GAN技術創建虛假財務數據的效果很難評價。
對于人工智能生成的圖片,人類可以簡單地看著圖片來判斷它們與真實的物體是否相像。但研究人員表示,使用該項技術創建財務數據的做法是全新的嘗試,沒有一種“公認的方法”可以供研究人員用于對軟件進行分級。
最終,美國運通的研究人員選擇使用統計方法分析人工智能生成的數據,他們發現由此得出的結果還算理想,但不夠完美。他們計劃在未來研究中進一步完善這些方法。
研究人員非常樂觀地認為他們的工作將帶來回報。比如他們在論文中寫道,訓練欺詐識別模型所需要的公開的財務數據不足,而人工智能研究人員可以對外公開人工合成的數據集。他們在論文中解釋說,這樣做有利于這個領域的進步,因為其他研究人員能夠在此基礎上開展深入研究。但美國運通的發言人稱,該金融公司沒有公開相關數據的計劃。
研究人員寫道:“使用這種方法可以保護客戶的個人數據和隱私。”(財富中文網)
譯者:Biz
美國運通(American Express)正在測試利用一項新技術打擊金融欺詐。這項技術以能夠幫助制作深度偽造視頻而著稱,這些視頻里的人說過的話事實上根本不存在。
美國運通希望利用這項技術創建虛假的財務數據,例如信用卡交易等,并將這些數據輸入到機器學習算法當中,從而幫助他們更有效地發現信用卡欺詐等問題。公司的目標是,一旦客戶的賬戶被盜,在犯罪分子大肆消費之前更快提醒客戶。
美國運通的研究其核心是名為生成對抗網絡(GAN)的人工智能技術,這種技術被用于創作深度偽造視頻。最近幾年,這項技術不斷完善,可以幫助創作讓觀眾們信以為真的視頻。
例如,兩年前,華盛頓大學(University of Washington)的研究人員利用GAN技術創作了一條美國前總統貝拉克·奧巴馬發表演講的逼真視頻,但這次演講根本是子虛烏有。最近,麻省理工學院(MIT)的高級虛擬技術中心(Center for Advanced Virtuality)創作了一條美國前總統理查德·尼克松在“阿波羅11號”登月任務失敗之后發表演講的深度偽造視頻,視頻中的演講同樣是不存在的。
在創作這條視頻時,麻省理工學院的研究人員使用尼克松演講的音頻片段對GAN軟件進行訓練,使其能夠學會調整演員的聲音,讓其聽起來更接近前總統的聲音。美國運通的研究人員則利用正常情況下用于計算消費者信用積分等任務的內部數據對GAN軟件進行訓練,從而使該軟件可以自行生成財務數據。
美國運通的機器學習研究副總裁德米特里·埃菲莫夫表示,公司的目標是GAN軟件能夠創造出“看起來正常的”虛假交易。存在明顯異常的數據效果會大打折扣,比如某一天在紐約市多次購買廁紙,第二天在加利福尼亞州貝克斯菲爾德買了一臺割草機。
關于美國運通如何利用人工合成的財務數據完善欺詐識別這個問題,埃菲莫夫拒絕置評,他說犯罪分子可能利用相關信息牟利。但一般來說,公司掌握的財務數據越多,就可以進一步完善其網絡安全系統。
還有一些公司也在研究利用GAN技術創建人工合成財務數據,比如在線零售業巨頭亞馬遜(Amazon)。2018年,亞馬遜發布了一份利用軟件創建人工合成電商交易數據的報告,這些數據最終能夠用于“產品推薦、鎖定交易和模擬未來事件等”。
密歇根大學(University of Michigan)的研究人員也發表了一篇使用GAN技術創建虛假股市訂單的論文。密歇根大學的計算機科學系博士候選人王欣曈解釋說,這些信息可以用于揭露股市操縱行為。
然而,美國運通的研究人員今年在年度神經信息處理系統大會(Conference on Neural Information Processing Systems)上發表的一篇論文中表示,使用GAN技術創建虛假財務數據的效果很難評價。
對于人工智能生成的圖片,人類可以簡單地看著圖片來判斷它們與真實的物體是否相像。但研究人員表示,使用該項技術創建財務數據的做法是全新的嘗試,沒有一種“公認的方法”可以供研究人員用于對軟件進行分級。
最終,美國運通的研究人員選擇使用統計方法分析人工智能生成的數據,他們發現由此得出的結果還算理想,但不夠完美。他們計劃在未來研究中進一步完善這些方法。
研究人員非常樂觀地認為他們的工作將帶來回報。比如他們在論文中寫道,訓練欺詐識別模型所需要的公開的財務數據不足,而人工智能研究人員可以對外公開人工合成的數據集。他們在論文中解釋說,這樣做有利于這個領域的進步,因為其他研究人員能夠在此基礎上開展深入研究。但美國運通的發言人稱,該金融公司沒有公開相關數據的計劃。
研究人員寫道:“使用這種方法可以保護客戶的個人數據和隱私。”(財富中文網)
譯者:Biz
American Express is testing technology that is best known for helping create deepfake videos—realistic clips of people saying things they never really said—to fight financial fraud.
In this case, the company is creating fake financial data like credit card transactions that it can feed into machine-learning algorithms to better help them spot credit card scams and other problems. The goal is to more quickly alert customers that their accounts have been compromised, before criminals have a chance to go on spending sprees.
At the heart of American Express’s research is the A.I. technology known as generative adversarial networks, or GANs, which are used to create deepfake videos. In recent years, the technology has improved to the point that it can help create convincing video clips that fool viewers.
Two years ago, for instance, University of Washington researchers used GANs to create a realistic-looking video of former President Barack Obama giving a speech that he never actually gave. More recently, MIT’s Center for Advanced Virtuality lab created a deepfake video of former President Richard Nixon giving a bogus speech about the Apollo 11 moon landing mission failing.
In the case of the fake Nixon clip, MIT researchers trained GAN software on audio clips of Nixon’s speeches so that it could learn to modify an actor’s voice to sound like the former President’s. American Express researchers, on the other hand, trained their GANs on internal data that is normally used for tasks like calculating consumer credit scores, so that the software could create its own financial data.
The goal was for the GANs to create fake transactions “that look normal,” said Dmitry Efimov, the vice president of machine learning research for American Express. Data with obvious anomalies, such as multiple purchases of toilet paper in New York City on one day, followed by a lawnmower purchase in Bakersfield, Calif., the next, would be less effective.
Efimov declined to comment about how American Express could specifically use synthetic financial data to improve fraud detection, citing the risk that criminals could use the information for their benefit. But, generally speaking, the more financial data the company has, the more it can improve its cybersecurity systems.
Other organizations that are researching using GANs to create synthetic financial data include online retailing giant Amazon. In 2018, Amazon published a paper about using the software to create synthetic e-commerce transactions so that the data could eventually be used for “product recommendation, targeting deals, and simulation of future events.”
Researchers at the University of Michigan have also published a paper about using GANs to create fake stock market orders. That information could be used to help uncover stock market manipulation schemes, explained Xintong Wang, a Ph.D. candidate in the University of Michigan’s computer science department.
Still, as American Express researchers described in a paper they presented at this year’s annual Conference on Neural Information Processing Systems, it’s difficult to evaluate how effective the GANs are at creating fake financial data.
Humans can easily look at A.I.-generated images to see if they resemble the real thing. But with financial data, the technology is so new that there are no “commonly accepted techniques” that the researchers can use to grade the software, they wrote.
The American Express researchers ended up using statistical techniques to analyze the A.I.-generated data and found that the results were good but not great. The researchers plan to refine their techniques for future research.
Ultimately, the researchers are optimistic that their work will pay off. As they described in the paper, there’s a lack of publicly available financial data that they can use to train their fraud-detection models. A.I. researchers could release their synthetic data sets to the public, which would be beneficial because other researchers could build on the work, the researchers explained in the paper. But an Amex spokesperson said the financial firm has no plans to do so.
“Customers’ personal data and privacy would be protected using this approach,” the researchers wrote.