現在很多社交媒體公司確實在收集用戶數據訓練Gen-AI,用戶不必由之任之。可以選擇拒絕,關鍵是要找到方法。
近日科技新聞網站404Media報道稱,領英(LinkedIn)未通知用戶就開始默認用帖子訓練人工智能,這一問題徹底浮出水面。領英主要用數據訓練人工智能幫用戶寫帖子或推薦內容。
社交媒體平臺為人工智能系統收集帖子和個人信息并不是什么新事。去年以來Meta就一直在收集Facebook和Instagram用戶數據,而X(前身為Twitter)從7月以來也在收集用戶數據。
在美國可能遭封禁的TikTok數據政策同樣受到審查,不過該公司尚未明確表示有沒有為Gen-AI工具收集用戶數據。
長期以來,社交媒體公司一直因收集、使用和共享用戶數據的方式廣受批評。上周四的一份報告中,聯邦貿易委員會稱社交媒體對用戶采取“大規模監控”,數據方面的管制“嚴重缺乏”。
領英到底在做什么
領英選擇歐盟和英國以外的數億用戶訓練人工智能,卻未明確告知用戶。領英上周三告訴404Media,“很快”將在服務條款中加入相關內容。
本月早些時候,領英對用戶政策進行了大規模更新,稱訓練人工智能時將編輯或刪除建議帖子或消息等個人信息,盡量減少訓練模型的數據里涉及的個人數據”。領英發給《財富》的一份聲明中表示,不會收集私信,也不會收集用戶私下相互發送的消息。
領英發言人格雷格·斯內珀告訴《財富》雜志,公司認為用戶有權掌控自己的數據。
“領英產品中一直追求某種形式的自動化,我們也明確表示用戶可以選擇如何使用數據,”他說。
如何拒絕領英為人工智能收集數據
若想拒絕領英的人工智能數據收集,要進入服務的“設置和隱私”頁面。點擊PC端網頁右上角的頭像,然后點擊“帳戶”即可訪問。
然后單擊左側邊欄上的“數據隱私”,會出現幾個選項,其中包括“用于Gen-AI改進的數據”。如果想退出,可以切換“使用我的數據訓練內容創建人工智能模型”一行字旁邊的開關。
默認情況下,該選項已啟用。這意味著你的個人數據和在領英發布的內容會被用于訓練“內容創建人工智能模型”,不僅適用于領英,也適用其“附屬公司”。
領英隸屬于微軟,微軟斥資數十億美元投資ChatGPT之后,與OpenAI在人工智能方面達成合作。根據領英常見問題解答,部分模型由微軟旗下Azure OpenAI服務提供。
但是,選擇拒絕人工智能訓練并不能刪除已收集的數據,領英也并未明確說明用戶數據從何時開始。
“選擇退出意味著領英及其附屬公司不會使用你在領英上的個人數據或內容訓練未來的模型,但不會影響進行中的訓練,”領英常見問題解答中顯示。
如果覺得如此多步驟太麻煩,谷歌前首席決策科學家凱西·科濟爾科夫向粉絲分享了一鍵退出鏈接,不用再費勁尋找頁面。她因擁有60多萬粉絲被領英標記為“意見領袖”,在帖子中批評了領英收集數據的行為,稱收集時“會克隆帖子不注明出處”。
如何拒絕X和Meta的人工智能數據采集
至于其他社交媒體平臺,退出數據收集的過程跟領英差不多復雜。
如果想拒絕X使用數據訓練其AI聊天機器人Grok,可在臺式電腦上“設置”中選擇“隱私和安全”。然后在“數據共享和個性化”中選擇Grok,取消選中允許數據共享的框。還有另一選項能刪除跟Grok的歷史對話記錄。
X在頁面上解釋稱,發布的帖子以及與Grok的互動、提示和結果都是為了訓練和微調人工智能模型,可能會與埃隆·馬斯克的xAI共享,xAI為X提供聊天機器人。聊天機器人只對付費用戶開放,但會使用所有公開帖子訓練。
Meta方面情況更棘手一些。就在上周Meta剛剛承認,2007年以來公司使用非歐盟用戶在Facebook和Instagram上的公開帖子訓練人工智能。
6月以來,Meta還一直在抓取與Facebook、Instagram、Threads和WhatsApp上聊天機器人的互動以訓練人工智能。目前,如果用戶所在國家沒有出臺數據隱私法,唯一能防止Meta使用帖子訓練人工智能訓練的方法就是將帳戶設置為私人。但出現在公共帖子中的數據仍會被收集,之前已被抓取的帖子也無法刪除。
TikTok對人工智能訓練保持沉默
就是否使用用戶數據搭建Gen-AI模型,TikTok并未回應《財富》雜志的置評請求。今年夏天,TikTok推出了一款Gen-AI廣告工具幫品牌制作視頻,TikTok的母公司,中國科技公司字節跳動也為中國以外的用戶推出了各種AI應用。
在“賬戶和隱私設置”下,TikTok表示會收集分析面部和語音信息,“以提高安全性和用戶體驗,推薦和調整內容,并進行分析和人口統計分類。”TikTok告知用戶,如果不想面部和語音被使用,就不要上傳自己的照片或視頻,已發布的照片或視頻也要刪除。(財富中文網)
譯者:梁宇
審校:夏林
現在很多社交媒體公司確實在收集用戶數據訓練Gen-AI,用戶不必由之任之。可以選擇拒絕,關鍵是要找到方法。
近日科技新聞網站404Media報道稱,領英(LinkedIn)未通知用戶就開始默認用帖子訓練人工智能,這一問題徹底浮出水面。領英主要用數據訓練人工智能幫用戶寫帖子或推薦內容。
社交媒體平臺為人工智能系統收集帖子和個人信息并不是什么新事。去年以來Meta就一直在收集Facebook和Instagram用戶數據,而X(前身為Twitter)從7月以來也在收集用戶數據。
在美國可能遭封禁的TikTok數據政策同樣受到審查,不過該公司尚未明確表示有沒有為Gen-AI工具收集用戶數據。
長期以來,社交媒體公司一直因收集、使用和共享用戶數據的方式廣受批評。上周四的一份報告中,聯邦貿易委員會稱社交媒體對用戶采取“大規模監控”,數據方面的管制“嚴重缺乏”。
領英到底在做什么
領英選擇歐盟和英國以外的數億用戶訓練人工智能,卻未明確告知用戶。領英上周三告訴404Media,“很快”將在服務條款中加入相關內容。
本月早些時候,領英對用戶政策進行了大規模更新,稱訓練人工智能時將編輯或刪除建議帖子或消息等個人信息,盡量減少訓練模型的數據里涉及的個人數據”。領英發給《財富》的一份聲明中表示,不會收集私信,也不會收集用戶私下相互發送的消息。
領英發言人格雷格·斯內珀告訴《財富》雜志,公司認為用戶有權掌控自己的數據。
“領英產品中一直追求某種形式的自動化,我們也明確表示用戶可以選擇如何使用數據,”他說。
如何拒絕領英為人工智能收集數據
若想拒絕領英的人工智能數據收集,要進入服務的“設置和隱私”頁面。點擊PC端網頁右上角的頭像,然后點擊“帳戶”即可訪問。
然后單擊左側邊欄上的“數據隱私”,會出現幾個選項,其中包括“用于Gen-AI改進的數據”。如果想退出,可以切換“使用我的數據訓練內容創建人工智能模型”一行字旁邊的開關。
默認情況下,該選項已啟用。這意味著你的個人數據和在領英發布的內容會被用于訓練“內容創建人工智能模型”,不僅適用于領英,也適用其“附屬公司”。
領英隸屬于微軟,微軟斥資數十億美元投資ChatGPT之后,與OpenAI在人工智能方面達成合作。根據領英常見問題解答,部分模型由微軟旗下Azure OpenAI服務提供。
但是,選擇拒絕人工智能訓練并不能刪除已收集的數據,領英也并未明確說明用戶數據從何時開始。
“選擇退出意味著領英及其附屬公司不會使用你在領英上的個人數據或內容訓練未來的模型,但不會影響進行中的訓練,”領英常見問題解答中顯示。
如果覺得如此多步驟太麻煩,谷歌前首席決策科學家凱西·科濟爾科夫向粉絲分享了一鍵退出鏈接,不用再費勁尋找頁面。她因擁有60多萬粉絲被領英標記為“意見領袖”,在帖子中批評了領英收集數據的行為,稱收集時“會克隆帖子不注明出處”。
如何拒絕X和Meta的人工智能數據采集
至于其他社交媒體平臺,退出數據收集的過程跟領英差不多復雜。
如果想拒絕X使用數據訓練其AI聊天機器人Grok,可在臺式電腦上“設置”中選擇“隱私和安全”。然后在“數據共享和個性化”中選擇Grok,取消選中允許數據共享的框。還有另一選項能刪除跟Grok的歷史對話記錄。
X在頁面上解釋稱,發布的帖子以及與Grok的互動、提示和結果都是為了訓練和微調人工智能模型,可能會與埃隆·馬斯克的xAI共享,xAI為X提供聊天機器人。聊天機器人只對付費用戶開放,但會使用所有公開帖子訓練。
Meta方面情況更棘手一些。就在上周Meta剛剛承認,2007年以來公司使用非歐盟用戶在Facebook和Instagram上的公開帖子訓練人工智能。
6月以來,Meta還一直在抓取與Facebook、Instagram、Threads和WhatsApp上聊天機器人的互動以訓練人工智能。目前,如果用戶所在國家沒有出臺數據隱私法,唯一能防止Meta使用帖子訓練人工智能訓練的方法就是將帳戶設置為私人。但出現在公共帖子中的數據仍會被收集,之前已被抓取的帖子也無法刪除。
TikTok對人工智能訓練保持沉默
就是否使用用戶數據搭建Gen-AI模型,TikTok并未回應《財富》雜志的置評請求。今年夏天,TikTok推出了一款Gen-AI廣告工具幫品牌制作視頻,TikTok的母公司,中國科技公司字節跳動也為中國以外的用戶推出了各種AI應用。
在“賬戶和隱私設置”下,TikTok表示會收集分析面部和語音信息,“以提高安全性和用戶體驗,推薦和調整內容,并進行分析和人口統計分類。”TikTok告知用戶,如果不想面部和語音被使用,就不要上傳自己的照片或視頻,已發布的照片或視頻也要刪除。(財富中文網)
譯者:梁宇
審校:夏林
You don’t have to let social media services harvest your data to train their generative AI, as many companies do these days. You can opt out—if you can figure out how.
The problem was hammered home last week when tech news site 404Media reported that LinkedIn had started training its AI on its users’ posts by default, without letting users know about the change. LinkedIn is relying on the data to train AI that will help users write their posts or to recommend content to them.
A social media platform hoovering up posts and personal information for their AI system isn’t entirely new. Meta has been harvesting Facebook and Instagram user data since last year, while X, formerly Twitter, has done the same since July.
TikTok, whose data policies are under scrutiny amid a possible U.S. ban, hasn’t clearly stated whether it harvests user data for any generative AI tools.
Social media companies have long been criticized for how they collect, use, and share user data. In a report on Thursday, the Federal Trade Commission called out social media services for their “vast surveillance” of users and “woefully inadequate” data controls.
What’s going on at LinkedIn
LinkedIn opted hundreds of millions of its users outside of the EU and the UK into its AI training push without specifically telling users about it. The company told 404Media on Wednesday that it will add new language to its terms of service “shortly.”
Earlier this month, LinkedIn made a broader update to its user policy, saying that when training AI, it will “seek to minimize personal data in the data sets used to train the models” by redacting or removing personal information such as suggested posts or messages, according to a LinkedIn explanation of the policy. LinkedIn said in a statement to Fortune that it doesn’t harvest direct messages, or messages sent privately between users.
LinkedIn Spokesperson Greg Snapper told Fortune that the company believes users should have control over their data.
“We’ve always used some form of automation in LinkedIn products, and we’ve always been clear that users have the choice about how their data is used,” he said.
How to opt out of LinkedIn’s data harvesting for AI
Opting out of LinkedIn’s data harvesting for AI requires visiting the service’s “Settings & Privacy” pages. They are accessible by clicking on your headshot in the upper right on a desktop computer, and then clicking on “Account.”
You must then click on “Data privacy” on the left sidebar, which brings up several options including “Data for Generative AI improvement.” To opt out, you toggle the switch next to the line that reads “Use my data for training content creation AI models.”
LinkedIn has turned on this option by default. It means your personal data and LinkedIn content is used to train “content creation AI models” — and not just for LinkedIn, but its “affiliates” as well.
LinkedIn is owned by Microsoft, which has also partnered on AI with OpenAI through Microsoft’s multi-billion dollar investment in the maker of ChatGPT. Some of LinkedIn’s models are provided by Microsoft’s Azure OpenAI service, according to LinkedIn’s FAQ.
But opting out of AI training does nothing to reverse the company’s collection of your data prior, and LinkedIn did not specify when it started harvesting user data to train AI.
“Opting out means that LinkedIn and its affiliates won’t use your personal data or content on LinkedIn to train models going forward, but does not affect training that has already taken place,” according to LinkedIn’s FAQ page.
If the multi-step process is too much, Cassie Kozyrkov, former chief decision scientist at Google, shared a one-click opt-out link with her followers that lets users avoid having to hunt for the appropriate page. In her post, Kozyrkov, who LinkedIn has designated a “top voice” with more than 600,000 followers, criticized LinkedIn for its data harvesting, saying it could “clone your posts without crediting you.”
How to opt out of X and Meta’s data harvesting for AI
As for other social media platforms, opting out of data harvesting involves a similarly complicated process to LinkedIn’s.
To opt out of X using your data to train its AI chatbot Grok, go to “Settings” on a desktop computer and select “Privacy and safety.” Then, under “Data sharing and Personalization,” select Grok. Here you can uncheck the box that permits data sharing. You can also select an option to delete your conversation history with Grok.
On this page, X explains that your posts, as well as interactions, prompts, and results with Grok are fair game for training and fine-tuning its AI model, and that they may be shared with Elon Musk’s xAI, which provides the chatbot to X. The chatbot is only available to paid users but is trained on any public posts.
It’s a trickier situation for Meta, which just last week acknowledged that it has used every public Facebook and Instagram post from non-EU users since 2007 to train its AI.
Since June, Meta has also been scraping interactions with chatbots on Facebook, Instagram, Threads, and WhatsApp to train AI. Currently, if you live in a country without a data privacy law, the only way to opt out of Meta using your posts for its AI training is to set your account to private. This does not protect against data harvesting of any public posts you appear in, or your own previous posts that were already scraped.
TikTok’s silence about AI training
TikTok did not respond to Fortune’s requests for comment about whether it builds generative AI models with user data. This summer, TikTok launched a genAI advertising tool for brands to create videos, and TikTok’s corporate owner, the Chinese tech company ByteDance, has launched various AI apps for users outside of China.
Under “Account and privacy settings,” TikTok says that it collects and analyzes face and voice information “to improve safety and user experience, to recommend and moderate content, and for analytics and demographic classification.” To stop your face and voice from being used, TikTok tells users not to upload any photos or videos of yourself and delete any that you’ve already posted.