精品国产_亚洲人成在线高清,国产精品成人久久久久,国语自产偷拍精品视频偷拍

首頁 500強 活動 榜單 商業 科技 領導力 專題 品牌中心
雜志訂閱

機器能否真正習得語言?

章勱聞
2024-03-15

之前的機器學習更像二語習得,而今天的生成式人工智能則接近母語學習。

文本設置
小號
默認
大號
Plus(0條)

過去一年注定會成為人類歷史的重要章節——在經歷了信息爆炸和信息過剩之后,“語言失控的時代”到來了。準確地說是人類失去了對語言的控制。去年初GPT新版本發布時,簡短的介紹最后有一句憂心忡忡的話:“人類已經難以分辨出大模型撰寫的新聞?!钡侥甑祝墒饺斯ぶ悄埽ˋIGC)產生的語言文字已經遠遠超越新聞內容,變得無處不在、難以統計。

要說明一點:失控并非一定導致災難,更重要的是看能否適應這種變化。就像人類未曾能夠控制微小尺度間病毒的來去,也從來無法阻止宇宙尺度上天體的運行,我們只是適應了這些規律。同樣,生成式人工智能雖然還在誕生的早期,但是它讓我們窺見一種可能:人類也許從來不是語言唯一的主人,而只是臨時看護了它的成長。要理解這一點,首先要思考一個問題:機器能否真正習得語言?

回到18年前的冬天,在牛津北郊的學生宿舍里,我在一臺二手的ThinkPad上處理著導師購買的33萬篇《紐約時報》語料,試圖通過機器學習讓算法能夠生成新聞背景。那一年,俄羅斯的“庫爾斯克號”核潛艇發生事故,沉入了海底。我立刻做了實驗,發現算法對潛艇災難的歸納與媒體報道高度相似。

我的導師是后來DeepMind的研究成員之一,他提醒我:實驗的成功可能緣于新聞文體的特殊性,而并非算法。這也加深了我的疑惑:我們似乎總是在存量信息中尋找規律,比如“新聞第一段總是存在各種事實要素”等。這似乎是在靠經驗和概率提升運氣,而并非真正讓機器學會語言。

這其中涉及到的專業叫“自然語言處理”。當時在同一間公寓里,另一位學者在研究“二語習得”,也就是人類如何學習母語之外的第二外語。我們交談之后,感覺兩門學科有相似之處,也存在類似的問題。

最近,在和獵豹移動董事長兼首席執行官傅盛的對話中,他忽然讓我理解了這種聯系。傅盛的觀點:之前的機器學習更像二語習得,而今天的生成式人工智能則接近母語學習。簡單理解:人類學習第二外語學習必須“錨定”一種母語,是一種關聯經驗的過程。作為對比,母語的習得則是人腦“沉浸”于客觀世界后獲得的整體印象,其過程更為“神秘且偉大”。

生成式人工智能的顛覆性在于:硅基智能一次性地完成了沉浸式的母語習得,而且接受了人類現存的上百種語言,以及語言所承載的人類知識和信息的總和。這種過程究竟創造了一個什么樣的事物,我們還在試圖理解,但是可以肯定其能量遠超我們的想象。

舉個例子,最近讀到一段質量不高的文字,講述了亞馬遜創始人杰夫·貝佐斯和一位Kindle早期設計師之間的恩恩怨怨。英文存在大量模糊的語言和跳躍的邏輯。我嘗試用一個國產大模型來翻譯這段話。結果發現AI不僅完成了英譯中,還補上了一些原文缺失的背景和邏輯關系,比如這位設計師離職后的故事。這種跨語言文化、深入到事件背景的梳理恰恰就是以前人類編輯的工作?,F在,機器不僅完成了文字創作,而且在速度和質量上遠超人類。

這個大模型是中國90后的人工智能天才楊植麟開發的“月之暗面”。很顯然,暫且忽略機器是否有“意識”和“情感”這些問題,人工智能至少已經從錨定人類的認知框架,跨越到了“母語學習”,直接認識了客觀世界。試想一下,未來它們將會取代多少人類的腦力勞動?

發刊前,我做了一個實驗,讓“月之暗面”閱讀了兩篇中英文的年度盤點,請它摘引一句對人類最有啟示的話。它選擇了拼多多創始人黃錚的一句意味深長的直接引語:“簡單和常識的力量是無窮的?!保ㄘ敻恢形木W)

原文刊載于1/2月刊《財富》(中文版)雜志。

財富中文網所刊載內容之知識產權為財富媒體知識產權有限公司及/或相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、復制及建立鏡像等任何使用。
0條Plus
精彩評論
評論

撰寫或查看更多評論

請打開財富Plus APP

前往打開

            主站蜘蛛池模板: 龙南县| 连山| 县级市| 陆川县| 祥云县| 恭城| 兰考县| 崇阳县| 酉阳| 松阳县| 江安县| 长白| 中阳县| 赤峰市| 阿拉善盟| 上饶县| 中卫市| 保定市| 兴安县| 尼勒克县| 迭部县| 阿克陶县| 巫溪县| 泌阳县| 收藏| 监利县| 谢通门县| 石楼县| 清镇市| 巨野县| 桐庐县| 靖宇县| 锦州市| 黄大仙区| 双峰县| 水城县| 滨州市| 淳安县| 凭祥市| 广汉市| 新干县|