一位癱瘓的女士憑借一小塊植入大腦的電極片和由美國加利福尼亞州的科學家開發的數字虛擬形象,能夠再次開口說話。
這是人類第一次將從大腦信號中捕捉的語言和表情用虛擬形象表達出來,而且虛擬形象可以用患者自己的聲音說話。
這是美國加州大學舊金山分校(University of California San Francisco)的愛德華·F·張博士實驗室(Dr. Edward F. Chang Lab)的第四年博士生凱羅·利特爾約翰的觀點。他還是8月23日在《自然》雜志(Nature)發表的詳細介紹該項目的論文的主要作者。
這位47歲的女性患者名為安,18年前的一次腦干卒中令她失去了說話能力。安同意通過外科手術在她的大腦皮層植入一塊像紙一樣薄、信用卡大小的電極片,共有253個電極。這些電極能夠獲取這個區域的信號,并傳達到舌頭、下顎、喉嚨和面部,這些部位在正常情況下會形成語言和面部表情。一條線纜插入頭顱上的一個端口,把這些電極連接到幾臺安裝了人工智能驅動系統的電腦。
安與利特爾約翰的團隊共同用幾周時間,訓練人工智能系統,使其可以識別她的電腦發出的獨特信號,并轉換成語音。這需要她在大腦中重復會話詞匯表里的1,024個單詞組成的短語。
利特爾約翰說:“安非常投入,也很努力。她愿意根據需要進行長時間錄制,而且她很清楚她的努力將創造一種語言神經假體,會讓有這方面殘疾的許多人受益?!?/p>
在完成系統訓練后,安的思想被轉換成口頭信息,由一個虛擬形象表達出來,這個虛擬形象使用根據幾年前拍攝的婚禮視頻重構的安自己的聲音。
利特爾約翰見證了安首次使用這個系統。一臺計算機化輔助與替代通信(AAC)設備讓她能夠通過頸部肌肉移動,緩慢費力地進行有限的溝通。除此之外,這是她近20年來首次可以出聲說話。
利特爾約翰對《財富》雜志表示:“對我和她而言,這是一個非常暖心的時刻,令我們備受鼓舞?!?/p>
他補充道,對安來說,“能夠聽到自己的聲音是一次激動人心的經歷?!?/p>
因為系統經過訓練可以識別39個音素,即單詞的子單位,而不是完整的單詞,因此它將解讀安的思想的速度提高了三倍,把大腦信號轉換成文本的速度約為每分鐘80個單詞。
協助開發解碼器的生物工程學研究生肖恩·梅茨格在有關該項目的新聞稿中稱:“準確性、速度和詞匯是關鍵。這些因素保證用戶幾乎能夠像正常人一樣快速溝通,可以進行更自然、更正常的對話。”
加州大學舊金山分校的神經外科系任愛德華·F·張希望該系統能夠很快供類似患者連續使用。由于該設備目前仍然在臨床試驗階段,因此安無法在研究以外的場合使用。張領導的團隊之前曾經幫助一位腦干卒中的男性,通過將大腦信號轉換成文本進行溝通。
他在新聞稿里說:“我們的目標是恢復充分的、具象化的溝通,讓用戶可以用最自然的方式與他人對話。這些技術的進步令我們向真正解決患者的需求邁出了一大步?!?/p>
利特爾約翰表示,不同于現有版本,這款產品要在安和其他類似患者的日常生活中應用,必須采用無線設計,并且體積更小巧,以便于攜帶。他希望在最多十年內就能夠開發出更完善的版本,并且可以獲得美國食品與藥品管理局(U.S. Food and Drug Administration)的批準。
另外一項腦機接口研究
安試驗的系統是一種腦機接口。這類技術能夠用于癱瘓患者表達自己的思想,例如已故的史蒂夫·霍金,只是這個系統的語音不像機器人一樣呆板,而且只要根據用戶的思考就可以轉換成語音。
美國加州大學伯克利分校(University of California Berkeley)的研究人員在今年8月的早些時候公布了一項相關研究成果,并在《PLoS生物學》雜志(PLoS Biology)上發表了論文。
外科醫生在位于紐約的奧爾巴尼醫療中心(Albany Medical Center)在29位癲癇病患者的大腦內植入電極,當時手術室里播放的是平克·弗洛伊德樂隊(Pink Floyd)的歌曲《迷墻中的另一塊磚(第一部分)》(Another Brick in the Wall, Part 1)。通過人工智能,研究人員能夠根據每一位患者大腦中的電子活動重現這首歌曲。
心理學和神經學教授羅伯特·奈特博士最近告訴《財富》雜志,這項成果將被用于開發更完善的腦機接口,用于幫助癱瘓患者、肌萎縮側索硬化癥(ALS)患者和失語癥等語言障礙患者。失語癥是指患者無法做出講話的必要動作。
隨著技術日益完善,最終它或許可以通過頭皮電極來表達用戶的想法。加州大學伯克利分校的人類認知神經學博士后研究員、論文的主要作者盧多維克·貝利耶對《財富》雜志表示,這類電極目前能夠用于表達一個人從一串字母里做出的選擇,但識別每個字母的時間至少需要20秒,因此將這種技術用于溝通非常不便。
如果該技術經過簡化,最終就可以協助非殘疾人士,比如腦力工作者,與計算機同步傳達他們大腦中的文本。
貝利耶指出:“關鍵是減少阻滯,使人們能夠用心中所想完成行動?!崩纾骸澳憧梢栽诖竽X中想:‘叫輛Uber網約車’,然后在你還沒有完成手頭的事情的時候,就會有網約車來接你。”
有人對這項研究的未來應用感到不安,對此,奈特和貝利耶強調,目前這種操作必須通過外科手術才能夠完成。他們表示,把大腦信號轉換成語音的人工智能“只是類似于為大腦提供了一個鍵盤”。
關于可能出現的隱私問題,貝利耶稱,他更擔心大型科技公司目前通過監控和跟蹤在線活動,對我們的了解程度。
此外,他認為隱私問題可以解決。在完成患者的無線腦電圖掃描后,信號將被加密。
貝利耶說:“許多事情尚處在開端,比如神經科學和計算機工程的融合,而且在許多方面,這些技術前途無限?!?/p>
奈特補充道:“我認為我即將揭開整個故事的謎團?!保ㄘ敻恢形木W)
譯者:劉進龍
審校:汪皓
一位癱瘓的女士憑借一小塊植入大腦的電極片和由美國加利福尼亞州的科學家開發的數字虛擬形象,能夠再次開口說話。
這是人類第一次將從大腦信號中捕捉的語言和表情用虛擬形象表達出來,而且虛擬形象可以用患者自己的聲音說話。
這是美國加州大學舊金山分校(University of California San Francisco)的愛德華·F·張博士實驗室(Dr. Edward F. Chang Lab)的第四年博士生凱羅·利特爾約翰的觀點。他還是8月23日在《自然》雜志(Nature)發表的詳細介紹該項目的論文的主要作者。
這位47歲的女性患者名為安,18年前的一次腦干卒中令她失去了說話能力。安同意通過外科手術在她的大腦皮層植入一塊像紙一樣薄、信用卡大小的電極片,共有253個電極。這些電極能夠獲取這個區域的信號,并傳達到舌頭、下顎、喉嚨和面部,這些部位在正常情況下會形成語言和面部表情。一條線纜插入頭顱上的一個端口,把這些電極連接到幾臺安裝了人工智能驅動系統的電腦。
安與利特爾約翰的團隊共同用幾周時間,訓練人工智能系統,使其可以識別她的電腦發出的獨特信號,并轉換成語音。這需要她在大腦中重復會話詞匯表里的1,024個單詞組成的短語。
利特爾約翰說:“安非常投入,也很努力。她愿意根據需要進行長時間錄制,而且她很清楚她的努力將創造一種語言神經假體,會讓有這方面殘疾的許多人受益。”
在完成系統訓練后,安的思想被轉換成口頭信息,由一個虛擬形象表達出來,這個虛擬形象使用根據幾年前拍攝的婚禮視頻重構的安自己的聲音。
利特爾約翰見證了安首次使用這個系統。一臺計算機化輔助與替代通信(AAC)設備讓她能夠通過頸部肌肉移動,緩慢費力地進行有限的溝通。除此之外,這是她近20年來首次可以出聲說話。
利特爾約翰對《財富》雜志表示:“對我和她而言,這是一個非常暖心的時刻,令我們備受鼓舞。”
他補充道,對安來說,“能夠聽到自己的聲音是一次激動人心的經歷?!?/p>
因為系統經過訓練可以識別39個音素,即單詞的子單位,而不是完整的單詞,因此它將解讀安的思想的速度提高了三倍,把大腦信號轉換成文本的速度約為每分鐘80個單詞。
協助開發解碼器的生物工程學研究生肖恩·梅茨格在有關該項目的新聞稿中稱:“準確性、速度和詞匯是關鍵。這些因素保證用戶幾乎能夠像正常人一樣快速溝通,可以進行更自然、更正常的對話。”
加州大學舊金山分校的神經外科系任愛德華·F·張希望該系統能夠很快供類似患者連續使用。由于該設備目前仍然在臨床試驗階段,因此安無法在研究以外的場合使用。張領導的團隊之前曾經幫助一位腦干卒中的男性,通過將大腦信號轉換成文本進行溝通。
他在新聞稿里說:“我們的目標是恢復充分的、具象化的溝通,讓用戶可以用最自然的方式與他人對話。這些技術的進步令我們向真正解決患者的需求邁出了一大步?!?/p>
利特爾約翰表示,不同于現有版本,這款產品要在安和其他類似患者的日常生活中應用,必須采用無線設計,并且體積更小巧,以便于攜帶。他希望在最多十年內就能夠開發出更完善的版本,并且可以獲得美國食品與藥品管理局(U.S. Food and Drug Administration)的批準。
另外一項腦機接口研究
安試驗的系統是一種腦機接口。這類技術能夠用于癱瘓患者表達自己的思想,例如已故的史蒂夫·霍金,只是這個系統的語音不像機器人一樣呆板,而且只要根據用戶的思考就可以轉換成語音。
美國加州大學伯克利分校(University of California Berkeley)的研究人員在今年8月的早些時候公布了一項相關研究成果,并在《PLoS生物學》雜志(PLoS Biology)上發表了論文。
外科醫生在位于紐約的奧爾巴尼醫療中心(Albany Medical Center)在29位癲癇病患者的大腦內植入電極,當時手術室里播放的是平克·弗洛伊德樂隊(Pink Floyd)的歌曲《迷墻中的另一塊磚(第一部分)》(Another Brick in the Wall, Part 1)。通過人工智能,研究人員能夠根據每一位患者大腦中的電子活動重現這首歌曲。
心理學和神經學教授羅伯特·奈特博士最近告訴《財富》雜志,這項成果將被用于開發更完善的腦機接口,用于幫助癱瘓患者、肌萎縮側索硬化癥(ALS)患者和失語癥等語言障礙患者。失語癥是指患者無法做出講話的必要動作。
隨著技術日益完善,最終它或許可以通過頭皮電極來表達用戶的想法。加州大學伯克利分校的人類認知神經學博士后研究員、論文的主要作者盧多維克·貝利耶對《財富》雜志表示,這類電極目前能夠用于表達一個人從一串字母里做出的選擇,但識別每個字母的時間至少需要20秒,因此將這種技術用于溝通非常不便。
如果該技術經過簡化,最終就可以協助非殘疾人士,比如腦力工作者,與計算機同步傳達他們大腦中的文本。
貝利耶指出:“關鍵是減少阻滯,使人們能夠用心中所想完成行動。”例如:“你可以在大腦中想:‘叫輛Uber網約車’,然后在你還沒有完成手頭的事情的時候,就會有網約車來接你?!?/p>
有人對這項研究的未來應用感到不安,對此,奈特和貝利耶強調,目前這種操作必須通過外科手術才能夠完成。他們表示,把大腦信號轉換成語音的人工智能“只是類似于為大腦提供了一個鍵盤”。
關于可能出現的隱私問題,貝利耶稱,他更擔心大型科技公司目前通過監控和跟蹤在線活動,對我們的了解程度。
此外,他認為隱私問題可以解決。在完成患者的無線腦電圖掃描后,信號將被加密。
貝利耶說:“許多事情尚處在開端,比如神經科學和計算機工程的融合,而且在許多方面,這些技術前途無限。”
奈特補充道:“我認為我即將揭開整個故事的謎團。”(財富中文網)
譯者:劉進龍
審校:汪皓
A paralyzed woman can speak again, thanks to a small panel of electrodes implanted onto her brain and a digital avatar developed by scientists in California.
It marks the first time speech and facial expressions have been captured from brain signals and communicated by an avatar—one that speaks with the patient’s own voice.
That’s according to Kaylo Littlejohn, a fourth year doctoral student with the Dr. Edward F. Chang Lab at the University of California San Francisco, and a lead author on a paper detailing the project, published on August 23 in the journal Nature.
The patient—a 47-year-old woman named Ann who had experienced a brainstem stroke 18 years ago, terminating her ability to speak—agreed to have a paper-thin, credit card-sized set of 253 electrodes surgically implanted onto the cortex of her brain. The electrodes intercepted signals from this area to her her tongue, jaw, larynx, and face that would have created speech and facial expressions, were it not for her stroke. A cable plugged into a port in her head connected the electrodes to a bank of computers, which were equipped with an artificial intelligence-powered system.
Ann worked with Littlejohn’s team for weeks to train the system to recognize her brain’s unique signals for speech. It entailed her attempting to repeat—with her thoughts—a variety of phrases from a 1,024-word conversational vocabulary.
“She’s extremely dedicated and hard-working,” Littlejohn said of Ann. “She’s willing to record as long as needed, and she really understands that her efforts will go toward creating a speech neuroprosthesis that many people who have this kind of disability will be able to use.”
Once the system was trained, Ann’s thoughts were translated into verbal messages conveyed by an avatar that used her own voice—reconstructed from a wedding video shot years ago.
Littlejohn was there the first time Ann used the system. Aside from a computerized AAC (augmentative and alternative communication) device that allowed her to use neck muscle movements to slowly and painstakingly communicate in a limited manner, it was the first time she had spoken in nearly two decades.
“It was just very heart-warming and encouraging, for both her and me,” Littlejohn told Fortune.
For Ann, “it was an emotional experience to hear her own voice,” he added.
Because the system was trained to recognize 39 phonemes—sub-units of words—instead of entire words, it was able to decipher her thoughts three times faster, decoding signals to text at a rate of nearly 80 words per minute.
“The accuracy, speed, and vocabulary are crucial,” Sean Metzger, a bioengineering graduate student who helped develop the decoder, said in a news release about the story. “It’s what gives a user the potential, in time, to communicate almost as fast as we do, and to have much more naturalistic and normal conversations.”
Chang, chair of neurosurgery at the university, hopes to soon develop the system for use by similar patients, on a continual basis. Because the device is still in a clinical trial, Ann isn’t allowed to use it outside of the study. A team he led previously enabled a man who had experienced a brainstem stroke to communicate via brain signals decoded into text.
“Our goal is to restore a full, embodied way of communicating, which is really the most natural way for us to talk with others,” Chang said in the release. “These advancements bring us much closer to making this a real solution for patients.”
In order to be useful in daily life for Ann and patients like her, such a product would need to be wireless, unlike the current version, and smaller so that it’s portable, Littlejohn said. He hopes an improved version could be developed and approved by the U.S. Food and Drug administration in a decade at most.
“Another Brick in the Wall” of brain-machine interfaces
Ann’s system is a type of brain-machine interface, also known as a brain-computer interface. Such technology can be used by paralyzed patients like the late Stephen Hawking to express themselves—only not so robotically, and merely by thinking, in this case.
Related work was debuted in earlier August by researchers at the University of California Berkeley, in an article published in the journal PLoS Biology.
Surgeons placed electrodes onto the brains of 29 epileptic patients at Albany Medical Center in New York, while the Pink Floyd song “Another Brick in the Wall, Part 1″ was played in the operating room. Using artificial intelligence, researchers were able to reconstruct the song from the electrical activity of each patient’s brain.
The work will be used to develop even better brain-machine interfaces to help paralyzed patients, as well as those with ALS and speech disorders like non-verbal apraxia, a condition in which patients can’t make movements necessary for speech, Dr. Robert Knight, a professor of psychology and neuroscience, recently told Fortune.
As the technology improves, it may eventually be possible to transmit thoughts through scalp electrodes. Such electrodes can currently be used to signal one’s choice of a single letter from a string of letters—but it takes at least 20 seconds to identify each letter, making communication far too cumbersome, lead author Ludovic Bellier, a postdoctoral researcher in human cognitive neuroscience at Berkeley, told Fortune.
If the technology is streamlined, it may eventually aid those without disabling conditions—like thought workers—in syncing with a computer to convey text from their minds.
“It’s really about reducing friction and allowing people to just think their action,” Bellier said. One example: “You could think, ‘Order my Uber,’ and you don’t have to finish what you’re doing—your Uber arrives.”
For those alarmed by potential future applications of the research, Knight and Bellier emphasize that such feats aren’t currently possible without surgery. And the A.I. developed to translate signals into sounds “merely provides the keyboard for the mind,” they assert.
As for the potential of privacy concerns to develop, Bellier said he’d be more worried about what Big Tech knows about us now, thanks to the monitoring and tracking of online activity.
Besides, privacy issues can be dealt with, he said. When a wireless EEG is completed on a patient, the signal is encrypted.
“We’re on the threshold of lots of things—the fusion of neuroscience and computer engineering, and really, in many ways, the sky’s the limit,” he said.
Added Knight: “I think we’re just on the edge of tickling this whole story.”