由億萬富翁澤維爾·尼爾投資的法國人工智能研究實(shí)驗(yàn)室展示了一款新語音助手。它具有各種類似人類的情感,與OpenAI曾承諾推出但因安全問題而推遲發(fā)布的一款產(chǎn)品類似。
去年成立的人工智能非營利組織Kyutai周三在巴黎舉行的活動(dòng)上展示了其Moshi服務(wù)。該實(shí)驗(yàn)室的科學(xué)家表示,他們的系統(tǒng)能使用 70 種不同的情緒和風(fēng)格說話。他們演示了該助手為攀登珠穆朗瑪峰提供建議,并用濃重的法國口音朗誦自己創(chuàng)作的一首詩。
Kyutai 首席執(zhí)行官帕特里克·佩雷斯表示:“它能邊說話邊思考。我們相信,Moshi有巨大的潛力,能夠改變我們與機(jī)器以及通過機(jī)器進(jìn)行交流的方式。”
這款語音助手是最著名的聊天機(jī)器人OpenAI的ChatGPT的最新挑戰(zhàn)者。越來越多的初創(chuàng)公司和大型科技公司,包括Anthropic、Cohere和Alphabet公司旗下的谷歌(Google),爭相推出能與OpenAI的GPT-4競爭的模型,盡管一些業(yè)內(nèi)專家擔(dān)心這種新興技術(shù)會帶來危險(xiǎn)。
OpenAI在5月為ChatGPT Plus用戶舉行了語音助手發(fā)布會,首次將強(qiáng)大的圖像識別功能與閃電般的反應(yīng)速度相結(jié)合。新產(chǎn)品本應(yīng)在幾周內(nèi)推出,但該公司后來將推出時(shí)間推遲到秋季,并表示最初不會包括其展示的視頻和屏幕共享功能。
OpenAI 還因?yàn)樵谄涔δ苤姓故玖艘粋€(gè)聽起來像女演員斯嘉麗·約翰遜的人工智能語音而遭到反對。在約翰遜聘請律師后,該公司撤下了該語音。
佩雷斯表示,他的實(shí)驗(yàn)室將以開源技術(shù)的形式發(fā)布該助手背后的模型和研究,代碼可以自由共享。他稱 Moshi 是 "首個(gè)已發(fā)布的實(shí)時(shí)語音人工智能助手"。
Kyutai 周三在一份聲明中表示,這項(xiàng)新服務(wù)是一個(gè) "實(shí)驗(yàn)原型"。該實(shí)驗(yàn)室的一位代表稱,未來幾周將推出模型和研究成果,但沒有說明具體日期。
Kyutai 于 去年11月投入運(yùn)營,當(dāng)時(shí)獲得了 3 億歐元(約合3.24 億美元)融資,其中包括來自尼爾、法國億萬富翁羅多爾夫·薩德和谷歌前董事長埃里克·施密特的投資。佩雷斯曾任法雷奧公司(Valeo SA)董事,他的實(shí)驗(yàn)室聘請了谷歌DeepMind和Meta Platforms等公司的研究人員。
尼爾認(rèn)為,這款語音助手是一個(gè)很有希望的標(biāo)志,意味著歐洲可以成為人工智能發(fā)展的全球參與者。他周三在接受采訪時(shí)表示:"他們今天展示的所有產(chǎn)品都是全球同類產(chǎn)品中的佼佼者。我們很高興歐洲能有這樣的產(chǎn)品。"
Kyutai公司的首席科學(xué)官熱爾韋·熱古在活動(dòng)中簡要地談到了安全問題。他表示,該實(shí)驗(yàn)室將使用索引和水印工具來識別和跟蹤人工智能生成的音頻。
為了訓(xùn)練其新模型,Kyutai 表示它與一位名為愛麗絲的配音演員合作,但沒有透露她的全名。(財(cái)富中文網(wǎng))
翻譯:劉進(jìn)龍
審校:汪皓
億萬富翁、伊利亞德公司副董事長澤維爾·尼爾。MARLENE AWAAD/BLOOMBERG VIA GETTY IMAGES
由億萬富翁澤維爾·尼爾投資的法國人工智能研究實(shí)驗(yàn)室展示了一款新語音助手。它具有各種類似人類的情感,與OpenAI曾承諾推出但因安全問題而推遲發(fā)布的一款產(chǎn)品類似。
去年成立的人工智能非營利組織Kyutai周三在巴黎舉行的活動(dòng)上展示了其Moshi服務(wù)。該實(shí)驗(yàn)室的科學(xué)家表示,他們的系統(tǒng)能使用 70 種不同的情緒和風(fēng)格說話。他們演示了該助手為攀登珠穆朗瑪峰提供建議,并用濃重的法國口音朗誦自己創(chuàng)作的一首詩。
Kyutai 首席執(zhí)行官帕特里克·佩雷斯表示:“它能邊說話邊思考。我們相信,Moshi有巨大的潛力,能夠改變我們與機(jī)器以及通過機(jī)器進(jìn)行交流的方式。”
這款語音助手是最著名的聊天機(jī)器人OpenAI的ChatGPT的最新挑戰(zhàn)者。越來越多的初創(chuàng)公司和大型科技公司,包括Anthropic、Cohere和Alphabet公司旗下的谷歌(Google),爭相推出能與OpenAI的GPT-4競爭的模型,盡管一些業(yè)內(nèi)專家擔(dān)心這種新興技術(shù)會帶來危險(xiǎn)。
OpenAI在5月為ChatGPT Plus用戶舉行了語音助手發(fā)布會,首次將強(qiáng)大的圖像識別功能與閃電般的反應(yīng)速度相結(jié)合。新產(chǎn)品本應(yīng)在幾周內(nèi)推出,但該公司后來將推出時(shí)間推遲到秋季,并表示最初不會包括其展示的視頻和屏幕共享功能。
OpenAI 還因?yàn)樵谄涔δ苤姓故玖艘粋€(gè)聽起來像女演員斯嘉麗·約翰遜的人工智能語音而遭到反對。在約翰遜聘請律師后,該公司撤下了該語音。
佩雷斯表示,他的實(shí)驗(yàn)室將以開源技術(shù)的形式發(fā)布該助手背后的模型和研究,代碼可以自由共享。他稱 Moshi 是 "首個(gè)已發(fā)布的實(shí)時(shí)語音人工智能助手"。
Kyutai 周三在一份聲明中表示,這項(xiàng)新服務(wù)是一個(gè) "實(shí)驗(yàn)原型"。該實(shí)驗(yàn)室的一位代表稱,未來幾周將推出模型和研究成果,但沒有說明具體日期。
Kyutai 于 去年11月投入運(yùn)營,當(dāng)時(shí)獲得了 3 億歐元(約合3.24 億美元)融資,其中包括來自尼爾、法國億萬富翁羅多爾夫·薩德和谷歌前董事長埃里克·施密特的投資。佩雷斯曾任法雷奧公司(Valeo SA)董事,他的實(shí)驗(yàn)室聘請了谷歌DeepMind和Meta Platforms等公司的研究人員。
尼爾認(rèn)為,這款語音助手是一個(gè)很有希望的標(biāo)志,意味著歐洲可以成為人工智能發(fā)展的全球參與者。他周三在接受采訪時(shí)表示:"他們今天展示的所有產(chǎn)品都是全球同類產(chǎn)品中的佼佼者。我們很高興歐洲能有這樣的產(chǎn)品。"
Kyutai公司的首席科學(xué)官熱爾韋·熱古在活動(dòng)中簡要地談到了安全問題。他表示,該實(shí)驗(yàn)室將使用索引和水印工具來識別和跟蹤人工智能生成的音頻。
為了訓(xùn)練其新模型,Kyutai 表示它與一位名為愛麗絲的配音演員合作,但沒有透露她的全名。(財(cái)富中文網(wǎng))
翻譯:劉進(jìn)龍
審校:汪皓
Xavier Niel, billionaire and deputy chairman of Iliad SA.
A French artificial intelligence research lab backed by billionaire Xavier Niel showed off a new voice assistant with a variety of human-like emotions that is similar to a product that OpenAI promised but delayed over safety concerns.
Kyutai, an AI nonprofit group formed last year, revealed its Moshi service at in event in Paris on Wednesday. Scientists for the lab said their system can speak with 70 different emotions and styles. They demoed the assistant offering advice on climbing Mt. Everest and reciting a poem it had composed with a thick French accent.
“It thinks as it speaks,” Kyutai Chief Executive Officer Patrick Pérez said. “We believe Moshi has tremendous potential to change the way we communicate with and through machines.”
The assistant is the latest challenger to OpenAI’s ChatGPT, the best-known chatbot. A growing number of startups and Big Tech companies, including Anthropic, Cohere and Alphabet Inc.’s Google, have rushed to introduce models to compete with OpenAI’s GPT-4, even as some industry experts worry about the dangers presented by the emerging technology.
OpenAI in May held a launch event for a voice assistant for ChatGPT Plus users that for the first time paired powerful image-recognition capabilities with lightning-quick responses. The new product was supposed to be available within weeks, but the company later delayed the roll out until fall and said it won’t initially include video and screen-sharing features it had demonstrated.
OpenAI also faced backlash for showcasing an AI voice in its feature that sounded like the actress Scarlett Johansson. The company pulled the voice after the actress hired lawyers.
Pérez said his lab will release the models and research behind the assistant as open-source technology, where the code is shared freely. He called Moshi the “first real-time voice AI assistant released.”
The new service is an “experimental prototype,” Kyutai said in a statement on Wednesday. A representative for the lab said the model and research will be available in the coming weeks, without specifying a date.
Kyutai was launched in November with €300 million ($324 million) in funding, including from Niel, French billionaire Rodolphe Saadé and former Google chairman Eric Schmidt. Pérez, a former director for Valeo SA, hired researchers from Google DeepMind and Meta Platforms Inc. for his lab.
The voice assistant is a promising indicator that Europe can be a global player in AI development, according to Niel. “All the products they showed today are the best in class worldwide,” he said in an interview Wednesday. “We are very happy to have this in Europe.”
Kyutai’s Chief Science Officer Hervé Jégou addressed safety concerns at the event briefly. The lab will use indexing and watermarking tools to identify and track audio that’s generated by its AI, he said.
To train its new model, Kyutai said it worked with a voice actress it called Alice, without disclosing her full name.