OpenAI全面發(fā)布類人ChatGPT語音助手,會(huì)說中文等50多種語言
激石Pepperstone(http://hskilr.com/)報(bào)道:
OpenAI首次公開發(fā)布四個(gè)月后,ChatGPT的類人高級(jí)人工智能(AI)語音助手功能終于開始面向廣大付費(fèi)用戶。
美東時(shí)間9月24日周二,OpenAI宣布,所有付費(fèi)訂閱OpenAI ChatGPT Plus 和 Team 計(jì)劃的用戶都將可以使用新的 ChatGPT 高級(jí)語音模式Advanced Voice,該功能將在未來幾天內(nèi)逐步推出,將首先在美國(guó)市場(chǎng)上線。下周,該功能將向OpenAI Edu 和 Enterprise 計(jì)劃的訂閱者開放。
這意味著,本周,ChatGPT的Plus 版?zhèn)€人用戶和 Teams 版小型企業(yè)團(tuán)隊(duì)用戶都可以啟用新的語音功能,只需通過說話、無需手動(dòng)輸入提示詞和GPT對(duì)話。在App上訪問高級(jí)語音模式時(shí),用戶可以通過彈出窗口知道自己已經(jīng)進(jìn)入了高級(jí)語音助手,用戶會(huì)收到App的通知。
OpenAI賦予ChatGPT新語音版兩種功能,一是為語音助手存儲(chǔ)“自定義指令”的功能,二是記住用戶希望語音助手表現(xiàn)何種行為的“記憶”功能,類似于今年4月OpenAI為ChatGPT 文本版本推出的記憶功能。用戶可以利用這些功能確保語音模式的個(gè)性化,讓AI助手根據(jù)用戶對(duì)所有對(duì)話的偏好做出響應(yīng)。
OpenAI本周二推出了五種不同風(fēng)格的新聲音,分別名為Arbor、Maple、Sol、Spruce 和 Vale,加上之前老版語音模式推出的四種聲音 Breeze、Juniper、Cove 和 Ember,可選聲音達(dá)到九種,撤走了被指山寨“寡姐”的聲音Sky。OpenAI還提高了部分外語的對(duì)話速度、流暢度并改進(jìn)口音。
OpenAI介紹,先進(jìn)的語音助手可以用超過50種語言說“對(duì)不起,我遲到了”,并在社交媒體的發(fā)帖中附上一段視頻,演示用戶可以要求語音助手表達(dá),因?yàn)樽屇棠痰攘撕芫?,向奶奶致歉。視頻顯示,AI助手首先按照要求總結(jié)了用戶想要表達(dá)的意思,用英語說了一遍,而后,在用戶提示AI奶奶只會(huì)說普通話之后,AI助手又用標(biāo)準(zhǔn)的普通話說了一遍。
全新的語音功能適用于OpenAI的AI模型GPT-4o,不適用于最近發(fā)布的預(yù)覽模型 o1。
此次新語音功能上線可謂姍姍來遲。華爾街見聞曾提到,今年5月OpenAI就在推出新旗艦?zāi)P虶PT-4o時(shí)演示了語音模式Voice Mode。當(dāng)時(shí)GPT-4o支持的ChatGPT聲音聽起來像一名美國(guó)成年女性,可以即時(shí)回應(yīng)請(qǐng)求。當(dāng)它聽到演示的OpenAI 研究主管 Mark Chen呼氣過度時(shí),似乎從中察覺到了他的緊張,然后說他說“Mark,你不是吸塵器”,告訴Chen要放松呼吸。
OpenAI原計(jì)劃6月末向一小批Plus計(jì)劃用戶推出該語音模式,但6月宣布推遲一個(gè)月發(fā)布,以便確保該功能安全有效地處理來自數(shù)百萬用戶的請(qǐng)求。當(dāng)時(shí)OpenAI稱,計(jì)劃今年秋季讓所有Plus用戶都可以訪問該功能,確切的時(shí)間表取決于是否達(dá)到內(nèi)部對(duì)安全性和可靠性的高標(biāo)準(zhǔn)。
7月末,OpenAI對(duì)有限的部分付費(fèi)Plus用戶推出高級(jí)語音模式下的ChatGPT,稱語音模式無法模仿他人的說話方式,且增加了新的過濾器,保證軟件能夠發(fā)現(xiàn)并拒絕某些生成音樂或其他形式受版權(quán)保護(hù)音頻的請(qǐng)求。不過,新的語音模式缺少5月OpenAI展示過的不少功能,比如計(jì)算機(jī)視覺功能。該功能可讓GPT僅通過使用智能手機(jī)的攝像頭就對(duì)用戶的舞蹈動(dòng)作提供語音反饋。?????????
掃描二維碼推送至手機(jī)訪問。
版權(quán)聲明:本文由激石Pepperstone發(fā)布,如需轉(zhuǎn)載請(qǐng)注明出處。