APP開發 系統定制 網頁開發 公眾號小程序 盡在鄰米

直線電話 021-50770206 - 上海 18817920445(同微信號) 深圳 18817379825

資訊

OpenAI全面發布類人ChatGPT語音助手,會說中文等50種語言

 2024-09-25

  831

OpenAI首次公開發布四個月后,ChatGPT的類人高級人工智能(AI)語音助手功能終于開始面向廣大付費用戶。

美東時間9月24日周二,OpenAI宣布,所有付費訂閱OpenAI ChatGPT Plus 和 Team 計劃的用戶都將可以使用新的 ChatGPT 高級語音模式Advanced Voice,該功能將在未來幾天內逐步推出,將首先在美國市場上線。下周,該功能將向OpenAI Edu 和 Enterprise 計劃的訂閱者開放。

這意味著,本周,ChatGPT的Plus 版個人用戶和 Teams 版小型企業團隊用戶都可以啟用新的語音功能,只需通過說話、無需手動輸入提示詞和GPT對話。在App上訪問高級語音模式時,用戶可以通過彈出窗口知道自己已經進入了高級語音助手,用戶會收到App的通知。

OpenAI賦予ChatGPT新語音版兩種功能,一是為語音助手存儲“自定義指令”的功能,二是記住用戶希望語音助手表現何種行為的“記憶”功能,類似于今年4月OpenAI為ChatGPT 文本版本推出的記憶功能。用戶可以利用這些功能確保語音模式的個性化,讓AI助手根據用戶對所有對話的偏好做出響應。

OpenAI本周二推出了五種不同風格的新聲音,分別名為Arbor、Maple、Sol、Spruce 和 Vale,加上之前老版語音模式推出的四種聲音 Breeze、Juniper、Cove 和 Ember,可選聲音達到九種。OpenAI還提高了部分外語的對話速度、流暢度和口音。

OpenAI介紹,先進的語音助手可以用50種語言說“對不起,我遲到了”,并在社交媒體的發帖中附上一段視頻,演示用戶可以要求語音助手表達,因為讓奶奶等了很久,向奶奶致歉。視頻顯示,AI助手首先按照要求總結了用戶想要表達的意思,用英語說了一遍,而后,在用戶提示AI奶奶只會說普通話之后,AI助手又用標準的普通話說了一遍。

全新的語音功能適用于OpenAI的AI模型GPT-4o,不適用于最近發布的預覽模型 o1。

此次新語音功能上線可謂姍姍來遲。華爾街見聞曾提到,今年5月OpenAI就在推出新旗艦模型GPT-4o時演示了語音模式Voice Mode。當時GPT-4o支持的ChatGPT聲音聽起來像一名美國成年女性,可以即時回應請求。當它聽到演示的OpenAI 研究主管 Mark Chen呼氣過度時,似乎從中察覺到了他的緊張,然后說他說“Mark,你不是吸塵器”,告訴Chen要放松呼吸。

OpenAI原計劃6月末向一小批Plus計劃用戶推出該語音模式,但6月宣布推遲一個月發布,以便確保該功能安全有效地處理來自數百萬用戶的請求。當時OpenAI稱,計劃今年秋季讓所有Plus用戶都可以訪問該功能,確切的時間表取決于是否達到內部對安全性和可靠性的高標準。

7月末,OpenAI對有限的部分付費Plus用戶推出高級語音模式下的ChatGPT,稱語音模式無法模仿他人的說話方式,且增加了新的過濾器,保證軟件能夠發現并拒絕某些生成音樂或其他形式受版權保護音頻的請求。不過,新的語音模式缺少5月OpenAI展示過的不少功能,比如計算機視覺功能。該功能可讓GPT僅通過使用智能手機的攝像頭就對用戶的舞蹈動作提供語音反饋。


快播三级片