展會(huì)信息港展會(huì)大全

消息稱OpenAI正在開發(fā)AI語(yǔ)音助理,GPT-5或年底前發(fā)布
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-05-11 15:40:46   瀏覽:7924次  

導(dǎo)讀:劃重點(diǎn) 1 新的OpenAI軟件內(nèi)置了音頻和視覺(jué)理解功能。 2 OpenAI的AI語(yǔ)音助手可以提高自動(dòng)化客戶服務(wù)代理的表現(xiàn)。 3 OpenAI有望在年底前完成GPT-5的訓(xùn)練,并公開發(fā)布。 騰訊科技訊5月11日消息,據(jù)國(guó)外媒體報(bào)道,在追求開發(fā)能像人類一樣交流的人工智能的競(jìng)賽中...

劃重點(diǎn)

1

新的OpenAI軟件內(nèi)置了音頻和視覺(jué)理解功能。

2

OpenAI的AI語(yǔ)音助手可以提高自動(dòng)化客戶服務(wù)代理的表現(xiàn)。

3

OpenAI有望在年底前完成GPT-5的訓(xùn)練,并公開發(fā)布。

消息稱OpenAI正在開發(fā)AI語(yǔ)音助理,GPT-5或年底前發(fā)布

科技新聞?dòng)?月11日消息,據(jù)國(guó)外媒體報(bào)道,在追求開發(fā)能像人類一樣交流的人工智能的競(jìng)賽中,OpenAI又有了新動(dòng)作。該公司準(zhǔn)備揭示一種全新的人機(jī)對(duì)話技術(shù),該技術(shù)能同時(shí)使用聲音和文本,并具備識(shí)別物體和圖像的能力。據(jù)兩位有幸目睹這款新型人工智能的人士披露,ChatGPT的開發(fā)團(tuán)隊(duì)已經(jīng)向特定客戶展示了其部分功能,其中包括比現(xiàn)有產(chǎn)品更為出色的邏輯推理能力。

這一技術(shù)成果是OpenAI首席執(zhí)行官山姆奧特曼(SamAltman)宏偉愿景中的又一重要進(jìn)化。他的最終目標(biāo)是開發(fā)出一種類似于斯派克瓊斯(SpikeJones)執(zhí)導(dǎo)的電影《她》(Her)中的虛擬助手那樣的先進(jìn)人工智能,并努力使現(xiàn)有的語(yǔ)音助手,如蘋果的Siri,變得更加實(shí)用和智能。

據(jù)一位內(nèi)部消息人士透露,OpenAI可能最早在下周一的一次公開活動(dòng)中預(yù)覽這款升級(jí)后的人工智能。這一時(shí)間比谷歌I/O開發(fā)者大會(huì)早一天,此舉意在搶在谷歌發(fā)布一系列人工智能產(chǎn)品之前,占據(jù)市場(chǎng)先機(jī)。

消息稱OpenAI正在開發(fā)AI語(yǔ)音助理,GPT-5或年底前發(fā)布

OpenAI認(rèn)為,具備視覺(jué)和音頻功能的智能助手有可能像智能手機(jī)一樣,引發(fā)一場(chǎng)科技革命。從理論上講,這樣的助手將能勝任許多目前難以想象的任務(wù),例如擔(dān)任學(xué)生撰寫論文或解決數(shù)學(xué)問(wèn)題的導(dǎo)師,或在人們需要時(shí)提供周圍環(huán)境的信息,如翻譯路標(biāo)或解釋如何修理汽車故障等。

由于這項(xiàng)新技術(shù)的規(guī)模龐大,目前還無(wú)法在個(gè)人設(shè)備上運(yùn)行。然而,在不久的將來(lái),客戶將能夠通過(guò)云端的版本來(lái)改進(jìn)OpenAI軟件已有的功能,例如自動(dòng)客戶服務(wù)代理。據(jù)一位知情人士透露,新軟件的音頻功能將幫助這些代理更好地理解呼叫者的語(yǔ)氣,甚至能察覺(jué)到他們?cè)谔岢鲆髸r(shí)是否帶有諷刺意味。

OpenAI已經(jīng)開發(fā)出可以轉(zhuǎn)錄音頻和將文本轉(zhuǎn)換為語(yǔ)音的軟件,但這些功能是通過(guò)獨(dú)立的會(huì)話AI模型實(shí)現(xiàn)的。而新模型則將這些功能融為一體,從而使得新的多模態(tài)模型在理解圖像和音頻方面表現(xiàn)更佳,并且相比功能較弱的模型,使用起來(lái)更為迅捷。

作為OpenAI的最大資助者,微軟有權(quán)自由使用OpenAI的技術(shù)。微軟可以利用OpenAI的新型人工智能來(lái)改進(jìn)自家的語(yǔ)音助手,或者嘗試將其縮小規(guī)模,以便在小型設(shè)備上運(yùn)行,這包括帶有前置攝像頭的可穿戴設(shè)備,這些設(shè)備能夠捕捉客戶周圍的環(huán)境信息。

目前尚不清楚OpenAI何時(shí)會(huì)向付費(fèi)用戶提供這些新功能。但據(jù)一位使用過(guò)聊天機(jī)器人ChatGPT的人士表示,OpenAI最終計(jì)劃將這些功能整合到其聊天機(jī)器人的免費(fèi)版本中。該人士還透露,OpenAI的目標(biāo)是使支持這些功能的新型AI模型比該公司目前銷售的最先進(jìn)的GPT-4Turbo更為經(jīng)濟(jì)實(shí)惠。在回答某些類型的問(wèn)題時(shí),新模型的表現(xiàn)甚至已經(jīng)超越了GPT-4Turbo。然而,值得注意的是,新模型仍然會(huì)犯下錯(cuò)誤,即出現(xiàn)所謂的“幻覺(jué)”現(xiàn)象。

GPT-5年底前發(fā)布?

與此同時(shí),谷歌的高管們也懷揣著利用人工智能開發(fā)卓越助手的宏偉愿景。去年12月,谷歌展示了其對(duì)話式人工智能Gemini的視頻,它能實(shí)時(shí)響應(yīng)語(yǔ)音指令,并識(shí)別出人們正在注視的圖像。然而,隨后該公司澄清,這些高級(jí)功能實(shí)際上需要研究人員使用圖像和文本進(jìn)行模型提示,而非視頻演示中展示的簡(jiǎn)單對(duì)話。

消息稱OpenAI正在開發(fā)AI語(yǔ)音助理,GPT-5或年底前發(fā)布

此外,除了圖像和文本處理,Gemini雖然增添了音頻分析能力,但它在理解許多傳統(tǒng)語(yǔ)音命令上仍有局限,也無(wú)法像Siri或谷歌助手(GoogleAssistant)等傳統(tǒng)語(yǔ)音助手那樣流暢地與用戶交流。

OpenAI同樣在奮力前行,以保持其相對(duì)于Meta等競(jìng)爭(zhēng)對(duì)手的領(lǐng)先地位。今年4月,Meta發(fā)布了開源人工智能模型Llama3,其性能超越了當(dāng)前許多會(huì)話式人工智能模型,并贏得了人工智能應(yīng)用開發(fā)者的廣泛贊譽(yù)。

OpenAI即將推出的這款具備音頻和視覺(jué)功能的新模型,只是其眾多研發(fā)項(xiàng)目中的冰山一角。外媒消息稱,該公司正致力于開發(fā)一款與谷歌競(jìng)爭(zhēng)的網(wǎng)絡(luò)搜索引擎,并研發(fā)名為計(jì)算機(jī)使用代理的自動(dòng)化軟件,旨在加速軟件開發(fā)及其他基于計(jì)算機(jī)的任務(wù)。此外,盡管尚未公開,但OpenAI已經(jīng)發(fā)布了人工智能視頻生成器Sora的預(yù)覽版本,這一創(chuàng)新在好萊塢引起了巨大轟動(dòng)。

尤為引人注目的是,OpenAI正全力以赴開發(fā)GPT-5,并期望它能比一年多前發(fā)布的GPT-4實(shí)現(xiàn)重大飛躍。據(jù)與OpenAI高層有過(guò)深入討論的人士透露,該公司有望在年底前完成GPT-5的訓(xùn)練并公之于眾。

OpenAI的產(chǎn)品和人工智能模型開發(fā)速度相當(dāng)快,這導(dǎo)致了一些先前宣布的項(xiàng)目并未得到足夠的關(guān)注。例如,盡管OpenAI曾向開發(fā)者承諾,到今年第一季度,他們能夠通過(guò)為其商店開發(fā)定制聊天機(jī)器人來(lái)實(shí)現(xiàn)盈利,但至今該公司尚未推出具體的實(shí)施方案。

然而,提升視覺(jué)和音頻功能有望助力OpenAI在數(shù)百萬(wàn)乃至數(shù)十億臺(tái)蘋果設(shè)備上運(yùn)行其對(duì)話式人工智能。近幾個(gè)月來(lái),蘋果與OpenAI就下一代iPhone操作系統(tǒng)如何整合OpenAI的模型進(jìn)行了深入探討。然而,這位ChatGPT的制造者面臨著激烈的競(jìng)爭(zhēng),蘋果同時(shí)也在與谷歌進(jìn)行類似的談判。

據(jù)悉,OpenAI的CEO山姆奧特曼(SamAltman)還與知名iPhone設(shè)計(jì)師喬尼艾維(JonyIve)攜手合作,共同研發(fā)一款人工智能消費(fèi)設(shè)備。這款設(shè)備有望從艾默生集團(tuán)和ThriveCapital等投資者那里籌集高達(dá)10億美元的資金。這一舉措意味著,奧特曼將加入大型科技公司和初創(chuàng)企業(yè)的行列,競(jìng)相發(fā)布人工智能設(shè)備和可穿戴設(shè)備。

然而,目前最先進(jìn)的人工智能模型由于體積龐大,必須在云端運(yùn)行,并依賴互聯(lián)網(wǎng)連接才能正常工作。因此,開發(fā)具備復(fù)雜視覺(jué)和音頻功能的對(duì)話式人工智能可能需要數(shù)月甚至數(shù)年的時(shí)間,才能將其縮小到足以在設(shè)備上運(yùn)行的尺寸。

分級(jí)定價(jià)策略

據(jù)一位與OpenAI高管密切交流的人士透露,OpenAI今年有望創(chuàng)造數(shù)十億美元收入,該公司正計(jì)劃推出一種全新的定價(jià)模式。若客戶選擇預(yù)付費(fèi)預(yù)訂Token(用于大語(yǔ)言模型處理或生成的單詞),該公司將提供高達(dá)50%的折扣。

目前,OpenAI主要采取按需定價(jià)策略,其大語(yǔ)言模型每生成百萬(wàn)Token的費(fèi)用在幾美分至120美元不等,而一些大型客戶則能享受到批量折扣的優(yōu)惠。提前付款以獲取折扣的策略在云計(jì)算領(lǐng)域已相當(dāng)普遍,如微軟Azure、谷歌云和亞馬遜AWS的客戶,均能通過(guò)提前預(yù)訂服務(wù)器容量來(lái)顯著降低成本。

通過(guò)引入更靈活的定價(jià)機(jī)制,OpenAI旨在與其他模型開發(fā)商以及旨在協(xié)助開發(fā)者以更低成本運(yùn)行開源模型的初創(chuàng)公司展開更有力的競(jìng)爭(zhēng)。這些初創(chuàng)公司,通常被稱為人工智能服務(wù)器經(jīng)銷商或推理服務(wù)提供商,他們對(duì)成本效率的重視有時(shí)會(huì)導(dǎo)致他們以越來(lái)越低的價(jià)格提供同樣的大模型服務(wù),有時(shí)甚至低于成本價(jià)。

為了進(jìn)一步幫助開發(fā)者降低成本,OpenAI已通過(guò)批處理API(BatchAPI)為開發(fā)者提供了一種經(jīng)濟(jì)高效的解決方案。這是OpenAI在4月份推出的一種應(yīng)用程序編程接口,允許開發(fā)者批量上傳模型查詢,并在愿意等待長(zhǎng)達(dá)24小時(shí)響應(yīng)的前提下,享受更為優(yōu)惠的價(jià)格。而像TogetherAI和Anyscale這樣的人工智能服務(wù)器經(jīng)銷商則聲稱,在他們的平臺(tái)上運(yùn)行開源模型比使用OpenAI的模型要便宜六倍之多。(編譯/金鹿)

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港