劃重點(diǎn)
01法國(guó)AI創(chuàng)企Gladia成功融資1600萬(wàn)美元,推出多語(yǔ)言實(shí)時(shí)音頻轉(zhuǎn)錄和分析引擎。
02該引擎提供超過(guò)100種語(yǔ)言的高級(jí)實(shí)時(shí)轉(zhuǎn)錄功能,延遲低于300毫秒。
03目前,Gladia的API已為7萬(wàn)名用戶和600家企業(yè)客戶提供服務(wù)。
04由于此輪融資,Gladia計(jì)劃推出一站式音頻AI工具包,以應(yīng)對(duì)市場(chǎng)競(jìng)爭(zhēng)。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
智東西(公眾號(hào):zhidxcom)
編譯 | 楊蕊
編輯 |漠影
智東西10月16日消息,據(jù)VentureBeat昨日?qǐng)?bào)道,法國(guó)AI轉(zhuǎn)錄和音頻智能創(chuàng)企Gladia成功融資1600萬(wàn)美元,并推出了一個(gè)多語(yǔ)言實(shí)時(shí)音頻轉(zhuǎn)錄和分析引擎。該公司計(jì)劃利用這筆資金推進(jìn)研發(fā),推出一站式音頻AI工具包。
Gladia成立于2022年,一直專注于開(kāi)發(fā)端到端的音頻基礎(chǔ)設(shè)施。該公司推出的最新微調(diào)引擎可以提供超過(guò)100種語(yǔ)言的高級(jí)實(shí)時(shí)轉(zhuǎn)錄功能。
該引擎的獨(dú)特之處在于能夠?qū)崟r(shí)捕捉通話中有價(jià)值的信息,包括來(lái)電者的情緒、對(duì)話中的關(guān)鍵信息和摘要。
該新產(chǎn)品克服了語(yǔ)言理解和實(shí)時(shí)數(shù)據(jù)處理等挑戰(zhàn),實(shí)時(shí)語(yǔ)音轉(zhuǎn)文本引擎的延遲低于300毫秒。
本輪融資由歐洲風(fēng)投機(jī)構(gòu)XAnge領(lǐng)投,Illuminate Financial、XTX Ventures等多家風(fēng)投公司參投。
截至目前,Gladia累計(jì)融資金額已達(dá)到2030萬(wàn)美元,早期種子輪投資者包括New Wave、紅杉資本(作為First Sequoia Arc計(jì)劃的一部分)、Cocoa和GFC。
一、Gladia新引擎:100多種語(yǔ)言實(shí)時(shí)轉(zhuǎn)錄,不到1秒生成內(nèi)容
語(yǔ)音轉(zhuǎn)文本產(chǎn)品在克服語(yǔ)言理解挑戰(zhàn)方面面臨著諸多困難。
其中,語(yǔ)言資源的數(shù)量和質(zhì)量不足是一個(gè)關(guān)鍵問(wèn)題。
在Gladia公司看來(lái),目前大多數(shù)語(yǔ)音識(shí)別系統(tǒng)主要依賴于英語(yǔ)音頻數(shù)據(jù)進(jìn)行訓(xùn)練,這在一定程度上限制了它們對(duì)其他語(yǔ)言的識(shí)別能力。
為了解決這個(gè)問(wèn)題,Gladia致力于開(kāi)發(fā)一個(gè)真正多語(yǔ)言的實(shí)時(shí)語(yǔ)音識(shí)別產(chǎn)品。
該公司新開(kāi)發(fā)的微調(diào)引擎能夠提供100多種語(yǔ)言的高級(jí)實(shí)時(shí)轉(zhuǎn)錄服務(wù)。
Gladia特別增強(qiáng)了新引擎對(duì)各種口音的識(shí)別能力,使其能夠迅速適應(yīng)不同語(yǔ)言環(huán)境,從而為用戶提供更加全面和高效的語(yǔ)音轉(zhuǎn)文字體驗(yàn)。
Gladia的首席執(zhí)行官兼聯(lián)合創(chuàng)始人Jean-Louis Quéguiner在接受VentureBeat采訪時(shí)稱,他創(chuàng)立Gladia的初衷源于個(gè)人經(jīng)歷,現(xiàn)有的音頻轉(zhuǎn)錄服務(wù)無(wú)法準(zhǔn)確識(shí)別他的法語(yǔ)口音。
他說(shuō):“考慮到目前大多數(shù)語(yǔ)音識(shí)別模型主要在英語(yǔ)音頻數(shù)據(jù)上訓(xùn)練,存在固有的偏見(jiàn),Gladia優(yōu)先構(gòu)建了第一個(gè)真正多語(yǔ)言的實(shí)時(shí)產(chǎn)品。”
此外,Gladia引擎的特別之處在于能夠即時(shí)從對(duì)話中提取信息,如來(lái)電者的情緒、關(guān)鍵信息和對(duì)話摘要。這意味著使用Gladia從通話或會(huì)議中生成文字記錄和見(jiàn)解只需不到1秒鐘的時(shí)間。
二、克服語(yǔ)言、數(shù)據(jù)多個(gè)挑戰(zhàn),延遲低于300毫秒不損準(zhǔn)確性
由于上下文信息有限,實(shí)時(shí)模型在迅速生成內(nèi)容、準(zhǔn)確輸出內(nèi)容上可能會(huì)遇到難題。
此外,實(shí)時(shí)模型需要更多的計(jì)算資源來(lái)支持其運(yùn)行,這進(jìn)一步增加了引擎開(kāi)發(fā)的復(fù)雜性。
Gladia推出的新產(chǎn)品克服了語(yǔ)言理解和實(shí)時(shí)處理數(shù)據(jù)等上述挑戰(zhàn),并且能夠?qū)δ苓M(jìn)行持續(xù)優(yōu)化,以提供更準(zhǔn)確的服務(wù)。
Gladia的實(shí)時(shí)語(yǔ)音轉(zhuǎn)文本引擎在延遲方面達(dá)到了行業(yè)領(lǐng)先水平,延遲時(shí)間低于300毫秒,且無(wú)論用戶使用的是哪種語(yǔ)言、位于何地或使用何種技術(shù)棧,都不會(huì)影響轉(zhuǎn)錄的準(zhǔn)確性。
XAnge合伙人Alexis du Peloux說(shuō):“Gladia代表了我們?cè)赬Ange所推崇的品質(zhì):一支大膽的全球科技團(tuán)隊(duì),處于AI創(chuàng)新的前沿,擁有成熟的商業(yè)模式,能夠?yàn)楦鱾(gè)行業(yè)帶來(lái)新機(jī)遇。在快節(jié)奏的AI環(huán)境中,Jean-Louis Quéguiner和他的團(tuán)隊(duì)表現(xiàn)非常出色,我們很自豪能夠支持Gladia進(jìn)行A輪融資。”
▲Gladia創(chuàng)始人Jonathan Soto(左)和Jean-Louis Quéguiner(右)。(圖源:VentureBeat)
三、整合AI功能,單一API已為7萬(wàn)用戶600家企業(yè)服務(wù)
Gladia試圖將多種AI功能整合到其現(xiàn)有平臺(tái)中。
聯(lián)合創(chuàng)始人兼首席技術(shù)官Jonathan Soto說(shuō):“我們的單一API兼容所有現(xiàn)有的技術(shù)棧和協(xié)議,包括SIP、VoIP、FreeSwitch和Asterisk。這使我們能夠輕松將實(shí)時(shí)轉(zhuǎn)錄和分析集成到客戶的AI平臺(tái)中,讓他們專注于為終端用戶提供最佳服務(wù)。”
該公司在2023年6月推出了其第一個(gè)異步轉(zhuǎn)錄和音頻智能API。
自推出以來(lái),Gladia的API在企業(yè)應(yīng)用中受到了廣泛關(guān)注,尤其在會(huì)議記錄和筆記輔助工具方面表現(xiàn)突出。
Gladia的首席執(zhí)行官兼聯(lián)合創(chuàng)始人Jean-Louis Quéguiner說(shuō):“Gladia的技術(shù)使垂直市場(chǎng)中需要尖端實(shí)時(shí)轉(zhuǎn)錄(包括銷售支持和聯(lián)絡(luò)中心平臺(tái))的公司能夠從人工呼叫后處理無(wú)縫轉(zhuǎn)向主動(dòng)、低延遲的工作流程。無(wú)論是自動(dòng)進(jìn)行客戶關(guān)系管理(CRM),還是采用AI為坐席提供實(shí)時(shí)指導(dǎo),Gladia都旨在幫助企業(yè)更智能、更高效地運(yùn)營(yíng)。”
目前,該API已為全球超過(guò)7萬(wàn)名用戶和600家企業(yè)客戶提供服務(wù),包括Attention、Circleback、Method Financial、Recall、Sana和VEED。
結(jié)語(yǔ):Gladia放新招!新資本助力研發(fā)一站式音頻AI工具包
Gladia將利用新資金推進(jìn)其研發(fā)工作,計(jì)劃很快將一站式音頻AI工具包推向市場(chǎng),并通過(guò)大語(yǔ)言模型和檢索增強(qiáng)生成擴(kuò)展其產(chǎn)品范圍。
該公司在聯(lián)絡(luò)中心即服務(wù) (CCaaS) 領(lǐng)域擁有多家設(shè)計(jì)合作伙伴,目前正在試行由Gladia的實(shí)時(shí)AI引擎提供支持的代理協(xié)助解決方案。
Gladia的這些新動(dòng)作,加上新資本的助力,使得公司在研發(fā)一站式音頻AI工具包方面有了更多的底氣,進(jìn)一步鞏固其在競(jìng)爭(zhēng)激烈的市場(chǎng)中的地位。
這對(duì)Otter.ai和Fireflies.ai等競(jìng)爭(zhēng)對(duì)手以及其他將語(yǔ)音對(duì)話轉(zhuǎn)錄為文本的基于AI的服務(wù)來(lái)說(shuō)將會(huì)是一個(gè)新的挑戰(zhàn)。
來(lái)源:VentureBeat