展會信息港展會大全

探索 AI 落地場景圖譜:從技術(shù)挑戰(zhàn)到商業(yè)應用的多元視角 | 2024T-EDGE
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-12-13 15:11:32   瀏覽:230次  

導讀:12月7日,在北京市大興區(qū)舉辦的2024T-EDGE創(chuàng)新大會暨鈦媒體財經(jīng)年會上,「AI 落地場景圖譜」圓桌由鈦媒體集團聯(lián)合創(chuàng)始人劉湘明主持,TDK InvenSense 副總裁 Pankaj Aggarwal、Traini 創(chuàng)始人孫鄰家、MascotGO 首席技術(shù)官 Peter Avritch、萬魔聲學董事長謝冠宏、紅杉中國合伙人張涵等嘉賓,圍繞 AI 落地應用面臨的挑戰(zhàn)、各公司在 AI 領(lǐng)域的進展與商業(yè)模式、AI 在不同領(lǐng)域的發(fā)展趨 ......

12月7日,在北京市大興區(qū)舉辦的2024T-EDGE創(chuàng)新大會暨鈦媒體財經(jīng)年會上,「AI 落地場景圖譜」圓桌由鈦媒體集團聯(lián)合創(chuàng)始人劉湘明主持,TDK InvenSense 副總裁 Pankaj Aggarwal、Traini 創(chuàng)始人孫鄰家、MascotGO 首席技術(shù)官 Peter Avritch、萬魔聲學董事長謝冠宏、紅杉中國合伙人張涵等嘉賓,圍繞 AI 落地應用面臨的挑戰(zhàn)、各公司在 AI 領(lǐng)域的進展與商業(yè)模式、AI 在不同領(lǐng)域的發(fā)展趨勢等話題展開。

Traini公司通過大量視頻標注理解寵物行為并選擇模型,與寵物行為專家合作確保數(shù)據(jù)準確性,公司在共情方向投入研發(fā),產(chǎn)品有 C 端用戶,且在模型端可輸出,與多家硬件公司合作。

孫鄰家表示,Traini未來嘗試在醫(yī)療端輔助診斷、為具身機器人提供數(shù)據(jù)。目前主要專注于狗狗領(lǐng)域,因北美和歐洲狗狗市場大且狗狗行為與人類交互更直接,未來可能延伸到其他領(lǐng)域。

謝冠宏提到,萬魔聲學在耳機降噪(飛機、火車降噪及通話降噪)、省電方面取得成果,睡眠豆第三代可準確監(jiān)控心率、呼吸和睡眠狀態(tài)。眼鏡產(chǎn)品也在發(fā)展,雖市場挑戰(zhàn)大但從一開始就注重差異化。

Peter Avritch提到,他的開發(fā)工作圍繞研究如何使用和獲取數(shù)據(jù),為用戶提供個性化推薦。

Pankaj Aggarwal則表示,AI 發(fā)展需要更多傳感器,傳感器能讓AI變得更智能,如耳機能判斷發(fā)言者自動調(diào)節(jié)聲音,未來機器人將使用更多傳感器,覆蓋消費、工業(yè)設(shè)備等多領(lǐng)域,且需關(guān)注小設(shè)備功能局限、安全及隱私問題。

張涵從投資視角闡述了目前AI應用在尋求大規(guī)模落地和商業(yè)化方面面臨的挑戰(zhàn),包括落地場景、Token成本控制、數(shù)據(jù)安全等。他認為在應用落地的優(yōu)化方向上,創(chuàng)業(yè)者可以尋找和構(gòu)建對模型以及Agent的輸出結(jié)果要求不太高的使用場景,實現(xiàn)產(chǎn)品和商業(yè)化更快、更早的落地。

探索 AI 落地場景圖譜:從技術(shù)挑戰(zhàn)到商業(yè)應用的多元視角 | 2024T-EDGE

以下是圓桌對話實錄,經(jīng)鈦媒體APP編輯整理:

劉湘明:特別高興今天有這樣的機會討論落地的問題,這次在美國參加很多AI會議,主要是兩個方向,一是AI落地;二是AI工具,結(jié)合大家在領(lǐng)域里的觀察,目前AI應用落地面臨有哪些挑戰(zhàn)和障礙是什么?

Pankaj Aggarwal:數(shù)據(jù)收集的過程應該是一大挑戰(zhàn),以及從不同來源收集數(shù)據(jù)并且進行整合,這也是挑戰(zhàn)。

過去十年,AI有100萬倍的計算成本下降,數(shù)據(jù)量增加了1萬倍,在這個過程中AI不斷地應用數(shù)據(jù),將數(shù)據(jù)數(shù)字化。

比如對于馬拉松長跑選手,可能配備了不同的傳感器,現(xiàn)在的AI技術(shù)有沒有能力把所有數(shù)據(jù)進行收集,并且進行符合需求的數(shù)據(jù)分析,這是非常重要的。

很多時候,AI數(shù)據(jù)沒有很好地被應用。比如很多小的設(shè)備,可能在電力或者其它方面有局限,導致沒有辦法在每時每刻收集數(shù)據(jù)。

智能終端或者智能邊緣也受到行業(yè)關(guān)注,我們需要有不同的傳感器,比如溫度傳感器、水分傳感器,以及其它的像WiFi、藍牙、云上設(shè)施等,收集并分析數(shù)據(jù)的過程受到電池的限制。

孫鄰家:AI落地應用最大的挑戰(zhàn)有三。第一,人們對大模型的期待非常高,大家期待出現(xiàn)能夠顛覆移動互聯(lián)網(wǎng)的大模型應用,一般的應用大家會覺得它太薄,不足夠變成殺手級的應用。這會和實際有個gap(差距),這個gap會導致做應用的公司,去融資或者想拿到足夠的錢,再往前的時候難度變得更大。

第二,很多做應用的公司,認為具備工程能力,又對大模型比較了解,就可以做了,過程中會使用現(xiàn)有的開源技術(shù)。但實際上這些公司對場景、用戶需求的理解,特別是在整個Workflow(工作流程)上理解比較淺,在做產(chǎn)品或者應用的時候很難切到用戶的痛點。

第三,現(xiàn)在的AI應用某種程度上等于AI Agent,需要有自己的模型。建立模型的時候,不論利用開源技術(shù)還是自己架構(gòu)的技術(shù),最后要形成比較獨特的技術(shù)優(yōu)勢,這個技術(shù)優(yōu)勢上邊要疊加無數(shù)的數(shù)據(jù),在AI應用層面,很多數(shù)據(jù)都是非結(jié)構(gòu)性的,怎么樣去處理、采集非結(jié)構(gòu)性的數(shù)據(jù),達到能夠訓練大量模型的程度,把它變成非常獨特的產(chǎn)品,這對于一般的團隊而言難度非常大,至少有一件事情大家必須要去做,就得去讀論文,讀英文的論文非常難,對于小公司而言非常難。

謝冠宏:AI終端存在四個主要難點。

省電難點。萬魔聲學幾年來一直在改進和克服省電、輕薄、穿戴舒適等問題,AI終端需做到不用時省電stand by一整天,又能隨叫隨到,使用時可迅速連接藍牙、wifi等,且視頻要有高帶寬。

音質(zhì)難點。要提高聲音質(zhì)量、消除噪音,讓使用者既能清楚理解對方講話,也能清晰聽到自己說話,還能發(fā)出接近人類的聲音給對方,改變傳統(tǒng)AI一問一答模式,實現(xiàn)全時間雙向?qū)崟r對應,能分清不同語言,雙方和動作,目前在眼鏡、耳機上已做到相應程度。

APP難點。使用AI需下載APP,但跟Apple、谷歌搶入口較難,未來是萬物互聯(lián)時代,可通過直接拉群的方式解決,同時提升使用的便利性。我們使用專利技術(shù)為人,AI與 messager 結(jié)合一物1號,達成人機互聯(lián)。

手機本地agent難點。要清楚分辨其能做和不能做的事,比如訂披薩時不能放入銀行賬號和家庭住址等隱私信息,當前模型設(shè)有防火墻隔離,但同時還要充分利用云端的智能跟資訊。

Peter Avritch:談到生成式AI,我的工作就是研究做哪些工具加入到大語言模型當中,研究如何使用這些數(shù)據(jù),如何獲取這些數(shù)據(jù),再把這些數(shù)據(jù)給回到大語言模型,實現(xiàn)個性化的推薦。

比如對于某個人來說,上哪所大學最合適,這不僅僅是學術(shù)問題、財務問題,它包含各個方面。對于16、17歲的孩子來說,做這樣的決策可能是整個人生最重要的決策,我們希望能夠運用到大模型幫助年輕人來做決策。

張涵:大模型這兩年發(fā)展非?,但能力還相對有限,特別是在內(nèi)容準確度、輸出能否符合預期等方面,離大規(guī)模商用和到基于Agent做閉環(huán)操作還是有距離的,仍然需要技術(shù)側(cè)、產(chǎn)品側(cè)的人才去不斷想辦法優(yōu)化。

在應用優(yōu)化的方向上,可能會有一批優(yōu)秀的產(chǎn)品經(jīng)理或者創(chuàng)業(yè)者去構(gòu)建更新的場景,比如他們尋找的用戶群體可能對模型和Agent的輸出結(jié)果預期沒有那么高。在這種情況下,產(chǎn)品反而變得更容易落地,商業(yè)化也更容易形成。

AI創(chuàng)業(yè)者還會普遍碰到token的成本問題,這和之前移動互聯(lián)網(wǎng)的差別比較大。當你做了一個AI產(chǎn)品,這個產(chǎn)品在還沒有形成良好盈利狀態(tài)和商業(yè)模式的時候,在這上面消耗的token以及獲客的成本疊加等等會使得整體成本變得更高。

最后是數(shù)據(jù)。不同的場景下,企業(yè)側(cè)可能積累了很多私有數(shù)據(jù)。如何在最大化保護數(shù)據(jù)隱私、數(shù)據(jù)和模型安全的前提下,讓私有數(shù)據(jù)和自己的業(yè)務側(cè)結(jié)合,與大模型聯(lián)接起來,從而提高工作效率,這可能還是個挑戰(zhàn)。

劉湘明:問個小問題,“Traini”的名字由何而來?商業(yè)模式就是把寵物的語言翻譯成人能聽懂的語言,怎么做到的?

孫鄰家:其實是training的縮寫,我們想表達寵物到人類世界被馴化的過程。

我們是全球第一家用生成式AI做寵物行為分析的商業(yè)公司,通過大量視頻的標注,系統(tǒng)性地理解寵物行為之后,再去選擇模型。我們目前專注在狗上面,會和頂級的寵物行為專家合作,讓他們成為我們的一部分,而且要付出很高的成本,例如股權(quán)給他們,來進行專業(yè)數(shù)據(jù)的標注,保證Ground truth最后能夠?qū)崿F(xiàn)。

其次我們在共情方向上進行大量的研究和開發(fā),例如用語音的方式呈現(xiàn),克隆成狗兒子和狗父母說話的形式,整個體驗對于產(chǎn)品都起到?jīng)Q定性的作用。我們看起來是C端產(chǎn)品,但做小模型一旦擁有數(shù)據(jù),建立數(shù)據(jù)壁壘,就有很大的能力可以做C2B,這個模式可以成立,目前在模型端也可以輸出,在硬件上可以用到。像蘋果、華為、尼桑汽車、上汽等等很多大的硬件公司都在找我們合作。

原來做的非常垂直領(lǐng)域的小的事情,是個芝麻,我們現(xiàn)在已經(jīng)把它變成通用,當模型能力變成通用之后,未來我們就可以做成寵物生活的生態(tài),就可以拿到西瓜,這是我們的邏輯。

我們其實還在探索商業(yè)模式,但基本的想法在C端收取費用費,提供API給這些公司。另外,做寵物可穿戴設(shè)備,實時進行翻譯。未來嘗試在醫(yī)療端,給寵物醫(yī)生做醫(yī)療輔助診斷,以及給具身機器人提供數(shù)據(jù),讓具身機器人在生活中可以和狗狗交互,做成更通用的場景。

我們主要做北美和歐洲,1.6億條的狗狗,市場足夠大。其次是狗狗的行為和人類的交互更突出、更直接,用這樣的解決方案,對我們的產(chǎn)品突出上會更大,作為創(chuàng)業(yè)公司我們只能做選擇,在未來的時候再延伸到其它領(lǐng)域。

劉湘明:其實音頻耳機是AI最早用到的領(lǐng)域,我現(xiàn)在的問題是在未來,AI會給我們帶來哪些驚喜,在硬件方面?

謝冠宏:我們專注在小模型,以前用在降噪、輔助睡眠、輔助聽覺,以及運動的器材,這些東西來做學習的終端,會越來越多,而且越來越準確,就像睡眠豆第三代,它對于心率、呼吸和睡眠狀態(tài)有非常準確的監(jiān)控。

一是和健康相關(guān),和運動相關(guān)的,逐漸AI會提供更多的東西;二是翻譯,我們做的比較大的改變是實時雙向?qū)φ,不管什么語音都共同做。另外的驚喜是這種硬件會越來越多,耳機、眼鏡、戒指、手表、鞋子等,這方面會提供很多驚喜。

降噪分兩方面,一是飛機或者火車上的聲音,把聲音降下來,這和世界一流水平可以媲美,部分效果甚至超越,因為AI學習給到我們很大的幫助;二是通話降噪,我在跟他講話,但是我旁邊吵鬧的聲音不要出來,AI就是要學習這是噪音,這是聲音,再傳送完美的原音的時候,其它噪音不能傳過去,再就是現(xiàn)在的省電越做越好。

劉湘明:簡單進行總結(jié),各個嘉賓我覺得來自于AI創(chuàng)業(yè)領(lǐng)域不同的環(huán)節(jié),其實我的感覺就是,AI其實有兩個方向,一是提高效率,做好“牛馬”;二是怎么去把生活過慢,提供足夠的情緒價值,追求效率的最后也是為了追求更美好的生活,所有的落地,所有的應用都是期待更好的明天,謝謝大家。

更多精彩內(nèi)容,關(guān)注鈦媒體微信號(ID:taimeiti),或者下載鈦媒體App

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港