展會信息港展會大全

亞馬遜云科技,如何解決生成式 AI 落地的四個關(guān)鍵問題?
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-06-25 09:31:47   瀏覽:5436次  

導讀:今天,可能是成為創(chuàng)業(yè)者的絕佳時機。 但再強大的大模型 api,距離產(chǎn)品落地,仍有不少距離。 如何尋找最佳落地場景,根據(jù)場景找到最合適的大模型,解決模型的工程化部署以及數(shù)據(jù)的實時交互,以及如何在和用戶進行互動時,保證模型本身的的安全性以及用戶數(shù)據(jù)...

今天,可能是成為創(chuàng)業(yè)者的絕佳時機。

但再強大的大模型 api,距離產(chǎn)品落地,仍有不少距離。

如何尋找最佳落地場景,根據(jù)場景找到最合適的大模型,解決模型的工程化部署以及數(shù)據(jù)的實時交互,以及如何在和用戶進行互動時,保證模型本身的的安全性以及用戶數(shù)據(jù)的安全性……

技術(shù)的落地,面臨著各種苦難和挑戰(zhàn)。

所幸,我們不是在 PC 互聯(lián)網(wǎng)早期的年代,需要手搓代碼、自行搭建服務(wù)器,所有業(yè)務(wù)完全從 0 起步。

我們有了云服務(wù),以及圍繞云服務(wù)誕生的各種上下層的服務(wù),讓創(chuàng)業(yè),尤其是 AI 創(chuàng)業(yè)這件事,變得「如此簡單」。

在 AGI Playground 2024 上,亞馬遜云科技大中華區(qū)產(chǎn)品部 大數(shù)據(jù)與人工智能產(chǎn)品總監(jiān) Troy Cui,分享了亞馬遜云科技在幫助創(chuàng)業(yè)者如何實現(xiàn) AI 應(yīng)用、乃至應(yīng)用出海上的優(yōu)秀經(jīng)驗。

以下內(nèi)容基于公開演講,經(jīng) Founder Park 整理。

亞馬遜云科技,如何解決生成式 AI 落地的四個關(guān)鍵問題?

01 讓企業(yè)更輕松拿下全球市場

英國著名科幻作家亞瑟克拉克曾提到:「任何非常先進的技術(shù),初看都與魔法無異」,在人類歷史上,這句話被一次次的印證。

19 世紀,用電能驅(qū)動燈泡的時候,1979 年愛迪生發(fā)明電燈泡,極大地推動了第二次工業(yè)革命。

1947 年開始的數(shù)字革命,晶體管和運算放大器的創(chuàng)新引發(fā)了電子學的「大爆炸」,導致了手機和筆記本電腦的誕生,這場革命也徹底改變了通信方式,使科技成為我們?nèi)粘I畹囊徊糠帧?/p>

1983 年,TCP/IP、互聯(lián)網(wǎng)技術(shù)的誕生,誕生了基于互聯(lián)網(wǎng)的各種新業(yè)務(wù)。亞馬遜也應(yīng)運而生。

亞馬遜在線的零售業(yè)務(wù),服務(wù)于全球數(shù)以億計的客戶。這些強大的技術(shù)也讓亞馬遜云科技在早期就關(guān)注到怎么去做管理和配置我們的基礎(chǔ)設(shè)施服務(wù)。

不管客戶規(guī)模大小,不管他有多新,也可以應(yīng)用到和大公司同等能力的基礎(chǔ)設(shè)施服務(wù),不管是存儲網(wǎng)絡(luò)還是數(shù)據(jù)服務(wù),應(yīng)該有一個擁有同等安全、按需付費、可靠且足夠經(jīng)濟的方案。

亞馬遜云科技,如何解決生成式 AI 落地的四個關(guān)鍵問題?

時至今日,亞馬遜云科技在全球 33 個國家和地區(qū)有 105 個可用區(qū),提供超過 200 個服務(wù)。

而且,這些服務(wù)仍舊在持續(xù)創(chuàng)新中。

哪怕是已經(jīng)存在 18 年之久的 Amazon S3 存儲服務(wù)、數(shù)據(jù)庫服務(wù),在去年也進行了新的發(fā)布Amazon S3 Express。這已經(jīng)是上一個 18 年,大家認為非常成熟的服務(wù),亞馬遜云科技至今仍在做進一步的更新和迭代。

而借助亞馬遜云科技的服務(wù),我們讓大量客戶可以更方便地服務(wù)全球客戶,開拓更多商業(yè)市常

原來做錄像帶租賃的 Netflix,用了亞馬遜云科技的大量服務(wù),如今在全球 190 多個國家和地區(qū)做流媒體服務(wù)。

對于中國企業(yè)的出海,也有像 OPPO 這樣借由亞馬遜云科技在海外進行布局的企業(yè),他們已經(jīng)成功做到全球手機出貨量 Top5。

02 構(gòu)建 AI 應(yīng)用第一步:選擇合適的模型

2023 年,ChatGPT 引領(lǐng)的 AI 之年。

亞馬遜云科技在幫助客戶做 AI 落地的過程中,也觀察到 2023 年是「生成式 AI 的 POC(概念驗證測試)年」。我們更多是做原型的驗證,以及可行性的驗證。

但是從去年年底到今年上半年,我們看到很多場景下,AI 已經(jīng)真的逐漸被客戶用于生產(chǎn)了。很多企業(yè)客戶已經(jīng)開始走這一步了,在這中間我們認為不可避免地會有以下四個內(nèi)容要做。

首先要選好應(yīng)用場景、切入場景;第二是要選擇一個合適的工具幫助落地;第三是真正落地后涉及到的三公里問題:工程化怎么解決?

亞馬遜云科技,如何解決生成式 AI 落地的四個關(guān)鍵問題?

這個問題很重要,當做到生產(chǎn)的時候就需要考慮規(guī);瘧(yīng)用。今天是一個人、十個人、一百個人做 POC testing(proof of concept,概念驗證測試),但當開始生產(chǎn)的時候,DAU 要做到千萬級,你的工程化一定和 100 個人用完全不一樣。上線之后,一定會面臨非常多的監(jiān)管,這又涉及到安全的問題怎么解決。

關(guān)于業(yè)務(wù)場景的選擇,首先是目標的創(chuàng)新,我們看到一些 toC 的業(yè)務(wù),尤其是新的 workflow(工作流),往往是基于「目標」的創(chuàng)新。很多企業(yè)客戶,他們在思考創(chuàng)新從哪開始的時候,往往想的是從大處著眼、小處著手,think big but start small。先從一個具體的場景做可行性驗證,之后才在企業(yè)里面爭取更大的投入。

在場景選擇之外的另外三項,亞馬遜科技就有比較強大的能力,能夠支撐創(chuàng)業(yè)者依次實現(xiàn)項目的落地。

首先是模型和模型工具的選擇:Performance & Accepability(高性能,可觸達)。

大家普遍都會非常關(guān)注性能,在涉及選擇 AI 模型的時候,大家首先會思考「我要選擇什么樣的模型」,「我要保證這個模型在能力上能滿足自己應(yīng)用的需求」。

在進行可行性驗證的時候,我們得知道「上限」在哪,選擇一個最棒的模型來保證自己的上限達標。

但是當我們?nèi)ニ伎忌a(chǎn)布局的時候,一個「上限」的 performance,不見得是你需要思考的全部。我們還需要考慮一個大模型的 inference status 能不能保證終端客戶的實時性要求?當你開始規(guī);鰳I(yè)務(wù)的時候,單一模型的推理成本是不是可以保證 ROI 在你的口徑空間里?

很多時候,我們在很多行業(yè)都會碰到一個三角難題,沒辦法同時滿足三項都達到完美。這里面一定會是一個折中的結(jié)果。

亞馬遜云科技,如何解決生成式 AI 落地的四個關(guān)鍵問題?

質(zhì)量、時延和成本的不可能三角

這也是為什么亞馬遜云科技會推出 Amazon Bedrock 這款產(chǎn)品,我們致力于給大家提供廣泛的有頭部能力的模型選擇。

亞馬遜云科技,如何解決生成式 AI 落地的四個關(guān)鍵問題?

大家可以看到,今年我們陸續(xù)更新了 Claude 3.0、Mistral、Llama 3 等模型。6 月 21 日,Claude 3.5 Sonnet 也剛剛上線了亞馬遜科技的 Amazon Bedrock,它比 Claude 3 擁有更智能的能力,但價格只有 1/5。模型的迭代在我們看來是非?斓,Claude 3 上線三個月不到,我們就又上線了 Claude 3.5 這個模型。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港