今天,可能是成為創(chuàng)業(yè)者的絕佳時機。
但再強大的大模型 api,距離產(chǎn)品落地,仍有不少距離。
如何尋找最佳落地場景,根據(jù)場景找到最合適的大模型,解決模型的工程化部署以及數(shù)據(jù)的實時交互,以及如何在和用戶進行互動時,保證模型本身的的安全性以及用戶數(shù)據(jù)的安全性……
技術(shù)的落地,面臨著各種苦難和挑戰(zhàn)。
所幸,我們不是在 PC 互聯(lián)網(wǎng)早期的年代,需要手搓代碼、自行搭建服務(wù)器,所有業(yè)務(wù)完全從 0 起步。
我們有了云服務(wù),以及圍繞云服務(wù)誕生的各種上下層的服務(wù),讓創(chuàng)業(yè),尤其是 AI 創(chuàng)業(yè)這件事,變得「如此簡單」。
在 AGI Playground 2024 上,亞馬遜云科技大中華區(qū)產(chǎn)品部 大數(shù)據(jù)與人工智能產(chǎn)品總監(jiān) Troy Cui,分享了亞馬遜云科技在幫助創(chuàng)業(yè)者如何實現(xiàn) AI 應(yīng)用、乃至應(yīng)用出海上的優(yōu)秀經(jīng)驗。
以下內(nèi)容基于公開演講,經(jīng) Founder Park 整理。
01 讓企業(yè)更輕松拿下全球市場
英國著名科幻作家亞瑟克拉克曾提到:「任何非常先進的技術(shù),初看都與魔法無異」,在人類歷史上,這句話被一次次的印證。
19 世紀,用電能驅(qū)動燈泡的時候,1979 年愛迪生發(fā)明電燈泡,極大地推動了第二次工業(yè)革命。
1947 年開始的數(shù)字革命,晶體管和運算放大器的創(chuàng)新引發(fā)了電子學的「大爆炸」,導致了手機和筆記本電腦的誕生,這場革命也徹底改變了通信方式,使科技成為我們?nèi)粘I畹囊徊糠帧?/p>
1983 年,TCP/IP、互聯(lián)網(wǎng)技術(shù)的誕生,誕生了基于互聯(lián)網(wǎng)的各種新業(yè)務(wù)。亞馬遜也應(yīng)運而生。
亞馬遜在線的零售業(yè)務(wù),服務(wù)于全球數(shù)以億計的客戶。這些強大的技術(shù)也讓亞馬遜云科技在早期就關(guān)注到怎么去做管理和配置我們的基礎(chǔ)設(shè)施服務(wù)。
不管客戶規(guī)模大小,不管他有多新,也可以應(yīng)用到和大公司同等能力的基礎(chǔ)設(shè)施服務(wù),不管是存儲網(wǎng)絡(luò)還是數(shù)據(jù)服務(wù),應(yīng)該有一個擁有同等安全、按需付費、可靠且足夠經(jīng)濟的方案。
時至今日,亞馬遜云科技在全球 33 個國家和地區(qū)有 105 個可用區(qū),提供超過 200 個服務(wù)。
而且,這些服務(wù)仍舊在持續(xù)創(chuàng)新中。
哪怕是已經(jīng)存在 18 年之久的 Amazon S3 存儲服務(wù)、數(shù)據(jù)庫服務(wù),在去年也進行了新的發(fā)布Amazon S3 Express。這已經(jīng)是上一個 18 年,大家認為非常成熟的服務(wù),亞馬遜云科技至今仍在做進一步的更新和迭代。
而借助亞馬遜云科技的服務(wù),我們讓大量客戶可以更方便地服務(wù)全球客戶,開拓更多商業(yè)市常
原來做錄像帶租賃的 Netflix,用了亞馬遜云科技的大量服務(wù),如今在全球 190 多個國家和地區(qū)做流媒體服務(wù)。
對于中國企業(yè)的出海,也有像 OPPO 這樣借由亞馬遜云科技在海外進行布局的企業(yè),他們已經(jīng)成功做到全球手機出貨量 Top5。
02 構(gòu)建 AI 應(yīng)用第一步:選擇合適的模型
2023 年,ChatGPT 引領(lǐng)的 AI 之年。
亞馬遜云科技在幫助客戶做 AI 落地的過程中,也觀察到 2023 年是「生成式 AI 的 POC(概念驗證測試)年」。我們更多是做原型的驗證,以及可行性的驗證。
但是從去年年底到今年上半年,我們看到很多場景下,AI 已經(jīng)真的逐漸被客戶用于生產(chǎn)了。很多企業(yè)客戶已經(jīng)開始走這一步了,在這中間我們認為不可避免地會有以下四個內(nèi)容要做。
首先要選好應(yīng)用場景、切入場景;第二是要選擇一個合適的工具幫助落地;第三是真正落地后涉及到的三公里問題:工程化怎么解決?
這個問題很重要,當做到生產(chǎn)的時候就需要考慮規(guī);瘧(yīng)用。今天是一個人、十個人、一百個人做 POC testing(proof of concept,概念驗證測試),但當開始生產(chǎn)的時候,DAU 要做到千萬級,你的工程化一定和 100 個人用完全不一樣。上線之后,一定會面臨非常多的監(jiān)管,這又涉及到安全的問題怎么解決。
關(guān)于業(yè)務(wù)場景的選擇,首先是目標的創(chuàng)新,我們看到一些 toC 的業(yè)務(wù),尤其是新的 workflow(工作流),往往是基于「目標」的創(chuàng)新。很多企業(yè)客戶,他們在思考創(chuàng)新從哪開始的時候,往往想的是從大處著眼、小處著手,think big but start small。先從一個具體的場景做可行性驗證,之后才在企業(yè)里面爭取更大的投入。
在場景選擇之外的另外三項,亞馬遜科技就有比較強大的能力,能夠支撐創(chuàng)業(yè)者依次實現(xiàn)項目的落地。
首先是模型和模型工具的選擇:Performance & Accepability(高性能,可觸達)。
大家普遍都會非常關(guān)注性能,在涉及選擇 AI 模型的時候,大家首先會思考「我要選擇什么樣的模型」,「我要保證這個模型在能力上能滿足自己應(yīng)用的需求」。
在進行可行性驗證的時候,我們得知道「上限」在哪,選擇一個最棒的模型來保證自己的上限達標。
但是當我們?nèi)ニ伎忌a(chǎn)布局的時候,一個「上限」的 performance,不見得是你需要思考的全部。我們還需要考慮一個大模型的 inference status 能不能保證終端客戶的實時性要求?當你開始規(guī);鰳I(yè)務(wù)的時候,單一模型的推理成本是不是可以保證 ROI 在你的口徑空間里?
很多時候,我們在很多行業(yè)都會碰到一個三角難題,沒辦法同時滿足三項都達到完美。這里面一定會是一個折中的結(jié)果。
質(zhì)量、時延和成本的不可能三角
這也是為什么亞馬遜云科技會推出 Amazon Bedrock 這款產(chǎn)品,我們致力于給大家提供廣泛的有頭部能力的模型選擇。
大家可以看到,今年我們陸續(xù)更新了 Claude 3.0、Mistral、Llama 3 等模型。6 月 21 日,Claude 3.5 Sonnet 也剛剛上線了亞馬遜科技的 Amazon Bedrock,它比 Claude 3 擁有更智能的能力,但價格只有 1/5。模型的迭代在我們看來是非?斓,Claude 3 上線三個月不到,我們就又上線了 Claude 3.5 這個模型。