【編者按】總部位于巴黎的人工智能初創(chuàng)公司 Mistral AI 成立僅一年,就被譽(yù)為現(xiàn)有大模型巨頭的有力挑戰(zhàn)者。
今年 2 月,Mistral AI 正式發(fā)布了旗艦級大模型 Mistral Large,直接對標(biāo) OpenAI 的 GPT-4;幾周前,Mistral AI 發(fā)布了其新一代開源語言模型 Mixtral 8x22B,聲稱實(shí)現(xiàn)了最高的開源性能和效率。
該公司首席執(zhí)行官兼聯(lián)合創(chuàng)始人 Arthur Mensch 以及其他兩位聯(lián)合創(chuàng)始人 Guillaume Lample 和 Timothée Lacroix 在回到法國創(chuàng)辦 Mistral 之前,分別任職于 Google DeepMind 和 Meta,后來因意識到生成式人工智能在歐洲的絕佳機(jī)會,辭職選擇創(chuàng)業(yè)。
日前,Mensch 在接受麥肯錫高級主管 Eric Hazan 和 Stéphane Bout 采訪時(shí),詳細(xì)介紹了Mistral 的開源戰(zhàn)略、歐洲如何在人工智能競賽中競爭,以及人工智能將如何改變工作場所。部分核心觀點(diǎn)如下:
1.人類在人工智能的進(jìn)程中仍然非常重要,我們應(yīng)該將生成式人工智能工具視為提高生產(chǎn)力和創(chuàng)造力的一種方式。
2.大型語言模型和生成式人工智能就像一種新的編程語言,它更加抽象,也更容易被人類語言所控制。
3.人們將專注于其他模型無法完成且永遠(yuǎn)不會被取代的工作,其中包括人際關(guān)系管理、發(fā)散思維、創(chuàng)造性思維和發(fā)明新想法。
4.三五年后,我們所做的工作應(yīng)該比現(xiàn)在的工作更有意義。
5.語言問題可能在一定程度上阻礙了歐洲生成式人工智能的發(fā)展。
6.開源模型的部分價(jià)值在于,它可以幫助客戶創(chuàng)建更便宜、更快速、更好的應(yīng)用程序。
學(xué)術(shù)頭條在不改變原文大意的情況下,做了簡單的編譯。內(nèi)容如下:
Eric Hazan:能否向我們介紹一下您創(chuàng)建 Mistral AI 的歷程?是什么促使您創(chuàng)辦了這家公司?
Arthur Mensch:當(dāng)然可以,我是科學(xué)家出生。我擁有機(jī)器學(xué)習(xí)和功能性磁共振成像專業(yè)的博士學(xué)位,之后在數(shù)學(xué)專業(yè)做了兩年博士后研究。之后我加入了Google DeepMind,我在那里從事了兩年半的大型語言模型(LLMs)研究,大約一年前離開了。
Eric Hazan:是什么讓您進(jìn)入生成式人工智能領(lǐng)域的?
Arthur Mensch: 我想我是被典型的研究偶然性帶到那里的。我當(dāng)時(shí)正在研究深度學(xué)習(xí),因此產(chǎn)生了濃厚的興趣。我就此寫了一篇論文,但隨后又回到數(shù)學(xué)研究領(lǐng)域,一待就是兩年。我加入 DeepMind 時(shí),有一個研究深度學(xué)習(xí)的小團(tuán)隊(duì),當(dāng)我做了一些有趣的工作來改進(jìn)流程時(shí),我的興趣又被點(diǎn)燃了。
Eric Hazan:在共同創(chuàng)辦 Mistral AI 公司的過程中,有什么趣聞軼事想與我們分享?
Arthur Mensch: 我和聯(lián)合創(chuàng)始人 Guillaume Lample、Timothée Lacroix 從學(xué)生時(shí)代就認(rèn)識,已經(jīng)有十年了。我在 DeepMind 工作,Guillaume 和 Thimothée 在 Meta 工作,我們?nèi)硕荚诠韫壬詈凸ぷ鞑⒀芯可疃葘W(xué)習(xí)。當(dāng)我們看到生成式人工智能領(lǐng)域正在加速發(fā)展時(shí),我們意識到,這是一個在法國創(chuàng)建公司并加快創(chuàng)建先進(jìn)大型語言模型進(jìn)程的絕佳機(jī)會。
Eric Hazan:換個更寬泛的問題,你認(rèn)為人類在人工智能的進(jìn)程中處于什么位置?
Arthur Mensch:人類仍然非常重要。我們應(yīng)該將生成式人工智能工具視為提高生產(chǎn)力和創(chuàng)造力的一種方式。通常情況下,生成式人工智能工具只有在正確提示的情況下才能生成有趣的內(nèi)容,或者創(chuàng)建一個足夠聰明的應(yīng)用程序。
無論是開發(fā)者還是創(chuàng)新者,都需要做大量的工作,才能真正產(chǎn)生可操作且有價(jià)值的結(jié)果。除了功能更強(qiáng)大之外,它與傳統(tǒng)的文字編輯器并無太大區(qū)別。但你確實(shí)應(yīng)該將它視為一種生產(chǎn)力工具和創(chuàng)建新應(yīng)用程序的途徑。因此,在這種情況下,大型語言模型和生成式人工智能就像一種新的編程語言,它更加抽象,也更容易被人類語言所控制。
Eric Hazan:這是下一個問題的絕佳切入點(diǎn)。您認(rèn)為我們的生活,尤其是我們的工作方式在未來三到五年內(nèi)會發(fā)生怎樣的變化?
Arthur Mensch:我認(rèn)為,對于許多瑣碎的工作來說,一些工具將賦予我們力量,它們要么可以幫助我們完成這些工作,要么可以幫助我們更快地完成這些工作。這意味著我們將能夠?qū)W⒂谄渌P蜔o法完成且永遠(yuǎn)不會被取代的工作,其中包括人際關(guān)系管理、發(fā)散思維、創(chuàng)造性思維和發(fā)明新想法。一般來說,三五年后我們所做的工作應(yīng)該比現(xiàn)在的工作更有意義。
Eric Hazan:讓我們換個話題,具體談?wù)?Mistral,您如何解釋自己在生成式人工智能領(lǐng)域的發(fā)展速度?
Arthur Mensch:我想談兩點(diǎn)。首先,我們擁有一支非常強(qiáng)大的團(tuán)隊(duì),他們經(jīng)驗(yàn)豐富,能夠在很短的時(shí)間內(nèi)完成生產(chǎn)和交付。這并不是一件容易的事,但這就是我們能夠在短短四個月內(nèi)完成模型發(fā)布的原因。
我們之所以能以如此快的速度為人所知并獲得一定的知名度,與我們從一開始就采用的開源策略密不可分。這創(chuàng)造了巨大的需求,從采用指標(biāo)來看,我們基本上領(lǐng)先于那些已經(jīng)存在了五年的公司。這一戰(zhàn)略發(fā)揮了很好的作用,我們現(xiàn)在正利用這一戰(zhàn)略為我們的產(chǎn)品提供反潰
Eric Hazan:在復(fù)雜的環(huán)境中,所有的人工智能公司似乎都很相似,是什么讓 Mistral 與眾不同?
Arthur Mensch:Mistral 的與眾不同之處在于我們的便攜式解決方案,它可以通過我們的應(yīng)用編程接口 (API) 作為軟件即服務(wù) (SaaS) 與任何云提供商一起使用。您可以訪問云上的類似 API,也可以訪問我們的 API。最重要的是,它可以作為一個平臺進(jìn)行部署。
因此,如果你有一個私有云,你想對工作負(fù)載進(jìn)行大量定制,或者你在企業(yè)內(nèi)部運(yùn)行,我們基本上是唯一的解決方案。這一切都與我們樂于廣泛分享我們的技術(shù)有關(guān) 這也是我們樂于分享開源技術(shù)的原因。
一般來說,我們的價(jià)值主張有三個方面。首先是部署的靈活性和平臺的可移植性,允許用戶在虛擬私有云(VPC)、內(nèi)部部署和云中部署。其次是價(jià)值,因?yàn)槲覀兊哪P驮趦r(jià)格方面定位非常準(zhǔn)確,而且它們的運(yùn)行速度非常快,性能達(dá)到頂級水平。第三是定制化,當(dāng)我們提供模型時(shí),我們會對模型權(quán)重進(jìn)行授權(quán),因此客戶的技術(shù)團(tuán)隊(duì)可以隨意修改這些權(quán)重,我們計(jì)劃很快通過服務(wù)來支持這一點(diǎn)。
Eric Hazan:Mistral 對開源模型有很強(qiáng)的承諾。你認(rèn)為它們能加快價(jià)值的采用和創(chuàng)造嗎?
Arthur Mensch:當(dāng)然,我認(rèn)為這是一種基礎(chǔ)架構(gòu)技術(shù),可以被轉(zhuǎn)換成任何類型的應(yīng)用。我們確實(shí)相信,應(yīng)用制造商需要創(chuàng)造差異化,也需要深入掌握技術(shù)。而做到這一點(diǎn)的唯一途徑就是能夠訪問整個堆棧。發(fā)起這場運(yùn)動的方法就是讓人們相信,我們的開源模式可以讓他們創(chuàng)建更便宜、更快速、更好的應(yīng)用程序,這就是我們的起點(diǎn)。
在過去的六個月里,我們已經(jīng)開始看到一些成果,因?yàn)樵S多公司意識到,他們可以將工作負(fù)載從閉源 API 轉(zhuǎn)移到開源模型。我們現(xiàn)在推出了商業(yè)模式,這些模式的部署和交付就像開源模式一樣具有完全透明的訪問權(quán)限這為我們的客戶帶來了很多價(jià)值。
Eric Hazan:現(xiàn)在我請 Stéphane 談?wù)剼W洲背景下的生成式人工智能。
Stéphane Bout:我們注意到全球范圍內(nèi)出現(xiàn)了大量的人工智能投資和激烈的研發(fā)競爭。與其他地區(qū)相比,歐洲如何才能保持獨(dú)特性和競爭力?
Arthur Mensch:首先要牢記的是,這是一款基礎(chǔ)設(shè)施軟件,通常需要一些支持和與團(tuán)隊(duì)的互動。因此,我們建議歐洲客戶與在性能方面具有競爭力的本地公司合作。很明顯,這也是一種創(chuàng)造更多本地參與、塑造我們產(chǎn)品的路線圖并產(chǎn)生一些非常有價(jià)值的支持的方式。
第二個方面,我認(rèn)為可能在一定程度上阻礙了歐洲生成式人工智能的發(fā)展,那就是語言問題。所有最早的人工智能公司在美國成立,主要用英語工作。我們正在用我們的模型來解決這個問題,使它們在法語、德語和其他歐洲語言方面更加強(qiáng)大。
作為一家歐洲公司,我們意識到了語言問題,這對我們來說非常重要,比美國公司重要得多。與美國的另一個重要區(qū)別是,歐洲的公共云普及率較低。仍有很多歐洲企業(yè)沒有使用公共云,這往往有很好的理由。因此,我們在私有云和企業(yè)內(nèi)部部署方面的產(chǎn)品確實(shí)能引起這些客戶的共鳴。
Stéphane Bout:在全球人工智能市場中,歐洲的主要優(yōu)勢和可能存在的弱點(diǎn)是什么?
Arthur Mensch:作為一個地區(qū),歐洲人才濟(jì)濟(jì),來自許多國家的許多人在數(shù)學(xué)和計(jì)算機(jī)科學(xué)方面都很強(qiáng)。這對 Mistral 來說是一個巨大的推動力,對客戶來說也是一個巨大的推動力,因?yàn)榭蛻敉ǔ6紦碛袕?qiáng)大的團(tuán)隊(duì)。
一個弱點(diǎn)是歐洲仍然是一個較為分散的市常歐洲沒有美國那樣的技術(shù)生態(tài)系統(tǒng),在那里,向其他技術(shù)公司銷售產(chǎn)品是顯而易見的。法國和歐洲其他國家也有一些科技公司,但它們之間的聯(lián)系不如美國緊密。
原文作者:
Stéphane Bout,Eric Hazan
原文鏈接:
https://www.mckinsey.com/featured-insights/lifting-europes-ambition/videos-and-podcasts/creating-a-european-ai-unicorn-interview-with-arthur-mensch-ceo-of-mistral-ai