文 | 烏鴉智能說
人工智能技術(shù)正在快速發(fā)展,并逐漸融入人們生活的各個方面。為了更好地了解人工智能領域的最新進展,來自20VC的Harry Stebbings訪問了 Mistral 聯(lián)合創(chuàng)始人 Arthur Mensch。Arthur Mensch 曾在 DeepMind 工作了兩年多,并在 2021 年創(chuàng)立了 Mistral,致力于開發(fā)高效的通用人工智能模型。
在對談中,Arthur Mensch 與我們分享了 Mistral 的發(fā)展歷程、技術(shù)理念、未來規(guī)劃以及他對人工智能行業(yè)的看法。他認為,模型效率比單純追求規(guī)模更加重要。Mistral專注于在特定成本和規(guī)模下實現(xiàn)業(yè)界頂尖的模型性能。Mistral 7B就是在模型壓縮方面取得了重大突破,并且填補了性能和效率之間的空白。當下模型混戰(zhàn)的最終狀態(tài)是開發(fā)人員平臺會更加成熟,擁有更豐富的功能,允許進行定制、開發(fā)低延遲的特定用途模型、進行評估并隨著時間的推移進行改進。模型只是一個很小的部分,雖然很重要,但它仍然只是應用程序的一部分。
通用模型將成為人工智能應用程序開發(fā)的基礎,開發(fā)人員可以使用這些模型來創(chuàng)建定制模型,以滿足特定需求。隨著模型性能越來越好,只要擁有相關(guān)數(shù)據(jù)并且理解用例,那么創(chuàng)建垂直應用程序就會變得越來越容易。Mistral 的創(chuàng)立是為了給開發(fā)人員帶來價值和自由,讓開發(fā)人員可以擁有和修改他們制作的模型和技術(shù)。讓開發(fā)人員和 AI 應用開發(fā)者擁有自由,這才是使生成式 AI 盡可能廣泛傳播的最佳方式。
在管理層面上,Arthur Mensch 指出小型團隊的高效性,并表示Mistral目前也在采用這種控制團隊規(guī)模同時保證信息透明同步的管理方式。同時他們也在嘗試平衡科研與銷售的關(guān)系,選擇更有復合背景的人才來減弱不同部門之間的代溝。透明的反饋對公司來說實際上非常有用。幾乎完全透明地運營公司幫助了他們打破了增長瓶頸。在戰(zhàn)略層面上,他們?nèi)孕枰嗟馁Y金、強勁的產(chǎn)品,并且不能只局限于歐洲市場,需要迅速進軍美國。
數(shù)據(jù)質(zhì)量是提高模型性能的關(guān)鍵,人工智能將改變?nèi)藗兊墓ぷ鞣绞,因為它要求人們變得更具?chuàng)造力,并帶來超出自動化所能及的價值。這將對就業(yè)市場造成結(jié)構(gòu)性變化,需要采取措施幫助人們適應。
01 Arthur Mensch的成長回顧
Harry Stebbings:Arthur,我想從你的成長經(jīng)歷開始。作為一名杰出的創(chuàng)始人,你小時候有哪些特質(zhì)和性格呢?你的父母或老師會如何描述你?
Arthur Mensch:我小時候總是充滿好奇心,也有些固執(zhí)己見,老實說,對待兄弟們也不太友好,不過隨著時間的推移有所改善。至于他們會怎么形容我,你應該去問他們。不過,我希望他們有美好的回憶吧!
Harry Stebbings:好吧,沒關(guān)系。你第一次接觸到人工智能是在什么時候?你小時候在法國,是如何接觸到機器學習的?是什么點燃了你最初的熱情?
Arthur Mensch:大概是在 2013 年,我記得 Andrew Ng 當時展示了用神經(jīng)網(wǎng)絡控制直升飛機倒飛,這是一個非常復雜的控制問題。雖然我不確定這是否真正屬于人工智能領域,但他確實提到過使用神經(jīng)網(wǎng)絡來進行控制。
Harry Stebbings:最近你曾在 DeepMind 工作了兩到三年。那段經(jīng)歷對你影響最大的是什么?它如何影響了你組建 Mistral 團隊的方式?
Arthur Mensch:在 DeepMind 我深刻體會到,一支由 5 人組成的團隊效率往往比 50 人的團隊高,前提是將 50 人團隊拆分成 10 個相互獨立的小組。這也是我們公司在組建科研團隊時采取不同組織方式的原因之一。正是因為這個教訓,讓我們意識到即使是小團隊也能做出重要成果。
Harry Stebbings:你能解釋一下 “相互獨立” 的意思嗎?這樣做難道不會降低效率嗎?劃分小組會不會產(chǎn)生信息孤島,反而降低整體效率?
Arthur Mensch:我們會共享基礎設施、代碼庫和研究成果。對于通用模型來說,你需要讓它們向不同的方向發(fā)展,比如掌握不同的語言、編程、數(shù)學和推理能力,甚至還需要加入多模態(tài)功能。這些方面雖然彼此關(guān)聯(lián)松散,但我們使用相同的優(yōu)化框架、數(shù)據(jù)和訓練方法。團隊不需要花大量時間進行協(xié)調(diào)會議,這也是一種平衡。到目前為止,我們規(guī)模還比較小,只有 25 個人,所以協(xié)調(diào)起來并不算太難。不過隨著團隊壯大,這肯定會成為一個挑戰(zhàn)。這是我在 DeepMind 的主要收獲之一。剛開始他們的規(guī)模很有效率,后來效率下降了一些,不過現(xiàn)在已經(jīng)有所恢復。總之,我們 Mistral 團隊的優(yōu)化目標就是盡可能快地迭代和發(fā)布產(chǎn)品。
Harry Stebbings:離開 DeepMind 創(chuàng)辦 Mistral 是一個容易的決定嗎?畢竟 DeepMind 是全球頂尖的人工智能研究機構(gòu),擁有眾多優(yōu)秀人才。
Arthur Mensch:這不是一個一開始就說一不二的決定。一開始可能只是 10% 的離開念頭,然后逐漸增加,直到有一天你意識到自己已經(jīng)無法再待下去了。同事之間的情誼很珍貴,所以不會是突然的決定。對我來說,做出決定的關(guān)鍵點可能是在去年 3 月底左右。周五我下定決心,然后周一就遞交了辭呈。
Harry Stebbings:夠干脆!一旦決定離開就立刻行動,這很棒!接下來我想從按時間順序回顧一下。你們發(fā)布的第一個模型 Mistral 7B 非常受歡迎,你認為這背后的原因是什么?你們做對了什么?又從中吸取了什么教訓?
Arthur Mensch:我認為 Mistral 7B 取得成功的因素有兩個。首先,它在模型壓縮方面取得了重大突破,這為整個科研界提供了寶貴的經(jīng)驗和學習資料。其次,它填補了性能和效率之間的空白。7B 的模型大小可以在 MacBook 或智能手機上高效運行,同時又具備足夠的功能實用性。此前也有 7B 大小的模型,但性能不足以支持有趣的應用。因此,我們通過瞄準這個特定的領域吸引了開發(fā)人員的注意,因為 7B 的模型大小正好滿足了業(yè)余愛好者在游戲 GPU 或 Macbook 上運行的需求。Mistral 7B 的成功在于填補了性能和效率之間缺失的一環(huán),從而引起了廣泛的興趣和應用。
Harry Stebbings:從中學到的教訓如何影響你們未來的發(fā)布呢?
Arthur Mensch:這讓我們意識到,比起單純追求更大規(guī)模的模型,效率更受關(guān)注。因此,我們繼續(xù)致力于開發(fā)高效的模型,比如后續(xù)的 Mixtral 8x7B 和 Mixtral 8x22B,都是在特定成本和大小下實現(xiàn)業(yè)界頂尖性能。追求效率的同時,我們也會逐步擴展到更大規(guī)模。
02 人工智能領域的效率與規(guī)模
Harry Stebbings:既然你們?nèi)绱俗⒅匦屎颓把兀敲匆?guī)模還重要嗎?
Arthur Mensch:規(guī)模在某種程度上很重要,如果你投入更多計算資源進行訓練,就可以使模型更加壓縮。因此,壓縮模型確實需要一定的計算資源以及一定的訓練規(guī)模。規(guī)模并不是唯一要素,并不是成功的秘訣,你還需要合適的數(shù)據(jù),否則你會遇到數(shù)據(jù)質(zhì)量瓶頸。還需要合適的訓練技術(shù),你需要找到一些方法來提高效率,這些方法并不需要額外的計算資源,因為計算資源成本很高。我們在 Mistral 公司做的一件事就是嘗試利用“計算乘數(shù)效應”來提高效率。
Harry Stebbings:在不增加計算成本的情況下提高效率,這個領域還有多少潛力可挖?我可能有點天真,我想問的是,還有很多可以挖掘的空間嗎?還是說我們現(xiàn)在已經(jīng)接近極限,只能做微小的改進?
Arthur Mensch:這還很難說。我相信我們可以做到在特定規(guī)模下性能更優(yōu)異的模型。這個問題就像,通過增加數(shù)據(jù)量和延長訓練時間,能否在相同類型的數(shù)據(jù)上訓練出更好的模型一樣,都是需要探索的問題。你可以嘗試預測最終能達到的性能極限,但最終還是要通過嘗試來驗證。
Harry Stebbings:大多數(shù)人認為模型格局的最終狀態(tài)會變成商品化,最終會有 12 家玩家,然后陷入價格戰(zhàn)。在你看來,模型的最終狀態(tài)會是什么?你如何看待商品化問題?
Arthur Mensch: 我認為模型混戰(zhàn)的最終狀態(tài)是開發(fā)人員平臺會更加成熟,擁有更豐富的功能,允許進行定制、開發(fā)低延遲的特定用途模型、進行評估并隨著時間的推移進行改進。模型只是一個很小的部分,雖然很重要,但它仍然只是應用程序的一部分。當你部署一個面向用戶的應用程序時,你需要確保它的運行,確保它的延遲隨著時間推移降低,確保它的質(zhì)量隨著時間推移提高。因此,我認為最終狀態(tài)是模型將成為任何人工智能應用程序開發(fā)人員的起點,它們需要被工具和生命周期管理平臺所包圍。這就是我們開始構(gòu)建的東西。通用模型有點缺乏差異化,你為你的應用程序創(chuàng)建的差異化來自你輸入的數(shù)據(jù)、你收集的用戶反饋以及你理解應用程序應該做什么的智能。這完全不是商品化,沒有一個辦法可以讓你從通用模型直接成為一個超級好、在特定任務上優(yōu)于所有其他模型的模型。我認為這是一個缺失的拼圖塊,也是我們在產(chǎn)品方面投入力量的方面之一。
03 改善模型質(zhì)量的挑戰(zhàn)與機遇
Harry Stebbings:Sam Altman 和 Brad 前幾天提到,現(xiàn)在的模型質(zhì)量還并不夠好,還需要大大提高。制約模型質(zhì)量的最大瓶頸是什么?要如何改善?
Arthur Mensch: 我認為數(shù)據(jù)質(zhì)量是一個限制因素。如何確保模型能夠利用整個世界知識,并沿著學習越來越復雜事物的路徑發(fā)展,這非常重要,但這也是一個被忽視的方面。計算資源當然也很重要,但是以我們現(xiàn)在擁有數(shù)據(jù)量來看,計算資源已經(jīng)不再是瓶頸了。例如,文本生成模型,問題在于如何精煉數(shù)據(jù),以及如何向模型本身輸入高質(zhì)量的數(shù)據(jù)來隨著時間推移進行改進。
Harry Stebbings:我們會看到能夠回答大量復雜問題的通用模型,還是更垂直領域?qū)S玫男⌒湍P停?/p>
Arthur Mensch:我們相信會出現(xiàn)垂直領域的模型,而且這些模型不會由我們提供,而是由應用程序的創(chuàng)建者構(gòu)建。因為想要獲得低延遲且擅長特定任務的模型,就必須去除通用性。通用模型雖然可以處理很多事情,但如果你想讓模型深入思考某個特定主題以供你的 AI 應用調(diào)用,同時還要保持良好的用戶體驗和低延遲,那么通用模型就不太適合。
Harry Stebbings:很抱歉這么直白,但好像價值真正產(chǎn)生的地方是在應用程序?qū)用,也就是?chuàng)建特定模型的地方。那么你們將如何發(fā)揮作用呢?
Arthur Mensch:制作專業(yè)模型是一項非常艱巨的任務,實際上這與創(chuàng)建預訓練模型的方式密切相關(guān)。因此,我們提供易于使用的工具,使開發(fā)人員能夠創(chuàng)建性能非常好的定制模型,而這些模型又不需要專家知識,畢竟這種專家人才很難找到。
Harry Stebbings:我作為投資者很高興聽到你剛才說應用程序?qū)訉a(chǎn)生價值。因為我擔心通用模型會被我們提到的某些公司碾壓。你如何看待應用程序?qū)尤匀荒軇?chuàng)造價值?對像我這樣的投資者,你有什么建議?
Arthur Mensch: 第一,隨著模型越來越好,只要擁有相關(guān)數(shù)據(jù)并且理解用例,那么創(chuàng)建垂直應用程序就會變得越來越容易,前提是你擁有簡化操作的工具。這讓我覺得應用程序?qū)永麧櫩臻g會越來越保但另一方面,由于我們可以壓縮模型并顯著提高效率,因此模型的成本也在下降。這意味著加上模型層的競爭壓力,模型的價格肯定會下降。因此,一方面是不斷增強的能力和壓縮的價格,這似乎會讓應用程序?qū)幼兊酶;另一方面,模型部分將會發(fā)展壯大。對我們來說,我們的做法是假設模型部分仍然會足夠大,我們需要在這個基礎上構(gòu)建平臺,因為這將使我們能夠?qū)崿F(xiàn)對你來說很感興趣的垂直應用。
Harry Stebbings:你如何看待你們的定位和品牌?因為其他一些參與者更直接地表示他們將主導許多不同的垂直領域,這讓人有點擔心。你們?nèi)绾慰创@種說法?
Arthur Mensch:我們不是垂直領域的公司。我們創(chuàng)立 Mistral 是為了給開發(fā)人員帶來價值和自由。當我們開始做的時候,當時只有一個 API,而且生成式人工智能領域似乎由少數(shù)幾家公司主導。因此,我們采取了這種平臺式的方法,我們讓開發(fā)人員擁有和修改我們制作的模型和技術(shù)。讓開發(fā)人員和 AI 應用開發(fā)者擁有自由,這才是使生成式 AI 盡可能廣泛傳播的最佳方式,這也是我們作為公司的目標。讓前沿人工智能融入每個人心中,這就是我們當初創(chuàng)立 Mistral 的原因。我認為我們做得還不錯,當然我們還有很多事情要做,但是我認為開源部分為社區(qū)帶來了便利,讓人們意識到他們可以通過修改模型本身來構(gòu)建非常有趣的技術(shù),而不需要依賴少數(shù)供應商的 API。
Harry Stebbings:開發(fā)人員關(guān)心什么?大家都在 Twitter 上討論性能問題,比如本周的 X 模型比上周的 Y 模型更好。他們關(guān)心效率、規(guī)模、成本等因素嗎?這些因素如何影響他們的決策?
Arthur Mensch:開發(fā)人員肯定會關(guān)心成本,他們也關(guān)心定制的可能性,能夠修改模型。在這方面,我認為我們只是觸及了皮毛。微調(diào)一直以來都是常用解決方案,但這可能有點達不到我們想要的效果。他們還關(guān)心能夠部署到任何地方,比如特定的云端空間、本地環(huán)境或者邊緣設備。因此,他們也關(guān)心可移植性,而可移植性通常會帶來數(shù)據(jù)控制的優(yōu)勢。通常情況下,當大型語言模型與知識庫或與某些企業(yè)相關(guān)的東西連接時,它們會變得非常有用,但同時也會成為應用程序的一個非常敏感部分。企業(yè)非常關(guān)注確保他們的專有數(shù)據(jù)能夠在一個完全安全的環(huán)境中被訪問,這就是為什么我們將我們的平臺部署在Azure和AWS上,為他們提供所需的安全層。
Harry Stebbings:艱難的問題來了,大語言模型基于的產(chǎn)品的邊際收入何時何地會超過邊際成本?
Arthur Mensch:我可以告訴你誰目前做得最好,但隨著時間的推移,情況可能會發(fā)生變化。目前做得最好的公司是英偉達,云提供商基本上持平,模型提供商還處于虧損狀態(tài),但希望不會一直虧損。我認為這將是一個充滿變動的領域,正如我所說,模型的能力使應用程序的成本越來越低。我不認為大語言模型的核心部分(也就是真正基礎層的邊際成本和利潤率)會降為零,否則肯定會存在公平性問題。
Harry Stebbings:你能解釋一下“公平性問題”嗎?
Arthur Mensch:通常,價值的積累往往集中在最困難的部分和最具可防御性的部分。在一段時間內(nèi),這主要體現(xiàn)在基礎模型上。它將成為大多數(shù)創(chuàng)新發(fā)生的地方,也是至少大部分積累價值的地方。
Harry Stebbings:今天創(chuàng)辦一家基礎模型公司真的有很多障礙嗎?我知道這是一個非;\統(tǒng)和愚蠢的問題,但現(xiàn)在有這么多不同的參與者,而且每天都在出現(xiàn)新的參與者,所以障礙是不是在逐日降低?
Arthur Mensch:我不認為是這樣。在這個領域取得成功非常困難。你需要在成本、效率、性能方面占據(jù)主導地位。只有少數(shù)公司目前處于有利地位。你可以嘗試做一些事情,但如果它無關(guān)緊要,如果它被另一個模型或另一種技術(shù)嚴格主導,那么你就會遇到問題。你需要克服一些難以克服的障礙,你需要非常高效地運營、籌集足夠的資金來獲得足夠的計算資源、擁有訓練模型的人才(這仍然是一種稀缺資源),以及一個好的品牌,因為正如你所說,競爭非常激烈,這些都不是憑空產(chǎn)生的。
Harry Stebbings:你認為計算成本下降的速度有多快?
Arthur Mensch:計算成本會隨著時間的推移而降低,首先是基于硬件成本。根據(jù) Nvidia 的路線圖,每兩年的相同 FLOPS (Floating point operations per second,每秒浮點運算次數(shù),理解為計算速度)數(shù)量,計算成本都會降低約 30%。另一個提高效率的因素是算法的改進。如果我們看看三年前和今天訓練模型的方式,我認為我們在算法方面取得了大約 100 倍的改進。所以這可能是近年來取得的大部分收益。當然,計算成本會降低,但不會比摩爾定律更快降低。
Harry Stebbings:正如你提到的,與核心供應商(如英偉達)建立良好關(guān)系似乎是成功的重要因素之一。這不是決定今天成功的核心因素嗎?
Arthur Mensch:這確實是一個重要方面。在人工智能層面上,我們對云服務提供商和英偉達都存在一定的戰(zhàn)略依賴關(guān)系。競爭也在升溫,但與硬件提供商保持良好合作關(guān)系對于開發(fā)軟件而言是很有幫助的,他們可以協(xié)助你優(yōu)化硬件利用。當你向企業(yè)出售開發(fā)者平臺時,通過他們熟悉的云提供商進行交付也是很有用的。所以在這方面確實需要進行一些重要的合作。
04 平衡研究團隊與銷售團隊
Harry Stebbings:對于您這樣一位創(chuàng)始人來說,既要管理研究團隊,又要組建企業(yè)銷售團隊,如何平衡這兩個團隊之間的關(guān)系呢?
Arthur Mensch:確實需要用心去平衡。我們希望科學團隊能夠理解用戶面臨的問題,因為這將反過來促進科學研究的進步。畢竟,我們研發(fā)的通用技術(shù)只有在識別出具體用例后才能真正發(fā)揮作用。因此,讓科學團隊盡早接觸產(chǎn)品和業(yè)務團隊是非常重要的。這將幫助他們理解模型的局限性以及如何加以改進。另一方面,銷售團隊也需要理解這是一款技術(shù)含量很高的產(chǎn)品。他們并不是在銷售一款成品,而是在銷售驅(qū)動該成品的產(chǎn)品。因此,他們需要告訴客戶如何正確使用這些模型,為企業(yè)帶來實際價值。這需要對銷售團隊進行強有力的培訓。
Harry Stebbings:研究團隊和銷售團隊的工作節(jié)奏似乎并不一致,科學研究通常需要幾個月的時間才能完成一個周期,而銷售團隊的周期則要短得多。您是如何解決這個問題的呢?
Arthur Mensch:到目前為止,我們設法招募了一些對技術(shù)感興趣的銷售人員,以及一些對商業(yè)感興趣的技術(shù)人員。這樣可以避免團隊之間出現(xiàn)代溝。
Harry Stebbings:開源技術(shù)是否適用于企業(yè)領域?企業(yè)是否已經(jīng)準備好迎接開源技術(shù),他們是否足夠重視它?
Arthur Mensch:這取決于具體企業(yè)的情況。一些企業(yè)已經(jīng)開始率先采用開源模型,并將它們投入生產(chǎn)使用。但是,要把這些模型應用于大規(guī)模生產(chǎn),還需要額外的產(chǎn)品功能,例如負載均衡和模型定制。使用自己研發(fā)的解決方案當然可以做到這一點,但要使其足夠魯棒和可擴展卻并非易事。要想真正提高定制模型的質(zhì)量,就需要一些難以掌握的方法。因此,一些技術(shù)實力雄厚的企業(yè)無疑已經(jīng)為采用開源技術(shù)做好了準備,并且已經(jīng)有許多成功的用例在生產(chǎn)環(huán)境中使用開源模型。
Harry Stebbings:為了擴大采用范圍,肯定還需要一些配套的工具進入市常如今,每個企業(yè)都在董事會上討論其人工智能戰(zhàn)略。您會給他們什么建議?他們應該問哪些問題?
Arthur Mensch:不要總是想著利用人工智能徹底改變所有產(chǎn)品,也不要將人工智能視為一種無所不能的代理,F(xiàn)在我們可以構(gòu)建非常智能的代理,但要后退一步,從組織層面理解人工智能帶來的影響。換句話說,不要將生成式人工智能視為提高文字處理工作效率的一種方式,而要將它視為徹底改變核心業(yè)務運營方式的一種手段。這通常涉及到對模型進行大量定制,以便在五年后每個人都采用這項技術(shù)的情況下為你帶來競爭優(yōu)勢。
05 美歐投資者的區(qū)別
Harry Stebbings:資金來源會影響擴展限制嗎?當你融資的時候,跟歐洲投資人和美國投資人溝通起來有很大差別嗎?
Arthur Mensch:種子輪融資沒什么差別,不過到了更大規(guī)模的 A 輪融資,情況就不同了。歐洲的基金架構(gòu)并不適合我們當時提出的融資方案,所以我們甚至沒跟他們怎么交流,因為他們根本理解不了我們需要多大規(guī)模的投資。
Harry Stebbings:你們還處于初創(chuàng)階段是吧?
Arthur Mensch:是的,我覺得歐洲缺乏的是像樣的成長型基金,它們能夠大舉押注,并且滿懷信心。隨著時間的推移,這種情況肯定會改善,尤其是如果我們可以更好地利用歐洲的財富,將更多資金投入到此類成長型基金中,而不是像現(xiàn)在這樣。
Harry Stebbings:你似乎比我更樂觀一點,你覺得未來幾年歐洲會出現(xiàn)更多成長型基金嗎?
Arthur Mensch:我可不覺得,至少在未來三到五年內(nèi)不會。這取決于一些政治決策,以及資金供應和人們是否相信歐洲的未來生態(tài)系統(tǒng)能夠與其他大型生態(tài)系統(tǒng)競爭。這是一個先有雞還是先有蛋的問題,但總歸在某個時候需要有人推動它往正確的方向發(fā)展。如果政治層面有這個意愿,如果有一些公司展示出在歐洲可以真正實現(xiàn)快速增長,這種情況就會朝著正確的方向發(fā)展,這正是我們所努力的。
Harry Stebbings:你提到過擴展速度是最難的事情之一,作為 CEO,當你帶領公司高速擴展時,你覺得最難的是什么?
Arthur Mensch:學習新事物!這是一邊干一邊學的過程。比如,如何讓 45 個人之間保持良好溝通,如何管理好自己的時間,用于展示公司、拓展業(yè)務等等,因為我們現(xiàn)在還處于需要深度參與交易談判的階段。
Harry Stebbings:假設你能夠回到過去,在成為 Mistral AI 的 CEO 之前一天晚上給自己一些建議,你會說什么?
Arthur Mensch:也許我會更注重產(chǎn)品開發(fā)和市場推廣。當時我們開展市場推廣的時候,根本沒什么可賣的東西。雖然最終還是取得了一些品牌知名度,但或許可以稍微改變一下順序,讓產(chǎn)品開發(fā)稍微領先于市場推廣一些。不過,由于這是一個快速發(fā)展的領域,我們確實是一起啟動了所有項目,這導致了一些組織上的問題,F(xiàn)在我們正在努力鞏固這方面的工作。
Harry Stebbings:考慮到該領域的快速發(fā)展,你們當時的戰(zhàn)略肯定會有所變化吧?
Arthur Mensch:總的來說,我們一年前制定的戰(zhàn)略并沒有太大變化。我們意識到我們需要更多的資金、強勁的產(chǎn)品,并且不能只局限于歐洲市場,需要迅速進軍美國。這些都是我們在發(fā)展過程中得出的結(jié)論,即使我們一年前就知道這些,也不會帶來太大幫助。
Harry Stebbings:你們現(xiàn)在覺得資金充足了嗎?
Arthur Mensch:初創(chuàng)公司總是需要融資的。在未來幾年里,投資都會大于收入,因為作為前沿公司,我們需要擴展規(guī)模并保持相關(guān)性。因此,肯定需要持續(xù)的投資。收入也在逐漸增加,所以也有一些可以用于再投資的收入。但我認為,在今后很長一段時間里,研究開發(fā)的速度都應該快于市場推廣的速度。
Harry Stebbings:談到目前的技術(shù)格局,你最尊重和欽佩哪家公司?
Arthur Mensch:他們都取得了不錯的成績。最近,OpenAI 讓大家感到驚喜,他們發(fā)布了優(yōu)秀的新模型。還有 Anthropic 和谷歌的朋友們也在出色地工作。這是一個充滿競爭的領域,我們彼此尊重,也朝著相同的更高目標共同努力。
06 快速問答環(huán)節(jié)
Harry Stebbings:當今世界上最讓你擔心的是什么?
Arthur Mensch:全球變暖。地球升溫以及美國尋找解決方案的競賽讓我很擔心。我認為人工智能是解決方案的一部分,因為它可以帶來更多控制,并在某些流程中帶來更高的效率。但實際上這是一場生存競賽,所以我覺得我們應該更多地意識到這一點。
Harry Stebbings:在過去 12 個月里,你改變了最多的想法是什么?
Arthur Mensch:改變了很多關(guān)于管理的先入為主的觀念,這些觀念以前我從未測試過。其中最大的一點是,透明的反饋對公司來說實際上非常有用。因此,幾乎完全透明地運營公司幫助了我們打破增長瓶頸。
Harry Stebbings:在 Mistral 發(fā)展過程中,哪個方面出乎意料地最具挑戰(zhàn)性?
Arthur Mensch:我們需要管理的需求量太高了,超出了我們的能力范圍。還有就是品牌出乎意料的成功,人們都認識我們了。我們知道會引起關(guān)注,但沒想到人們會這么快開始使用我們的產(chǎn)品。
Harry Stebbings:Arthur,你現(xiàn)在有很多事要做,肩上也有很多期待和資金壓力,你該怎么做才能放松下來?
Arthur Mensch:我會跑步和騎自行車。我想我伴可能會對我心生怨言,但我還是會盡量照顧我的女兒。
Harry Stebbings:你最近剛當了爸爸,現(xiàn)在你有哪些當初剛有女兒時希望自己知道的呢?
Arthur Mensch:老實說,我完全沒想到照顧一個小孩子需要這么多精力。
Harry Stebbings:你認為未來AI會在 10 年內(nèi)改變世界嗎?社會在一切都融入 AI 的情況下會變成什么樣?
Arthur Mensch:人工智能將顯著改變?nèi)藗兊墓ぷ鞣绞,因為它要求人們變得更具?chuàng)造力,并帶來超出自動化所能及的價值。因此,這將對就業(yè)市場造成非常結(jié)構(gòu)性的變化,這意味著需要迅速采取一些適應措施,例如培訓和教育,讓人們能夠理解在日常工作中會有什么樣的期待,以及如何與人工智能協(xié)作。
Harry Stebbings:你認為人們對工作被取代的恐懼被夸大了嗎?
Arthur Mensch:取決于你跟誰交談。我認為一些工作肯定會消失,但也會有一些新的工作產(chǎn)生。因為我們正試圖讓人類思維達到更高的抽象層次,這樣我們才能與機器對話,機器也能理解并以人類的方式回答。這不像計算機帶來的那種巨大變革。不過,我認為現(xiàn)在正以歷史上前所未有的速度提升思維抽象的層次,這將使社會適應起來更具挑戰(zhàn)性,需要提前預見到這一點。
Harry Stebbings:最后一個問題,假設 10 年后一切都順利,Mistral 會是什么樣子?
Arthur Mensch:Mistral 將擁有非常相關(guān)的一些商業(yè)和開源模型,還將擁有功能強大的開發(fā)者平臺,使人們能夠創(chuàng)建他們的人工智能應用程序。那將是一個好的成就。