對話點阿裏雲義千也不通不是問周靖人起點是終

2024-05-14 15:35:02分类：MCEX Global阅读(62)

千萬的通义千问學問，這必須承認，对话一定要這麽文縐縐的阿里嗎？

周靖人：我們去年 9 月份的時候就發布了“通義”大模型係列，語言、云C也這個也是周靖终点接上去 GPT4 或 5 一定會有打破的地方，今天所有的起点MCEX Global模型離我們真正去模擬人類的智慧體還有很遠的距離。

通义千问因此 ChatGPT 的对话誕生並沒有讓我們轉變投入方向。都有千萬次交互的阿里熱情。

今天一定程度上人工智能業務算法的云C也算法體係已經在改變，在實現路徑上我們要取長補短，周靖终点

這種你追我趕是起点今天科技健康發展的必經之路。AI 和我們一樣，通义千问我們也在這方麵有不少的对话投入，

周靖人：今天創新迭代的阿里速度一方麵需求我們有一些新的想法，

賣個關子，那這樣就是真正意義上形成了 MaaS。跟煉丹似的，或者說接近於多模態真正的趨近人類智慧體的路徑上的一個節點。不斷地進行打破。正因為今天這個是一個剛剛發展起來的嶄新的領域，

“通義千問”其實是一個 MaaS（模型即服務）的底座

品玩：也就是可能這個模型並沒有完全成熟，今天如果到一個時間點我們都覺得成績解決完了，

在不斷取長的過程裏，

我們其實認為，包括把它適配到不同的場景。讓模型能麵對你的一些回複，它不是起點也不是終點，今天 ChatGPT 有一些很出色的工作，

品玩：其實我們對於初創公司做模型這件事情，千萬次的問，在這方麵是非常獨特的。還有下一款“通義”模型

品玩：今天很多人把大模型的日新月異歸結於湧現（emergence）。千萬次的追問是人類獲取智慧的方式，坦誠地講，抹茶代理

我們在思考模型的生態如何快速發展，然後會不斷去調整，但我們在這方麵還有長足的工作，但是在 InstructGPT 出來之前，其實今天它既是研討又是工程，包括今天跟一些多模態的延展，但更重要的是需求今天雲的基礎設施。我們認為這是一個長期以來技術發展的演進過程。

ChatGPT 非常領先，千問主要是指它目前一個主要的對話形狀。變成用模型去評價一個模型本身，

達摩院支持別人在阿裏雲上開發大語言模型

品玩：也就是在阿裏雲上別人也可以開發自己的模型。今天的進步確實有很多工程以及經驗的因素在裏麵，包括這個模型深層次的機理。或者說快速的教育過程，找到一個如 SFT 和 Prompt 等方向後，還有一些知識增強的測試。其實本質都是在預訓練大模型的整體思路上不斷進行探索，之前也展示過很多模型研討的進展，從開發者的角度，我們才加入這樣一個陣列，聽覺等，我們關注的是如何能夠讓我們的模型彌補自己的不足，如今這些技術的使用能更有效地把模型作為知識體的能力釋放出來，LLM（large language model）開始能根據自然語言理解有效地提取人類大量的知識體係，那之所以 OpenAI 能夠做出非常出色的工作，其實缺乏一個有效的手段把這方麵的能力釋放出來。而是既定路線上的一個節點

品玩：我們今天一直在使用通義千問，反正管用”，

所以今天我們方向是一致的，

品玩：那麽 MaaS 會讓我們和 OpenAI 走上不同的演進道路麽？

周靖人：我們認為今後 AI 的開發門檻會越來越低，但是它也需求先投入到一個真實甚至是一個商業的環境中去。

品玩：最後一個成績，所以我剛才講到，抹茶返佣如此篤定，為了加速 MaaS，今天 ChatGPT 基於 Chat 這樣一個產品的形狀做得非常出色，需求進一步地去打破去創新。不斷的去推進科技前進。全方位的一個競爭，但我們注意到這一次並沒有提供文生圖的功能。它的許多特點讓我們印象深刻，是從雲的基礎設施到 AI 算法，隻有這樣人類的整體科技才能不斷地提升，

品玩：盡管你強調多模態，如今賣個關子。那今天你整個的創新速度是跑不起來的。從 StructBERT 到 M6，

所以通義是一個模型係列的名字，能夠真正應用到一些各行各業的場景裏麵去。所以幾乎這些工作都是互相強關聯的，這本身就是模型在理解方麵的一個能力。甚至在更多的一些場景裏麵有突出的一些能力的表現。像我們的 Composer 模型等，我們也不能妄自尊大，包括基於 reinforcement learning（強化學習）的調優方式讓人眼前一亮。通過整個零碎的一係列優化帶動了今天 OpenAI 不斷創新的速度。ChatGPT 包括 InstructGPT 給我們很多啟發，

我覺得這個是必然會發生的。不光是對模型一線的工作者，網上也有了很多對它的測試，這是科技發展的必經之路。不管是任何一個模態來的信息，所以提出 MaaS，也就是說今天圍繞著模型作開發的範式會逐漸誕生。

但最終我們認為類似人類智慧體的預訓練大模型一定是多模態的。整個達摩院包括整個阿裏的態度其實是相當開放的？

周靖人：對。也就是欧易代理說今天真正把通義千問模型作為 MaaS 上麵的一個底座，也是我們認準的一個重要方向。都會被拿來跟 ChatGPT 做對標。每個人都參與，而這些都是計劃的一部分。那我們也比較欣喜的看到越來越多的行業、今後我們需求形成的是一個一個模型的不同層級的結構。快速地去解決一些具體的成績。再到 PLUG 再到最新的 Composer 等一係列視覺模型，這點毫無疑問。上一次半年前我們聊到大模型的時候，您同意這個說法嗎？

周靖人：我覺得應該說今天我們有點類似處於早期深度學習發展的那個階段。對你就不是一個衝擊。能夠把不同方式的輸入有機的聯合在一起。為什麽這麽說，其實都是在這條道路上。向開發者開放，我們這次是把過去積累的一部分工作向社會，不簡簡單單是一個算力的數字，

品玩：如何看 AI 行業的議程正在被 ChatGPT 設置這個事實，

我們講它是一個全方位的競爭，因為一個人獲取知識的方式有視覺、如何能夠更高效的去服務更大規模模型的訓練，不斷創新。

今天我們在不斷探索基於多模態的大模型的路徑上，我們去年在 ChatGPT 出來之前就提出並一直在強調 MaaS，讓我們覺得這個它可能它是實現了一次非常成功的大規模的湧現？

周靖人：我覺得湧現可能是一個主觀的定義。它會更多的以模型為第一思考的角度和元素，後來 GPT4 的發布其實在有形之中驗證了大家實看法比較一致——AI 會朝著多模態的體係進一步發展。讓大家體驗到我們在工作上的一些進展，其實在有形之中也是強聯合，很多公司在做文生圖，

周靖人：對，

在這個過程中間，對吧。欧易返佣如何判斷它的表現？

周靖人：怎麽去全麵評測一個大模型本身是非常有挑戰的。都會在整個競爭上處於劣勢。

如今我們內部是有一個測試集，

品玩：通義千問其實也就是 MaaS 的成果之一，是在我們整個 AI 戰略和模型戰略的主線上。今天可能我有一些新的想法，其實今天整個行業還沒有一個標準。對吧？

有時候更多的是說，其實我們在這方麵一直在積累，我們一定會走到這一步。到了一定時刻有一個打破，

至於今天整個 OpenAI 已經在給我們設置議程，或者說我們才能湊熱鬧，今天我們大概知道這個模型為什麽會有這麽突發的一個表現，對吧？因為很多的創新來自許多新的想法，揣測到你到底是喜歡哪一種說話的方式，我們科技界一定是要保持開放的心態，以及，

品玩：如今通義千問最希望或者最需求解決的成績是什麽？

周靖人：這個模型可以優化的地方還有非常多。如何能快速地去迭代模型將成為一個製勝的關鍵。並且代表今天我們在相關領域的又一個重要進展。所以對我們行業內的人來講，那今天我如何能夠去嚐試？如果說每一次的嚐試它需求花的時間是幾個月甚至更長，阿裏雲智能 CTO 周靖人進行了一次獨家對話，我們每一份工作其實都有各種各樣的一個湧現，也來源於今天它跟微軟 Azure 的有機結合，一些簡單的推理，甚至今天也開始按照這樣一個觀點去打造自己的產品服務體係。雲計算廠商還有更多的互聯網公司也開始認同這樣的一個觀點，其實我們每年都會有各種各樣的一個湧現，通義千問的哪一個研發場景，我們希望千問也能夠不斷地學習逼近人類的智慧。底層的網絡存儲各個方麵都會涉及到。就是說無論其它玩家做什麽，但是離我們的整體設計還有長足的工作需求去完成。我們希望有更多的參與者不斷地加入到這方麵的科技創新。可能連科技界部分工作者都還不看好這條路線。但下次也許就是我們在引領技術的發展

品玩：所以對大模型而言，

周靖人：是的，其中簡單的測試包括一些創作，當然這一次看起來是全社會的一個湧現，

周靖人：我們是非常歡迎的。一些文案的續寫，才能讓科技創新不斷加速。我們對 ChatGPT 所采用的一些技術和各個方麵能夠達到的驚豔效果也是感到出乎意料。我們已經已經真正進入到了一個模型的世界。阿裏巴巴旗下大語言模型——“通義千問”開啟邀測。我們很好奇你們會怎麽測試它，

我認為今天大模型其實在不斷地逼近我們人的智慧。ChatGPT 究竟改變了什麽？

周靖人：它基於 SFT（有監督精調），其實達摩院也有相關的一係列工作發表了，而接上去，也許對我是一個衝擊，今天通義千問是以對話作為一個能力的表現方式，

去年我們在國內首次推出 model as a service 模型即服務（MaaS），這個領域也就不再令人興奮了。這也很難評價。所以給通義千問接入文生圖並不是最難的，雖然我們也認識到今天小公司在訓練大模型的經費和技術上有門檻，還可以根據你的一些詳細指令去修正這個圖。我們又創建了“魔搭”這樣的社區。

品玩：這對大模型研討路線有什麽影響？

周靖人：首先，甚至涉及到了今天我們計算機科學的方方麵麵。今天模型的研發跟行業的應用已經在並行進行。應該說是國內最早探索大模型方向的公司之一。實際上是各個方麵都陸陸續續已經準備好了。那個時候大家對整個深度學習的理解，我們長期以來在這方麵做投入，我們並不認為今天大模型是一家獨大。

阿裏應該說在這方麵非常開放，能夠在上麵進行額外的開發，更重要的是教育了整個社會。是個既定路線上的節點。也覺得是“不知道為什麽，我們認為想象的空間是巨大的。今後的多模態必然能夠做到，能夠不斷通過雲的基礎設施，但我覺得這個是成績本身的特點所帶來的。

原創：玄寧駱軼航

對話訪談人：王兆洋駱軼航

對話受訪人：周靖人

對話整理人：李曉賢

來源：品玩

4 月 7 日，能把科技再往前推一步，我們也有機會和它背後的負責人，是多模態的一張藍圖繪到底，

周靖人：對，您是否可以描述一下，

品玩：那初創公司做大模型呢？你們怎麽看？

周靖人：我覺得對待大模型，我們願意把我們的模型供大家使用，

我們會有一係列的評測，

但是解決過程也是我們科技發展的一個必經之路，下次也許就是我們在推進行業的發展。大家都是在互相取長補短，那當然每個人的認知是不一樣的，那當然會激發基於大模型的一係列模型應用。但我還是認為科技的發展總是有一定的積累後，但阿裏不是說今天有了 ChatGPT，能回答千問的，

我認為 ChatGPT 的推出，它更多是一個工程上的成績。而是能夠把這部分的基礎設施更好地提供給我們中國的創業公司，甚至一些簡單的數學。

今天其實我們回過頭去看，任何一個科技都是處於你追我趕中，今天它給我們整個計算機科學領域都帶來了一個驚訝的反應，

周靖人：我們從 2019 年就開始嚐試各種各樣的大模型，我們同樣也希望能不斷地去推進最先進的技術進步，

我認為在這一場競爭裏麵，那“通義千問”在阿裏的大模型研討曆程裏是什麽地位？

周靖人：這個模型是我們的一個中間態。提出了我們的“千問”。如何能快速追趕上，為什麽叫通義千問，人的智慧很重要的一點就來自於語言，另外一方麵我們也把我們模型所依賴的這樣一個雲的能力也對外進行服務。大家快速認識到基於一個智慧體的預訓練大模型會有多麽出色的表現。甚至我們認為今天看到的所謂大模型的能力也都是冰山一角，甚至每個人的評價其實也是很主觀的，這個叫做一個湧現。不光能夠做文生圖，結合行業知識的定製化能力等。

比如從模型本身和零碎層來講，把相關的能力有效地表達出來了，

通義千問成為我們通義模型係列中重要的一員。

品玩：也就是說阿裏的大模型路線，我們是有一個體係化的思考。這樣才能讓中國整體的 AI 能力有一個全方位的提升。甚至我們是在全球第一個提出來這樣一個概念的大公司。其實中間有很多的技術細節，提升輔助人類日常工作生活方方麵麵的能力，如何接入更多模態，不斷的創新，是嗎？

周靖人：對，

品玩：阿裏並不是因為 ChatGPT 的出現才開始密集投入大模型的，今後大家要慢慢學會怎麽在大模型上去做二次的開發，

也就是說今天我們不乏有一些新的想法，

品玩：所以這些 know-how 是什麽？很多人說如今找不到，

以下為對話實錄：