熱門:
突破就在這兩三年!面壁智能聯(lián)合創(chuàng)始人李大海:新一代人機交互方向已現(xiàn)曙光
當人工智能開始從屏幕走向現(xiàn)實世界,人機交互正經(jīng)歷一次升級時刻。
無論是手機、汽車,還是正在加速落地的機器人與可穿戴設(shè)備,過往以你問我答為核心的回合制交互,正逐漸暴露出響應遲緩、感知割裂、上下文中斷等問題。這種交互方式的先天缺陷,正在成為AI進入物理世界的關(guān)鍵瓶頸。
2月2日,面壁智能聯(lián)合創(chuàng)始人兼CEO李大海接受包括《每日經(jīng)濟新聞》記者在內(nèi)的媒體采訪時表示,新一代人機交互的方向已經(jīng)出現(xiàn)曙光,但真正的躍遷不會一蹴而就,而是伴隨著云端與端側(cè)模型能力的持續(xù)提升逐步發(fā)生。在這一過程中,全模態(tài)模型是否能夠成為連接數(shù)字智能與物理世界的具身大腦,正在成為產(chǎn)業(yè)關(guān)注的核心問題。

圖片來源:面壁智能
全模態(tài)不是功能疊加,而是交互范式變化
隨著AI開始進入物理世界,當其驅(qū)動機器人或可穿戴設(shè)備時,傳統(tǒng)的人機交互模式開始顯現(xiàn)弊端。
清華大學計算機系長聘教授、面壁智能聯(lián)合創(chuàng)始人兼首席科學家劉知遠認為,對人類而言,聽、說、看本身是多通道并行的,人可以在說話的同時繼續(xù)聽、繼續(xù)看,這些過程并不會彼此阻礙。但在人機交互層面,此前的大多數(shù)模型都很難具備這種能力,“一旦你開始說,就沒有辦法看了,有這樣那樣的問題?!?/p>
這種交互方式的缺陷,限制了AI走向具身智能的深度。在劉知遠看來,擬人化、高度自然的交互能力,是讓機器人、智能終端更像人的關(guān)鍵一步?!八ㄈB(tài)模型)和讓我們未來的機器人、智能終端能夠像人一樣去進行自然交互,可能離得更近。”
依照這一判斷,具身智能并不是一個獨立分支,而是對模型交互能力提出了更高要求的應用場景。劉知遠強調(diào),在具身、智能終端等場景中,其實同樣需要類似的模型,才可能讓它更好地服務(wù)人類。劉知遠在采訪中判斷,具身智能在能力層面的快速迭代,可能并不遙遠。“如果說還有多久,我估計可能也就是這兩三年時間?!?/p>
落到產(chǎn)業(yè)層面,端側(cè)模型與AI硬件的結(jié)合,正在成為一個現(xiàn)實而復雜的命題。
在李大??磥恚S著大廠下場、智能體進入手機等終端形態(tài),新一代人機交互的形態(tài)已經(jīng)看到曙光,但這也并不意味著拐點已經(jīng)到來。他判斷,這一躍遷不會是一次性完成的,“大家會在這個方向上不斷地探索,這個要伴隨著云端模型和端側(cè)模型的持續(xù)提升?!?/p>
即便在當前被廣泛討論的手機場景中,技術(shù)本身仍存在明顯約束。李大海表示,像豆包手機背后依托的是目前行業(yè)里最優(yōu)秀的模型之一,但它對人類復雜任務(wù)的完成率其實也沒有完全達到可用的理想狀態(tài)。
李大海進一步分析稱,一方面,純云端方案難以繞開隱私問題;另一方面,端側(cè)資源的算力等消耗,使得全模態(tài)能力在手機上的落地需要更長時間。李大海直言,模態(tài)越多,資源消耗越大,這決定了不同終端形態(tài)的節(jié)奏差異。
手機目前的交互仍主要以語音和觸控為主,模態(tài)相對受限。李大海介紹,以豆包手機為例,其核心突破是讓智能體可以像人一樣操作手機,代替用戶完成復雜任務(wù),這相當于解決了像人一樣輸出的問題。而下一個重要的演進方向,則在于輸入方式的變革。
“目前手機與人的上下文同步,依賴人在屏幕上的主動操作。如果未來手機能直接聆聽、觀看真實世界,它就能更好地與主人同步、共享上下文?!崩畲蠛UJ為,這是手機邁向真正智能體的關(guān)鍵一步,但也將直面功耗與隱私保護的雙重挑戰(zhàn),對產(chǎn)品設(shè)計提出了更高要求。
相比之下,汽車、機器人等場景,由于資源條件更寬松,也被李大海認為是全模態(tài)模型更具潛力的落地方向。而在具身智能領(lǐng)域,他認為,當前的瓶頸不在本體,而在大腦,一旦模型能力出現(xiàn)突破性進展,具身智能很可能迎來類似“ChatGPT時刻”的躍遷。
行業(yè)將快速見證模型專業(yè)能力與交互能力爆發(fā)
在這種判斷下,面壁智能對自身的定位并不著重關(guān)注某一個產(chǎn)品或硬件形態(tài),而在于是否能夠持續(xù)產(chǎn)出高質(zhì)量模型。
在AI領(lǐng)域,Scaling Law(規(guī)模定律)曾是公認的鐵律,但關(guān)于其是否會碰壁的爭論從未停止。面壁智能曾經(jīng)提出另一個視角:Densing Law(密度法則),即大模型的保鮮期極短,能力密度每100天左右提升一倍。這意味著,重要的不是開發(fā)出一個優(yōu)秀的模型,而是具備持續(xù)開發(fā)優(yōu)秀模型的能力。
面壁智能將自己定位為“做大模型的光刻機”。李大海解釋說,這個光刻機指的是不斷訓練出更高能力密度的大模型。
劉知遠補充表示,密度法則的邏輯與芯片行業(yè)相類似:大模型未來的趨勢是尺寸越來越小、密度越來越高。進而極致地降低模型成本,同時用更小的尺寸讓其更有可能在距離用戶更近的終端上運行。
李大海強調(diào),端側(cè)模型的商業(yè)化,本身也是能力驗證和數(shù)據(jù)飛輪的一部分。單純依靠商業(yè)化的路徑銷售模型,來實現(xiàn)將模型部署到百億臺設(shè)備的目標可能比較困難,更現(xiàn)實的路徑是通過生態(tài)和開發(fā)者,共同推進這一過程。
關(guān)于與大廠之間的競爭,在李大??磥?,創(chuàng)業(yè)公司的機會并未因為大廠入場而消失。AI仍然是一個產(chǎn)業(yè)級機會,創(chuàng)業(yè)公司面臨的考驗是,選擇在一個非常廣闊的賽道上占領(lǐng)比較小的份額,還是在比較小的市場去爭取頭部,“我相信還有很大的空間給大家去發(fā)揮。”
對于未來的技術(shù)趨勢,劉知遠提出了兩大主旋律:一是智能能力的持續(xù)增強;二是智能的使用持續(xù)高效。他認為,接下來一兩年,行業(yè)將快速見證模型專業(yè)能力越來越強,以及與世界交互能力的爆發(fā)?!八ㄖ改P停┳鳛橐粋€智能體,具備了更強的自主學習能力,這是接下來一兩年非常重要的發(fā)展趨勢。當它具備了自主探索、學習成長的能力之后,再下一步的突破,其實就是多智能體的協(xié)同。”
劉知遠表示,在未來的五到十年,全球一定會進入多智能體互聯(lián)互通、高度協(xié)作,并涌現(xiàn)出群體智能的狀態(tài)。
(文章來源:每日經(jīng)濟新聞)
(原標題:突破就在這兩三年! 面壁智能聯(lián)合創(chuàng)始人李大海:新一代人機交互方向已現(xiàn)曙光)
(責任編輯:126)
將天天基金網(wǎng)設(shè)為上網(wǎng)首頁嗎? 將天天基金網(wǎng)添加到收藏夾嗎?
關(guān)于我們|資質(zhì)證明|研究中心|聯(lián)系我們|安全指引|免責條款|隱私條款|風險提示函|意見建議|在線客服|誠聘英才
天天基金客服熱線:95021 |客服郵箱:vip@1234567.com.cn|人工服務(wù)時間:工作日 7:30-21:30 雙休日 9:00-21:30
鄭重聲明:天天基金系證監(jiān)會批準的基金銷售機構(gòu)[000000303]。天天基金網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前請核實,風險自負。
中國證監(jiān)會上海監(jiān)管局網(wǎng)址:www.csrc.gov.cn/pub/shanghai
CopyRight 上海天天基金銷售有限公司 2011-現(xiàn)在 滬ICP證:滬B2-20130026 網(wǎng)站備案號:滬ICP備11042629號-1
- D
- 德邦基金德邦證券資管大成基金東財基金達誠基金東方阿爾法基金東方紅資產(chǎn)管理東方基金東莞證券東?;?/a>東海證券東吳基金東吳證券東興基金東興證券第一創(chuàng)業(yè)東證融匯證券資產(chǎn)管理
- G
- 光大保德信基金國都證券廣發(fā)基金廣發(fā)資產(chǎn)管理國海富蘭克林基金國海證券國金基金國聯(lián)安基金國聯(lián)基金格林基金國聯(lián)證券資產(chǎn)管理國融基金國壽安?;?/a>國泰海通資管國泰基金國投瑞銀基金國投證券國投證券資產(chǎn)管理國新國證基金國信資管國信證券國新證券股份工銀瑞信基金國元證券
