
杭叉集團首席科學家、浙江杭叉國自智能科技機器人有限公司CTO陶熠昆
當“具身智能”成為科技行業熱點,人形機器人演示頻繁刷屏,工業領域卻深陷“叫好不叫座”的困境—技術熱潮與規模化落地之間仍存在明顯鴻溝。作為物流裝備領軍企業,浙江杭叉國自智能科技機器人有限公司深耕行業數十年,在具身智能浪潮中堅守務實初心。近日,杭叉集團首席科學家、浙江杭叉國自智能科技機器人有限公司CTO陶熠昆接受本刊專訪,深度解析具身智能與傳統工業自動化的核心差異,直面落地瓶頸,分享“場景+數據+綜合能力”的突圍路徑,為行業提供了兼具戰略高度與實踐價值的發展藍圖。
破界與重構:具身智能的本質是數據驅動的范式革命
談及具身智能,行業常陷入“產品形態決定論”誤區,認為人形機器人即具身智能,AGV、叉車等傳統裝備與智能無關。對此,陶熠昆明確核心認知: “智能是一種方法,而非產品形態。真正的分水嶺,在于驅動邏輯的根本不同。”
傳統工業自動化設備,本質是“規則驅動的手工編碼產物”。以誕生近30年的叉車AGV為例,其市場滲透率僅2%,遠低于人工叉車。“這并非價格問題,而是其難以適應復雜工業環境。”陶熠昆解釋,當前叉車AGV更偏向自動化設備,需依賴大量預設規則運作,一旦遭遇未編碼的場景變化,便容易“癱瘓”。
具身智能的核心,則是“數據驅動的自主決策能力”。“智能的上限遠高于規則驅動模式,能讓設備像人一樣思考,適配復雜、柔性的工作場景。”陶熠昆強調,當叉車通過海量數據訓練獲得自主判斷能力,可應對不同堆放位置、規格的貨物及動態倉庫環境時,才能真正替代叉車工,實現復雜場景下的高效作業—這正是具身智能打破自動化產品天花板的關鍵。
這種從“規則驅動”到“數據驅動”的轉變,構成了機器人技術的“范式革命”。“傳統自動化是‘人定規則、設備執行’,能力邊界受限于人的認知;具身智能是‘數據訓模型、設備自主決策’,可通過數據積累持續進化,這種進化潛力正是范式革命的核心。”
現實與挑戰:工業落地的雙重瓶頸—可靠性與數據成本
盡管具身智能前景廣闊,陶熠昆仍坦言行業面臨現實瓶頸:“我們需辯證看待其發展,長期樂觀但短期必須直面障礙,保持定力與耐心。”
工業場景對設備的核心要求是“可靠性”,這是具身智能落地的第一道關卡。“工業生產容不得試錯,可靠性達不到99.9%就無法真正投入使用。”陶熠昆指出,當前以大語言模型相關技術為代表的具身智能方案,雖能聽懂指令、完成復雜動作,但可靠性僅90%-95%,這一差距在工業場景中形成了“不可跨越的鴻溝”。
數據成本過高是另一大障礙。陶熠昆以大語言模型為參照: “頂尖大語言模型的訓練數據達上千億級,而具身智能任務更復雜—需融合多模態感知、應對物理世界動態反饋,但其最優模型的訓練數據僅幾百萬級,二者相差十萬倍。”
數據采集的難度與成本更雪上加霜。“大語言模型可直接利用互聯網公開數據,但具身智能需要與工業場景高度匹配的真實運行數據。”陶熠昆介紹,不少企業通過數采中心采集數據,但這種方式成本高昂,且采集數據與現場真實數據差異較大, “實驗室的‘理想數據’,難以訓練出應對工業現場‘復雜變量’的模型”。他進一步分析,工業場景千差萬別,同一設備在不同企業、生產線的運行狀態各異,要收集足夠覆蓋這些變量的數據,成本難以想象。
差異化突圍:杭叉國自智能的三大核心護城河
面對機遇與瓶頸,杭叉國自智能憑借數十年積累,構建了獨特競爭優勢。陶熠昆將其總結為“算法、場景、數據”三角模型,并強調: “開源時代,算法差距最易彌補,真正的護城河是場景、數據與企業綜合能力。”
場景護城河:數十年行業認知的沉淀“場景體現企業對行業十年甚至數十年的認知,這種積累短期內無法復制。”陶熠昆表示,工業具身智能落地的關鍵,是選擇“合適的場景”—需具備真實客戶需求、封閉垂直、可復制的特征,且傳統方法無法解決,能推動“數據飛輪”運轉。
杭叉國自智能在物流領域深耕數十年,積累了海量客戶資源、渠道網絡與服務體系,形成場景選擇的先天優勢。“我們深諳物流行業的每一個細分場景,從倉庫布局、貨物規格到作業流程、操作習慣,這些深入骨髓的認知,讓我們能精準篩選具身智能落地的‘試驗田’。”
數據護城河:零成本獲取的真實工業數據
“數據是具身智能的基礎,多少數據就有多少智能。”陶熠昆表示。與其他企業高成本建設數采中心不同,杭叉國自智能擁有天然數據優勢。“我們已售出幾百萬臺人工叉車,這些設備在全國物流倉庫、生產車間日夜運行,每一次啟動、轉向、搬運,都是最真實的工業數據。”陶熠昆介紹,公司的 AGV及各類自動化物流設備也在持續運行,其搭載的傳感器與數據采集系統,能實時收集多維度作業數據。
“我們獲取這些數據的成本極低,甚至常為零成本。”他強調,這些數據的核心優勢是“真實性”—包含地面平整度、光線明暗、貨物偏心負載等復雜變量,這是實驗室數據無法模擬的。更重要的是,這些數據能形成“數據飛輪”正向循環:第一代產品運行產生新數據,優化模型后吸引更多客戶使用,進而產生更多數據,推動模型持續迭代。
綜合能力護城河:冰山之下的核心競爭力
陶熠昆用“冰山模型”形容具身智能產品落地邏輯:“露出水面的模型僅占10%,水下90%是企業綜合實力—涵蓋渠道推廣、產品設計、供應鏈整合、研發管理、資金實力、品牌影響力與服務網絡等。”
在他看來,這些“看不見的能力”更難被超越。“具身智能產品是軟硬件深度融合的復雜系統,需適配硬件平臺、考慮工業可靠性、控制成本、觸達客戶、解決售后問題,這些都需要長期積累與整合。”
分步演進:從具身技能到全場景智能的落地路徑
面對長期目標與短期瓶頸,杭叉國自智能制定了務實的分階段落地路徑。陶熠昆以自動駕駛為參照: “自動駕駛經15年積累從L2逐步演進至L4,具身智能落地也需遵循此邏輯,不可急于求成。”
他將具身智能落地分為三個階段:
L2階段為“自身感知+規則決策”。設備感知部分實現智能化,可自主識別環境、貨物、障礙物等信息,但決策與控制仍基于規則驅動。在陶熠昆看來,這是過渡階段,能讓設備具備基礎智能感知能力,積累初步數據,解決部分場景效率問題。
L3階段為“具身技能”階段,也是當前核心發力點。“我們不追求機器人‘無所不能’,而是‘精益求精’。”陶熠昆表示,具身技能即深耕垂直領域的單一或少數核心技能,比如“搬箱子”—無論箱子位置、規格、周邊環境如何,機器人都能精準可靠完成任務。“訓練垂直領域技能所需數據更少、落地更容易,且能切實解決工業剛需,讓數據飛輪運轉,為產業注入信心。”他直言,當前行業靠表演型機器人支撐的熱度難以持續,剛需產品才是產業發展的核心動力。
L4階段為“全場景智能”,機器人可自主應對各類復雜場景,完成多樣化任務,真正“像人一樣工作”。 陶熠昆強調: “這一階段可能還需5-10年,需海量數據積累、模型算法優化與硬件技術進步,但通過L2、L3階段的積累,我們能逐步逼近目標。”
面向未來,陶熠昆表示,杭叉國自智能將保持務實開放姿態, 以場景為根基、數據為驅動、綜合能力為支撐,推動具身智能從“實驗室”走向“生產線”,從“技術概念”變為“生產力工具”,為中國工業智能化轉型貢獻力量。
摘自《自動化博覽》2026年第一期暨《2026具身智能專刊》






訪談頻道