基于多重機制優化的水下具身智能機器人系統目標識別算法研究-資訊-控制網

基于多重機制優化的水下具身智能機器人系統目標識別算法研究

點擊數：2776 發布時間：2026-02-10 10:48:10
分享到：

本文提出了一種基于多重優化改進的YOLO v8n-improved算法，旨在解決具身智能水下機器人在光線昏暗、介質渾濁的工作環境中，常規檢測算法因識別精度不高而難以有效應用的問題。具體而言，該算法首先采用深度可分離卷積DSConv替換YOLO v8n骨干層P9層及Neck層最后一層的常規卷積，以此降低網絡復雜性并提升推理速度；其次，在YOLO v8n的C2f模塊中引入倒置殘差注意力機制iRMB和雙通道卷積DualConv，從而增強網絡對關鍵全局信息的捕捉能力，減少訓練參數，進而提升模型對復雜場景的理解能力，優化模型性能；最后，增設小目標檢測頭以增強對小目標的檢測能力。為驗證所提算法的有效性，本研究分別在Kaggle水下魚類數據集、自主實驗采集的魚類數據集、水下裂縫數據集以及水下管纜數據集上進行了測試。測試結果表明，相較于先前算法，本文算法在mAP@0.5、mAP@0.5～0.95、精確率和召回率等關鍵指標上均實現了顯著提升。

關鍵詞：水下機器人；智能識別；YOLO v8n；倒置殘差注意力機制iRMB；深度可分離卷積DSConv

寧波大學，寧波韋爾德斯凱勒智能科技有限公司王寶磊

寧波韋爾德斯凱勒智能科技有限公司鄧華偉，王斐

寧波大學吳可

寧波韋爾德斯凱勒智能科技有限公司賈慶偉

寧波蔚瀾環保科技有限公司錢罡，史薛瑜

隨著信息技術的飛速發展，水下環境的探索與監測已成為全球科研和工業領域的關鍵議題。水下機器人的具身智能識別能力作為水下作業的重要技術支撐，直接關系到作業效率與安全性。海洋資源開發、環境監測、水下考古以及軍事偵察等領域，對水下機器人的具身智能識別性能也提出了更高要求。然而，水下環境的復雜性，如光衰減、高濁度、低對比度和高光散射等因素，導致水下圖像常常模糊、色彩失真和細節丟失，極大地影響了智能識別的準確性和效率[1]。

傳統的水下機器人智能識別方法主要包括基于聲吶的探測技術和基于光學成像的圖像處理技術[2]。聲吶技術雖能在復雜環境中提供穩定成像，但成像速度慢且難以實現實時處理。光學成像技術則因高分辨率和實時性優勢而備受青睞，但水下光學成像常受光線衰減和散射影響，圖像質量下降，進而影響目標檢測的準確性[3]。為克服這些限制，研究者們開始探索基于深度學習的檢測算法。其中，YOLO（You Only Look Once）系列算法因其快速高效的檢測能力被廣泛應用。YOLO算法將目標檢測任務整合為端到端的神經網絡模型，顯著提高了檢測速度和精度。2023年， Ultralytics團隊提出的YOLO v8算法在水下機器人智能識別中展現出較大優勢，許多研究者基于此進行了優化。例如，李博豪等通過引入可變核卷積、注意力機制等提出了無人機航拍小目標檢測算法[4] ；王文浩等通過引入DBB模塊和Non- local改進方案等提出了水面漂浮物高效檢測算法[5] ； Wang等開發的STF-YOLO算法通過引入新的卷積結構STRCN，在小目標檢測方面實現顯著性能提升[6] ； Zhang等提出的GCS-YOLO v8模型提高了遠光燈車輛檢測效率[7]。然而，因水下渾濁介質會降低圖像可見度和對比度，上述算法的檢測效果受限嚴重，它們直接應用在水下目標識別上尚不成熟。

因此，本文以YOLO v8n為基礎，通過多重優化提升具身智能水下機器人在渾濁介質環境下的識別性能。具體優化措施包括：首先，用深度可分離卷積DSConv （Depthwise-Separable Convolution with Kernel Distribution Shift）替換YOLO v8n骨干層P5層的常規卷積，降低網絡復雜性并提高推理速度；其次，在YOLO v8n的C2f模塊中引入倒置殘差注意力機制iRMB，增強網絡捕捉關鍵全局信息的能力，提升其對復雜場景的理解；最后，采用KioU損失函數替代原有的CioU損失函數，提高復雜環境下的邊框回歸精度。實驗表明，本文的優化設計有非常明顯的有效性。

1 YOLOv8基礎結構相關介紹

1.1 具身智能水下機器人介紹

本文設計的水下機器人屬于新一代數字化具身智能水下機器人，融合了ROV和AUV兩類機器人技術優點，實現了“遙操作+自主導航”多模式作業。該機器人在產品設計層面主要分為水下航行器、水下采測作業

裝置、岸基操控裝置和遠程系統四大模塊。機器人功能架構如圖1所示。

圖片1.png

圖1 機器人功能架構

其中，水下航行器核心組件包括高密度電池、大力矩舵機、抗擾控制器和機載傳感器，確保了機器人的穩定運行和精確控制。水下采測作業裝置主要設計了高清攝像機、高亮度水下照明、多波束聲吶成像、多功能作業工具以及多模態水質監測設備，這些裝置使得機器人能夠執行復雜的水下觀測、采樣和作業任務。岸基操控裝置通過岸基邊緣計算控制器和AI加速識別服務器進行數據處理和智能分析，同時提供便攜式遙控器、多功能操控器和功能更加豐富的桌面式工作站，以適應不同的操作需求。遠程系統則通過4G/5G DTU連接云服務器，支持APP軟件、PC數據分析軟件和大數據庫，對數據進行遠程分析和管理，為操作人員提供決策支持。

本文水下機器人智能識別的工作流程為：首先具身智能機器人水下航行器搭載的高清晰光學相機在高亮度水下照明裝置的輔助下對水下目標區域進行成像，然后通過智能機器人水下航行器的臍帶纜發送到岸基控制裝置的邊緣計算控制器中，再經部署本文優化算法的AI加速識別服務器完成目標識別，最后將識別結果在岸基操控裝置進行顯示存儲，并通過4G/5G DTU將識別結果發送至云服務器中供云端使用。上述過程中，對水下目標智能識別較為關鍵的部分為AI加速識別服務器。本文中的AI加速識別服務器配置為： Intel Core i7- 10700KF CPU，NVDIA Ge Force RTX 3090 GPU， 32 GB內存，24GB顯存， Pytorch2.3.1深度學習框架， Python3.9編譯系統，CUDA 11.8。

1.2 YOLOv8 基礎結構介紹

YOLO v8是YOLO系列算法的最新版本，該版本YOLO算法實現了“速度-精度”的權衡優化提升。從YOLO演進過程來看， YOLO v1以“回歸式端到端”框架奠定實時檢測基礎[8] ；YOLO v2-v3借助Darknet骨干與多尺度融合策略，將mAP提升10%量級并維持毫秒級延遲[9] ；YOLO v5-v7通過錨點精煉、重參數化及EMA注意力，在邊緣端實現小于3ms的推理增益[10] ； YOLO v8則進一步以C2f跨階段模塊與解耦head重構，使640×640輸入下COCO mAP達53.3%，參數量較v7縮減15%，顯著緩解了密集小目標漏檢。YOLO v8n作為YOLO v8的輕量級版本，廣泛應用于機器人等運算資源受限的具身智能系統中，其網絡結構如圖2所示。

圖片2.png

圖2 YOLOv8n 網絡結構

在YOLO v8n架構中，數據預處理層、主干網絡層和頸部網絡層是其關鍵部分。數據預處理層對輸入圖像執行歸一化、增強等操作，為后續特征提取奠定基礎；主干網絡層是模型的核心，負責從輸入圖像中提取并逐步抽象出特征；而頸部網絡層則進一步處理由主干網絡提取的多尺度特征，以提升模型在不同尺度上的目標檢測性能。

2 改進算法介紹

2.1 DSConv深度可分離卷積

卷積算子作為深度學習視覺模型的表征引擎，其機理在于通過可學習核組在輸入張量上執行局部加權滑動，逐級抽取低階邊緣、中階紋理與高階結構等空間譜系特征，為后續檢測或分類任務奠定語義基底。然而，當輸入分辨率或訓練語料規模顯著擴張時，標準稠密卷積暴露出兩項固有缺陷：其一，計算負荷隨通道數與空間維度的乘積耦合增長，浮點運算量與激活內存同步膨脹，直接拉長訓練與推理時間，并令模型在算力與內存受限的具身智能設備上難以實時收斂；其二，參數量隨網絡深度線性累積，造成假設空間冗余，在小樣本場景下顯著放大過擬合風險，同時抬升遷移微調與壓縮部署的工程復雜度。

為應對上述瓶頸，本文在骨干網絡Backbone的P5層級與頸部網絡Neck末端引入深度可卷積分離算子DSConv[11]，以替換標準稠密卷積。 DSConv通過“量化-分布偏移”耦合機制，在保持浮點卷積精度的同時可以降低計算與存儲開銷。其核心思想可概括為：先將浮點權重離散化至低比特整型空間，再借助可學習的分布偏移向量對量化核進行逐通道校正，使整數運算結果在統計意義上等價于原始浮點卷積。該策略一方面壓縮了參數量與激活值位寬，另一方面利用整數乘加指令的硬件友好特性，將理論FLOPs削減約8倍，并縮短推理延遲。DSConv的完整數據流如圖3所示：（1）核分布偏移KDS（Kernel Distribution Shift）模塊對輸入卷積核執行逐組量化，生成低比特核VQK；（2）通過輕量級擴展算子將VQK維度對齊至原始特征圖，并以殘差路徑RES保留高頻細節；（3）卷積分布偏移CDS （Convolutional Distribution Shift）單元在通道維度施加可學習偏置，補償量化誤差，確保輸出特征分布與浮點卷積保持Wasserstein距離最小。上述過程在數學上可視為對原始卷積算子的分布保持映射，從而在端側設備上實現精度-效率聯合最優。

總體而言，集成DSConv后模型的推理效率可以實現顯著提升，這種提升是在確保模型準確率不受影響的基礎上實現的。通過簡化網絡結構，DSConv不僅能夠提升運算速度，還可以降低模型的復雜度，這使得它在資源受限的具身智能設備中表現出色。 DSConv的引入還帶來了模型泛化能力的顯著提升。通過精簡參數數量， DSConv有效降低了模型在訓練過程中出現過擬合的可能性，這對于在數據量有限的情況下訓練深度學習模型尤為重要。這種泛化能力的增強，意味著模型在面對新的、未見過的數據時，能夠展現出更好的適應性和穩定性，從而在廣泛的應用場景中提供更加可靠的性能。

圖片3.png

圖3 DSConv計算流程

2.2 C2f_DiRMB

在深度學習范式中，瓶頸Bottleneck網絡結構對特征提取效率與模型性能具有支配性影響。針對該關鍵節點，本文通過設計C2f_DiRMB模塊，對YOLO v8n原生C2f單元實施重構。該模塊在維持原有計算開銷的前提下，通過引入高階卷積算子，擴展了特征張量的語義深度與空間廣度，并增強了網絡的表征能力。

改進后的C2f_DiRMB模塊憑借經系統性設計的卷積范式，在特征提取階段實現雙重優化：其一，通過增強局部感受野的譜系響應，使網絡對細微紋理、邊緣擾動等高頻成分保持高靈敏度，從而在復雜視覺任務中顯著降低了目標誤識別與類別混淆概率；其二，在維持前向傳播低延遲約束的同時，將語義判別邊界推向更高維流形，實現精度與速度的協同提升。嵌入其中的iRMB子模塊在繼承CBAM[12]輕量級拓撲的前提下，引入殘差校正路徑，使梯度張量在深度級聯中保持高秩特性，有效抑制了信息坍縮；其通道-空間雙重注意力通過張量低秩分解與逐像素重標定策略，強化了跨通道協同與長程空間依賴，構建起更具表達力的特征交互機制，進而提升了模型對復雜上下文的解析能力。并行DualConv分支以3×3深度卷積與1×1逐點卷積同址運算，輔之以動態組卷積調度，可在保留局部幾何結構的同時將理論參數量壓縮至標準卷積的三分之一，顯著降低了片上訪存與乘法累加次數，故在具身智能設備上仍能保持實時推理特性。

為了能夠在保持Bottleneck模塊參數效率優勢的基礎上，提升特征表達能力，本文通過兩項關鍵技術對傳統Bottleneck模塊的結構進行改進：特征增強結構和雙路徑特征提取機制。在特征增強方面，通過引入倒置式特征擴展（iRMB）方法，先擴展特征維度以提升表征空間，再采用高效卷積操作降低計算量。這種設計既保留了原有通道壓縮-擴展的核心機制，又通過優化的維度調整策略，在保證運算效率的同時增強了特征學習能力。特征處理過程中維持的跨層連接機制，有效保障了信息傳遞的完整性。在特征提取層面，創新性地采用并行雙分支結構（DualConv）。其中一路使用常規卷積捕捉局部細節特征，另一路采用大感受野操作提取全局上下文信息。兩路特征在輸出階段通過自適應的加權融合策略進行組合，這種設計能夠自動調整網絡對不同尺度特征的關注程度，并顯著提升了其對目標尺寸變化的適應能力。

圖片4.png

圖4 iRMB模塊

2.3 小目標檢測頭

針對水下場景目標成像尺寸偏小、成像分辨率低及懸浮顆粒與氣泡散射所導致的高頻信息衰減與背景噪聲耦合等問題，本文提出了一種面向輕量化部署的多級檢測頭擴展框架，其核心思想在于以分層特征耦合機制彌合淺層紋理與深層語義在單級輸出時的固有矛盾，進而提升網絡對弱對比度小目標的感知魯棒性。水下光學鏈路受水介質吸收、前向散射與后端成像傳感器物理孔徑的多重限制，目標在像平面呈現低信噪比、邊緣退化及頻譜混疊等退化特征。傳統單階檢測模型將預測任務委托于最深特征層（通常對應輸入降采樣至1/32），雖具備類別可辨性，卻因空間柵格稀疏而難以對亞像素級目標進行精確定位。反之，僅依賴淺層特征雖可保留高頻細節，但缺乏足夠的感受野與語義抽象能力，且易被復雜水體噪聲干擾。

為此，本文構建了四級檢測頭體系，通過“淺層特征適配與增強-多級特征互補-動態尺度響應”三級策略實現特征表達與計算開銷的權衡：首先，對P2層特征執行階梯式上采樣以恢復空間分辨率，并引入深度可分離卷積對高頻邊緣與紋理進行選擇性強化，在保留局部敏感性的同時抑制參數冗余；其次，通過跨層通道拼接將P2局部細節與P3～P5全局語義聯合表征，使網絡同時具備亞像素級細節感知與場景級抽象能力；最后，四級檢測頭按感受野遞進形成自適應尺度響應，淺層柵格聚焦極小目標，中層覆蓋中等尺度區間，深層負責大尺度實例錨定，實現錨框先驗與特征圖空間的解耦，降低小目標漏檢概率并抑制背景誤激活，從而在保持計算圖稀疏性的前提下完成水下弱對比度目標的穩健識別。

經上述多重機制優化后的YOLO v8n（YOLO v8n- improved）網絡結構如圖5所示。

圖片5.png

圖5 基于多重機制優化的YOLOv8n （YOLOv8n-improved）網絡結構

3 實驗驗證

3.1 實驗數據

為驗證本文所設計的優化算法的有效性，我們使用兩組數據進行實驗，分別為第三方開源網站Kaggle數據集和本文實際拍攝采集數據集。其中Kaggle數據集如圖6所示，包含不同水下背景、不同水下照度、不同水下魚類共計4505張照片，在實驗中訓練集3153張，驗證集901張，測試集451張。 Kaggle數據集實驗平臺采用本文1.1節中介紹的AI加速識別服務器相同配置的服務器進行離線實驗驗證。

圖片6.png

圖6 Kaggle數據集

本文實際拍攝采集數據集如圖7所示，為使用本文智能水下機器人在寧波市奉化江寶化橋段水下真實拍攝，拍攝時間為2024年春夏交接時節，該水域在此季節水草茂盛、水溫適宜，適合魚苗發育。數據采集時采用的智能水下機器人設定每秒拍攝采集30幀有效圖像，采集時長30分鐘，共采集54000張圖像，通過數據清洗挑選出其中帶有魚類目標且非重復的有效圖像約7600張。同Kaggle數據集實驗一樣，使用4505張有效圖像進行實驗，其中用于訓練集3153張，驗證集901張，測試集451張。實際拍攝采集數據集實驗平臺直接采用本文1.1節中介紹的AI加速識別服務器在線進行實驗驗證。

圖片7.png

圖7 實際拍攝數據集

Kaggle數據集實驗和實際拍攝采集數據集實驗參數設置均如表1所示。

表1 參數設置

表1.png

3.2 評測指標

為了對模型性能進行準確評估，本文采用了精確度（Precision）、召回率（Recall）、均值平均精度( mAP）和參數量（Params），作為實驗評測指標。

精確率（Precision）是預測為正的樣本中實際為正的比例，召回率（Recall）是所有實際為正的樣本中被正確預測為正的比例。二者計算公式如式（1）、式（2）所示：

式1.png

其中，TP是指模型正確預測為正類的樣本數量，

FP是指模型錯誤的預測為正類的樣本數量， FN是指實際為正類但被模型錯誤預測為負類的樣本數量。

mAP（meanAveragePrecision）是衡量目標檢測模型性能的指標，分為mAP0.5和mAP0.5～0.95兩種。mAP0.5是在IoU（IntersectionoverUnion）閾值為0.50時的平均精度均值，即預測框與真實框的IoU大于等于0.50時，預測才被視為正確。 mAP0.5～0.95是在0.50到0.95的IoU閾值范圍內，以0.05為步長計算每個閾值的平均精度（AP），然后取這些AP值的平均值。具體計算公式如式（3）、式（4）所示：

參數量（Params）即模型訓練過程中的參數總數，是衡量模型空間復雜度和規模的重要指標。較大的參數量代表著模型更為復雜，需要更大的存儲容量來存儲這些參數。

3.3 實驗結果與分析

3.3.1 Kaggle數據集實驗對比

本文通過Kaggle數據集實驗，首先比較了傳統YOLO v8n和優化后的YOLO v8n-improved兩種算法在邊界框、置信度和類別損失上的性能差異。分析兩種算法的訓練和驗證過程中的損失曲線，可以發現兩者的損失值都維持在較低水平，但YOLO v8n-improved在分類和置信度損失上略低于YOLO v8n。通過對精確度、召回率、mAP@0.5和mAP@0.5～0.95四個關鍵指標的收斂情況分析對比，可以發現，YOLO v8n- improved在精確率、召回率和mAP@0.5～0.95上表現更優，且收斂曲線更為平順。

為了進一步證明本文提出的各個改進模塊的優越性，我們還設計了基于Kaggle數據集的消融實驗，實驗結果如表2所示。

表2 消融實驗

表2.png

上述實驗結果顯示，通過改進特征網絡，將C2f模塊替換為C2f-DiRMB模塊，模型的召回率和mAP@0.5～0.95分別提升了0.2%、0.1%、0.3%，但準確率略有降低。在卷積模塊中，用DSConv替換傳統卷積后， mAP@0.5提升了0.4%，準確率、召回率和FPS均有所提高。綜合來看，與傳統YOLO v8n模型相比，新提出的模型在mAP@0.5和mAP@0.5～0.95上分別提高了0.5%和0.8%，在準確率和召回率上分別提升了0.5%和1.0%，參數量有所下降，性能提升顯著。

3.3.2 實際拍攝采集數據集實驗對比

本文通過實際拍攝采集數據集實驗，對改進前后兩種算法性能進行了比較，并通過準確率、召回率、 mAP@0.5mAP@0.5～0.95等參數對性能對比結果進行了統計，如表3所示。

表3 性能對比

表3.png

通過對上表數據的分析可知，在實際拍攝采集數據集實驗中，YOLO v8n-improved在準確率、召回率、 mAP@0.5、mAP@0.5～0.95上相較于傳統的YOLO v8n網絡分別提升了2.3%、0.2%、0.2%、0.9%。由此可見，通過本文的優化設計，改進后算法在水下目標檢測任務中展現出了更強的準確性和魯棒性，能夠成功識別水體渾濁環境中的重疊目標，進而可以為實際應用提供更可靠的檢測結果。

圖8展示了實際拍攝采集數據集其中一副有較少數量魚類的圖像，該圖像中魚類目標的數量為5條。通過兩種算法識別效果差異的直觀對比可知：基于傳統YOLO v8n算法能夠成功識別3條、漏識別2條，成功識別出的3條的置信度分別為0.87、0.86、0.74，如圖8（a）所示；基于本文改進的YOLO v8n-improved算法能夠成功識別5條，成功識別出的5條的置信度分別為0.89、0.87、0.78、0.72、0.67，如圖8（b）所示。

圖片8.png

圖8 對比測試結果

圖9展示了實際拍攝采集數據集其中一副有較多數量魚類的圖像，該圖像中魚類目標的數量為18條，且該圖像中有多個尺寸較小的目標。通過兩種算法識別效果差異的直觀對比可知：基于傳統YOLO v8n算法能夠成功識別11條、漏識別7條，識別成功率為61.1%，未成功識別的全部為小尺寸目標，如圖9（a）所示；基于本文改進的YOLO v8n-improved算法能夠成功識別18條，識別成功率為100%，如圖9（b）所示。

圖片9.png

圖9 對比測試結果

對比測試可以看出，傳統YOLO v8n算法在處理物體重疊和水體渾濁條件下的識別任務時，存在一定漏識別的風險，特別是難以完成對小尺寸目標的識別；而改進后的YOLO v8n-improved算法在處理該類場景下的識別任務時，表現會更加讓人滿意。

3.4 拓展實驗

除上述基本實驗外，本文還將上述改進算法進行了拓展應用部署，在水下管廊裂縫識別以及水下管纜識別任務中進行了實驗，如圖10所示。實驗結果顯示，本文改進算法在該類任務場景下表現良好，能滿足實際使用需求。

圖片10.png

圖10 拓展實驗結果

4 結論

本文以YOLO v8n為基礎，通過三項改進構建了適用于渾濁水域的目標檢測模型：以DSConv替換骨干P9與Neck末層常規卷積，壓縮了參數量并提升了推理速度；在C2f模塊嵌入倒置殘差注意力機制iRMB與雙通道卷積DualConv，增強了全局關鍵信息捕獲；增設小目標檢測頭，緩解了水下圖像小目標漏檢。 Kaggle公開數據集與奉化江實測數據集的對比實驗表明，改進模型的mAP@0.5、mAP@0.5～0.95、精確率及召回率分別較原網絡提升了0.5%、0.8%、0.5%與1.0%，參數量下降了0.9×106 ，并在水體渾濁、目標重疊場景下顯著降低了漏識別。以上結果驗證了本文所提多重優化策略可在不增加計算負擔的前提下，有效提高水下機器人對復雜環境的感知可靠性與實時性，為后續工程部署提供了直接可用方案。

作者簡介：

王寶磊（1986-），男，山東濰坊人，高級工程師，博士，現任寧波大學產業教授，寧波韋爾德斯凱勒智能科技有限公司技術副總，研究方向為智能機器人及其控制系統。

參考文獻：

[1] 劉有用. 基于生成對抗網絡的水下多目標識別[D]. 綿陽: 西南科技大學, 2020.

[2] Xing B, Sun M, Ding M, et al. Fish sonar image recognition algorithm based on improved YOLOv5[J]. Mathematical Biosciences & Engineering, 2024, 21 (1).

[3] Shi K, Wang J, Zhu H, et al. Intelligent target detection of underwater optical images based on image enhancement[J]. Proceedings of SPIE, 2023.

[4] 李博豪, 李智. 基于改進YOLOv8n的無人機航拍小目標檢測算法[J]. 智能計算機與應用, 2025 (5) : 173 - 179.

[5] 王文浩. 基于改進YOLOv8的水面漂浮物檢測模型[D]. 南昌: 南昌大學, 2024.

[6] Hui Y M, WANG J, LI B. STF - YOLO: A small targetdetection algorithm for UAV remote sensing images based onimproved Swin Transformer and class weighted classification decoupling head[J]. Measurement, 2024, (224) : 113936.

[7] Zhang L, Zhang K, Yang K, et al. Driving risks from light pollution: an improved YOLOv8 detection network for high beam vehicle image recognition[J]. The Journal of Supercomputing, 2025, 81 (1) : 1 - 23.

[8] 毛少華, 王文東. 基于深度學習的YOLO系列物體檢測算法研究綜述[J]. 延安大學學報 (自然科學版), 2024, 43 (02) : 88 - 95.

[9] 臧濤, 傅志凌, 王喆, 等. 改進YOLOv3的紅外弱小目標檢測[J]. 計算機工程與設計, 2024, 45 (11) : 3479 - 3485.

[10] 莫恒輝, 魏霖靜. 基于改進YOLOv7的復雜環境下蘋果目標檢測[J]. 浙江大學學報 (工學版), 2024, 58 (12) : 2447 - 2458.

[11] 徐一翔, 呂勇. 基于生成對抗網絡的輕量化圖像融合算法[J]. 北京信息科技大學學報(自然科學版), 2024, 39 (03) : 84 - 90.

[12] 沙浩源, 梅飛, 李丹奇, 等. 基于改進生成對抗網絡的電壓暫降事件類型辨識研究[J]. 中國電機工程學報, 2021, 41(22) : 7648 - 7660.

[13] Rezatofighi H, Tsoi N, Gwak J, et al. Generalized Intersection Over Union: A Metric and a Loss for Bounding Box Regression [C]. 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Long Beach, CA, USA, 2019 : 658 - 666.

[14] 佘明磊, 張神德, 鄧志勇, 等. 最佳交并比在塔吊裂縫檢測的應用[J]. 南陽理工學院學報, 2021, 13 (6) : 65 - 69.

摘自《自動化博覽》2026年第一期暨《2026具身智能專刊》

1.我有以下需求：
得到貴公司產品詳細資料得到貴公司產品的價格信息貴公司產品銷售人員聯系我貴公司技術支持人員聯系我
2.詳細的需求：
*
姓名:	*
單位:
電話:	*
郵件:	*

技術頻道

行業頻道

熱門頻道

技術頻道

行業頻道

熱門頻道

資訊頻道

熱點新聞

推薦產品