所屬欄目:核心期刊 更新日期:2025-05-06 09:05:39
中國圖象圖形學報最新期刊目錄
光場角度線索表征的語義分割研究————作者:程欣怡;賈晨;張梓軒;石凡;
摘要:目的 當前的光場語義分割方法局限于單一物體,手工特征表達魯棒性差且缺乏高層角度語義信息,針對上述不足,提出了一種適用于靜態圖像的端到端語義分割網絡,充分挖掘了深度卷積神經網絡對光場圖像特征的表征潛力,探索了空間和角度結構關系以解決過分割和欠分割問題。方法 從多尺度光場宏像素圖像構造出發,基于多種骨干網絡設計,提出了一個高效角度特征提取器(angular feature extractor, AFE...
認知機器的模型與結構研究進展————作者:鮑泓;鄭穎;梁天驕;
摘要:機器如何與人一樣具有認知能力?認知能力可用智能度量,人的智能是認知過程的涌現,人們從認知的模型出發研究其結構,結構決定機器的認知功能。本文旨在探討機器認知的模型和構建方法,為設計新一代認知機器提供新的模型、結構和方法論。本文用分析、歸納和演繹的方法綜述認知機器模型和結構的起源、演進與發展趨勢。首先,從20世紀初計算機器的發明和DNA雙螺旋結構模型的發現談起,闡述了“圖靈機模型+馮·諾依曼結構”劃時...
深度學習領域單視圖三維物體重建研究綜述————作者:劉草;曹婷;康文雄;蔣朝輝;陽春華;桂衛華;梁驍俊;
摘要:從單個視圖恢復物體三維結構信息是計算機視覺的重要研究方向,在工業生產、醫療診斷和虛擬現實等領域發揮重要作用。傳統單視圖三維物體重建方法需要結合幾何模板和幾何假設以完成特定場景對象的三維重建任務。而當前基于深度學習的單視圖三維物體重建方法通過數據驅動的方式,在重建對象適用范圍和重建模型魯棒性等方面取得進展。本文首先討論近年來單視圖三維物體重建領域常用的數據集與評價指標。然后圍繞基于深度學習的單視圖三...
面向高光譜全色銳化的混合注意力雙分支U型網絡————作者:楊勇;王曉爭;劉軒;黃淑英;劉紫陽;王書昭;
摘要:目的 高光譜(hyperspectral, HS)全色銳化旨在融合高空間分辨率全色(panchromatic, PAN)圖像和低空間分辨率高光譜(low resolution hyperspectral, LRHS)圖像,生成高空間分辨率高光譜(high resolution hyperspectral,HRHS)圖像。現有全色銳化算法往往忽略PAN和HS圖像之間的模態差異,從而造成特征提取不精確...
擴散模型生成視頻數據集及其檢測基準研究————作者:鄭天鵬;陳雁翔;溫心哲;李嚴成;王志遠;
摘要:目的 擴散模型在視頻生成領域取得了顯著的成功,目前用于視頻生成的擴散模型簡單易用,也更容易讓此類視頻被隨意濫用。目前,視頻取證相關的數據集更多聚焦在人臉偽造領域上,缺少通用場景的描述,使生成視頻檢測的研究具有局限性。隨著視頻擴散模型的發展,視頻擴散模型可以生成通用場景視頻,但目前生成視頻數據集類型單一,數據量少,且部分數據集不包含真實視頻,不適用于生成視頻檢測任務。為了解決這些問題,提出了包含文本...
感知約束和引導下的特征點增強局部水印算法————作者:郭娜;黃櫻;牛保寧;關虎;蘭方鵬;張樹武;
摘要:目的 圖像水印技術通過在圖像中嵌入標識版權的水印信息來實現版權保護。其中,局部水印技術將水印嵌入特定圖像區域,可防止水印被裁剪攻擊破壞,同時盡量減小視覺影響。該技術通常利用特征點進行局部區域的定位和同步。然而,水印嵌入及后續可能的圖像攻擊容易引起特征點偏移,導致無法準確定位嵌入區域,造成水印提取失敗。因此,提高特征點穩定性對局部水印技術的可靠性至關重要。方法 本文提出感知約束和引導下的特征點增強局...
多尺度大核注意力特征融合網絡的圖像超分辨率重建————作者:宋霄罡;張鵬飛;劉萬波;魯曉鋒;黑新宏;
摘要:目的 圖像超分辨率重建是計算機視覺領域內的基礎任務。卷積神經網絡通過滑動窗口機制和參數共享特性能夠有效提取局部特征,但對圖像遠距離信息的感知能力較弱。Transformer中的自注意力機制可以更好地捕捉序列中的全局依賴關系,但同時會帶來高額計算資源占用的問題。方法 為了解決這些問題,本文提出了一種基于多尺度大核注意力特征融合網絡的超分辨率重建方法 MLFN(multi-scale large ke...
面向透射文檔圖像復原的模糊擴散模型————作者:王義杰;龔嘉鑫;梁宗寶;崇乾鵬;程翔;徐金東;
摘要:目的 在對文檔進行數碼成像時,墨水濃度和材質透明度等因素可能會導致文檔背面內容透過紙張變得可見,從而導致數字圖像中出現透射現象,影響文檔圖像的實際使用。針對這一現象,提出了一種模糊擴散模型,基于模糊邏輯的均值回歸思想,不需要任何先驗知識,增強擴散模型處理文檔圖像中隨機因素的能力,不僅解決了文檔圖像的透射現象,而且增強了圖像的視覺效果。方法 所提方法通過均值回歸隨機微分方程連續添加隨機噪聲降低原始圖...
多特征聚合的邊界引導視頻圖像顯著目標檢測————作者:張榮國;鄭曉鴿;王麗芳;胡靜;劉小君;
摘要:目的 視頻顯著目標檢測的目的是識別和突出顯示視頻中的重要對象或區域。現有的方法在挖掘邊界線索和時空特征之間的相關性方面存在不足,并且在特征聚合過程中未能充分考慮相關的上下文信息,導致檢測結果不夠精確。因此提出了多特征聚合的邊界引導網絡,進行顯著目標邊界信息和顯著目標時空信息之間的互補協作。方法 首先,提取視頻幀顯著目標的空間和運動特征,在不同分辨率下將顯著目標邊界特征與顯著目標時空特征耦合,突出運...
結合知識蒸餾與互信息的多模態MRI疾病預后————作者:魏然;戚曉明;何宇霆;江升;錢雯;徐怡;祝因蘇;Pascal Haigron;舒華忠;楊冠羽;
摘要:目的 多模態心臟磁共振(cardiac magnetic resonance,CMR)圖像預測非缺血性擴張型心肌病(nonischemic dilated cardio myopathy,NIDCM)的預后在對臨床中心力衰竭或心源性猝死等不同應用中發揮著重要作用。針對多模態CMR圖像預后表征困難和標注困難兩個挑戰,提出了一種基于混合匹配蒸餾與對比互信息估計的模型,用于小樣本上的多模態CMR圖像對N...
人臉視頻中心率變異性參數估計方法綜述————作者:周才英;占新龍;魏遠旺;張先超;李永剛;王超超;葉曉朗;
摘要:本綜述探討了基于人臉視頻的心率變異性(heart rate variability,HRV)估計技術,突出了其在健康監測和疾病診斷中的無創性和實時監控的優勢。首先,解析了HRV的生理學基礎和核心參數的定義,闡明了其在醫療保健領域的應用潛力。接著,詳細介紹了人臉視頻采集的技術細節、數據預處理流程,重點討論了多種HRV參數估計方法,包括傳統信號處理技術和深度學習算法。分析表明,深度學習技術在HRV估計...
YOLO-SF-TV:經顱超聲圖像三腦室檢測模型————作者:萬奧;高紅鈴;周曉;薛崢;牟新剛;
摘要:目的 經顱超聲成像技術作為高效率、低成本且無創的診斷手段,已逐步應用于帕金森病患者認知功能障礙診斷。由于經顱超聲圖像信噪比低、成像質量差、目標組織復雜且相似度高,需要依賴專業醫生手動檢測。但是人工檢測不僅費時費力,還可能因為操作者的主觀因素影響,造成檢測結果出現差異性。針對這一問題,提出了一種基于Swin Transformer和多尺度深度特征融合的YOLO-SF-TV(YOLO network ...
用于遙感場景分類的全局—局部特征耦合網絡————作者:王俊杰;李偉;張蒙蒙;高云浩;趙伯禹;
摘要:目的 卷積神經網絡(convolutional neural network,CNN)因其強大的特征歸納和學習能力,在遙感場景分類任務中收獲了廣泛的關注。然而,由于卷積采取的是一種局部歸納機制,這阻礙了全局依賴關系的獲取,并限制了模型的性能。而視覺Transformer(visual Transformer,ViT)的核心在于自注意力機制,它能夠建立全局依賴關系,這一屬性可以緩解基于卷積神經網絡算...
針對高光譜遙感圖像變化檢測的混合注意力和雙向門控網絡————作者:李相潭;高峰;孫悅;董軍宇;
摘要:目的 高光譜圖像能提供豐富的光譜和空間信息,但常受到多種噪聲的干擾,增加了其在變化檢測領域應用的復雜性。為了解決上述問題,提出一種基于混合注意力和雙向門控網絡的高光譜圖像變化檢測方法,旨在提升變化檢測的性能,從而在復雜環境和多變條件下實現更可靠的變化檢測。方法 通過整合局部和全局特征,改進了Transformer中的自注意力和前饋神經網絡。具體而言,提出了混合注意力模塊,采用卷積神經網絡(conv...
室內大尺度全景視覺定位數據集————作者:余海林;劉佳潤;葉智超;陳信宇;占若豪;申屠溢醇;陸仲赟;章國鋒;
摘要:目的 視覺定位廣泛應用于自動駕駛、移動機器人和增強現實等領域,是計算機視覺領域的關鍵技術之一。現有的室內視覺定位數據集在重復紋理、對稱結構和相似場景等方面不能完全反映出實際應用中的挑戰,缺少相應指標反映視覺定位在實際應用中的問題。針對這些問題,提出一個基于全景相機的大尺度室內視覺定位基準數據集。方法 選取了4種在實際應用中具有代表性的視覺定位場景,使用全景相機對選取場景進行分時段稠密采集,獲取不同...
MSFF-GAN:云霧環境下結冰風洞圖像去霧模型————作者:周文俊;楊新齡;左承林;王一帆;彭博;
摘要:目的 結冰風洞是地面實驗的關鍵設備,可模擬云霧環境,對研究結冰對飛機性能的影響極為重要。但云霧環境會降低圖像質量,這不僅阻礙了對結冰過程的細致觀察,還減少了結冰檢測與分析的準確度。鑒于此,提出了一種新的圖像去霧方法——多尺度特征融合生成對抗網絡(multi-scale feature fusion generative adversarial network, MSFF-GAN),旨在改善結冰風洞...
三維風格化人臉生成與結構化建模————作者:胡佳平;周漾;
摘要:目的 現有的三維人臉風格化方法難以生成較大相機姿態的人臉視圖,或止步于生成多角度的人臉視圖,而非結構化的三維網格模型。鑒于此,提出一種基于樣例的三維人臉風格化與結構化建模方法。方法 該方法不僅能夠合成新的全相機視角下的風格化人臉視圖,還具有生成結構化的人臉三維網格模型的能力,即包括人臉三維網格以及對應的紋理貼圖。具體來說,提出了一個兩階段的結構化三維風格人臉生成框架,主要包括三維感知人臉生成器域遷...
嵌入切片序列關聯模式的前交叉韌帶損傷分類————作者:劉英莉;茶寅秋;黃一山;高明;
摘要:目的 膝關節前交叉韌帶(anterior cruciate ligament,ACL)損傷的及時診斷是降低骨關節炎等風險重要途徑。作為ACL損傷判別的常用影像學方法,三維磁共振成像(magnetic resonance imaging,MRI)相較于二維自然圖像細節更繁雜,醫生診斷所需時間長,智能輔助醫療是有益的。目前應用三維卷積神經網絡(3D convolutional neural netwo...
改進實時目標檢測Transformer的持刀危險行為檢測算法————作者:金濤;胡配雨;
摘要:目的 在對公安系統網絡攝像頭獲取的視頻數據進行分析時,行人危險持刀行為的自動檢測面臨刀具形狀、大小的多樣性,以及遮擋和多目標重疊等因素導致的檢測精度低、誤檢率高的挑戰。針對上述問題,提出了一種改進實時目標檢測Transformer(real-time detection Transformer,RT-DETR)的持刀危險行為檢測算法(human-knife detection Transforme...
基于深度學習的監控視頻異常檢測方法綜述————作者:汪洋;周腳根;嚴俊;關佶紅;
摘要:利用監控視頻監測異常在社會治理中具有至關重要的地位,因此視頻異常檢測一直是計算機視覺領域備受關注且具有挑戰性的議題。鑒于此,以深度學習的視角,對當前關鍵的視頻異常檢測方法進行了分類和綜述。首先,全面介紹了視頻異常的定義,包括異常的劃定和類型分類;隨后,分析了目前全監督、弱監督、無監督等方面的深度學習方法在視頻異常檢測領域的進展,探討了各自的優缺點,特別針對結合大模型的最新研究進展進行了探討;接著,...
copyright © www.optiwork.cn, All Rights Reserved
搜論文知識網 冀ICP備15021333號-3