圖像分類是機器學習和模式識別領域中一個十分重要的研究熱點,其目的是基于標簽已知且完整的圖像數據集訓練一個分類器,并對新樣本的標簽進行預測和分類。傳統(tǒng)的圖像分類問題通常是單標簽分類問題,即一張圖片僅對應一個類別標簽。然而,現(xiàn)實世界的圖像往往具有多義性,即一張圖片通常和多個類別標簽相關聯(lián)。針對傳統(tǒng)的單標簽學習框架難以解決的多義性問題,通過給樣本對象明確地指定一組相關類別標簽的標簽子集,多標簽學習框架應運而生?,F(xiàn)有的大多數多標簽學習算法都是假設訓練樣本的標簽集是完整的,然而,在實際應用中,訓練樣本的標簽往往是不完整的。并且,訓練樣本的標簽通常采用人工標注,耗時又耗力,而且由于人工標注存在主觀性,標簽語義存在歧義,致使訓練樣本的部分標簽漏標、缺失。隨著互聯(lián)網和社交媒體的發(fā)展,大量由用戶標注并上傳的圖像數據唾手可得,但是這些圖像數據往往存在標簽缺失問題。如何利用這些容易獲取卻具有標簽缺失問題的數據來訓練一個健壯、有效的多標簽分類算法,仍然是一個亟待解決的問題。本文主要研究針對存在標簽缺失問題的多標簽圖像分類問題,主要研究內容如下:1.利用標簽間固有的關聯(lián)性以及示例間的相似性,提出了一種基于示例級和標簽級關聯(lián)的多標簽圖像分類算法。該算法首先采用線性重組策略計算每個示例與其近鄰示例間的相似性,其次采用標簽矩陣的低秩表示挖掘標簽間的高階關聯(lián)性,然后采用一種加權最小二乘損失函數保證給定標簽與預測標簽的一致性,最后,通過拉普拉斯流形正則化聯(lián)合兩種關聯(lián)以及損失函數構建最終的目標函數。在多個圖像數據集上的實驗證明,該算法能夠有效處理標簽缺失問題。2.基于低秩特征映射與低秩標簽恢復,提出了一種針對標簽缺失問題的雙重低秩的多標簽圖像分類算法。該算法首先假設算法的特征映射系數矩陣具有低秩性,來挖掘特征空間中的標簽關聯(lián)。然后假設標簽關聯(lián)矩陣是一個低秩矩陣,來挖掘標簽間的高階關聯(lián)性,并同時利用低秩的標簽關聯(lián)恢復原標簽矩陣的缺失標簽。然后通過保證預測標簽與恢復后的標簽之間的一致性,將標簽關聯(lián)的提取、標簽恢復與模型的訓練結合到一起。最后通過正則化引入示例級的關聯(lián)性。