計算機視覺的圖片標注有很多種,應用也各不相同,那么下面一起了解下計算機視覺的圖片標注類型及應用!
圖片標注類型
在深入研究計算機視覺的圖片標注用例之前,有必要了解圖片標注的各種方法。讓我們一起分析常見的圖片標注技術。
1.邊界框
多功能且直接的邊界框是計算機視覺中常用的圖像注釋類型之一。邊界框包圍對象并協助計算機視覺網絡找到感興趣的對象。創建很容易,只需要指定框的左上角和右下角的X和Y坐標。邊界框幾乎可以應用于任何物體,可以大大提高物體檢測系統的準確性。
2. 多邊形分割
多邊形分割是另一種圖像注釋技術,也是邊界框背后理論的擴展。它幫助計算機視覺系統找到目標,復雜的多邊形比簡單的盒子更能準確地檢測到目標的位置和邊界。與邊界框相比,多邊形分割可以切掉目標邊緣的噪聲/無用像素,避免混淆分類器。
3.線路標注
線條標注創建直線和曲線,主要用于描繪圖像的各個部分。當需要標記和劃定的部分太小或太細而無法通過邊界框等方法繪制時,可以使用線標記。直線和曲線易于標注,常用于訓練倉庫機器人識別傳送帶上零件的差異,或訓練自動駕駛車輛識別車道。
4.特征點的標注
計算機視覺系統的第四種圖片標注是特征點標注。因為它在圖像上創建點,所以有時稱為點標記。只需幾個小點,就可以將畫面中細小復雜的物體進行分類。然而,特征點標注通常使用許多點來描述目標的輪廓或框架。特征點的大小各不相同,較大的點有時用于區分區域內的重要/標志性區域。
5.三維長方體
3D 長方體是一個非常強大的圖片標注,很像一個邊界框,可以幫助分類器找到對象。但三維長方體具有長寬高的三維成像,錨點一般位于目標邊緣,點用線填充。物體以三個維度呈現,允許計算機視覺系統學習區分三維空間中的體積和位置等特征。
6.語義分割
語義分割是一種將圖像劃分為不同區域的圖片標注方法,可以對圖像中的每個像素點進行分類。圖像的語義/定義上不同的區域被彼此分割。例如,圖片的一部分可能是“天空”,另一部分可能是“草地”。語義分割的關鍵是每個區域都由語義信息定義,圖像分類器對屬于該區域的每個像素進行分類。
圖片標注類型用例
1.邊界框標注
邊界框用于計算機視覺圖像注釋,以幫助網絡定位對象并協助創建定位和分類對象的模型。常見用途包括檢查目標相互沖突的情況。邊界框和物體檢測顯然用于自動駕駛系統中以定位道路上的車輛。此外,它還可以用來對建筑工地的目標進行分類,分析工地安全,讓機器識別不同環境中的目標。
邊界框用例:
利用無人機鏡頭監控建筑對象,從地基鋪設到建筑物準備好入住,識別雜貨店的食品和其他物品,自動監控結賬過程,并檢測車輛的外部損壞以進行詳細的保險理賠分析。
2. 多邊形分割
多邊形分割用許多復雜的多邊形注釋對象,能夠捕獲不規則形狀的對象。當需要精度時,多邊形分割比邊界框更有效。由于多邊形可以勾勒出物體輪廓,去除邊界框的噪聲,提高模型精度,多邊形分割在自動駕駛中很有用,可以突出標志和路標等不規則物體,定位車輛比邊界框更準確。它還可以用于準確標記許多不規則物體,例如衛星和無人機檢測到的物體。多邊形分割也比邊界框更適合準確檢測水生生物。