当社の図形認識技術の一部は、画像のラベリングとラベル付けされた領域(プリミティブ)の特徴解析(ブロブ解析)をベース
にしています。
モノクロ画像については、A0超の複雑な地形図やA1見開き新聞紙などでも1秒以内で全図形のラベリングと領域(プリミティブ)
の基本属性(面積やサイズなど)計算を実行します。
当社では、ラベル付けされた領域を「プリミティブ」と呼ぶケースがあります。漢字や記号は、以下のように1つ以上のプリミ
ティブに分割されて解析されます。英語の大文字や数字は、1文字=1プリミティブとなっています。
ラベリングは、モノクロ画像の場合、画素の上下左右の4方向の連結がある部分をひとつの領域(プリミティブ)とみなす4連結
ラベリングと斜め方向の連結も認める8連結ラベリングがあります。
グレイスケール、カラー画像では
- 統計的に元画像との誤差が最も少ない減色処理に基づいたラベリング
- 単純な輝度空間、色空間での距離に基づいたラベリング
- Colorization using optimizationに基づいたラベリング
などで領域を分割します。特に、3.の手法は、計算量が大きいのが欠点ですが、
- 計算に使った画素間の距離の定義における最適な領域分割が可能
- 並列計算向けのアルゴリズムで高速化がしやすい
- 動画にもそのまま適用できる
という特長を持っているために、徐々に利用頻度が高まっています。
当社のライブラリで計算できる基本属性には以下のようなものがあります。
- 外接長方形
(xmin,ymin)-(xmax,ymax)に存在する。
水平方向フェレ径=xmax-xmin
垂直方向フェレ径=ymax-ymin
- 面積
- 周囲長
- 円形度
- 線幅
- 絶対最大長、BR'DTH、ORIENT
ラベリングは以下のように利用されています。
- 一定の面積以下の領域をノイズとして背景色で塗りつぶす
たとえばモノクロの場合、黒領域、白領域のいずれもラベリング可能なので、孤立点や孤立穴をノイズとして除去することができる。
- 線図形から、線幅を推定する
- プリミティブ同士の距離や位置関係から、文字列や段落の範囲を推定する
|