ALPRIM Ver 1.0 ユーザーズマニュアル

目次
  1. 概要
  2. CJocrPrimクラスの概要
  3. CJocrPrimクラスのサブクラス
更新履歴
  1. CJocrPrimEXクラス提供開始:2000年07月
  2. CJocrPrimRDクラス提供開始:2000年10月
  3. バージョンアップ:2002年07月
  4. ラスタ編集コマンド提供開始:2003年04月
  5. 一般文書レイアウト抽出オプション提供開始:2004年08月
  6. 帳票、図面タイトルレイアウト抽出オプション提供開始:2005年08月

マニュアルホームページ

リファレンスマニュアル


概要

ALPRIM Ver1.0は1999年10月にリリースされた、モノクロ文書画像解析ライブラリです。Ver.1.0では、以下の機能が提供されます。
  1. モノクロビットマップ画像をプリミティブに変換する機能
    4連結あるいは8連結で連結しているbit1あるいはbit0の領域をプリミティブと定義しています。

  2. プリミティブの大きさ等の条件に合致する隣接するプリミティブをまとめてクラスタとして抽出する機能。
    ALPRIMライブラリでは、デフォルトではクラスタ=テキスト段落として最適化されています。
    「隣接」は、プリミティブ間の距離などの複数のパラメータによって定義されています。

  3. クラスタを構成するプリミティブを囲む最小矩形を計算する機能
    角度を自動推定するバージョンと、あらかじめ指定するバージョンの二つの関数で提供しています。

  4. 表抽出機能
    1つ以上のクラスタを含む罫線で囲まれた領域(表)を抽出する機能

  5. ユーザーが選択した一つ以上のプリミティブを255のレイヤのいずれかに移動する機能。

  6. プリミティブの、面積、周囲長、重心の計算
    全てのプリミティブに対して、面積、周囲長、重心などの特徴を計算します。

  7. 特徴によるプリミティブの分類
    特徴の値の範囲によってプリミティブを分類します。

  8. 特定のレイヤのプリミティブを削除する機能

  9. 特定のレイヤのプリミティブを別レイヤに移動する機能

  10. 特定のレイヤをビットマップ画像に逆変換する機能
    たとえばテキストをレイヤ1へ移動してレイヤ1をビットマップに逆変換すると、テキストに対応する画像だけのビットマップが得られます。

  11. 特定のレイヤの指定領域のビットマップ画像を任意倍率で取得する機能
    モノクロ画像で取得する関数と、255カラー画像で取得する関数の2種類を提供。レイヤ0~254へ移動したプリミティブを、それぞれ異なるカラーで表示することができます。



特長

  1. 高速
    サポートCPUとして最低スペックのPentium 166MHzでも、A4、400dpiの画像から1秒でプリミティブ作成+クラスタ抽出。
  2. 省メモリ
    元のビットマップ画像のデータを全く損なわずに全てをプリミティブ表現。
    プリミティブ変換した画像は、通常は元画像よりも少ないメモリで格納できます。
  3. 大型画像対応
    座標系は4バイト。A0長尺にも余裕で対応。

目次


OS対応

Windows 95、Windows 98、Windows NT対応。
ライブラリは全てANSI標準のC、C++で記述されているため、Macintosh、UNIXへの移植も可能。


目次


ライブラリのファイル構成

クラス名 CJocrPrimRDまたはCJocrPrimEXまたはCJocrPrim
ヘッダファイル ocrdef.h
ocrco.h
primitive.h
cjocrprim.h
absparam.h
cjocrprimex.h
cjocrprimrd.h
errcode.h
必要なLIB NGKOCR4.LIB
必要なDLL NGKOCR1.DLL
NGKOCR2.DLL
NGKOCR4.DLL
ALVEC.DLL
ALPOLYGON.DLL
コンパイル定数 USENGKDLL4

目次


クラスライブラリの構成

CJocrPrimにビットマップ画像の先頭アドレス、背景のビット値、幅、高さを設定し、プリミティブ変換した後に各種の処理を実行します。
このクラスライブラリは、Y軸正が上方向でも下方向でも同じように動作します。

目次


CJocrPrimクラスの概要



CJocrPrimクラスのサブクラス

CJocrPrimクラスのサブクラスとしてCJocrPrimEXクラスとCJocrPrimRDクラスを提供します。
サブクラスにおいて、クラスタ抽出のパラメータの強化、角度推定や最小外接矩形の推定に 関する精度向上。画像からテキスト段落を抽出するためのパラメータの自動推定機能が提供 されています。
また、破線認識機能が追加されており、文書画像内の破線部分を指定レイヤへ移動すること ができます。
さらに、プリミティブの削除、挿入、移動、プリミティブの切断といったラスタ編集コマンド が追加されています。
CJocrPrimクラスの代わりにCJocrPrimRDクラスを利用することを強くお勧めします。CJocrPrimRD クラスは、CJocrPrimクラスのサブクラスであるため、上位クラスの全ての機能をサポートしており その上、機能・精度両面で強化されているからです。
目次



CJocrPrimEXクラス提供開始

CJocrPrimクラスの代わりに、サブクラスCJocrPrimEXクラスを使うことにより、文字列抽出機能大幅に精度向上することができます。
文字列抽出パラメータファイル(拡張子.prm)を、切り替えることで多様な文書に対応。
複数のパラメータファイルを使うことで複雑なレイアウトの文書からのテキスト抽出が可能

目次



CJocrPrimRDクラス提供開始


目次



バージョンアップ


目次



ラスタ編集コマンド

2003年04月に以下の機能を持ったラスタ編集コマンドが追加されました。
 従来はプリミティブやクラスタをレイヤ間移動して、レイヤを削除したり、レイヤごとのラスタを取得したり、レイヤごとに着色したラスタを取得したりするなどの、レイヤ単位の編集機能しかありませんでした。
ラスタ編集コマンドを用いることで、プリミティブやクラスタ単位での編集操作ができるようになりました。
さらにプリミティブやクラスタの切断コマンドを用いることで画素単位での編集操作も可能となっています。
  1. プリミティブ削除
    指定したプリミティブを削除します
    数多くのプリミティブ選択手段と組み合わせて、ラスタ編集に利用します。
  2. クラスタ削除
    指定したクラスタを削除します
    多様なクラスタ選択手段と組み合わせて、ラスタ編集に利用します。
    特定のレイヤの内容の削除やノイズ削除は、専用のAPIを利用したほうが高速に処理することができます
  3. プリミティブ移動
    指定したプリミティブを平行移動します。
    移動した先に別のプリミティブ/クラスタが存在して重複する場合でも、別オブジェクトとして管理されています。
  4. クラスタ移動
    指定したクラスタを平行移動します。
    移動した先に別のプリミティブ/クラスタが存在して重複する場合でも、別オブジェクトとして管理されています。
  5. プリミティブ挿入
    指定したプリミティブを挿入します。
    任意の画像を本ライブラリを用いて変換することで挿入することができます。
    自由描画したものをプリミティブ化して挿入するなどの利用方法が考えられます。
  6. クラスタ挿入
    挿入操作をクラスタ単位としたものです
    他の画像の特定のレイヤを一つのクラスタとして取得して挿入するなどの利用法が考えられます
  7. プリミティブ/クラスタ切断1
    複数の切断線でプリミティブ/クラスタを切断します。幅1の切断線で切断するので、切れたことが目で見えますが、図形が切断線の分だけ消えます。
  8. プリミティブ/クラスタ切断2
    複数の切断線でプリミティブ/クラスタを切断します。幅0の切断線で切断するので、切れたことが目で見えませんが、図形の面積は変わりません。
  9. 特定レイヤクラスタ化
以下の機能は高度なラスタ編集機能で、マニュアル記述はオプションとなっています。契約内容によってマニュアルが提供されます。
  1. 画像合成
    1枚の画像全体を挿入することができます。
    画像全てを挿入したいときには、他のAPIよりも高速に処理することができます。
  2. 表罫線分離
    表罫線と文字を分離します。
  3. 線分分離
    2点で指定した線分と文字を分離します
  4. テンプレート抽出
    グレイスケール画像で指定したテンプレート図形を画像から探索して独立したプリミティブとします。

目次



一般文書レイアウト抽出オプション提供開始

従来の図面や地形図のテキストだけでなく、一般文書(新聞、論文誌、雑誌、カタログなど)のレイアウトを抽出するためのライブラリの提供を開始
市販OCRと同等のテキスト抽出が可能
別売りオプションライブラリ
OCRソフト開発には、文字認識ライブラリ(別売)が必要

目次



帳票、図面タイトル対応オプション提供開始

帳票に対応するたの、罫線位置情報抽出、罫線・文字切り離し機能をライブラリ提供開始
別売りオプションライブラリ
OCRソフト開発には、文字認識ライブラリ(別売)が必要


目次


マニュアルホームページ

リファレンスマニュアル