テロップ認識の精度を高めることは非常に困難です。ニュース番組はともかくバラエティ番組となると
さらに困難に拍車がかかります。 多くの研究者がテロップの文字部分だけを抜き出すためのアルゴリズムを研究・開発してきましたが それでも実用化には程遠いのが現状です。 アートロジックはテロップを含む画像に対して、テロップの文字部分の一部を認識できるカラー画像の2値化アルゴリズムを 14個組み合わせて、「下手な鉄砲も数撃ちゃ当たる」方式で対応しています。
2コア4HT程度のPCでは画像1枚で、4秒程度処理時間がかかるという欠点があります。1フレーム/秒の速度を出すには 8コア/16HTのCPUが必要となります。当然のことならが64bitOSでの運用推奨となります。 |
下図のような、低認識率の認識処理を14プロセス並列実行して、結果を統合することで
高い精度を実現します。 著作権の関係で、画面の隅だけの引用となります。ご了承ください。 |
|
---|---|
色成分無視で低輝度部分に強い2値化 | 色成分無視で高輝度部分に強い2値化 |
黄色・オレンジ色を文字色とする2値化 | 縁取り文字(縁取りは低輝度)をターゲットとする2値化 |
彩度情報を使った2値化 | カラー文書向けの一般的な2値化(テロップ用専用ではない) |