傾き・反り・影がある文書画像の行認識(その4)

前回の記事から1週間ちょっとたちました。
プロットした点から外れ値を取り除きました。

外れ値を取り除いた

点が2つだけになった列が残っているのはあまり気にしないでください。消します。

やらなければならないこと

1. 曲線が直線になるように画像を変形する

2つの線の幅が変わるから(たとえば500ピクセルあった幅が400ピクセルになる)、どのピクセルを選ぶかというアルゴリズムを考えたが、その実装をしてない。

曲線の方程式を引数に渡したものの、制御点を渡すのを忘れてた。3次スプライン曲線は複数の3次関数をつなぎ合わせたものだって認識がどうも抜けるな。

2. 3次スプライン曲線の制御点を増やす

ご覧の通り、プロットした点に沿った曲線になっていない(左端のほうはほぼぴったりでも右端のほうは直線状になっているなど)。いまは3次関数を2つだけ繋いでいる(制御点が3つ)だが、3つ、4つと増やす必要がある(しかしあんまり増やすと計算量が増える)。

制御点がいくつでも大丈夫なようにコードを書き換えなくちゃいけない。

3. 位置関係による分類

これはまだ手をつけてません。

上の方にあって、専有面積が大きいものが店名、その下が電話番号とかをやる。

Leave a Reply

Your email address will not be published. Required fields are marked *

CAPTCHA