富士通研究所、デジタルカメラ向け文書画像の高速歪み補正技術を開発
デジタルカメラ向け文書画像の高速歪み補正技術を開発
~紙面輪郭がなくても、文字の並び方向から歪み補正を実現~
株式会社富士通研究所(注1)は、富士通研究開発中心有限公司(注2)と共同で、文書をデジタルカメラで斜め方向から撮影した際に生じる画像の歪み(注3)を、文書中の文字の並ぶ方向を手がかりに、高速で補正する技術を共同開発しました。
今回開発した技術を適用することにより、看板や時刻表、ホワイトボートなどを、紙面輪郭(注4)を含めずに部分的に斜め方向から撮影しても、あたかも真正面から撮影したように、画像の文書を読みやすく補正することが可能になります。
【 開発の背景 】
昨今、コンパクトデジタルカメラやカメラ付き携帯電話の普及にともない、デジタルカメラはスナップや風景写真だけでなく、会議室中のホワイトボードの板書や電車の時刻表など、日常におけるさまざまな情報の記録にも活用されるようになりました。しかし、デジタルカメラで文書を撮影する場合、正面から撮影できないと画像に歪みが生じ、文書が読みづらくなってしまいます。
【 課 題 】
従来の歪み補正技術では、文書全体を撮影し、いびつな四角形として写っている紙面輪郭を長方形に補正することで、画像の歪みを補正していました。しかし、この方式では、紙面輪郭を含めて文書の全体を撮影する必要があり、必要な部分のみを手軽に撮影することができないという問題がありました。
【 開発した技術 】
今回開発した歪み補正技術では、いびつな四角形の紙面輪郭を長方形に補正する従来方法に加え、文書内に存在する文字の並びや下線、表などを解析し、それらの文字や罫線などが平行に整列するように画像補正を行います。
これまでの技術では、紙面輪郭から歪んでいる方向とその角度を示す水平および垂直消失点(注5)を求め、消失点に向かう直線を平行にすることで歪み補正していました(図1)。
図1.紙面輪郭がある画像の補正例(従来技術)
添付資料をご参照ください。
今回開発した技術では、文書中に整列して書かれている文字や罫線の並びや方向から、消失点の位置を推定します(図2)。垂直方向の消失点の検出には、文字の並びだけでなく漢字に含まれる垂直ストローク方向情報も使用しており、紙面輪郭がなくても高精度な検出を可能にしています。
図2.紙面輪郭のない画像の補正(新技術)
添付資料をご参照ください。
さらに今回、デジタルカメラなどの組込み機器への搭載に向け、高速化も実現しました。歪みの補正具合を粗調整から微調整へ段階的に計算し、十分な補正精度が得られた時点で、補正処理を終了します。必要最小限の演算が選択されるため、処理時間が短縮されます。また、高速・低精度と低速・高精度の2種類のアルゴリズムを組合せ、高速で高精度な補正を実現しています。これにより、一般的なパソコンで、メガピクセル画像を0.1秒程度で補正処理を行うことが可能です(Pentium4 2.6ギガヘルツで、100万画素の画像を処理した場合)。
【 効 果 】
撮影画像に紙面輪郭が写っていない場合でも、被写体の歪み補正を行うことが可能です。そのため、掲示物や紙文書を撮影する際に、紙面輪郭を気にする必要がなく、必要な箇所を拡大して撮影できます。
さらに、高速な画像補正処理性能を活かし、組込み機器にも対応できます。
【 今 後 】
本技術は、コンパクトデジタルカメラなどの組込み機器への搭載を目指します。
【 商標について 】
記載されている製品名などの固有名詞は、各社の商標または登録商標です。
以 上
<注 釈>
注1:株式会社富士通研究所:代表取締役社長 村野和雄、本社 神奈川県川崎市。
注2:富士通研究開発中心有限公司:董事長 吉川誠一、本社 中国北京市。
注3 歪み:正しくは、「透視歪み」と言う。長方形の紙面を斜め方向から撮影した場合、その紙面が長方形として撮影されない歪みのこと。
注4 紙面輪郭:文書などが記述されている紙の縁。通常、長方形の形状をしている。
注5 消失点:道路の縁など、もともと平行であった物体が、撮影した画像のなかで、透視歪みのため非平行となった時、それらを延長して得られる交点のこと。
【 関連リンク 】
株式会社富士通研究所
http://jp.fujitsu.com/group/labs/