[前の年][次の年]

Computer Vision and Image Understanding (Academic Press) Vol.63, No.1

階層的な三角形分割をもとにした、多重解像度の曲面のモデリング
Multiresolution Surface Modeling Based on Hierarchical Triangulation

Marc Soucy and Denis Laurendeau

Computer Vision and Image Understanding, vol. 63, no. 1, pp. 1-14, January 1996

Keywords: computational geometry, equiangularity, multiresolution analysis, surface modeling, triangulation

本論文では、多重解像度の曲面のモデリングの逐次的な方法を述べる。 最初のモデルは、いくつかの方向から撮られたレンジ画像の統合によって 得られる曲面の三角形分割である。 その後、階層的な三角形分割アルゴリズムにより、 三角形分割点の除去によって得られる再分割の誤差を最小にするように、 点を繰り返し除去してゆく。 最適化手法により、 3次元空間における曲面の三角形分割の等角性を最適化、 すなわち、各分割三角形ができるだけ正三角形に近いようにする。 提案する方法は、 曲面の情報を圧縮する他に、 三角形分割のトポロジーと曲面方向の不連続性を保持するという性質を持つ。 穴を持つような、複雑な多くの部分から成る物体から構築された 実験的なモデルを示す。

Copyright(c) 1996 Academic Press, Inc.


並列なユークリッド距離変換アルゴリズム
A Parallel Euclidean Distance Transformation Algorithm

HUGO EMBRECHTS AND DIRK ROOSE

Computer Vision and Image Understanding, Vol.63, No.1, January, pp.15-26, 1996

ユークリッド距離変換(EDT)を行なう並列アルゴリズムを提案する。 これは符号つきEDT(SEDT)のための高速な逐次アルゴリズムに基づく、 「分割−統合」型のアルゴリズムである。 SEDT問題をボロノイ図形の部分的な計算として再定式化した後では、 SEDTの局所部分的な計算に続く統合ステップが効率的に実行できる。 ここから、計算量が小領域内の画素数に比例する2つの局所的計算 ステップと、計算量が画像の周囲長に比例する1つの大局的計算ステップ を持つアルゴリズムが導かれる。 本文ではアルゴリズムについて述べ、計算量を解析し、負荷の不均衡に関する議論 と、iPSC/2上での速度測定を行なう。

Copyright(c) 1996 Academic Press, Inc.


データ駆動かつモデル駆動型の多重解像度処理
Data- and Model-Driven Multiresolution Processing

ANDREA CALIFANO, RICK KJELDSEN, and RUUD M. BOLLE

Computer Vision and Image Understanding, Vol.63, No.1, January, pp.27-49, 1996

先の論文では視覚認識の枠組について述べたのだが、ここではその枠組に 的確に適合するような多重解像度処理技術を紹介する。 入力は、画像全体については低解像度で処理され、小ウィンドウ内については 高解像度で処理されるのだが、これらは同時に処理される。 ここでは、高解像度のウィンドウの動きを制御するアプローチを導入するが、 それはデータ駆動とモデル駆動の両方による固定点の選択を考慮するものである。 固定点を定める方法として、三つの方法が実現された。それは、データ中の説明 されない大領域に基づくもの、オブジェクトモデルデータベース内の衝突に基づ くもの、および2次元空間充填アリゴリズムに基づくものである。 我々は、この種のマルチ解像度処理というものは、広く認められているように計 算時間を制限するのに有用であるだけでなく、ビジョン問題の全体を扱いやすく かつ安定したものにするうえで決定的な要因たりうるということを論じる。 このアプローチを示すために、3次元表面テクスチャのあるクラスを導入し、こ れをこのシステムにおける認識用の特徴とする。 表面テクスチャ認識というのは、表面抽出の場合よりも一層の高解像度処理を必 要とする典型的な例である。 例をあげるならば、表面テクスチャはピンポン玉とゴルフボールを識別するのに 使われうるし、曲線テクスチャはタイプの異なるギアを認識するのに使われうる のである。 それ以外の実験結果もまた述べられており、このアプローチの有利な点とそれが 包含するものを示している。

Sz

Copyright(c) 1996 Academic Press, Inc.


アクティブフォビエティド(Fovetaed)ビジョンシステム: 注目機構と走査パスの収束指標
An Active Foveated Vision System: Attentional Mechanisms and Scan Path Covergence Measures

HIROYUKI YAMAMOTO, YEHEZKEL YESHURUN, MARTIN D. LEVINE

COMPUTER VISION AND IMAGE UNDERSTANDING Vol. 63, No. 1, January, pp. 50-65,1996 ARTICLE NO. 0004

フォビエティド(foveated)ロボットビジョンシステムの試験台の実装を示す。 フォビエーション(forveation)を得るために、ビジュアルセンサーは 非均一なサンプリングを行ない、また機械的に特定の注視点へ向けられる。 重要な作用素が 注視点の系列を選択するのに使用される。 情景の広角な表現を作るために、 連続写真のフォービアル(foveal)な高解像度と周辺の低解像度を統合する。 そのような視覚処理は 霊長類や人類の生物学的観点からの課題とし て研究されてきた。 本研究の目的はフォビエティド(foveated)マシンビジョンを 研究することができる効果的なビジョンシステムを構築することである。 現在の実装は、 1・PUMAロボットによって注視点の回りを平行移動したり傾けたりして 位置決めするCIDカメラ 2・SIMD型並列コンピューター 3・多値画像、エッジ画像、そしていくつかの凝視点から得た重要点の 地図を構築する従来型のコンピューター を統合したものである。 システムは高度にモジュール化され、 その構造は 実時間処理のために 直列および並列のコンポーネントの効果的な統合を実現している。 二つの異なる注目メカニズムの統合と、人工画像と自然画像に対するそれらの 挙動の定量的な評価によって、 システムのモジュール性とそのポテンシャルを アクティブビジョンの試験台とする。 この挙動評価のために3種類の基準を提案する。

Copyright(c) 1996 Academic Press, Inc.


文書認識におけるフォントと機能語認識
Font and Function Word Identification in Document Recognition

SIAMAK KHOUBYARI AND JONATHAN J. HULL

Computer Vision and Image Understanding, Vol. 63, No. 1, Jan., pp. 66-74, 1996

英語文書の文章部分で用いられている主要なフォントを認識するアルゴリズムを示す。 多用される機能語(the, of, and, a, to など)もフォント認識の一部として 認識される。 単語の画像のクラスターは入力画像から生成され、フォントと文書画像から作られた 機能語のデータベースとのマッチングが行なわれる 最もマッチするフォントや文書によって主要なフォントや機能語がわかる。 この方法は、ほとんどの印刷文書が一つの主要なフォントで書かれているという 事実を利用している。 また、文書中で繰り返し用いられる単語を利用して、入力画像のノイズに対処する。 この方法の利点の一つは、文書認識アルゴリズムの前処理として用いることが 出来る点である。 原画像と低品質画像のデータベースに対する実験から良好な結果を得ている。

Y.A.

Copyright(c) 1996 Academic Press, Inc.


多重運動のロバストな評価:パラメーター的な区分的平滑フローフィールド
The Robust Estimation of Multiple Motions: Parametric and Piecewise-Smooth Flow Fields

Michael J. Black and P. Anandan

Computer Vision and Image Understanding, Vol.63, No.1, January. pp. 75-104, 1996

オプティカルフローを評価する大多数のアプローチは次のことを仮 定している。つまり、ある有限の画像領域内において、一つの運動しかあり得 ない。この「単一運動仮定」は、普段の場合(例えば、透明度、深さ不連続性、 独立移動物体、影、鏡反射)では守られていない。ロバストな光学的フロー の評価には、この単一運動仮定を緩和しなければならない。 本論文は、「ロバストな評価」に基づく枠組を提案し、多重運動によって引 き起こされている定輝度と空間連続性の違反について論ずる。この「ロバスト 評価枠組」は光学的フローの標準的定式化に応用でき、仮定の違反に対する敏 感さを低減できることもこの論文で示される。このアプローチは光学的フロー を復元する3つの標準的な技法に用いられている:領域に基づく回帰法、相関、 運動不連続性の正規化。本論文は、一つの領域内での多重パラメーター運動モ デルの復元、区分的平滑フローフィールド(flow field)の復元に焦点を当て、 自然と合成画像系列の応用例を与える。

Copyright(c) 1996 Academic Press, Inc.


知識ベースによる公共施設地図の解釈
英語タイトル Knowledge-Based Interpretation of Utility Maps

J.E.DEN HARTOG, T.K.TEN KATE and J.J.GERBRANDS

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.63,No.1,January,pp.105-117,1996

本論文では公共施設地図の解釈における知識ベースに基づいた アプローチについて述べる。 本方法は意味論的ネットワークで表現される先験的知識の二つの タイプに基づいている。 意味論的ネットワークは先験的知識での推論と結果の解釈に有効な 表現を与える。 意味論的ネットワークに基づいた地図解釈システムについて述べる。 本システムはトップダウン制御構造とボトムアップの対象認識法とが 統合されている。 本システムを公共施設地図でテストし、その結果について 述べる。

Copyright(c) 1996 Academic Press, Inc.


コーナーと接点を強調した輪郭追跡
Contour Tracking by Enhancing Corners and Junctions

MARCELLO DEMI

Computer Vision and Image Understanding, Vol.63, No.1, pp.113-134, Jan. 1996.

従来の論文では,連続画像より望ましい解像度で自動的に輪郭を抽出する 方法として最初のフレーム上の開始輪郭の近似を与える方法が提案されて いる.このような方法は満足のいく結果が得られるが,コーナーや接点と いった単一孤立点ではlocalization errorsが発生する.コーナーや接点 の取扱いの困難性については分析されており,エッジオペレータの適用が 効果があることが分かっている.以前の論文で用いられているGaussianの 傾斜は(i)不連続性に関するridges,(ii)コーナー,接点における局所的 最大を得るフィルターに置き換えられる必要がある.このようなフィルタ が提案され,white Gaussian noiseに対する応答も分析されている.フィ ルタ応答は分散指数で,完全中心モーメント(平均偏差)である.フィル タにより生成されたエッジマップは正および負の平均偏差を表わす2つの マップに分けることができる.両者の差異は平均偏差であり,Gaussianの 傾斜と同様な不連続性におけるridgesとコーナー,接点の局所的最大を決 定する.それらの和は伝統的なDoG(difference of Gaussians)である.二 つに分けられたマップはそれぞれ二つの半境界を決定する.これらの半境 界についてはエッジ点のマップを得,境界追跡の手続きを改良するため, 他の著者によって提案されている.

Copyright(c) 1996 Academic Press, Inc.


傾きベクトル場におけるパラメータの付けられたもっともらしい境界
Parameterized Feasible Boundaries in Gradient Vector Fields

Marcel Worring, Arnold W.M.Smeulders, Lawrence H.Staib and James S.Duncan

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.63,No.1,January,pp.135-144,1996

複雑に入り組んでいる物体を含むノイズの多い画像を 局所的な画像情報のみに基づいて分割することは困難である。 このような物体の境界抽出の問題に対して モデルに基づいて分割の手順を定める手法を用いることは有益である。 幾何学的モデルのパラメータを調整すること、すなわち 境界テンプレートが画像中の物体の位置を突き止め、 最適な手法で記述することによって分割処理が行なわれる。 この解法の最適性は目的関数がテンプレートの形状と同じ程度に 画像の情報を考慮に入れることに基づいている。 従来、文献において目的関数は主に 傾斜(Gradient)の強度と記述された テンプレートの滑らかさを測定することに基づいていた。 本論文では 画像の平滑化ガウシアン微分 (Gaussian smoothed derivatives) から導かれる 傾斜の方向の情報に基づいた 新しい画像の目的関数を提案する。 本手法は 検出対象物体の近くに他の物体 (conflicting object)が存在する場合でさえも 精度良く物体の境界の位置を突き止めるように設計されている。 本手法では輪郭の物理的なもっともらしさを保証するために 新しい滑らかさに関する目的関数を導入した。 本手法は人工的なデータを用いて評価されている。 また、医用画像の実画像における結果は 本手法が複雑な画像に対して 精度良く物体の境界の位置を突き止めるのに 非常に効果的であることを示している。

mNt

Copyright(c) 1996 Academic Press, Inc.


非凸形状を持つ2次元と3次元パターンの解析
Analyzing Nonconvex 2D and 3D Patterns

Gunilla Borgefors and Gabriella Sanniti di Baja

Computer Vision and Image Understanding, Vol.63, No.1, January, pp.145-157, 1996

非凸形状を持つパターンを凹部を記述することで解析する方法を提案する。凹 部は凸部を結ぶ外包の形状と実際のパターンとの差を計算し同定される。この 外包の形状の良い近似は、繰り返しパターンの局所的な凹部を埋めるようなフ ィルタリングを行なうことで得られる。このフィルターはパターンの形状の曲 率の情報を利用しており、フィルターの大きさによっても得られる外包の形状 は異なる。 この論文では、2次元と3次元の外包の形状を求めるのにパラレル処理とシー ケンシャル処理の2つの方法を提案する。求められた外包の形状は2次元の場 合は多角形、3次元の場合は多面体となり、凸かおよそ凸の形状を持つように なる。 凸部を結ぶ外包と実際のパターンとの差分パターンに対して再度同様な解析を 繰り返し行ない、より精密に実際のパターンの形状を解析する方法を示す。ま た、ピラミッド構造上に異なる解像度のパターンを用意し、外包の形状を階層 ツリーで解析する方法も示す。

Copyright(c) 1996 Academic Press, Inc.


Geonを用いた距離画像上の3次元物体の表現法
Representing 3-D Objects in Range Images Using Geons

Q. Nguyen and M. D. Levine

Computer Vision and Image Understanding, vol.63, No.1, pp. 158-168, 1996.

本論文では,Biederman によって提案された geon( geometrical ion )とい う立体プリミティブに基く部分要素とそれらの空間的結合により物体を表現す る手法を提案する. この手法では,まず,物体の距離画像の枝−分岐点グラフ( edge-junction graph )を入力とし,部分要素に対応する部分グラフに分解する. 次に,各部分要素に関して,枝の特徴から,対応する geon の形を推定する. また,部分要素の空間的な接続関係は凹状枝とT型分岐点から推定されうる. レーザー距離測定器から得られた画像に対しての実験結果をいくつか示す.

Copyright(c) 1996 Academic Press, Inc.


平面構造と運動の動的な更新:定常運動の場合
Dynamic Updating of Planar Structure and Motion: The Case of Constant Motion

D. W. Murray and L. S. Shapiro

Computer Vision and Image Understanding, vol.63, No.1, pp. 169-181, 1996.

本論文では,1台のカメラに対して任意だが定常な運動をする部分平面の三次 元構造と運動を再構成する非線形問題に動的な解を与える,拡張カルマンフィ ルター( extended Kalman Filter )を用いたアルゴリズムについて述べる. 観測した運動を時間で積分するアルゴリズムにより,シーンの構造と回転運動 の間の対応は,観測した運動をその場その場で瞬間的に処理することなく復元 される.それによって,そのような瞬間的な処理で生じる,回転運動の値に二 つの可能性があるといった曖昧さを解消できる. 適切に制御できる実験環境で撮影した風景と動いている自動車の中から撮影し た風景,それぞれ数十フレームの画像上で,運動から平面の構造を動的に再現 した実験の結果を示す.

Copyright(c) 1996 Academic Press, Inc.


線特徴を用いたGeometric Hashingの蓋然的手法
A Probabilistic Approach to Geometric Hashing Using Line Features

FRANK C. D. TSAI

Computer Vision and Image Understanding, Vol.63, No.1, pp.182-195, Jan. 1996.

最近研究されている物体認識アルゴリズムの多くは,画像分割は信頼性が あるものと仮定している.しかし実際にはこの仮定が成り立たないことは多い. 本論文では,ひどく低品質なsingle intensity画像に対するモデルに基づいた 物体認識手法として,Hough変換とgeometric hasingを統合した手法を提案する. geometric hasingのパフォーマンス分析における従来の研究は点特徴に焦点を 当てているが,外界からのひどいノイズとocclusionのために特徴を見つけるこ とが困難になっている.本論文ではより強健な認識のための不変量として線特徴 を用いる.これらの線特徴の統計的性質を分析的に調査する.画像変換される 2次元(またはフラットな3次元)のような様々なviewing transformationsが 考慮される.一般的な透視画法変換の変わりによく用いられるaffine変換につ いて,提案手法はノイズに強く,高度に閉塞された環境下でも使用できることを示す.

Copyright(c) 1996 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.63, No.2

透視投影不変量の近似としてのアフィン不変量の解析
Analysis of Affine Invariants as Approximate Perspective Invariants

Yu Cheng

Computer Vision and Image Understanding, Vol. 63, No. 2, March, pp. 197-207, 1996

本論文では始めに物体上の点の透視投影のための正比例の近似の 概念について紹介する。 それから、物体上の線分の透視投影とその正比例の近似の最大相対誤差の 解析を通して、実際的に有用な直角三角形誤差決定ルール(OTEDR)を得る。 ルールの定義から始めて、透視投影不変量の近似としてアフィン不変量の使用の 可能性を調べる。 例えば、与えられた物体の平面上の2本の平行な線分の長さの比、共通の底面の 面積の比などを調べた。 実験結果によって我々の解析の信頼性を確かめた。

Y.A.

Copyright(c) 1996 Academic Press, Inc.


効率的な曲線図形検索への階層的アプローチ
A Hierarchical Approach to Efficient Curvilinear Object Searching

Jianying Hu and Theo Pavlidis

Computer Vision and Image Understanding Vol. 63, No. 2, March, pp.208-220, 1996

曲線図形の検索は、パターン認識や情報検索において現れる共通の 問題である。 検索の効率をいかにして改善するかが、データ量が多いときには特に、 重要な問題となる。

本論文では階層的なアプローチを提案する。そこでは、高次で目立った 種々のタイプの形状特徴が抽出されるが、それらは、異なる抽象レベルに おいて曲線図形を表すために用いられる。 検索手順はトップダウンで実行される---まず最初のレベルでは 同じタイプの特徴の数だけが比較され、次の中間レベルでは 特徴間の幾何学的な拘束条件がチェックされる。最後に必要となる 大がかりなマッチング演算は、限られた候補の組にだけ適用すればよい。 こうして高い効率を達成することができる。

道路画像のマッチングと手書き筆記体の認識という、2つの異なる アプリケーションについて汎用的手法が実装されており、 両者に関して行なった実験の結果を報告する。 汎用的手法を他のアプリケーションに合わせて容易に調整できるように、 特徴選択の指針も与えてある。

Copyright(c) 1996 Academic Press, Inc.


Photomotion
Photomotion

Ruo Zhang, Ping-Sing Tsai and Mubarak Shah

Computer Vision and Image Understanding, Vol.63, No.2, pp.221-231, March, 1996.

一画像のみを用いた従来の陰影化手法により得られた形状からは陰の領域 の特定ができず、物体の表面を正確に再現できない。従来の光度測定の立 体視法により得られた形状は、全体のコストを最小にする全ての入力画像 を必要とするという欠点を持つ。この(立体視法の)過程では、新しい画 像が入ると処理を最初からやり直す必要がある。

これらの2手法の欠点を克服するために、著者らはshape from photomotion と呼ばれる新しい手法を提案する。この方法では depth map を再現するた め、シーン近辺で動く光源により得られた、連続する2次元 Lambertian 入力画像を利用する。それぞれの入力画像の中では、オブジェクトはシー ン中で位置固定となり、光源の方向だけが変数となる。光源の移動によっ て画像中の点の明るさが変化する。明るさの変化により未知パラメータで ある depth map を補うことが可能であるので、それぞれの入力画像にお いて depth map は定数とすることができる。この輪郭は、拡張カルマンフィ ルタによる反復的処理に適している。この新手法は、光度測定の立体視法 の連続的形状である。この手法は、形状の推定をそれぞれの光源の方向だ けでなく、photomotion により徐々によくしていくという点で、光度測定 の立体視法とは大きく異なる。カメラが固定されているため、様々な光源 の位置のおける depth map が計算可能となる。そのため、カメラ可動、 光源固定の場合でも有利な手法である。

本手法は連続する合成画像と実画像に対して適用実験された。

Copyright(c) 1996 Academic Press, Inc.


一組の距離画像からの物体表面の対応付けと動きの計算
Surface Correspondence and Motion Computation from a Pair of Range Images

Bikash Sabata and J.K.Aggarwal

Computer Vision and Image Understanding, Vol.63, No.2, March, pp.232-250, 1996

連続画像から移動している物体の動きを推定することは、コンピュータビジョ ンにおいて大変興味深い問題である。本論文では、一組の距離画像から動きの パラメータを推定する問題を扱う。ここでは、(1)物体の表面を抽出し連続フ レーム間の表面の対応付を行なう、(2)これらの対応付けから物体の動きを計算す る、という2つの部分に分けて考える。

本論文では、表面の対応付けをするために、ハイパーグラフに基づいた新しい 考え方を導入する。このハイパーグラフの階層的な表現は、探索範囲を劇的に 減らすばかりでなく、探索に使用される位相的な情報と幾何学的な情報のコー ド化を容易にする。実際の距離画像から得られた結果は、このアルゴリズムが オクルージョンやセグメンテーション誤りに対してロバストかつ良好なもので あることを示した。

このフレーム間の動きは、平面と二次曲面の組を使って計算される。そして、 最小自乗法により最も良い動きを推定する。線形な関係にある特徴の組では、 回転と移動の動きが独立になるために扱いやすいが、二次曲面では、回転と移 動は独立とはならない。この場合、最小化するための方程式は非線形であり、 ユニークな解の存在も保証されない。そこで、二次曲面からユニークで線形な 特徴を抽出し、それらを使って動きを推定することでこの問題を解決した。

Copyright(c) 1996 Academic Press, Inc.


多角形の切断面間の区分線形補間
Piecewise-Linear Interpolation between Polygonal Slices

Gill Barequet and Micha Sharir

Computer Vision and Image Understanding, Vol. 63, No. 2, March 1996, pp. 251-272

Keywords: curve matching, medical imaging, surface interpolation, surface reconstruction, triangulation

本論文では、一連の平行な多角形の横断面から、区分線形表現の曲面を再構築 する方法を示す。 これは、医用画像、地形データからの地形表面の再構築などの応用において重 要な問題である。 以前のほとんどの研究のように、この問題を、隣り合った切断面の間を、 区分線形近似する問題として取り扱う。 我々のアルゴリズムでは、部分輪郭の整合をとるための部分曲線マッチングの 方法、整合していない部分を解消するための3次元多角形の最適三角形分割、 そして、単連結でない領域間を補間するための最小木を使ったヒューリスティッ クスを使っている。 この問題を解くための以前の方法と違って、我々のアルゴリズムはどのような 種類のデータでもうまく取り扱うことができそうである。 各切断面には、ネスティングの階層をもった、複数の輪郭があってもよく、 さらに、多重連結領域間の補間を扱うためにいくつかの以前の論文で提案され ているような、直観に反した、輪郭間をつなぐ「橋」の導入を避けることがで きる。 実際の医用画像を含む、様々な複雑な例を使った実験結果により、 我々のアルゴリズムの高い性能と頑健さを示す。

(HN)

Copyright(c) 1996 Academic Press, Inc.


ベクトル化した機械製図の仕上げ
Perfecting Vectorized Mechanical Drawings

Y. Chen, Y. A. Langrana, and A. K. Das

Computer Vision and Image Understanding, Vol.63, No.2, March, pp.273-286, 1996

本論文は、スキャンされた機械製図を、ベクトル化ファイルに変換するシステ ムについて述べる。ベクトル化ファイルは、直線、弧、円から成り、紙面上の 機械製図に関する記述を生成している。スキャンされた機械製図は、まずRENDER というシステムで直線追跡、曲線合わせなどの技法を用いてベクトル化される。 しかしながら、この初期ベクトル化の結果は十分でない。本論文で議論された P-RENDERという後処理システムは初期ベクトル化の結果をさらに磨き上げて 、(原図と)全く同じ数の直線と弧を有する機械製図を再生する。 ダッシュ箇所をも検出し、生成する。大きなC-或はD-サイズの機械製図につい て、前記の洗練アルゴリズムはCADデータベースに適するサイズに縮小する。

Copyright(c) 1996 Academic Press, Inc.


PCB(プリント配線基盤)の自動検査アルゴリズムについてのサーベイ
Automatic PCB Inspection Algorithms: A Survey

Madhav Moganti, Fikret Ercal, Cihan H. Dagli and Show Tsunekawa

Computer Vision and Image Understanding, Vol.63, No.2, pp.287-313, March, 1996.

検査プロセスの重要性は、拡大の途を辿る一方であった。というのも、 現代における製造工程上の要求がそうであったためである。100% の品質保証を達成しようとする試みも、しばしばなされてきた。これ は、電子的な商品を大量生産するような製造設備においての話であり、 部品から組立部品・最終製品に至るまで、あらゆるものについての 100%の品質保証を達成しようとする試みである。このように、こ こ20年間以上にわたって、プリント配線の視覚的検査を自動化しよ うとする様々なアプローチが、報告されてきたのである。

本サーベイは、プリント配線基盤の自動検査について、そのアルゴリ ズムと技術について調べるものである。まず、これらのアルゴリズム を分類する上での分類木を示し、これに沿ってアルゴリズムのグルー プ化を行なう。ここでは、主として画像解析と欠陥検出のストラテジ を取り上げることとし、この両者についての最新技術をも含めるもの とする。さらに、商用のPCB(プリント配線基盤)検査システムに ついても簡潔にまとめる。

(Sz)

Copyright(c) 1996 Academic Press, Inc.


特徴の抽出を伴わないカメラ補正
Camera Calibration without Feature Extraction

Luc Robert

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.63,No.2,March,pp.314-325,1996

従来のカメラ補正技術は、 「画像中から点や線分、時には円錐の様ないくつかの特徴を抽出」し、 次に最適化のプロセスにおいて、 「3次元モデルを画像上に投影する射影パラメータを定める」 という2つのステップにより構成されていた。

しかしながら、連続する2つのステップで処理を行なった場合、 誤差がステップ間で伝搬することは良く知られるところである。 カメラ補正において、従来の手法で特徴の抽出の精度に問題があった場合、 その誤差は射影パラメータの算出に影響し、 最適化のプロセスで打ち消されることはない。

ステップ間の誤差伝搬の問題を避ける為に、 本手法では特徴抽出による中間表現を用いない 1ステップの新しいアプローチを用いる。

本手法では、 強度勾配の最大あるいはラプラシアンのゼロクロス点としての画像のエッジの のみに基づいて処理を行ない、複雑な特徴抽出による中間表現を用いない。 そのため、実用上インプリメントが容易であり、 さらには用いている中間表現のタイプ (点、線分、円錐など)に依存しないので、 入力画像中のオブジェクトの種類による影響を受けず、 頑健性が高いと言える。

本論文では、まず新しい手法を説明し、次にいくつかの例を用いて 従来の手法と本手法の比較を示す。 また、実データと人工的に作成したデータによって、 本手法の 収束性/初期状態の影響/信頼性/精度に関する特徴を明らかにする。

mNt

Copyright(c) 1996 Academic Press, Inc.


離散平面における凸状と直線性を「長さ」と「曲率絶対値の総和」によって 表す方法
Characterizing Digital Convexity and Straightness in terms of "Length" and "Total Absolute Curvature"

Kazuo Kishimoto

COMPUTER VISION AND IMAGE UNDERSTANDING Vol. 63, No. 2, March,pp.326-333,1996

デジタル幾何においては、連続空間とは違う難しさがある。 K.Kishimoto とM.Iriは、(Jpn.J.Appl.Math.6,1989,179-207)において 異方性のある「長さ」と「曲率絶対値の総和」を提案しており、 本論文ではそれをもって離散平面における凸状と直線性を 以下のように表す。

1.閉じたデジタル図形Fは、その輪郭の「曲率絶対値の総和」が2πで ある場合に、そしてその場合にだけ、凸状である。

2.デジタル弧s(F)は以下のどちらかの条件が成り立つ場合に、そして その場合にだけ、デジタル的直線である (a)s(F)の「曲率絶対値の総和」が0 (b)s(F)の「長さ」が"十分"に短い

この定義によって、連続の世界とデジタル(離散)の世界とが 結ばれることとなる。

Copyright(c) 1996 Academic Press, Inc.


輪郭の断片からの円弧の認識
Recognition of Partial Circular Shapes from Segmented Contours

Filiberto Pla

Computer Vision and Image Understanding, Vol.63, No.2, pp.334-343, March, 1996.

本論文では、輪郭の断片を用いて、隠蔽された部分をもつような円弧から円を 検出する方法について述べる。輪郭は曲率の微分にもとづいて分割される。曲 率が一定の断片をプリミティブとする。このプリミティブは、同じ円上にある と考えられる輪郭の断片相互の関係を明らかにするためのクラスタリングアル ゴリズムの入力となる。最小化条件によって、正確な円のパラメーター(中心座 標、半径)が求められるが、その能力は、円の輪郭線の半分以上が隠れていても 検出されたパラメーターの正確さが保たれるほどである。

この方法によって、円のパラメーターを評価するのに用いられた輪郭の断片を 再生させることができ、いくつかの実用的なアプリケーションに対して有用な 情報を提供することができる。

Copyright(c) 1996 Academic Press, Inc.


2値画像のチェイン符号化された輪郭の階層的な表現
Hierarchical Representation of Chain-Encoded Binary Image Contours

Jack Koplowitz and Joseph Deleone

Computer Vision and Image Understanding, Vol. 63, No. 2, March, pp. 344-352, 1996

チェイン符号化された輪郭の階層的な設計法を紹介する。 もし輪郭が2値画像の境界を表すなら、 画像の正確なデジタル化は高い解像度から低い解像度へ向かう ピラミッド構造として実現される。 我々の提案する新しい伝送システムは、もっとも高い解像度だけの輪郭の 伝送と同じビット数で、多解像度の画像を得られるように設計されている。

Y.A.

Copyright(c) 1996 Academic Press, Inc.


多重スケールMRF表現を用いた距離・輝度画像の再構築と境界検出
Reconstruction and Boundary Detection of Range and Intensity Images Using Multiscale MRF Representations

Bilge Gunsel, Anil K.Jain and Erdal Panayirci

Computer Vision and Image Understanding Vol. 63, No. 2, March, pp.353-366, 1996

フィルタリングにもとづく多重スケールの境界検出法において、根本的に 難しいのが、ノイズや、境界の形状が変わらないような重要でないエッジ の除去である。それらの方法では、入力画像をさまざまなスケールでぼか すことによって、ノイズや不要な細部を取り除いており、その結果、画像 の不連続箇所において位置の精度が落ちることになる。 本論文では、検出と局所化という目的が互いに相反してぶつかるのを防ぐ、 非線形多重スケール境界検出法を導入する。 対をなすマルコフランダム場(MRF)の多重スケール表現を用いた本方法を、 ベイズ的アプローチにもとづく統計的な正則化手法に対して適用している、 これにより、多数のスケールから同時に抽出される境界情報をロバストに 統合することができる。

この手法は、希薄なデータの他に輝度画像・距離画像にも適用でき、 フィルタリングにもとづく多重スケールの手法において主な問題となる、 エッジオペレータのサイズにも依存しなくなる。

Copyright(c) 1996 Academic Press, Inc.


曲線の軸
The Curve Axis

Doron Shaked and Alfred M. Bruckstein

Computer Vision and Image Understanding, Vol.63, No.2, pp.367-379, March, 1996.

本論文は、形状の中間軸の表現と極めて正確な骨格化アルゴリズム について述べる。この骨格化アルゴリズムは、多角形のようなパラ メータによって表現された形状に適している。 中間軸表現は、局所的境界特徴を計算するのに有効な方法として研 究されてきた。次に、軸らしい関数が本当に軸であるのかという問 題が扱われ、軸関数における2つの重要かつ、局所的に十分な制限 が得られた。提案された骨格化手法は、中間軸が系の1次微分方程 式の解となることに基づいている。新しい骨格化手法は、滑らかな 形状に対する軸の離散パラメータ的表現を定める。アルゴリズムへ の入力は形状境界のパラメータ表現となる。最後に、提案アルゴリ ズムによる骨格化の例を示している。

Copyright(c) 1996 Academic Press, Inc.


ベイズ確率の枠組での能動的格子モデル
An Active Lattice Model in a Bayesian Framework

Jean Michael Carstensen

Computer Vision and Image Understanding, Vol.63, No.2, March, pp.380-387, 1996

マルコフ・ランダム・フィールドが、変形可能な長方形格子の構造的なモデル として使用される。ベイズ確率の枠組で、事前確率として使用される時に、こ のモデルは、画像中の格子構造を推定するのに大変強力である。格子のゆらぎ と格子点の距離でペナルティーを与えることにより、規則正しい格子の状態へ の最大確率を得る。マルコフ・ランダム・フィールドは、格子構造についての 事前の知識を表現し、観測された格子点を合体させる観測モデルを通して、事 後確率から事実をシミュレートできる。シミュレーテッド・アニーリングによ って見つけられた最大事後推定は、再構築された格子として使用される。

このモデルは、遺伝子工学の実験の自動解析アルゴリズムの基本部分として開 発された。このアルゴリズムは、多くの画像での実験で良好な結果が得られ、 高速で精度が良く頑健性が高い方法である。また、いくつかの可能なモデルの 拡張についても述べている。

Copyright(c) 1996 Academic Press, Inc.


3次元の単純性テストのための一つのアルゴリズム
An Algorithm for a 3D Simplicity Test

Longin Latecki and C. Min Ma

Computer Vision and Image Understanding, Vol. 63, No. 2, March 1996, pp. 388-393

Keywords: digital geometry, thinning, digital topology

どの細線化(または、縮退)アルゴリズムも、点の消去条件のリストとして述 べることができる。もし、与えられた画像の点がこれらの条件の一つに合って いれば、その点は消去される。

(3次元の)細線化(または、縮退)アルゴリズムの設計を容易にする、すな わち、条件のリストをできるだけ短くするために、 どの条件も黒、白、don't-care(与えられた画像の黒か白のどちらの色にも対 応)の3つの色を使って記述している。 細線化アルゴリズムにより消去されるすべての点集合が、 点の順序付けにおいて、 どの点も、点列でのそれより前の点がすべて消去された後、 単純であるようにできるとき、また、そのときに限って、 その細線化アルゴリズムは連結性を保持する。 したがって、消去された点が単純であるかどうかを決定することが重要である。

本論文では、 3色で記述される任意の消去条件の単純性を決定するための、初めての3次元 アルゴリズムを示す。 このアルゴリズムは、記憶容量と処理速度において、効率的なものである。 したがって、連結性を保持する3次元の細線化(または、縮退)アルゴリズム の設計において、有用な道具となり得る。

(HN)

Copyright(c) 1996 Academic Press, Inc.


グラフのデジタル位相
Digital Topology on Graphs

D. Nogly and M. Schladt

Computer Vision and Image Understanding, Vol.63, No.2, March, pp.394-396, 1996

デジタル空間を表現できるグラフに関する位相づけについて、その可能性と不 可能性について論ずる。既知の8連結を保ちながらデジタル平面を位相付ける ことの不可能性に、新しい証明を与える。

Copyright(c) 1996 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.63, No.3

物体の切り出しと記述のための対称的構造のグルーピング
Grouping Symmetrical Structures for Object Segmentation and Description

Antti Ylae-Jaeaeski and Frank Ade

Computer Vision and Image Understanding, Vol.63, No.3, May, pp.399-417, 1996

本論文では、濃淡値画像から物体(またはその一部)を切り出し、その物体を 認識する方法について述べる。この方法では、エッジ画像から、対称的な形状 の対称軸による記述を抽出している。まず、二値エッジ画像の切片線形近似を 行なう。その結果、得られた線分のうちの二つから線分組(LSP : Linear Segment Pair)を作成し、その属性をいくつか計算する。これらの属性によっ て、記号的規則や粗いしきい値からLSPをリジェクトするか選択するかを決 められる。LSPは、付け加えられた属性や規則にしたがってまとめられ、最 終的に順序集合として表される。また本論文では、形状記述、物体認識、ステ レオ対応づけへの応用について述べる。この切り出しの方法は広く画像の分野 で有用である。例えば、ほぼ実時間に、三次元で重なりのある現実世界の物体 を操作可能なロボットビジョンに用いることができよう。

Copyright(c) 1996 Academic Press, Inc.


両眼視イメージフローからの多運動体の3次元的な動きと構造の復元
Recovering the Three-Dimensional Motion and Structure of Multiple Moving Objects from Binocular Image Flows

Wendong Wang and James H.Duncan

Computer Vision and Image Understanding, Vol.63, No.3, May, pp.430-446, 1996

複数の独立に運動する剛体の3次元的な動きと構造を、両眼視イメージ フロー場の解析を通して復元する、新しい方法を与える。 ステレオ画像対におけるまばらな特徴点組の位置と速度をアルゴリズム への入力とする。 入力データから結合した特徴点を分離し、これら特徴点のステレオ対応 を作成し、物体の3次元的な動きを決定することによって、一度に 一つの剛体を解析する。 解を求めるには、stereo-motionアルゴリズムにもとづく反復法を用いる。 このアルゴリズムは、J.H.Duncan, L.Li, W.Wang の"Recovering Three- Dimensional Velocity and Established Stereo Correspondence form Binocular Image Flows"(opt. Eng. 34(7), July 1995, 2157-2167)に おいて与えられた、一組だけの3次元運動成分を持つシーンの解析を 行なうアルゴリズムである。 本理論は、シーンの3次元構造に関して何らの拘束も課さない。 手法を確かめるため、計算機で生成した画像と実験室の画像系列についての 実験結果を示す。

Copyright(c) 1996 Academic Press, Inc.


両眼運動と空間的感覚の変化に伴う奥行きの知覚における誤差分析
Analysis of Error in Depth Perception with Vergence and Spatially Varying Sensing

HOSSEIN SAHABI AND ANUP BASU

Computer Vision and Image Understanding, Vol.63, No.3, May, pp.447-461, 1996

ステレオビジョンでは3次元の点の奥行きは左右の画像への投影された 場所により推定される. カメラから得られた画像平面は離散的ピクセルにより構成される. この画像の離散化によって,3次元の点の奥行きの推定が 不確定なものになる. 本論文では両眼運動および奥行きの推定誤差における解像度の 空間的変化の効果ついて述べる. まず始めに,単一の解像度のステレオ画像の組が用いられたときの 両眼運動について調べた. 次に人間に似たステレオシステムの問題について研究した. このシステムではカメラの真中の解像度が高く,周囲に近づく につれて非線型に解像度が悪くなっていく. 本論文では奥行き推定の誤差のみについて述べており,ステレオマッチ ングはすでになされているものとする.

Copyright(c) 1996 Academic Press, Inc.


ホップフィールド型ニューラルネットワークで制御されたボロノイ・ピラミッ ド
Voronoi Pyramids Controlled by Hopfield Neural Networks

Etienne Bertin, Horst Bischof and Pascal Bertolino

Computer Vision and Image Understanding, Vol.63, No.3, May, pp.462-475, 1996

本論文では不規則なピラミッド構造の新しい構成法について述べられている。 本方式の優れた点は2つある。 (1)オリジナル画像の画素レベルから処理を開始する代わりに、最初に画像に 適応的なボロノイ曲線を当てはめる。この利点は画素レベルを使用するのに比 べてピラミッド構造の最下位レベルのセルの数が減少することである。 (2)不規則なピラミッド構造に対して動作の重みを制御できるホップフィール ド型のニューラルネットワークを使用する。ホップフィールド型ネットワーク の動作の重みを制御することは、そのまま適応型ピラミッドの考え方に通じる。

このアプローチの妥当性はイメージセグメンテーションのいくつかの例で示さ れる。

Copyright(c) 1996 Academic Press, Inc.


境界検出アルゴリズムの性能評価基準
A Performance Measure for Boundary Detection Algorithms

P.L. Palmer, H. Dabis, and J. Kittler

Computer Vision and Image Understanding, Vol.63, No.3, May, pp.476-494, 1996

本論文は中間グレーレベル値の異なる領域間の境界及び境界モデルを検出す るアルゴリズムの性能を比較することについて論ずる。このような評価基準の 有用性は異なるアプローチの比較に限らず、自己最適化の画像処理システムの 構築に一つ重要なステップを提供し、このシステムの各レベルでのアルゴリズ ムのパラメータを自動的に調節して、性能を改善する。 我々はまずこの性能基準の一般事項について述べる。次に、この性能基準の 理論的な枠組を提示する。この性能基準の有用性を示すために、直線の境界を 検出するある3段階中間レベル画像システムの性能を評価する。このシステム の出力の特徴付けに用いられている評価基準の能力をテストするために、合成 画像(画像の各点の性質が分かっている)および実画像を使用した。

Copyright(c) 1996 Academic Press, Inc.


同一平面上の特徴点を用いた繰り返し型姿勢推定
Iterative Pose Estimation Using Coplanar Feature Points

Denis Oberkampf, Daniel F.Dementhon, and Larry S.Davis

Computer Vision and Image Understanding, Vol.63, No.3, May, pp.495-511, 1996

本稿では、同一平面上にある4つもしくはそれ以上の特徴点を用いて、 既知の対象物に関する1台のカメラの位置と方向を求める新しい方法 について述べる。 この方法は、正しい投影近似の測定に始まり、二つの異なる姿勢推定を 得るまで繰り返しこれを精緻化し、各姿勢の関連品質測度を与えるもので ある。 カメラの距離が対象物の奥行きに比べて遠い場合、あるいは画像のノイズ のために特徴点抽出の精度が低い場合には、二つの姿勢に対する品質測度 は類似したものとなり、二つの姿勢推定結果は利用可能な情報の信頼でき る解釈となる。 これとは対照的に、既知の方法は同一平面上の四点の閉じたフォーム姿 勢解決法を用いるのだが、画像にノイズがあって対象物が離れている場 合に頑健ではない。というのは、その方法が二つの姿勢のうち一つのみ を提供するからであって、しかも誤った方が選ばれるかもしれないから である。

Sz

Copyright(c) 1996 Academic Press, Inc.


確率的ハフ変換における逐次解析を用いた適応制御の構築
Deriving Stopping Rules for the Probablistic Hough Transform by Sequential Analysis

D.Shaked, O.Yaron, and N.Kiryaati

Computer Vision and Image Understanding, Vol.63, No.3, May, pp.512-526, 1996

ボーティング(voting)の代わりにポーリング(polling)を用いることで、 ハフ変換における計算量を大きく減らすことが出来るのは周知の事実である。 ポーリングでは、データの一部分をランダムに抽出し、入力として用いる。 ポーリングを用いる確率的ハフ変換では、 入力するデータの数によってその性能が左右される。 (多くの数の入力データを用いるほど精度は良くなるが、処理時間が長くなる。)

多くの場合、確率的ハフ変換では入力データの数を固定とするが、 その固定の入力データ数が最適な値になっていることは稀である。 なぜならば固定の数の入力データを用いる場合に エラーを常に所望の値より小さくする為には、 平均的な状態でエラーを所望の値より小さくする為に必要な入力データの数よりも 多くの数の入力データを用いる設計にする必要がある。

最近の実験では、ボーティングの適応制御によって 平均入力データ数に対する エラーの比率を改善出来ることが示されている。 しかしながらそれらの実験においては理論的な基礎が欠落しているので、 性能の一般的評価と適応制御の最適な設計が行なわれていない。

本論文では逐次仮説検定の統計理論 (the statistical theory of sequential hypotheses testing ) を用いて、 確率的ハフ変換における適応制御解析と開発における理論的な枠組を構築した。 また、実画像と合成画像において提案手法の性能を確認した。

mNt

Copyright(c) 1996 Academic Press, Inc.


2次元および3次元データの当てはめのための合成超2次関数モデル
A Hybrid Hyperquadric Model for 2-D and 3-D Data Fitting

Isaac Cohen

Computer Vision and Image Understanding, Vol.63, No.3, May, pp.527-541, 1996

Keywords: data fitting, hyperquadric

曲線および曲面の新しい陰(implicit)モデルを提案する。 これは超2次関数(Hyperquadric)をベースとしており、 局所的にも大局的にも形状の制御が可能であり、 扱える形状の種類の幅が広い。 大局的な形状モデルにおけるいくつかの局所的な属性 によって合成超2次関数モデルを定義する。 我々のモデルの長所は、ユニークな陰方程式によって局所的および大局的な 属性を記述するところにある。 つまり、(選択した数的解法によらず)パラメータによって形状の表現を 生み出している。 データの当てはめは、データ非依存なように形状の陰表現をモデル化したうえ で、エネルギー最小化によって行なう。 超2次関数の幾何的性質と、その陰方程式をわずかに修正した場合の形状が どのように変形するかについて考察することによって、 陰表現に適切な項を加える。そしてこれにより、 自動的によりフィットさせるアルゴリズムを定義することができる。 この幾何的アプローチは、データ点の有効な記述と、望みの精度でフィットを 自動調整することを可能とする。

Copyright(c) 1996 Academic Press, Inc.


最尤立体視アルゴリズム
A Maximum Likelihood Stereo Algorithm

Ingemar J. Cox, Sunita L. Hingorani, Satish B. Rao and Bruce M. Maggs

Computer Vision and Image Understanding, Vol.63, No.3, May, pp.542-567, 1996

本論文では、最尤コスト関数を最適化する立体視アルゴリズムについて述べる。 最尤コスト関数は、左画像と右画像での特徴点の対応づけが共通の真の値のま わりに正規分布していることを仮定し、二つの特徴点が適合しているとした場 合の重みつき二乗誤差、いいかえれば特徴点が隠れていると決定した場合のコ ストから成る。この立体視アルゴリズムは、順序と一意性の制約のもとにコス ト関数を最大にする対応点の組を検出する。また、プリミティブのマッチング には無関係である。しかし、本論文で述べる実験では、マッチングは個々の画 素強度において行われる。広く考えられていることとは反対に、画素に基づく 立体視は種々の画像に対してロバストであると思われる。また、

(1)密な不整合マップの提供、

(2)特徴抽出が不要、

(3)領域間の相関に基く方法のような最適なウィンドウ設定の問題の回避、

といった利点をもつ。特徴抽出やウィンドウ設定が不要であるから、アルゴリ ズムは非常に速く実行できる。実験結果によって、良好な立体視の対応点が、 順序と一意性という制約のみを用いて、すなわち局所的ななめらかさという制 約なしで検出されることが明らかになった。しかしながら、もともとの最尤立 体視アルゴリズムには多数の最小値を示してしまうことが見受けられる。動的 計画法のアルゴリズムは一つだけを検出することが保証されているが、必ずし も各エピポーラ走査線ごとに同じものを検出するわけではなく、隣接する走査 線間に小さな局所的な差が現れ、誤った対応点が生じる。伝統的に、もともと のコスト関数を修正するような正則化は、多数の最小値というような問題に対 して適用されてきた。我々は、古典的な正則化を避ける一方、いくつかの大局 的な結合性という制約を与えることで、いくつかのアルゴリズムを開発してき た。この方法は、解がもともとのコスト関数を最小にし不連続性を保存するこ とを保証するという利点をもつ、新しい手法であると我々は考えている。その 制約は、隣接するエピポーラ線の間、またはエピポーラ線に沿って、水平方向、 または、垂直方向の不連続の合計を最小にすることに基いており、局所的平滑 化を避けられる。実験では、水平方向と垂直方向の不連続の合計を最小にする と最も正しい結果を与えることがわかった。正しい適合の割合が高く、濃淡値 の不連続という不鮮明さがほとんどない。もう一つ、対応づけのあいまいさを 減らすための結合性という制約を課することとは二つ以上のカメラを用いるこ とである。ゆえに我々は二つのカメラに対する最尤法をN個のカメラに拡張す る。N個のカメラによる立体視アルゴリズムは、与えられた二つのカメラの組 の間の対応づけの中で最も良い対応づけを与えるカメラの組を決定する。その ようなカメラの組は主カメラと呼ばれる。カメラの相対的な位置に関する知識 により、三次元空間の点を、残りの(N−2)個のカメラの画像上に投影され た主カメラでの二つの特徴点の対応づけによって仮決定できる。これら(N− 2)個の点は、その後仮決定された適合を立証するために用いられる。アルゴ リズムが主カメラの特徴点間の隠れを明示的にモデル化するだけでなく、加え られた(N−2)枚の画像上の隠れの可能性をもまたモデル化される。従来の 研究では、この隠れの過程をモデル化しておらず、その有益性と重要性は実験 的に立証される。他の複数の画像からの立体視アルゴリズムのように、この方 法の計算コストとメモリーコストは画像の数に比例して増加する。二枚の屋外 の風景画像に対する実験結果を示す。明らかに、カメラまたは画像の数が増え るにつれて、対応づけ誤りの数が減少することがわかる。

Copyright(c) 1996 Academic Press, Inc.


2値変換に基づいた3次元デジタルトポロジーと応用
3D Digital Topology under Binary Transformation with Applications

P. K. SAHA AND B. B. CHAUDEIURI

Computer Vision and Image Understanding, Vol.63, No.3, May, pp.418-429, 1996

本論文ではある物体の点から物体でない点への変換やその逆の変換に基づいた 3次元デジタルトポロジーについて研究する。 このような変換の結果として、影響を受けた点の3x3x3近傍にある物体の ある部分は消えるか、2つ以上の部分に分割されるか、 または物体の2つ以上の部分が、1つにマージされるかもしれない。 また3x3x3近傍にある、くぼみやトンネルがなくなるかも知れないし、 生成されるかも知れない。 本論文の目標の一つは、変換点の3x3x3近傍の多くの物体の部分やトンネルやくぼみ の変換を計算する効果的なアルゴリズム(topo_para)を開発することである。 他の重要な貢献は3次元デジタル画像の表面の骨格表現の 点のタイプの分類(例えば、弧の内部の点、弧のエッジの点、表面の内側の点、 表面のエッジの点、など)と接合点のタイプの検出(例えば、弧同士の接合点、 表面と弧の接合点、表面同士の接合点、など)である。 これらの接合点を使うことで、3次元表面を意味のある部分にトポロジカルに 分割することが可能である。 また、topo_para によって計算したトポロジカルなパラメータを使って 3次元のデジタル画像のオイラー数を計算する効果的なアルゴリズムについても 述べる。

Copyright(c) 1996 Academic Press, Inc.


サーベイ:画像解析とコンピュータビジョン:1995
SURVEY: Image Analysis and Computer Vision: 1995

AZRIEL ROSENFELD

Computer Vision and Image Understanding, Vol.63, No.3, May, pp.568-612, 1996

本論文はコンピュータビジョン、画像解析に関係する1550件以上の 論文のサーベイを紹介する。 対象としている分野は、計算技法、特徴の抽出とセグメンテーション、 画像とシーン解析、2次元形とパターン、カラーとテクスチャー、 マッチングとステレオ、3次元復元と解析、 3次元モデル・理解、動き解析である。 関連する分野についてもいくつかの論文を紹介する。 応用の他に、幾何学とグラフィック、圧縮と処理、センサーと光学、 透視投影、ニューラルネットワーク、人工知能、パターン認識などである。

Copyright(c) 1996 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.64, No.1

隠蔽面の知覚的補完
Perceptual Completion of Occluded Surfaces

Lance R.Williams and Allen R.Hanson

Computer Vision and Image Understanding, Vol.64, No.1, July, pp.1-20, 1996

コンピュータビジョンの研究者はこれまで主に、はっきり見える環境 構造の視覚再構成の問題を研究してきた、本論文では、視覚再構成に ついての従来の目標を一般化して、前に向いている面は見えていても 隠れていても、両方とも扱うようにする。 この、より大きな範囲の環境を前部面(anteior surface)という。 複数の前部面が重なったところでは、一つの画像上で近傍に映ってみえるので、 "shape-from"手法が前提とするように、面が近いことと画像上で近い ことが1対1に対応するという保証はない。 その結果、三次元シーン構造のトポロジーはもはや明らかでなく、 画像輪郭から推測するしかない。 本論文では、前部面の境界が観測者を中心とする座標系において ラベルづけ結び目グラフ(labeled knot-diagram)として表されることを示す。 境界が隠れなかったり、面の反射率が背景のそれと異なる場合には、 境界は画像輪郭によって追跡できるだろう。 しかし、境界が隠れていたり、面の反射率が背景と一致している場合 には、画像中で輝度変化は検出されないだろう。 このような条件下で前部面の境界の完全なトレースを推測することを 図形補完(figural completion)問題と呼ぶ。 もっと具体的に言うと、画像の輝度境界を表す輪郭の一部から、前部 面を表すラベルづけ結び目グラフを計算する問題を調べる。 モデルの検証は様々な架空の輪郭表示について行なう。 実験系は補完仮説と結合最適化という二段階の過程からなる。 ラベリングの手法は整一次不等式系の制約を受けるので、 整一次プログラムの最適で実行可能な解が最終的な構成となる。

Copyright(c) 1996 Academic Press, Inc.


同一直線上にある点を用いた画像の動きからの Egomotionの計算とIndependent Motionの検出
Computing Egomotion and Detecting Independent Motion from Image Motion Using Collinear Points

Niels Da Vitoria Lobo and John K.Tsotsos

Computer Vision and Image Understanding, Vol.64, No.1, July, pp.21-52, 1996

本論文では新しい拘束(点が同一直線上にある拘束)について述べ, 分析を行なう.この拘束は画像の動きの計算と(画像の動きから)独立し た物体の動きの検出に用いられる. その拘束によって観測者の回転を無効にする簡単な方法が得られ,一方同時 に,T.F.O.E. (Translational Focus of Expansion) の位置が明らかになる. また、この拘束は非常に少ない計算量で独立な動きを検出できる.

Copyright(c) 1996 Academic Press, Inc.


移動した多角形の重なり部分についての考察
On the Area of Overlap of Translated Polygons

David M.Mount, Ruth Silverman and Angela Y. Wu

Computer Vision and Image Understanding, Vol.64, No.1, July, pp.53-61, 1996

平面上に2つの単純な多角形 P, Q と移動ベクトル t が与えられ、Q が t だ け移動したものと P との重なりを表す関数は、モーションプランニングや物 体認識の多くの例で考慮しなければならない。本論文ではこの関数に関するい くつかの数学的な結果を述べる。また、この関数の表し方を計算する方法と一 定の重なり部分の輪郭曲線を追跡する方法の効果的なアルゴリズムを述べる。

Copyright(c) 1996 Academic Press, Inc.


隠れ輪郭線からの大域3次元表面の再構築
Global Three-Dimensional Surface Reconstruction from Occluding Contours

Changsheng ZHAO and Roger MOHR

Computer Vision and Image Understanding, Vol.64, No.1, July, pp.62-96, 1996

本論文は移動カメラから取った画像系列から非多面体の3D表面を再構築す る問題を取り上げる。我々は3D規則化した均一双立方B-スプライン表面斑点 からその表面を再構築する直接の方法を提案する。この再構築は視線をその表 面上に移動するときの隠れ輪郭線の動きを観察することによって実現される。 視線がその表面に到達できない完全な凹形部品を例外として除いて、カメラ の動きが分かれば、3D表面の再構築は可能であることをこの論文で示す。あ る物体の3D表面を構成するある重なっているB-スプライン表面斑点の集合を 再構築できたら、我々が開発した方法でそれらを効率良く融合し、全体の表面 を得ることができる。この方法は、3D三角形メッシュと規則化した均一双立 方B-スプライン表面の補間に基づいている。 この方法は以下の点で従来の方法と異なっている。まず、この問題を2D画 像中の輪郭の平滑化の代わりに、3D表面の規則化として捉えることにある。 次に、我々は、小さい局部斑点から全体の表面を修復することを提唱している ことである。以前の著者達はこの表面のある局部的な性質(例えば、3D形状 の位置と表面の湾曲度合の推定)の修復にしか考えいなかった。 合成データと実データの実験結果を提示する。

Copyright(c) 1996 Academic Press, Inc.


選択可能な品質からなる3次元構造の翻訳カメラを用いた高速抽出法
High-Speed Extraction of 3D Structure of Selectable Quality Using a Translating Camera

run K. Dalmia and Mohan Trivedi

Computer Vision and Image Understanding, Vol.64, No.1, July, pp.97-110, 1996.

本稿では、制御可能な解像度、フィールドの奥行き及び精度からなる3次 元構造を抽出する計算的アプローチについて述べる。ここで、すべての情 報はリアルタイムの速度で利用可能であるとする。 このアプローチは、動的に制御される一台のカメラを用いて取得される画像 ストリームについての空間的かつ時間的な勾配(gradients)を用いている。 個別のタスクの要求に依存して、解像度、フィールド奥行き及び精度を制御 するための適切なパラメータと画像ストリームの幾つかのフィールドが選ば れる。ここでパラメータというのは、例えば求められた差異値、カメラのフ レーム間の置換などである。 パイプライン・アーキテクチャーに基づくプロセッサのうえで、画像ストリ ームの取得と処理は、リアルタイムで実行される。

このシステムの精度、フィールド奥行きと解像度の制御性について示し、 さらに様々なシーンについてうまく動作する能力があることを示すため に行なわれた大規模な実験についても述べる。 このシステムは、画像の取得と処理の間に待ち時間がまったくない状態で 動作するのである。 これらの実験において、画像の取得と処理にかかる全体の時間は、 0.27秒から1.56秒の間にある。 奥行きの精度は、85%から92%である。

Sz

Copyright(c) 1996 Academic Press, Inc.


3次元表面の復元における画像情報と幾何学情報の融合の効用
Taking Advantage of Image-Based and Geometry-Based Constraints to Recover 3-D Surfaces

P.Fua and Y.G.Leclerc

Computer Vision and Image Understanding, Vol.64, No.1, July, pp.111-127, 1996

3次元形状の復元において 画像情報と幾何学情報は統一された骨組みを用いることで結合することが出来る。 画像情報はステレオおよび shape-from-shading と同種のものであり、 一方、幾何学情報は3次元空間上の点や3次元特徴や2次元の射影の形態で 与えられるものである。

複雑な表面の形状を復元するのに、形式的に統合された骨組みは重要な役割を担う。 なぜならば1つの情報源から、物体の表面形状の表現について 単一の解を得ることは困難な場合が多いからである。

我々は形状復元に対して、目的関数の値が小さくなるように 表面の3次元表現を変形させるアプローチを取った。 この目的関数は異なる情報源の加重和であり、 それぞれの重みはそれぞれの情報の貢献度に応じて定められている。

本論文では形状の復元に用いた情報と 目的関数におけるそれぞれの情報に対する重み付けの手法と 目的関数の最適化の手法について述べると共に 1つの情報源のみを用いた場合には解決不可能な 処理が困難な多くの実画像に対する結果を示す。

mNt

Copyright(c) 1996 Academic Press, Inc.


カメラ未調整状態における動き方程式の1次拡張
The First Order Expansion of Motion Euations in the Uncalibrated Case

T. Vie'ville and O.D.Faugeras

Computer Vision and Image Understanding, Vol.64, No.1, July, pp.128-146, 1996

Keywords: motion equation

本論文では、連続するシーンにおける構造と動きを、カメラの調整の ない状態(Uncalibrated)において求める方法について述べる。 まず最初に、カメラの調整(キャリブレーション)と、硬直的な動きと、 シーン構造を定義する式を決める。 そして、平面構造という特殊なケースも含んで、2フレーム間の離散的 置換を考慮しながら、動き方程式と、それより求めた構造と、 深さ移動の式を見直す。 次のステップでは、これらの式の1次の拡張と、関連した微小量の識別 性の解析を行なう。 これらの式が離散空間においても完全に同等であることを示す。 しかし、微小置換の場合においては、 この置き換えの投影は、動きの回転要素から明確に分離される。 これは本方式の長所でありこれを利用することで、 回転不均衡が再帰的に解消される。 これは式の解析の以下のような異なる局面を単純化する。 すなわち、動き方程式からの構造、あいまいさの解析、そして動き方程式の 幾何的解釈である。 このメカニズムを異なるセットの実画像でテストした。 離散モデルと連続モデルを比較し、シーンの射影からの再構築を示した。

Copyright(c) 1996 Academic Press, Inc.


三次元表面追跡アルゴリズム
A 3D Surface Tracking Algorithm

Xiaoqing Qu and Xiaobo Li

Computer Vision and Image Understanding, Vol.64, No.1, July, pp.147-156, 1996.

本論文では、立体的なエッジデータを表面モデルに変換する、三次元表面追跡 アルゴリズムについて述べる。三次元モデルの生成法としては、立体素の強度 値データのしきい値処理に基く方法や、多数のエッジ立体素の層から表面を追 跡する方法があるが、前者は非一様な照明に敏感であり、後者は境界の抽出に 時間がかかる経験的手法が用いられているため、そのような方法を用いるには、 膨大な探索空間が必要になることが障害となっている。我々のアルゴリズムで は、エッジ立体素から直接表面モデルを構築する。立体素は、そこでの二次微 分が負で、隣接立体素と傾きの方向の符号が変化するならば、その表面上にあ るとみなされる。この定義により、一つの表面立体素の層のみが存在でき、追 跡アルゴリズムは単純な幅優先探索となる。さらに、表面立体素の決定は、傾 きの方向に敏感ではなく、この方法はノイズに対してロバストである。また、 実データに対する実験結果についても報告する。

Copyright(c) 1996 Academic Press, Inc.


ラベル付けされたランダム場のエネルギー最小配列の探索としてのグルーピング
Grouping as a Searching Process for Minimum-Energy Configurations of Labelled Random Fields

VITTORIO MURINO CARLO S. REGAZZONI, AND GIAN LUCA FORESTI

Computer Vision and Image Understanding, Vol.64, No.1, July, pp.157-174, 1996

エッジに基づいて記述されたプリミティブをグルーピングする、 2つのレベルの確率論的な方法を紹介する。 低いレベルでは、関係グラフを得るために、直接ハフ変換に基づいた 投票機構が用いられる。 この関係グラフのノードはエッジ画像から抽出された線分の集合に対応する。 ノードは抽出された線分の幾何学的な関係(例えば、平行である、 同一直線上にある、収束する、など)によってリンクが張られる。 高い方のレベルでは、グルーピング処理は 各ノードにラベルを振り分けることより成る。 同じラベルのノードの部分集合は切り出すグループと一致するとみなされる。 ラベルの全ての提起された配列の良さを評価する尺度として、 非線形なコスト関数を用いる。 この尺度はギブス分布から導かれる場の配列の確率に関係する エネルギー関数と解釈することができる。 これは、マルコフランダム場(MRF)としてのラベルグラフのモデリングに対応している。 エネルギー関数は、正確な幾何学的な意味をもった局所的な項の 相互作用によって定式化される。 ラベルつけされたMRFは多重近傍系(multiple neighborhood system)と 多重cliqueによって特徴づけられる。 最善のラベルの配列を探すために、疑似アニーリングアルゴリズムを用いた。 この方法をたくさんの様々な実画像に対して実験を行ない、 その結果は提案した手法の能力を示している。

Copyright(c) 1996 Academic Press, Inc.


3D形状の平面および曲面対称性の距離画像からの検出
Detecting Planar and Curved Symmetries of 3D Shapes from a Range Image

Yoshinobu Sato and Shinichi Tamura

Computer Vision and Image Understanding, Vol.64, No.1, July, pp.175-187, 1996

本論文では3D形状の鏡面対称性の検出問題について述べる。あらゆる向き からの3D形状データを処理する従来の手法と違って、本手法は一つの 視点からみた一枚の距離画像を使う。 また、大局的な対称性だけでなく局所的な対称性の検出にも適用できる。 本手法は二つの段階からなり、最初にハフ変換を用いて対称平面の候補を 初期推定する。ハフ変換によって集められる局所部分として、隠蔽を起こす 輪郭点と面上の点の間の点対により決定される局所対称点を用いる。 次に、反復重みづけ最小2乗法を適用して最大値でないものを抑制し、 パラメーター値を改善していく。 本手法はさらに平面の他に曲面対称性を抽出するように拡張され、 ここでは二種類の拡張法を提案する。平面のフィッティングのかわりに 2次関数でフィッティングするものと、平滑化局所的対称性の3D拡張を表す 平滑化局所的面対称性を抽出するものである。 人工および現実の距離画像についての実験結果を示す。

Copyright(c) 1996 Academic Press, Inc.



Computer Vision and Image Understanding (Academic Press) Vol.64, No.2

多重射影視野幾何のための標準表現
Canonical Representations for the Geometries of Multiple Projective Views

Q.-T. Luong and T. Vieville

Computer Vision and Image Understanding Vol. 64, No. 2, September 1996

本論文は(画像の)運動とステレオ解析に関するものであり、更正されていない カメラの多重視野処理に有効な新しい統一された表現方法を提示する。 情報の可用性によって、情報を数レベルで考慮する。 それ以外に、次のことをも紹介する: N個の視野のepipolar幾何学の代数的記述、カメラ の自動焦点測定の枠組み、焦点測定の更新、ズーミングしながら移動して撮った画像 系列の運動からの構造抽出。

ここで、二個または三個の一般射影行列に対する、標準分解(canonical)という 特殊分解を提示する。この分解によって、与えられた変換の組に対して不変である カメラシステムの幾何学的な記述が可能になった。 これらの表現はもっとも簡潔であり、かつ、考えられる各記述レベルの特性を完全に 把握できる。ここでいう特性とは、互いに関連しているEuclid的なもの (明白に区別 していた焦点測定に関するもの、と運動から構造抽出に関するもの)、アフィン、 および射影である。

最後に、周知の基本マトリックスの分解が得られた。 三つまたはそれ以上の視野が取得可能な場合に現れた依存性については、標準分解 を用いて調べ、新しいの結合数式を確立した。この理論は実画像を用いて分かりやすく 解説した。

LXP

Copyright(c) 1996 Academic Press, Inc.


レンジ画像における対象物の部品の検出
Finding the Parts of Objects in Range Images

Andre Lejeune and Frank P. Ferrie

Computer Vision and Image Understanding Vol. 64, No. 2, September 1996

Keywords: key-words

視覚パターンの解釈における一つの主要な問題は、形状の分割において、 分割後の構成要素が対象物の部品に対応するような、そうした分割 を行うことにある。

本稿が示すのは、レーザによる距離検出システムを用いて得られる 一組の表面推定をそうした部品に相当する部分集合へと分割する方 法である。 各部品の定義は、特徴集合によって陰的になされる。ここで特徴集 合というのは、外部的な手段によって計算された部分境界仮定を同 定するものである。 ここで取られる戦略は、表面に関する二つの相互補完的な表現を利 用するというものである。すなわち、一つは、局所構造を異なる特 性において記述するもの(エッジ、線、輪郭など)であり、いま一 つは表面を表現するものであって、異なるスケールでの滑らかなパ ッチの集まりを用いるものである。 これら二つの表現の間の解釈に首尾一貫性を課することにより、効 率的でかつまた堅固な分割アルゴリズムを求めることが可能である ことが示される。 一群の距離画像に対する性能の実例が示される。

Sz

Copyright(c) 1996 Academic Press, Inc.


構造的記述と幾何・統計的変換を統合した形状認識
Shape Recognition by Integrating Structural Descriptions and Geometrical/Statistical Transforms

Hirobumi Nishida

Computer Vision and Image Understanding, Vol. 64, No. 2, September 1996

Keywords: shape matching, character recognition, shape analysis, structural descriptions, affine transform

手書き文字認識システムの研究・開発における主な難しさは、 変形の多様さである。 手書き文字のような複雑な対象を認識するための鍵は、 変形量の定量的推定とともに、変形に強い形状記述にある。 本論文では、Nishida and Mori (1992) による構造的記述をもとにして、 手書き文字のための形状マッチングのアルゴリズムと形状変換の解析と記述の 方法を提案する。 対象は変形に強い定性的・大局的構造によって記述され、 その記述と予め構築されたモデルとの整合をとる。 対象とモデルの間の構成要素の対応をもとにして、 幾何・統計的変換を推定し、その推定をもとに認識や拒絶の判定が下される。 構造的記述と幾何・統計的変換が体系的に統合される。

オフラインの手書き数字認識とオンライン手書き認識について、 実験結果を示す。

HN

Copyright(c) 1996 Academic Press, Inc.


デジタル凸輪郭における線分の対称性
Line Symmetry of Convex Digital Regions

Julia Jean Robinson

COMPUTER VISION AND IMAGE UNDERSTANDING Vol. 64, No. 2, September 1996

本論文ではユークリッド平面上において、 S個の離散点が与えられた場合に、 S個の離散点から構成される凸画像が線対称であるか否かを判定する アルゴリズムを2つ提案する。

それぞれのアルゴリズムについて計算量(time complexity)と 計算に必要なメモリ量(space complexity)を正確に見積もったところ、

アルゴリズム1:計算量は O(N3 log3 N) ,必要メモリ量 O(N3 log N)

アルゴリズム2:計算量は O(N4 log2 N) ,必要メモリ量 O(N log N)

であった。

mNt

Copyright(c) 1996 Academic Press, Inc.


ペントランドの光源方向推定器改良版を使用した 色情報からの方向付け問題の直接解法
Direct Solution of Orientation-from-Color Problem Using a Modification of Pentland's Light Source Direction Estimator

Mark S. Drew

Computer Vision and Image Understanding, Vol.64, No.2, September 1996

一様な色のランベルティアン(Lambertian)面が 方向や強さが未知の光源点の集合や延長方向の光源や反射などによって 照らされているのであれば, 照明は該面からの方向でスペクトル変化を生じ, また該面の法線は,色空間上の点へのロバストな回帰を使って 直交変換となるように復元される.

最近,この未知の直交変換が, 復元された法線の積分可能条件を適用することで復元され得ることが 示された. しかし,この積分可能性法は 避け難い凹凸のあいまい性という結果を生む. ここでもっとシンプルな方法がこのあいまい性を解消できる. ペントランドの方法またはそれに類似したRGB各チャンネルにおける 傾き検出方法を使用することで, 3つの光源の組合わせとして扱うことができるようになり, ロバストな回帰によって3光源の偏りに関する3つの制約 が導かれる. 色空間逆変換によって3光源の偏り状況が導かれる. この結果,光源の方向を正確に求めることができ,それゆえ該面の法線も 求まる. 実画像における該アルゴリズムの性能を自己評価する機構を採り入れた.

Copyright(c) 1996 Academic Press, Inc.


高速なノイズ分散評価法
Fast Noise Variance Estimation

J.Immerkaer

Computer Vision and Image Understanding, Vol.64, No.2, pp.300-302, September, 1996.

本論文では,画像のゼロ平均加算ガウシアンノイズの分散を評価する,速く 単純な方法について述べる.この方法は画像の中でノイズの分散が変化して いるようは状況で,ノイズの分散を局所的に評価するのにも用いられ得る.

必要なのは3×3のマスクと画像中にわたって,もしくは隣接画素の範囲で の加算のみである.1画像,もしくは1つの局所領域につき,全部で14の 整数演算が必要である.本手法は,ノイズの分散が広値域をとるときに有効 である.しかし,コントラストの高いテクスチャー画像や領域では細い線を ノイズとしてしまうことがある.

Copyright(c) 1996 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.64, No.3

形状と画像の幾何学的な熱方程式と非線形拡散
Geometric Heat Equation and Nonlinear Diffusion of Shapes and Images

BENJAMIN B. KIMIA AND KALEEM SIDDIQI

Computer Vision and Image Understanding, Vol. 64, No. 3, November, pp. 305-322, 1996

視覚情報処理では低い解像度から高い解像度へと 形状や画像の階層的な表現を必要とすることが多い。 ガウシアン平滑化、異方性拡散(anisotropic diffusion)、 正則化などの線形や非線形の多くの平滑化の手法が提案され、 尺度空間表現に用いられている。

本論文では形状や画像の局所的な曲率に基づいた幾何学的な平滑化 の方法を提案する。 曲率による変形や幾何学的な熱方程式は文献[41]で提案されている 反作用拡散(reaction-diffusion)の特殊な場合である。 形状に対しては、手法は伝統的な熱方程式を用いた平滑化と類似しているが、 微小な各段階の弧の長さによる再正規化を用いる。 画像に対しては、平滑化は異方性拡散に類似しており、 明るさの傾きの方向では拡散の成分は0なので、エッジの位置はそのままである。 形状に対する曲率の変形に基づいた平滑化はたくさんの望ましい特性がある。 すなわち、inclusion orderを保持する(離れている曲線をつながない)、 新しい変曲点を生成せずに端点と変曲点を無視できる、 曲率の総計を減少させる、局所的な反復計算を可能にする半群特性を満たす、 などである。 曲率の変形に基づいた画像の平滑化は、 画像をそれぞれ曲率によって平滑化された同じ輝度の集合として 見ることに基づいている。 これらの平滑化されたレベルの集合を、平滑化された画像に再び組み立てること は多くの数学的な特性に従う。 形状を平滑化することから画像を平滑化することへ拡張することは 数学的に妥当であることが多くの最近の結果で示される。 これらの結果の一般化は 形状に対する完全なエントロピー尺度空間を画像に対して拡張することが 正しいことを示す。 そしてそれぞれの同じ輝度レベルの曲線は 定数と曲率の変形の組み合わせによって変形される。 この手法をインプリメントし、いくつかの医療画像、航空写真、距離画像など で検証した。

Y.A.

Copyright(c) 1996 Academic Press, Inc.


信頼度を用いたFOEの直接計算
Direct Computation of the FOE with Confidence Measures

Shahriar Negahdaripour

Computer Vision and Image Understanding Vol.64, No.3, November, pp.323-350, 1996

"focus of expansion"(FOE) の位置を得るための直接的な方法を 提案する。そのベースは、画像から領域を選択し、それぞれの領域で シンプルな計算を並行させるというものであり、各領域は推定された FOEのまわりを囲む円形の区画になっている。 推定FOEから真のFOEへの方向はシンプルな計算から決定され、 いくつかの領域に対する、FOE拘束線という線群の交点を最良に推定 すると、FOEの位置が得られる。 最も信頼性の高いデータに対してさらなる重みを与えるため、 ある解析をもとに、各々の局所領域からの情報に信頼度を付与できる ようにした。 こうして、局所領域から得られるデータに十分な情報が含まれなく ても、FOEの位置をより精度良く決めることができる。 様々なテクスチャを持つ実画像についての実験結果から、本手法の 性能を示す。

Copyright(c) 1996 Academic Press, Inc.


パイプラインド画像処理装置におけるプログラミング
Programming a Pipelined Image Processor

Thomas J. Olson and John R. Taylor

Computer Vision and Image Understanding Vol.64, No.3, November, pp.351-367, 1996

リアルタイムコンピュータビジョンシステムにおいては, 初期のビジョンを代表するピクセル指向演算を行うために, 画像処理ハードウェアがよく用いられる. この種のハードウェアはプログラミングが難しく, 実験が制限され,研究の発展の大きな障害となる. 本論文では我々の開発した2,3のプログラミングツールについて述べる. 専用ハードウェアを利用した本ツールにより,実時間の初期ビジョンの システムの構築が容易になった. 対話型グラフィカルツールを用いて作成された粗いデータ フローグラフによりユーザはシステムに計算を指示できる. これらのデータフローグラフは初期化時にハードウェア上で実行可能な 効果的なプログラムにコンパイルする. システムは一般に市販されているパイプラインドプロセッサ 上にインプリメントされている. 我々は,システムの基礎となる計算モデル,リアルビジョンアプリケーション の構築のための基礎,ターゲットマシンのための効果的実行スケジュール生成 アルゴリズムについて述べる.

Copyright(c) 1996 Academic Press, Inc.


3次元におけるデジタル距離変換
On Digital Distance Transforms in Three Dimensions

Gunilla Borgefors

Computer Vision and Image Understanding Vol. 64, No. 3, November, pp.368-376, 1996

3次元におけるデジタル距離変換は10年以上もの間研究されてきた。しかし、 扱われる問題の複雑さのすべてが解明されたわけではない。 この論文では、3x3x3画素の近傍の局所的な距離に基づいた3次元変換に対す る完全な幾何学的解釈と解法が示される。そして、正当な距離変換の新しい手 法が発見される。

最適な解決方法が可能な限り次元に独立に距離変換することで計算される。な お、ここでいう最適とは真のユークリッド距離における最大の距離差を最小に することで定義されるものである。 よく知られた<3,4,5&rt;距離変換がもっとも実際的な重み付け距離変換であるこ とが確認される。ここで、距離はエリアを共有している隣接画素が3、エッジ を共有しているものが4、ポイントを共有しているものが5となる。

M.T.

Copyright(c) 1996 Academic Press, Inc.


属性をもとにしたOpening, 細線化、及び、粒状解析
Attribute Openings, Thinnings, and Granulometries

Edmond J. Breen and Ronald Jones

Computer Vision and Image Understanding, Vol. 64, No. 3, Novemmber 1996

Keywords: mathematical morphology, thinning, gray-scale thinning, nonlinear filter, shape descriptor

本論文では、openingとclosingへの属性をもとにしたアプローチを確立し、 濃淡値画像での実装のための効率的なアルゴリズムを与える。 属性をもとにしたopeningは、連結成分の変換であるという点で、 再構築によるopeningと同様なものである。 しかしながら、属性をもとにしたopeningは、 形状による偏りのない、一般化された形状特徴を記述できるという点で、 より一般的なものである。 本研究を、濃淡値の粒状解析と、 非増大フィルタである濃淡値画像の細線化に拡張する。 濃淡値画像の非増大の細線化を使用は、 濃淡値画像をフィルタするのに適用する、 コンパクト性や離心率のような非増大の形状記述子を 使うことを許すという点で、 重要な一般化と見ることができる。 提案するフィルタの性能を示すために、応用を挙げる。

HN

Copyright(c) 1996 Academic Press, Inc.


画像解析での距離変換の正規性
Regularity Properties of Distance Transformations in Image Analysis

Christer O. Kiselman

Computer Vision and Image Understanding Vol. 64, No. 3, November 1996

画像平面中の任意の集合に対し、距離変換はその集合への距離を測定する関数を 与える。 この距離を測定できる複数の異なる方法があるが、そのうちのいくつは望ましくない 性質を持っている。 これは、infimal合成によって多数の重要距離を定義できることを意味する。 この作用(infimal合成)を用いて、Borgeforsの意味での半正規性を研究し、 この性質に同値性を持つ距離の条件を与えた。

LXP

Copyright(c) 1996 Academic Press, Inc.


知覚上のグループ化のための確率的アプローチ
A Probabilistic Approach to Perceptual Grouping

Rebecca L. Castano and Seth Hutchinson

Computer Vision and Image Understanding Vol. 64, No. 3, November 1996

我々は、 画像特徴の可能なグループ化の空間を覆う確率分布を決定するための 一般的枠組みを示す。 この枠組みは、画像特徴のグループ分割のうち確率的にもっとも 高いものの幾つかを見つけるのに用いられうるのであって、 多くの特徴グループ化技法のようにただ単に一つの分割 を返すだけというものではない。 さらにそのグループ化そのものに加えて、 各分割の確率が計算される。このときに、 これはわずかなグループ化技法のみがなしうることであるが、 複数の分割の相対確率についての情報をも提供する。 グループ化の確率分布の決定においては、いかなるパラメータ推定 も行なわれない。したがって、データ量が少なくかつ偏在があると きに起きる問題を排除している。その問題とは、パラメータ推定が なされて、そのパラメータが次のグループ化過程で使われるときに 起こりうるエラー混入のような問題である。

我々は、この枠組みを二つの特殊な場合に適用した。 一つは線素を直線へと分類する場合であり、いま一つは 平行軸に対する相互対称性(これはエッジ組によって形成される) を分類する場合である。 幾つかの実画像についての両者の結果が示される。

Sz

Copyright(c) 1996 Academic Press, Inc.


完全に並列な3次元細線化アルゴリズムとその応用
A Fully Paralle 3D Thinning Algorithm and Its Applications

Milan Sonka

COMPUTER VISION AND IMAGE UNDERSTANDING Vol. 64, No. 3, November 1996

細線化アルゴリズムは連結性を保存しながら、 骨格のみが残るようになるまで対象画像を繰り返し削る処理と考えることができる。 しかしながら、一般的に3次元の並列細線化アルゴリズムにおいては、 連結性が保存されることを証明するのは困難である。 ようやく近年になって、この証明を簡単にする十分条件が CVGIP: Image Ungerstanding( 59, No3( 1994 ), 328-339 )に発表された。 本論文では連結性を保存する完全に並列な3次元細線化アルゴリズムを提案する。 その際、3次元並列細線化アルゴリズムにおいて連結性が保存されることを 先に述べた十分条件を用いて示す。 今回行なったデモンストレーションによって、 新しい世代の3次元並列細線化アルゴリズムの設計が可能になると共に、 比較的容易に連結性の保存を証明できるようになった。

mNt

Copyright(c) 1996 Academic Press, Inc.


動きパラメータの再帰的推定
Recursive Estimation of Motion Parameters

S.Chaudhuri and S.Sharma

Computer Vision and Image Understanding, Vol.64, No.3, November 1996

ノイズィな画像シーケンスからの再帰的な動きパラメータ推定の ロバストなアルゴリズムを示す. 計算効果の高い再帰的手法を用いた最小メディアン自乗法を使用する. 特徴点の半分近くが適合度が低くても十分に動作する. レンジまたはステレオのデータシーケンスを扱う 再帰的制約付き最小自乗法を提案した. また,モノクロデータシーケンスに対するトータル再帰的最小自乗法 を提案した.

Copyright(c) 1996 Academic Press, Inc.


[前の年][次の年]