[前の年][次の年]

Computer Vision and Image Understanding (Academic Press) Vol.69, No.1

What-and-Whereフィルター:オブジェクト認識と画像理解のための 空間マッピング機能を有するニューラルネットワーク
The What-and-Where Filter, A Spatial Mapping Neural Network for Object Recognition and Image Understanding

Gail A.Carpenter, Stephen Grossberg and Gregory W. Lesher

Computer Vision and Image Understanding Vol.69, No.1, pp.1-22, January, 1998

ここで紹介するWhat-and-Whereフィルターと言うものは、空間マッピング、オブジェ クト認識、画像理解のためのニューラルネットワーク・アーキテクチャーの構成部品 である。このフィルターは、ニューロン・セルの活性化状態の位置、方位、そして画 像中のすべての対象図形の大きさ(どこに存在するかを)を同時に、空間マッピング (地図化)する。この空間地図は、これらの図形特徴が空間的に何処に局在している かを指示するのに使えるであろう。方位検出演算子の多段解像度配列に引き続いて、 位置、方位、大きさに関する競合と補間の兼ね合いをうまく調整することによって、 ここに導入するWhereフィルターを定義することが出来る。この解析から、正規化付 き、または、正規化なしの片エッジフィルター(cliff filter)のような役割の方位 フィルターに立脚する空間マッピングシステムに関して考慮されなければならない、 いくつかのことが明らかになる。同様に、対象物の大きさと方位検出の兼ね合いで生 じる2重ピークの問題(方位とサイズ依存フィルターによる最尤マッチング)、大き さの影響よりも複数方位にわたって検出された自己相似性から、補間をどのように扱 うか、の問題なども明らかになる。いくつかの計算効率の良いWhereフィルターを提 案する。このフィルターは、並列に、場所に依存せず、方位に依存せず、サイズに依 存しないで、複数の対象画像を不変表現に変換するために利用できるであろう。こ の、画像の不変表現できることが、注視オブジェクトの学習や認識(What it is)を 狙ったシステムの一部を成している。対象オブジェクトをシリアルな探索によって見 つける他のモデルと異なり、このWhat-and-Where表現は、視野中の狙ったオブジェク トを並列に高速に見つける事ができる。このような表現は、画像理解のために、オブ ジェクトの多次元表現や空間的関連を学習するのにも利用する事が出来る。ここで紹 介したWhat-and-Whereフィルターは、 注視物の空間と方位の処理の流れが大脳皮質 で行われているという事、その一方、Whatの処理の流れは、注視オブジェクトの学習 と認識に利用されているという大脳生理学のデータにヒントを得たものである。

Ej

Copyright(c) 1998 Academic Press, Inc.


X Vision:実時間のビジョン応用のための携帯型部品
X Vision:A Portable Substrate for Real-Time Vision Applications

Gregory D. Hager and Kentaro Toyama

Computer Vision and Image Understanding Vol.69, No.1, pp.23-37, January, 1998

ここ数年の間、標準プロセサーが、標準的ワークステーション上で視野追跡を必要と するような面白い問題のために使われるほどの速度に到達した。しかし、自ら視野追 跡技術を開発しようと言う注意はほとんど払われなかった。この論文では、モジュ ラー型で携帯型のX Visionについて述べる。X Visionは、単純なデジタイザーを装着 した標準的なワークステーション上で高性能を可能にする、実時間処理のためのプロ グラミング環境である。X Visionは、画像レベルでの小数の追跡用プリミティブと、 この追跡用プリミティブを組み合わせる枠組みとを備え、その結果複雑な追跡が可能 なシステムとなっている。処理効率とロバスト性は、画像特徴検出レベルにおいて幾 何学的・時間的な制約を課すことで達成されており、ここでは画像変形(ここでは エッジの曲がりや方向性)と特殊画像処理が組み合わされ、その結果特徴抽出が高速 かつ頑健に可能となった例を示している。過去数年間、我々はX Visionをいくつかの 画像処理システムに利用してきた。ここに、イラストを使って、このX Visionが、ど のような応用に利用されたかを示し、その中で、単純で基本的なプリミティブを、課 題に依存した制約と組み合わせる事によって、有用で頑健な追跡システムが出来るこ とを示す。

Ej

Copyright(c) 1998 Academic Press, Inc.


各種エッジ抽出方法の比較
Comparison of Edge Detectors

Mike Heath, Sudeep Sarkar, Thomas Sanocki, and Kevin Bowyer

Computer Vision and Image Understanding Vol.69, No.1, pp.38-54, January, 1998

低レベルの画像処理アルゴリズムは客観尺度を得る事が困難であるため、処理結果を 並べて読者に主観的に判断してもらうのが従来の手法であった。これは科学的には満 足すべき戦略ではない。しかし、ヒトによる評価によって、より厳密な、有益で定量 的な結論が得ることが出来る。我々は、ヒトによる低レベルの画像処理アフゴリズム の評価から、実験心理学と統計学に基づいたパラダイムを示す。我々は、4つの有名 なエッジ抽出アルゴリズム、Canny, Nalwa-Binford, Sarkar-Boyer, Sobelを比較す る事によってこの実験戦略を示す。また、我々は次のような疑問に答える事もできる :オブジェクト認識の課題において、ヒトがエッジ検出結果を認識するとして、統計 的に優位な差があるか? 演算子パラメータの選択によってエッジ検出の結果は顕著 に変わるか? 各検出子において、エッジ抽出の品質を大きく変えることなく、全部 の画像に適用可能な演算子のパラメータを選べるか? 1つのエッジ検出子が全ての 画像に対して同じ品質のエッジを抽出できるようにしたり、画像毎に変えるようにす ることは出来るか?

Ej

Copyright(c) 1998 Academic Press, Inc.


画像形状のズーム不変処理:コアの数理
Zoom-Invariant Vision of Figural Shape: The Mathematics of Cores

Stephen M. Pizer, David Eberly, Daniel S. Fritsch, Bryan S. Morse

Computer Vision and Image Understanding Vol.69, No.1, pp.55-71, January, 1998

画像のズーム不変性や、画像の中心軌跡(訳注:原語のmedial locusは中央値の軌跡 であるが、便宜上中心軌跡とした)に代表される画像を横切るような境界結合線は、 オブジェクト形状の重要な側面であると信じ、ここに、我々は画像の強度データから 直接中心軌跡を抽出するアルゴリズムとその数学理論を示す。コアと呼ばれる中心軌 跡は、中間表現情報のスケール空間において、一般化された最大値、として定義され る。これは、並進、回転、そして特に、ズームに対して不変である。この軌跡は画像 の変動に感度が低く、参照されている論文に使われている従来の中心軌跡とは、よい 対比をなす。コアに関する幾何学的性質と画像オブジェクト表現が、上記の変動に対 する低感度性とともに示されているが、このコアは、多様な画像解析の目的に利用で きる。

Ej

Copyright(c) 1998 Academic Press, Inc.


図形形状のズーム不変ビジョン −画像の変動がコアに与える影響−
Zoom-Invariant Vision of Figural Shape Effects on Cores of Image Distrubances

Bryan S. Morse, Stephen M. Pizer, Derek T. Puff, Chenwei Gu

Computer Vision and Image Understanding Vol.69, No.1, pp.72-86, January, 1998

コアと呼ばれる中心軌跡は、並進、回転、ズームに不変な中心情報の形のスケール空 間における、一般化された最大値、である。S.M.Pizerたちは、これらの不変性は、 中心軌跡のもつ性質から、境界検出には図形の幅に比例するアパーチャで出来る事が 示唆されることを示した(Comput. Vision Image Understand. 69, 1998)。このコア の性質から、以前の中心軌跡手法と異なり、画像の変動に影響を受けないことが分か る。殊に、画像変動の振幅がコアのアパーチャ以下で、図形の幅に比例していても、 図形や背景の強度変動に比べて、コアによって与えられる位置変動と幅の変動が、わ ずかに生じるだけである。加算ノイズ、画像のぶれ、境界のみだれ、オブジェクトの 変動のような、画像の変動に対して、このコアによる変動がいかに鈍感であるかにつ いて議論され、例示されている。

Ej

Copyright(c) 1998 Academic Press, Inc.


ベイズ識別を利用した、モデルによる3Dオブジェクトの認識
Model-Based 3DObject Recognition Using Bayesian Indexing

June Ho Yi, David M. Chelberg

Computer Vision and Image Understanding Vol.69, No.1, pp.87-105, January, 1998

この研究の特徴は、効果的な分類(インデックス付け)に狙いを絞った3次元オブ ジェクトの認識である。実用的なビジョンシステムにおいては、主要な問題点は、す べての可能なオブジェクトのマッチング計算をしないで、いかに最良に合致するモデ ルを抽出するかである。我々は、モデルオブジェクトを効率よく分類するために、ベ イズ統計の枠組みを利用した。モデルオブジェクトの特徴分類の決定論的測度は事後 確率によって定義した。局面依存の知識としてはCAD データからオフラインでコ ンパイルし、これをモデルオブジェクトの特徴分類能力を決定する事後確率を推定す るために利用した。正しいオブジェクトを高速に選択あるいは分類付けするために、 モデルオブジェクトの特徴量の分類能力順にオブジェクトが並んでいると仮定した。 上記原理に基づきLSG(local surface group)と呼ばれる特徴量の構造を使って実験 可能なプロトタイプのビジョンシステム実装化した。我々のシステムではオブジェク トに多様な特徴を仮定することが出来る。オブジェクトの仮定を実証するために、仮 定されたオブジェクトが見える画像を推測し、計算された見え方の像に対応するモデ ルオブジェクトを描写した。オブジェクトの仮定は、さらに描写された画像中の特徴 に合致する追加特徴を画像中に見つける事によって更新される。合成画像と、実画像 に適用した実験から、この分類法の有効性が示された。

Ej

Copyright(c) 1998 Academic Press, Inc.


十分な伝播に基づくZ^2空間における2つの高速ユークリッド距離変換
Two Fast Euclidean Distance Transformations in Z^2 Based on Sufficient Propagation

Hinnik Eggers

Computer Vision and Image Understanding Vol.69, No.1, pp.106-116, January, 1998

Z^2空間上における2値画像に対する、2つの新規なエラーのない、シ−ケンシャル なユークリッド距離の変換方法(EDT)を紹介するが、これは十分なd-1伝播とd-∞伝播 の条件下で成り立つ。両方の方法とも輪郭画素を介した繰り返し伝播、つまり、順序 伝播(ordered propagation)である。しかし、伝播をユニークな最短ユークリッド経 路に限定しても、伝播経路として十分である。更に、各伝播画素に、距離推定を与え る事で、エラーのない直接画素更新が可能になる。これらのアイデアを使って、多く の余計な計算を省く事が出来る。計算テストの結果、このアルゴリズムは、符号付 き、符号なしの両方とも、有名なEDTに比べて顕著に高速であることが示された。両 方の方法を比べると、十分なd-∞伝播を行った倍には、平均効率が上昇する。

Ej

Copyright(c) 1998 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.69, No.2

ハフ変換における収束性の保証
Guaranteed Convergence of the Hough Transform

Menashe Soffer and Nahum Kiryati

Computer Vision and Image Understanding Vol.69, No.2, pp.119-134, February, 1998

垂直パラメータを利用した連続投票カーネルによる直線のハフ変換について考察し た。このハフ変換は、共線(同一直線上)検出問題を、パラメータ空間上の2次元関 数のグローバルな最大値を見つける問題に変換している。この原理は、固定目盛りM 推定を利用したロバストな回帰に似ている。標準的なM推定の場合は、初期値推定が 適切である必要があるが、これと異なり、ハフ変換は、直線パラメータの適切な初期 値には依存しない。グローバルな最適値問題は、計算が可能な限り細分化した格子面 の全探索によって行われる。有界領域上の一般関数のグローバルな最大値は有限回の 関数評価によっては見つけることはできない。対象関数の滑らかさがあらかじめ十分 知られている場合のみ、グローバルな最大値に収束することが保障される。現実のグ ローバル最適化問題においては、先験的な情報を取り出して、これをうまく利用する ことが主要な課題となっている。ハフ変換においての収束性は、最大値を有する格子 点の最近傍に存在することを保証されることである。ハフが基本的なアイデアを特許 に取得してから30年以上後の今日まで、真の最大値を見逃さないためには、格子の細 かさがどれほどであれば良いかが未だにはっきりしていない。本論文では、ハフ変換 がグローバルな最大値に収束性するための条件を導く。目的ハフ関数可変性の必要条 件が飽和放物線投票カーネル(断面が放物線形状の重み関数)の利用と、アプリケー ション依存性パラメータとともに画像モデルを規定することによって得られた。エッ ジ近傍のランダムエラー、背景ノイズの存在する条件で、統計的な収束性が保障され る。この連続投票関数を利用したハフ変換の、ピーク近傍の構造やノイズ投票値の空 間的統計量に関する重要な中間結果が得られた。収束条件が調べられ、その結果パラ メータ空間における量子化間隔が導かれた。多段解像度ハフ変換のための収束性を保 障する条件も導かれた。この理論を画像モデルによって作られた画像に適用し、その 理論的結果について考察され、例として示された。

Ej

Copyright(c) 1998 Academic Press, Inc.


局所平面幾何不変量を用いた線分画像のマッチングとモデル化
Using Local Planar Geometric Invariants to Match and Model Images of Line Segments

Patrick Gros, Olivier Bournez, and Edmond Boyer

Computer Vision and Image Understanding Vol.69, No.2, pp.135-155, February, 1998

画像のマッチング処理は、異なる画像中の同一特徴が表す特徴を見つける処理から構 成される。これは、いくつかの画像が与えられるときの、ビジョンの基本的処理であ る。本論文で述べるのは、2つの画像中の線分マッチング・アルゴリズムについてで ある。このアルゴリズムの鍵となるアイデアは、2つの画像の見かけ上の動きは平面 幾何変換(相似変換またはアフィン変換)で近似しうるという仮定であり、この仮定 に基づいて近似を算出することである。 このような仮定の下では、近似的に局所平面不変性が関与しており、両方の画像で同 一の値を持つはずである。 このような不変量は、両画像の1組の構成要素に対して計算され、その値によって マッチングされる。すべての要素のマッチングが、整合性のとれたものであるこ とを保証するために、グローバルな制約が課される。 すなわち、2つの画像間の全ての局所マッチングは、ほぼ同じ幾何学的変換を満足し なければならない。

これらの最初のマッチングは、平面ホモグラフィーとエピポーラ幾何の推定を利用し て、見かけ上の動きをより正確にかつグローバルに近似することで、より正しく、完 全になる。 もし2つ以上の画像について考慮するなら、2つずつマッチングをとることから始ま り、そして、第2ステップとしてグローバルなマッチングへと帰結する。 最後に、対象物の異なる局面(ここでは、異なる方位から見た面)を見せている画像 対から、マッチングアルゴリズムによってこれらを比較し、各局面のモデルを計算す ることが可能である。 この研究では、すでに得られている画像中の多くの要素の従来と異なる利用方法を示 している。すなわち、ここで利用されている局所平面状不変量のいくつかは、 準不変量としてBinford によって提示され、Ben-Arieのpeaking effectに関する仕事 の中で研究されている。 また、アルゴリズムそのものは、幾何学的ハッシング法やハフのアルゴリズムから得 ら れたアイデアを利用している。このアイデアへの主な制約は、使われている不変量か ら来ている。対象画像が、平面からなるオブジェクトや、多くの微小平面からなる人 工物について計算している限りは、非常に安定している。しかし、きわめて一般的な 多面体の画像を扱うのであれば、多分失敗するであろう。 このアルゴリズムの主な特長は、ノイズが多い場合や、輪郭で定義される多角形の近 似が不正確である場合、あるいは画像間の見かけ上の動きが無限に小さくない場合、 同一シーン内にいくつかの異なる動きがある場合、またカメラが校正されてないた め動きが未知である場合にも有効に働くことである。 この基本的なマッチングアルゴリズムが第2章に示され、この正当性や完全性につい ては第3章に、いろいろな画像に対するマッチングは第4章、そして、異なる方位か らの対象物のモデル化については第5章に示されている。 他のアルゴリズムによる結果についてはそれぞれの章に示されている。

Ej

Copyright(c) 1998 Academic Press, Inc.


中心線の枝刈り
Pruning Medial Axes

Doron Shaked and Alfred M. Bruckstein

Computer Vision and Image Understanding Vol.69, No.2, pp.156-169, February, 1998

芯線(medial axes)は魅力的な形状特長であるが、境界のノイズに鋭敏なため、 多くの応用を促すまでには至ってない。 このノイズに対する過敏性を克服するには、何らかの制約が必要である。 枝刈りは、多くの芯線整形処理の中の1方法であり、骨格化と細線化処理のほとんど で利用されている。 枝刈りアルゴリズムは、アプリケーションに応じて様々な定式化が行われている。 これに使われる用語の不整合のため、多くの枝刈りアルゴリズムの解析・比較が行わ れなかった。実際、見かけのうえで異なっているアルゴリズムの多くも同等であるも のがある。 本論文では、枝刈り法の標準として評価枝刈りパラダイムを提案する。 提案するパラダイムは枝刈りの解析・比較が容易であるとともに、新しい枝刈り法を あつらえるのにも容易な枠組みとなっている。 我々は既存の枝刈り法を解析し、新しく2つの方法を提案し、モデルに基づく解析に よってこれらの方法を比較する。この理論的解析は、多数の枝刈り法のシミュレーシ ョン結果によって支持されている。

Ej

Copyright(c) 1998 Academic Press, Inc.


ロボットビジョンのための、生物学に動機づけられた空間不変データ圧縮モデル
A Review of Biologically Motivated Space-Variant Data Reduction Models for Robotic Vision

Marc Bolduc and Martin D. Levine

Computer Vision and Image Understanding Vol.69, No.2, pp.170-184, February, 1998

霊長類の網膜は、必要とあらば、高解像の広視野像から小視野像にまで、見計らいな がら、非線形の「画像」データ圧縮を行っている。自律性ロボット工学にとって、適 当な応答時間を持った視覚系を開発するのに、この折衷法は有用である。本論文は、 ハードウエアで実装化されている2つのクラスの網膜−皮質データ圧縮モデルを再検 討している。その最初のクラスは、等角写像関数に基づいて、網膜から皮質への写像 を再現するものである。画素強度は受容領域(RF)と呼ばれるところで、まとまって平 均化されるが、このRFはオーバーラップはしてなく、平均化は均一である。網膜の場 合と同様にRFのサイズはセンサーの中心から遠ざかるに従って大きくなる。このモデ ルクラスを用いた実装化例では、ビデオレート(30フレーム/秒)で作動すると報告 さ れている。2番目のモデルクラスは、可変解像度網膜−皮質写像に加えて、網膜の神 経節細胞のRFがオーバーラップしている特徴が再現されている。このモデルクラスに よるデータ圧縮は、RFがオーバーラップしているため、演算コストがかかる。このモ デ ルによる実装化では、最低の20フレーム/秒の作動提案が最近なされている。生物学 的に整合がとれていることに加えて、オーバーラップしている領域を使う場合は、RF の多様な計算マスク(フィルター)を単に選択するだけでよい。

Ej

Copyright(c) 1998 Academic Press, Inc.


分散した3Dの点群から、表面情報に基づくオブジェクトの高速再生法
A Fast Surface-Based Procedure for Object Reconstruction from 3D Scattered Points

C.Oblonsek and N.Guid

Computer Vision and Image Understanding Vol.69, No.2, pp.185-195, February, 1998

本論文では、分散した3Dの点群からオブジェクトを再構成することができる3つの フェーズからなる方法を示す。その最初のフェーズにおいては、素晴らしく高速の三 角形形成アルゴリズムに立脚しており、これがオブジェクト表面の基礎となる近似を する。ブリッジ(bridge)を挿入することによって、三角形形成アルゴリズムが0より 大きな種数(genus)を有する表面について、再形成を試みその表面の種数を決定す る。最初のフェーズの結果から、次のフェーズで使われる、シャープなエッジ、シル エットの輪郭形状(silhouette polyline)、コーナーなどのようなオブジェクト表面 の特徴が抽出される。シャープなエッジとコーナーは、最終フェーズにおいて、三角 形メッシュ平滑化処理に利用されるが、ここではより改良されたエッジ消滅則とメッ シュの精緻化手続きが導入される。一方、シルエットの輪郭形状は、再生オブジェク トのワイヤーフレームモデルの生成に利用される。 全体を通じてのオブジェクト再構成処理手続きに要する時間は、複雑さと線形の関 係であった。

Ej

Copyright(c) 1998 Academic Press, Inc.


工学図面からの寸法を表す数値テキストのセグメンテーションと認識
Segmentation and Recognition of Dimensioning Text from Engineering Drawings

Dov Dori and Yelena Velkovitch

Computer Vision and Image Understanding Vol.69, No.2, pp.196-201, February, 1998

工学図面中の寸法を表す数値の認識は、数値が図面の正確な寸法や許容度値を与え るものであるから、図面認識の基本的な要素と言うことができる。我々の対象とする 工学図面は、ISOやANSIの標準に従うものとする。 テキストのセグメンテーションと認識に先立って、直行ジグザグベクトル化、 アークのセグメンテーション、矢印の先端対(日本語では何故か矢尻と言う)の 認識が行われる。 テキストボックス(数値を囲む矩形領域)の抽出は、文字と線の候補パターンに対 して、まず、領域成長プロセスによって開始される。 テキストボックスの内容(数字に隣接する注釈線の形状)に基づいて、図面の標準 が(ISOであるかANSIであるかが)検出された。 元のテキストボックスは、更に、基本の構成要素のボックスにまで再分割された。 この要素ボックスのおのおのに対して、ニューラルネットを利用したOCRによる認識 が適用された。 最後に、OCR の認識結果が内容的に適切か否かが確認され、そして、図面から検出 された寸法情報と比較された。

Ej

Copyright(c) 1998 Academic Press, Inc.


証拠収集のための、フーリエ記述子からの任意形状のパラメータ化
Parameterizing Arbitrary Shapes via Fourier Descrptors for Evidence-Gathering Extraction

Alberto S. Aguado, Mark S. Nixon, and M. Eugenia Montiel

Computer Vision and Image Understanding Vol.69, No.2, pp.202-221, February, 1998

ハフ変換の定式化によれば、自由なパラメータと解析的方程式で表される任意の形状 を抽出することが可能である。それにもかかわらず、任意の形状の抽出には、固定し た参照点を基準とするエッジ点の座標値をテーブル化しておくという非解析的表現が 中心となっている。

本論文では、優れた任意形状の抽出方法を開発したことを報告する。それは、 形状の解析的表現と、フーリエ記述子による特徴化の一般化性とを組み合わせる ものである。 定式化の基礎となっているのは、パラメータ形状表現によって得られるハフ変換の定 義であり、ハフ変換の記述能力をより複雑な形状に拡張しているため、テーブルの利 用が不要になっている。 我々は形状を解析的に表現しているため、開発した技法は、ハフ変換本来のロバスト 性を受け継いでいる。 ここで開発した方法に基づき、さらにパラメータ空間への分解に異なった複数の戦略 を使うことによって、形状抽出の多様な方法を示す。これらの方法において、勾配方 向の情報と、エッジ点をグループ位置として扱うことによって、パラメータ空間が圧 縮される。 処理速度、ノイズに対する感度、単純さ、一般性などの兼ね合いによって、色々な方 法が選択できる。合成画像、自然画像に適用させた抽出処理例から、ノイズの多い環 境からでも目的の形状がうまく抽出できることを示している。

Ej

Copyright(c) 1998 Academic Press, Inc.


密なオプティカルフロー系列からの密な構造
Dense Sructure from a Dense Optical Flow Sequence

Yalin Xiong and Steven A. Shafer

Computer Vision and Image Understanding Vol.69, No.2, pp.222-245, February, 1998

本論文は、密なオプティカルフローの系列から密な構造情報を取り出すような、動き から構造を抽出するシステムについて述べている。特徴に基づいた従来の手法では、 密な構造を抽出することは不可能であったが、それは計算時間が実用範囲を超えてい たからである。我々は、不確定情報が、独立で相関する部分情報に分解出来ることを 示し、そして固有表現に基づいた不確定表現を採用することで計算の複雑さをO(N^2) からO(N)に低減させうることを示す。ここに、Nは画像中の画素数である。さらに、 この新しい手法は、連続画像中に特定の特徴が複数のフレームに渡って追跡できなく なるような画像に対しても、画像の融合が容易である事を示す。

Ej

Copyright(c) 1998 Academic Press, Inc.


単位4元数の部分群による2D多角形アークのマッチング
Matching 2D Polygonal Arcs by Using a Subgroup of the Unit Quaternions

Douglas R. Heisterkamp and Prabir Bhattacharya

Computer Vision and Image Understanding Vol.69, No.2, pp.246-249, February, 1998

単位4元数の部分群を、2D回転の計算に用いる。 より普通に用いられている方法を使わずに、わざわざ4元数を用いる利点は、 4元数代数を用いるのは閉形式の解を求めることと、同一形式で2Dおよび3Dの 両方に対処できるからである。 この部分群は、同じ長さの多角形アークを2×2行列の最小固有値と対応づける マッチングに適用される。 この結果は、長いアークに対する短いアークの位置のマッチングに利用される。

Ej

Copyright(c) 1998 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.69, No.3

CADモデルのリバースエンジニアリングのための、複数の距離像の同時位置合わせ
Simultaneous Registration of Multiple Range Views for Use in Reverse Engineering of CAD Models

David W. Eggert, Andrew W. Fitzgibbon, Robert B. Fisher

Computer Vision and Image Understanding Vol.69, No.3, pp.253-272, March, 1998

CADモデルをリバース・エンジニアリングする場合は、いくつかの方位から見た 対象物画像を、1つの共通フレームに統合する必要がある。 最初、大まかに並べられた複数の部分3D形状データが、いくつかの画像として与 えられたとする。 最近人気のある「反復型最近接点アルゴリズム」の改良版を利用して、 初期の大まかなデータをずっと精細化することが出来る。 統合化されたデータセット全体を利用して、データの対応付けがなされる。 以前の処理において、孤立点の対応付けを除くため、距離に閾値を設けるという あぶなっかしい処理を取っていたが、これは不必要となる。 徐々に形状を整合させていく処理は、全てのデータセットについて同時に計算され、 その結果、大局的に見て最適な変換が得られる。 データセットが互いにバネ群で陰的連結された力学的モデルの最適化法によって、 部分的な個々の動きによる改良がなされる。 2Dと3Dデータセットによる実験では、初期の位置関係が極めて大雑把であって も収束が可能である事、そして、最終的な位置合わせ精度は、画像のサンプリング 点間の1/4以下に近づくことが、一般的結論として得られる。

Ej

Copyright(c) 1998 Academic Press, Inc.


陰的表面ベースの幾何学的融合
Implicit Surface-Based Geometric Fusion

A. Hilton, A.J.Stoddart, J. Illingworth, T. Windeatt

Computer Vision and Image Understanding Vol.69, No.3, pp.273-291, March, 1998

本論文では、一群の表面計測データから高信頼性の3Dモデルを統合化する汎用のア ルゴリズムを紹介する。この新しいアルゴリズムは、スカラー場の関数のゼロ集合で ある1つの連続的表面の陰的表現を与える。 なお、陰的表面とは、表面計測データから構成されるユークリッド空間内で定義され る場の関数によるイソ表面(同じ値を持つ面)のことである。 任意の陰的表面に対して、多角形化アルゴリズムを使って、明示的なオブジェクトモ デルが得られる。 オブジェクトモデルは、2.5D距離画像と携帯型センサーの距離画像の両方から再 構成することができる。 我々の知る限り、ノイズの多い携帯型センサーによる距離データから3Dオブジェク トを再構成することができるのは、この幾何学的融合アルゴリズムが最初である。 この手法は、従来法に比べていくつかの重要な利点を持つ。 表面の陰的表現によって、未知のオブジェクトを任意の位置関係や配列で表現するこ とを可能にする。 連続的表面の陰的表現によって、複雑な形状の再構成が可能になる。 測定の不確かさに関するパラメータを使うことによって、ノイズの多いオーバーラ ップした表面測定値を正確に統合化することができた。 この測度を利用することで、相当程度のノイズがあってもアルゴリズムはロバスト 性を保っていることが保証される。 従来の陰的表面ベースのアプローチは、離散表現を使っており、その結果、曲率の 大きい部分や厚さが薄い部分で再構成の信頼性が低下していた。 表面境界をインプリシットに直接表現することによって、任意の位置関係のオブジ ェクト表面の正確な再構成を保障している。 オーバーラップ領域の計測値の統合は、3D空間のみの演算で実施できる。 従来の手法では部分的な2D投影が必要であり、その結果、高信頼性のオブジェク ト表面再構成に限界があるという不具合が、取り除かれた。 従来のレンジセンサーデータによる2.5D画像用に開発されたすべての既知の幾 何学的統合アルゴリズムでは、携帯型センサーデータは利用できなかった。 この新しいアルゴリズムの実験評価結果によれば、このパーフォマンスは、従来法 に比べて複雑な形状の再構成が改良されていることを示している。

Ej

Copyright(c) 1998 Academic Press, Inc.


画像系列からの都市シーンの3D再構成
3-D Reconstruction of Urban Scenes from Image Sequences

Oliver Faugeras, Luc Robert, Stephane Laveau, Gabriella Csurka, Cyle Zeller, Cyrille Gauclin, Imad Zoghalami

Computer Vision and Image Understanding Vol.69, No.3, pp.292-309, March, 1998

本論文では、カメラ・パラメータとか、その動きに関する先験知識なしに、 一連の画像から、シーンに関する現実的なテクスチャー付きモデルを再構 成する問題について述べる。 この目標達成のために、シーン中に絶対座標値を含むような制御点の知識 は必要としない。 まず第1に、様々なコンピュータビジョンのツールを利用して画像間の対 応付けをとり、エピポーラ幾何条件を再現し、これから、あらゆるカメラ 位置に対応して遠近感のある完全な投影マトリックスをどのように算出す るかを示そう。 次に、シーン幾何の再構成に進む。 更に、シーン中の平行線や既知の角度情報を、アフィン変換や相似変換の 条件を知ることなしに、シーン形状の再構成のためにどうしたら利用でき るかを示す。 もし、このような情報が得られなくても、自己校正(self-calibration)の 技術によって、シーンのユークリッド構造を再構成することができる。 シーン形状は多面体によってモデル化されている。 これらシーン多面体上のテクスチャーは撮影画像から自動的に抽出される。 複数の画像がモザイク状に組み合わされて、通行人や街路樹のようなわざ とらしい物が、テクスチャーからどのようにして自動的に取り除かれるか を示す。 このビジョンシステムは、ビジョンサーバーとして実装化されたが、これ はCAD−CAMモデラーの幾何形状や、一連の画像からテクスチャー情 報を供給する。 全システムは、シミュレーションや仮想現実および強化現実への応用のた めに、高品質のシーンモデルを効率的かつ高速に作ることができる。

Ej

Copyright(c) 1998 Academic Press, Inc.


空間包絡:3Dシーンの一表現
The Space Envelope: A Representation for 3D Scenes

Adam Hoover, Dmitry Goldgof, Kevin W. Bowyer

Computer Vision and Image Understanding Vol.69, No.3, pp.310-329, March, 1998

本研究では、境界記述に基づく形状モデルである空間包絡を紹介する。 空間包絡は、1つのオブジェクト(あるいは物体)をモデル化するのではなく、 ある大きさの空間を包み込む。 この利点は、どこから見ても、任意の数のオブジェクトが表現できることである。 いくつ存在するかは、単に画素だけのデータでは良く分からない。 しかし、常に1つの、しかも1つのみ、中空体が存在するのである。 一旦、空間包絡を定義するモデルが出来ると、シーンの内容が整合するように 高度演算が施される。 例えば、表面形状と位相から、見ることの可能なオブジェクトの数が推論される。 閉じた中空体は(既知の自由空間において)視野に基づくナビゲーションシス テムに使えるであろうし、一方、これらの表面は視野の対応付けに利用できる であろう。 距離画像から、表面関係に基づく表現(いわゆる b-rep)の空間包絡を自動的 に構成するアルゴリズムを示す。 四種類のレンジカメラによって撮られた400以上の画像に適用した試験結果も 示されている。

Ej

Copyright(c) 1998 Academic Press, Inc.


メッシュモデルの最適化による非剛体オブジェクトの効率的な非線形有限要素モデル 化
Efficient Nonlinear Finite Element Modeling of Nonrigid Objects via Optimization of Mesh Models

LeonidV. Tsap, Dmity B. Goldgof, Sudeep Sarkar

Computer Vision and Image Understanding Vol.69, No.3, pp.330-350, March, 1998

本論文では、非剛体の運動解析のために非線型有限要素法(FEM)を適用する ための、新しい汎用の枠組みを提案する。 我々は、すでにコンピュータビジョン、構造力学やCADにおいて確立され ている技術を利用することによって、イメージデータや先験知識を集約した モデルを構築した。 これらの技術によって、メッシュモデルの最適化プロセスが導かれる。 線形FEMは、非剛体の特定タイプの運動問題について解くことが出来る、物理 モデルであることが証明されている。 しかし、線形FEMは非線形物質や大変形を扱うことが出来ない。 非線形FEMを非剛体運動解析に適用するには、計算の複雑さやノイズへの感度 の問題から制限がある。 非線形FEMに関連する問題を、我々は対象物のパラメータ記述を変更すること によって取り組む。 これは、ノイズの最悪な影響度合いを明確にし、メッシュ 制御戦略を採用し、多段スケール法を採用することによって、変形可能性を 解析すると言う物理学に動機づけされた手法によっている。こ れらの手法の組み合わせによって非剛体運動に関するシステマティックな手順が示さ れ、十分詳細で柔軟なFEMモデルが構築される。皮膚の弾性に関する実験結果によれ ば、この手法の正当性が示されている。このモデルによって、正常な皮膚と異常な皮 膚の弾性の差の客観的検出が可能である。我々の研究は、非剛体オブジェクトと大き な変形を含む連続距離画像から、点の対応付けと力の回復の正確な計算が可能である 事を示している。

Ej

Copyright(c) 1998 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.70, No.1

平面状集合のアフィンマッチング
Affine Matching of Planar Sets

Kenji Nagao, W. E. L. Grimson

Computer Vision and Image Understanding Vol.70, No.1, pp.1-22, April, 1998

画像中のオブジェクトを認識するためには、オブジェクトモデルを イメージデータ上に(うまくマッチングするように)射影する最大 適合変換を見つけなければならない。 本論文では、モデルとデータに組み込まれているそれぞれ対応する 特徴量グループの重心を整列させる方法に基づいた、パラメータ復 元のための新しい整列方法を提案する。 このような特徴量のクラスターを見出すために、平面パッチの不変 特徴を使い、回転変換までの変換によって正規化された座標系でク ラス内の分散が最小になるようなクラスタリング手法を開発した。 この方法は、たとえオブジェクトが3Dであっても、たった1組の 2Dモデルとデータ画像の対を利用して達成できる。 コンピュータ・シミュレーションと自然画像の両方を使った実験に よると、表面の部分的オクルージョンを含むかなりの摂動にも耐え られることが示されている。

Ej

Copyright(c) 1998 Academic Press, Inc.


孤立して重複するスポットの検出と特徴付け
Detection and Characterization of Isolated and Overlapping Spots

H. J. Noordmans, A. W. M. Smeulders

Computer Vision and Image Understanding Vol.70, No.1, pp.23-35, April, 1998

孤立して重複するスポット(つまり、連結したぼんやりしたスポット)を 検出して、これを特徴づけるシステマティックな手法を紹介する。 まず、スポットを、内部構造を持たない画像細部として定義することで、 分析は以下のものに還元される。すなわち、位置、明度、大きさ、および 可能であればその方位についての決定である。 これを検出するのに、スポット・モデルを、画像のあらゆる位置でマッチング させる処理を行う。 さらに特徴づけのフェーズでは、各スポットにモデルを順次当てはめて、 最もよく似たモデルを探す処理を行う。 いずれのマッチング手続きも、重み付き画像マッチングに基づいており、重み は遠くに行くほど減少するようになっているが、これは、近接するスポット の影響を減少させるためである。 S/N比、パラメータ精度、2つのスポットが分離可能な最小距離についての 実験結果によれば、分離したスポットに対しては重みは大きく、また、オ ーバーラップしたスポットに対しては小さくする必要があることを示している。 この方法は、星雲を背景にした星の検出と特徴づけ、および、ペトリ皿中 の群状の酵母コロニーの検出用に実用に供された。この重み付きマッチン グ法は、スポットの定義に自由度と柔軟性を持たせたまま、正確なスポッ トの特徴付けを行うことができる。 他の方法に比べると、我々の方法は、検出と性格付けのフェーズで整合性 が保たれている。 これは、適当なサイズが不明であっても、1つのスポットが最大強度を示 すようなものであるなら、オーバーラップしたスポットを分離できる。

Ej

Copyright(c) 1998 Academic Press, Inc.


形状認識のための拡張された属性列マッチング
Extended Attributed String Matching for Shape Recognition

S. W. Chen, S. T. Tung, C. Y. Fang, Shen Cherng, Anil K. Jain

Computer Vision and Image Understanding Vol.70, No.1, pp.36-50, April, 1998

本論文では、属性列マッチング法(ASM)(幅、長さ、角度などの複 数の属性の列についてマッチングをとる方法)を拡張し、従来1つ のオブジェクトのみを扱ったのに対して、複数のオブジェクトを含 む画像を扱う。 この新しい手法は、ASM固有の複数の弱点を明らかにした。 我々は、この研究の中で、この弱点を克服することができた。 主な課題を上げると次のようなものである; ファジー分裂・合併によるの2方向不変弛緩法、編集演算のための 新しいコスト関数群、編集演算のための適合性コスト。 それぞれ、次のような3つのアルゴリズムが開発された; 従来のASM,ここで提案する新コスト関数で特徴づけられる 改良ASM(MASM)、編集演算の適合性コストを組み込んだ拡張ASM(EASM)。 これらのアルゴリズムは多数の実画像に適用された。 これらの実効性を比較することで、新コスト関数と、編集演算のた めの適合性コストの両方によって、計算される類似値の適用範囲が 大幅に拡張されたことが分かった。 類似値の分離性能強化によって、オブジェクト間の識別可能性が強 調されている。実験の結果、拡張ASMの応用性が確かめられた。

Ej

Copyright(c) 1998 Academic Press, Inc.


プリントサーキット基盤のための部分パターンレベルの検査
A Subpattern Level Inspection System for Printed Circuit Boards

Madhav Moranti, Fikret Ercal

Computer Vision and Image Understanding Vol.70, No.1, pp.51-62, April, 1998

既存の検査システムは、アルゴリズムから見て処理速度が遅く、 PCB(電子回路プリント基盤)製造に要求される検査仕様に 合致するには多くの欠点を持っている。 本論文に示されるシステムは、すべての欠陥を同時に、しかも、 同じ手法で扱え、従来手法に比べて格段に高速である。

システムは3つの主要なフェーズからなる; 第1ステップは、金色のPCB画像を部分パターンに分割すること、 第2ステップは、学習過程、 第3ステップ(最終)は、照合/検査フェーズである。

ここに示されるシステムは、ニューラルネットワークとファジ ー論理のPCBへの応用を示している。 手法は高度に並列化されており、部分パターンレベルで作動する。 ここに提案する方法の有効性が実験結果とともに示されている。

Ej

Copyright(c) 1998 Academic Press, Inc.


注視の動的・多重解像度モデルと、その顔特徴抽出への応用
A Dynamic and Multiresolution Model of Visual Attention and Its Application to Facial Landmark Detection

Barnabas Takacs, Harry Wechsler

Computer Vision and Image Understanding Vol.70, No.1, pp.63-73, April, 1998

ここでは二つのことを述べる。 一つは、注視運動を生成するための、動的かつ多重解像度に基づく 新しい注視機構についてである。 いま一つは、その応用であり、顔特徴認識のための候補領域の位置決め についてである。 ここで提案する注視モデルは、低レベルかつデータ駆動型であり、 方向性ガウスフィルターによる非線形サンプリング・ラティスを 採用しており、局所画像特徴(顕著さ)を抽出するために、微小 な振動を利用するものである。 サンプリング格子が画像中を動くに連れて、多重解像度の局所特徴 の「証拠」が、短期視覚メモリーに蓄積されていく。 注視点の動きに従って、特徴表面が回帰的に計算されていくような 単純な統合手法を提案する。 顔画像へ適用したシミュレーション結果は、我々の手法の応用可 能性を示している。

Ej

Copyright(c) 1998 Academic Press, Inc.


プリントボード画像の基本パターンへのセグメンテーション
Segmentation of Printed Circuit Board Images into Basic Patterns

Madhav Moganti, Fikret Ercal

Computer Vision and Image Understanding Vol.70, No.1, pp.74-86, April, 1998

プリントサーキットボード(PCB)の検査では、セグメンテーション (領域分離)が最初で、最も大切なステップである。 本論文では、PCB画像のセグメンテーションのための新しい技法を 紹介する。この技法は、基本的には、PCB画像を、プリミティブな PCBの部分画像を含む小さなウィンドウに分割する。 この手法は、単純性とPCB画像の均一性を有効活用しており、その結 果、本質的に並行処理に向いている。実験とその結果についての 詳細な考察も記述されている。

Ej

Copyright(c) 1998 Academic Press, Inc.


動きモデルに基づく境界抽出と実時間実装
Motion-Model-Based Boundary Extraction and a Real-Time Implementation

Hongche Liu, Tsai-HOng Hong, Martin Herman, Rama Chellapa

Computer Vision and Image Understanding Vol.70, No.1, pp.87-100, April, 1998

動き境界の抽出とオプティカルフローの計算は、動き再現問題の 2つの部分問題であるが、この2つをそれぞれ独立に解くことは 出来ない。これら2つの問題は、これまでは別個に扱われてきた。 最近よくあるアプローチは、動き境界の抽出部とオプティカルフ ロー計算部とからなる反復型のものであって、反復につれて各々 の結果を精緻化するというものである。 我々は、動き境界の抽出とオプティカル・フローとを同時に行う ための、局所的で非反復型のアルゴリズムを紹介する。 これは、3Dの一般的な動きを遠近投影して得られる画像系列(動画)を、 3Dエルミート多項式分解することによって実現される。 局所的なモデル・パラメータが用いられるが、これは、 動きを推定すべきか、それとも動き境界を近傍から抽出すべきか を決定するためである。 この非反復型アルゴリズムの決定的な利点は、効率性にある。 実時間実装と、これによる実験結果が示される。

Ej

Copyright(c) 1998 Academic Press, Inc.


コンパクトな分布関数によるパターンの分類
Pattern Classification with Compact Distribution Maps

Tin Kam Ho, Henry S. Baird

Computer Vision and Image Understanding Vol.70, No.1, pp.101-110, April, 1998

分類における困難な問題は、分類の条件付き分布を簡潔で忠実に 表現することである。 我々は、このような分布を写像する方法を、類似性を表す距離関 数として提案する。 この距離関数を利用した分類法は誤差が少なく、信頼性を持って 認識結果のリジェクトが可能になる有用な確信度スコアが可能と なる。 何千というクラスを有する困難な認識問題の応用を通して、この 手法を図解する。 任意のドメインへの応用のため、特徴変換という写像に有用な自 動化された特徴量変換法を示す。

Ej

Copyright(c) 1998 Academic Press, Inc.


共平面の3重点の結合不変量:オブジェクト認識のための安定性と分離能力
Joint Invariants of a Triplet of Coplanar Conics: Stability and Discriminating Power for Object Recognition

Long Quan, Francoise Veillon

Computer Vision and Image Understanding Vol.70, No.1, pp.111-119, April, 1998

一対の共平面2次曲線の連結不変量(joint invariant)は、 不変量をオブジェクト認識に利用するための中心的役割を 果たしてきた。 本論文では、共平面2次曲線の3重点の不変量を問題にする。 3つの2次曲線の問題では、これらの、2つずつの対による 不変量に加えて、2次曲線の3重点に基づく新たな不変量 が存在する。 3つの2次曲線によるこの新たな不変量は2次曲線の3重 点の識別に利用できるとともに、対ごとに相似性を持つと考 えられる。 3つの共平面2次曲線による3重点の全ての連結不変量が、 まず初めに、3元の2次形式の不変代数に基づいて導かれる。 次に、シミュレーションと実画像の両方に対して、この連結 不変量の識別能力、精度、安定性が実験された。 最後に、3つの共平面2次曲線の3重点を利用する方法は、任 意の数の共平面2次曲線に拡張可能であることが示される。

Ej

Copyright(c) 1998 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.70, No.2

2D形状平滑化のためのモルフォロジー的なスケール・スペース
Morphological Scale Spece for 2D Shape Smoothing

Ben K. Jang and Roland T. Chin

Computer Vision and Image Understanding Vol.70, No.2, May, 1998

本稿では、モルフォロジー的な演算に基づく、多重スケールの境界表現 について述べる。 まず、オブジェクトの境界は、オープニング演算とクロージング演算を 何度か適用することで漸進的に平滑化される。このとき用いられる構造 要素は、次第に大きくなるものであり、このようにしてオブジェクトの 多重スケール表現が生成される。 次に、平滑化された境界セグメントのうち、連続するスケールをまたが るものが抽出される。これらは、互いに結合されて、「モルフォロジー 的なスケール・スペース」と呼ばれるパターンを形成する。 このスケール・スペース・パターンの属性が調べられ、ガウシアン・ スケール・スペースと対比される。 スケール・スペース表現が、画像解析に応用できることを示すために、 このスケール・スペースをベースとした形状平滑化アルゴリズムが提案 される。 特に、Witkinのスケール・スペース・フィルタリングと一致しているの は、モルフォロジー的スケール・スペースによって、スケールをまたが り明らかに関連づけられる境界特徴が、大局的領域と局所的特徴へと体 系化されることである。 その体系から、滑らかな境界にとって知覚的に主要な特徴が決められる のだが、このときにオブジェクトや入力パラメータに対する先験的知識 は、不要である。 広範な実験を行うことで、2D形状の平滑化に対するモルフォロジー的 なスケール・スペースの性能を示す。

Na

Copyright(c) 1998 Academic Press, Inc.


非剛体的運動の解析:関節運動と弾性運動
Nonrigid Motion Analysis: Articulated and Elastic Motion

J. K. Aggarwal, Q. Cai, W. Liao, and B. Sabata

Computer Vision and Image Understanding Vol.70, No.2, May, 1998

実世界における物理的物体の運動は、一般には非剛体的である。 ロボティックスやコンピュータ・ビジョンにおいて、非剛体的物体 の運動は、広範な研究分野の研究者の関心を集めている。 研究されている非剛体的物体は、一般に、本体の変形の程度に 応じて、3つのカテゴリーに分類することができよう。 それは、関節運動、弾性体、および流体である。 関節運動において、物体を構成する個々の剛体的部品は、各々が 互いに独立して動くのだが、物体全体の運動は、事実上は非剛体 的である。 弾性運動は、ある程度の連続性あるいは滑らかさに従うような、非剛体的 運動である。 流体運動は、連続性の前提さえ成り立たず、トポロジー的な変化や乱流 変形も含むこともありうる。 本論文は、関節運動と弾性運動に関する従来の研究の概要を示す。それぞ れ、ヒトの身体の運動および動物の心臓の運動という問題に動機付けられ ている。 我々は、多数の研究者により広く採用されているような、ボトムアップ的 手法における画像系列を通した物体の3D構造や運動の再現に関 し、様々なアプローチを研究する。 これらのアプローチは、 (1)形状モデル無しに運動を再現するもの (2)モデルベースの解析 に分類される。 各々のアルゴリズムを検討する際、我々は、相互に関連しあっている、特 徴の複雑さと運動の拘束条件についても述べる。

Na

Copyright(c) 1998 Academic Press, Inc.


表面再構成用変分法のための多重解像度に相当する効率的な方法
Efficient Multiresolution Counterparts to Variational Methods for Surface Reconstruction

Paul W. Fieguth, William C. Karl, and Alan S. Willsky

Computer Vision and Image Understanding Vol.70, No.2, May, 1998

変分法は、コンピュータ・ビジョンにおいて、かなりの成功をおさめて採用さ れている。特に、表面再構成問題について、そうである。 このタイプの定式化は、望ましい再構成結果を得るために、計算的に複雑な、 オイラー・ラグランジェ(Euler-Lagrange)偏微分方程式 (PDEs: partial differential equations)による解を必要とする。 さらに、このようなアプローチに必要な再構成誤差の共分散は、通常は無視 される。 本稿では、表面再構成のための、計算的に効率がよく多重スケール的なアプ ローチについて述べる。 この方法は、オイラー・ラグランジェの偏微分方程式を解くのに用いられる 多重解像度的な方法とは、根本的に異なる。 その代わりに、変分法の問題を統計的な推定問題と解釈することにする。 つまりその目的は、近接するがわずかに異なる多重スケールの推定問題を 定義することにある。こうすれば、表面再構成と誤差統計計算の両者を、 効率的に解く余地が生まれる。 特に、表面に対する薄膜と薄板の変分モデルは、それぞれ、表面とその勾配 についての1/f2既知(prior)統計モデルとして解釈される。 このような1/f2の振る舞いは、画素当たり一定の計算複雑さをもつアルゴリ ズムを許容するような多重解像度モデルのクラスが最近になって導入された ことにより、行えるようになった。

Na

Copyright(c) 1998 Academic Press, Inc.


属性行列スペクトルを用いたモデルベース分割
Modelbase Partitioning Using Property Matrix Spectra

Kuntal Sengupta and Kim L. Boyer

Computer Vision and Image Understanding Vol.70, No.2, May, 1998

本稿では、固有値あるいはスペクトルに基づいた、CADモデルの 表現方法を提案する。 この表現は、CADモデルに対してより従来型である属性グラフに 基づく表現とともに用いられることになる。 固有値は、オブジェクト構造の全体記述を与えるとともに、 大規模なモデルベースを、構造的に均質なパーティションへと分割 するのに役立つ。 次に、各パーティションのモデルは、階層的に体系づけられる。こ れは、報告済みの論文 [IEEE Trans. on PAMI 17, 1995, 321332] で示したアルゴリズムにしたがう。 認識において、距離画像のオブジェクトから計算された全特徴は いくつかの「都合のよい」パーティション、つまり正しいオブジェ クトモデルが存在していそうなパーティションを選択することで、 モデルベースの枝刈りに用いられる。 我々は、実際のシーンのオブジェクトから計算された固有値の中の 撹乱についてもモデル化し、この撹乱モデルがどのように認識の過 程で効果的に使用できるかについて示す。 ここで報告されるパーティション分割の実験の対象は、 平面、円筒、球表面を持つ125のCADオブジェクトのモデルベ ースを用いて得られた、実際の距離画像である。 認識結果から観測されるのは、低次処理(表面分割とグループ化) において妥当な程度の誤差に対して、常に正しいパーティションが 含まれることである。 また、実験結果によると、認識速度が著しく向上する傾向が見られる。 これは、ここで検討したモデルベースよりもはるかに小規模なものに おいてもそうである。

Na

Copyright(c) 1998 Academic Press, Inc.


不完全な輪郭からの完全な形状:ルール・ベースのアプローチ
Complete Shape from Imperfect Contour: A Rule-Based Approach

Yuan Ding and Tzay Y. Young

Computer Vision and Image Understanding Vol.70, No.2, May, 1998

本稿では、輪郭から形状を求める研究における2つの重要な問題について 述べる。 一つめは入力データの不完全さであり、二つめは出力される3Dオブジェ クトモデルの完全さである。 ここで提案する解決方法は、以下のものに基づいている。 (1)線図形構造の不完全さの解析(特にL型分岐) (2)ルール・ベース・システムの実現 拘束条件は、線のラベリング、2D・3D幾何、および人間の視知覚のゲ シュタルトの原理によって課されるが、これはプロダクション・ルールに 定式化される。システム制御機構は、これらのルールがインタラクティブ に動作しうるように設計される。 このシステムでは、完全な線図形が特殊ケースとして扱われる。 人間の視知覚と矛盾のない、完全な3Dオブジェクトモデル(不可視面を 含む)を、再構成することができる。 非単調な複雑な前向き推論機構は、真理維持系(TMS:Truth Maintenance System) を用いることで実現される。 TMSを用いるのは、仮説的状況における推論のための、現在アクティブな 事実(facts)の依存ネットワーク(dependency network)を維持するため である。 これは、矛盾を解決する仮定(DDB:Depencency Directed Backtracking と 呼ばれる)をバックトラックするのに、効率的な方法をもたらす。

Na

Copyright(c) 1998 Academic Press, Inc.


単一ビューからの3D道路再構成
3D Road Reconstruction from a Single View

Antonio Guiducci

Computer Vision and Image Understanding Vol.70, No.2, May, 1998

画像プレーン境界から、道路の局所的な3D再構成を行うための、新しい アルゴリズムが示される。 同一走査線において、道路の2ヶ所の境界点に対する画像および接線が 与えられると、このアルゴリズムは、2点の一方を終点とする道路断片 の3D空間内における位置を計算する。 導入される近似については、十分な議論がなされ、様々な誤差要因の決定 と比較のための公式が示される。 このアルゴリズムは非常に高速で、著者の機関における開発の下、モバイ ル・ラボ上に実時間実装がなされた。(Na)

Copyright(c) 1998 Academic Press, Inc.


Loweの姿勢推定アルゴリズムを高精度化する完全投影の定式化
A Fully Projective Formulation to Improve the Accuracy of Lowe's Pose-Estimation Algorithm

Helder Araujo, Rodrigo L. Carceroni, and Christopher M. Brown

Computer Vision and Image Understanding Vol.70, No.2, May, 1998

既知対象物を追跡するアルゴリズムに関して、David Lowe の有力で 古典的なオリジナル版があり、石井らはこれを再公式化したが、 いずれも(違いはあるが)近似された画像モデルに依存したもので ある。 それらの簡易化の仮定を取り除くことで、はるかに高精度化・高収束化 され、おそらくは計算時間特性にも優れた完全投影的解法が得られる。

Na

Copyright(c) 1998 Academic Press, Inc.


画像解析とコンピュータ・ビジョン:1997年
Image Analysis and Computer Vision: 1997

Azriel Rosenfeld

Computer Vision and Image Understanding Vol.70, No.2, May, 1998

本稿は、コンピュータ・ビジョンと画像解析に関する1700件ほどの 参考文献を、主題別に示している。 ここでカバーしているトピックスは、計算手法、特徴抽出とセグメ ンテーション、画像・シーン解析、2D形状、パターン、色・テクスチャ 、マッチングとステレオ、3D再構成と解析、3D形状とモーションである。 以下の関連トピックスに関しても、若干の関連文献が含まれる。 幾何とグラフィックス、圧縮と処理、センサーと光学系、視知覚、 ニューラル・ネットワーク、人口知能とパターン認識、様々な 応用。

Na

Copyright(c) 1998 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.70, No.3

ドキュメント画像のインデキシングと検索:サーベイ
The Indexing and Retrieval of Document Images: A Survey

David Doermann

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.70, No.3, June, pp.287-298, 1998

大規模なドキュメント画像データベースを維持することは、経済 的には割に合わない。 そのために、途方もなく大きな需要が創造された。それは、これ らの画像に含まれる情報のアクセス・操作に関してロバストな手 段を望む、というものである。 ペーパーレス・オフィスへと向かう試みはある。 それは、大量の印刷ドキュメントを、画像のままでスキャンし、 アーカイブするというものだ。そこには、適切なインデクス情報 がないのである。 もちろん、従来型のデータベースに、インデキシングと検索 の能力を与える方法はある。 その一つに、ドキュメントをすべて電子的表現へと変換する 方法がある。こうすれば自動的なインデキシングができるか らである。 ただし残念なことに、完全な変換というのは難しく、それを妨げ る要素として、コストの高さ、画質の悪さがある。 さらに、テキストでない要素の多くが適切に表現されえないとい う事実がある。 そのような場合に有利な方法は、画像形式でコピーを維持し、画 像のままで扱うというものだ。 本稿では、ドキュメント画像へのアクセスおよび操作の方法に関す るサーベイを提供する。 ここでは、完全かつ厳密な変換を要求しないものに限る。 まず、二つの技術について簡単に論ずる。一つは、不完全データ に対する従来型のテキスト・インデキシング技術である。 いま一つは、部分的に変換されたドキュメントの検索についてで ある。 続いて、(画像をそのまま扱うという意味で)直接的な特徴化、 操作、および検索といった技術に関する、より包括的なレビュー を行う。 対象とするドキュメントは、テキスト、グラフィック、情景画像 を含むものとする。

Sz

Copyright(c) 1998 Academic Press, Inc.


紙文書の分類:対象分野と言語から独立なテキスト分類のための 一般的システム
Categorizing Paper Documents: A Generic System for Domain and Language Independent Text Categorization

Thomas Bayer, Ulrich Kressel, Heike Mogg-Schneider, and Ingrid Renz

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.70, No.3, June, pp.299-306, 1998

テキスト分類とは、あらかじめ定義されたカテゴリーを、テキスト に割り当てることである。 この場合のテキストは、もともと電子的に利用可能なものであるか、 あるいはドキュメント画像解析から得られたものでもよい。 ここでは、テキスト分類の一般的なシステムについて述べる。 それは、代表的なテキスト集の統計的な分析に基づくものである。 重要な特徴量は、学習テキストから自動的に抽出される。 その方法は、現実の単語フォームからサブ文字列を選んで、統計情 報と一般的な言語知識とを適用することに基づく。 次いで、線型変換により、主要な情報を保存したままで特徴ベクト ル次元数の圧縮がなされる。 分類に用いるアプローチは、多項式を用いた最小自乗的な手法で ある。 このシステムは、対象領域が新しくなったり、言語が異なるよう な場合にも、効率よく適応しうる。 応用においても、このテキスト分類器は信頼性が高く、高速で、 かつ完全に自動的なものである。 例として、二つの分類タスクを試みた。その結果、およそ80% の認識スコアを達成した。 また、認識誤りやタイプミスに対しても非常にロバストである。

Sz

Copyright(c) 1998 Academic Press, Inc.


画像のままのドキュメントからのOCR抜き要約作成
Summarization of Imaged Documents without OCR

Francine R. Chen and Dan S. Bloomberg

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.70, No.3, June, pp.307-320, 1998

ここで提案するシステムは、画像のままのドキュメントを対象にして、 その内容を表す要約を作成するものである。 ここでいう要約は、画像のままのドキュメントから抽出された選択領域 の集まりである。 選択領域が含むものには、文章、主要フレーズ、見出し、図などがある。 それらの抽出において、OCRは用いられないのである。 処理内容は以下の通りである。 まず、画像のままのドキュメントから、単語領域の外接矩形を検出し、 単語の読み順を決め、テキストの文章・段落の境界の位置を決める。 単語領域の外接矩形は、等価クラスというものにまとめられる。 これは、テキスト形式における単語(ターム)を真似ている。 等価クラスは単語内容を表現するものである。これを検出したのち、 その集合からキーとなるフレーズを検出する。 要約文章の選択には、統計的な識別器を用いており、これを 離散的に表現された文章特徴の集合に対して適用するのである。 文章選択の評価に関しては、プロ(アブストラクト作成会社)の作った 要約の集合に対してなされた。これについても述べる。

Sz

Copyright(c) 1998 Academic Press, Inc.


主要傾き、複数傾き、およびロゴ検出のための圧縮ドキュメント画像の解析
Analysis of Compressed Document Images for Dominant Skew, Multiple Skew, and Logotype Detection

A. Lawrence Spitz

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.70, No.3, June, pp.321-334, 1998

ドキュメント画像の圧縮アルゴリズムでもっともよく使われるものといえば、 CCITTのものである。 CCITTのG3圧縮というのは、アナログ回線上のモデムによるファクシ ミリ伝送のすべてに用いられる。 また、CCITTのG4圧縮は、ドキュメント画像のデジタル圧縮・蓄積に 用いられる。 これら圧縮画像には、十分かつ容易に解釈できる空間情報が含まれており、 それらは画像を特徴づけることが可能である。 特に、黒構造と白構造のボトムの位置を特定することが可能である。 黒構造のボトムを用いるならば、その並びのピークの強さを決定して、 それに基づいて画像の主要傾き角度を求めることができる。 この方法は、マイナーピークを検出することでさらに拡張され、一つの 画像にある複数の傾きを検出することができる。 白構造と黒構造に関するピーク並びの角度分布を分解し、並び記号を作る。 圧縮表現において検出されうる明白な並び記号を生み出すようなロゴを 設計することもできる。

Sz

Copyright(c) 1998 Academic Press, Inc.


ドキュメント画像の記号的な圧縮と処理
Symbolic Compression and Processing of Document Images

Omid E. Kia, David S. Doermann, Azriel Rosenfeld, and Rama Chellappa

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.70, No.3, June, pp.335-349, 1998

本稿では、ドキュメント画像の圧縮・表現方法について述べる。 これは、ドキュメント画像のなかに見られる要素レベルの冗長性 を用いるものである。 このアプローチでは、まず繰り返し現れるパターンを検出する。 類似するパターンを1つのプロトタイプで表現し、 パターン・インスタンスの位置を蓄積する。 そして、両者の残差を符号化する。 新しい符号化方法を用いて、我々が与える表現は、 スケーラブルなロッシー(損失あり)圧縮とプログレッシブ伝送 とを容易にし、圧縮されたドメインにおけるドキュメント画像解 析を支援するものである。 このアプローチを導き、符号化手続きの詳細を与え、圧縮結果について報告し、 ドキュメント画像理解のタスクの一つのクラス、すなわち圧縮表現上 での操作が可能なものについて述べる。

Sz

Copyright(c) 1998 Academic Press, Inc.


背景記述を用いるページ・セグメンテーション
Page Segmentation Using the Description of the Background

Apostolos Antonacopoulos

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.70, No.3, June, pp.350-369, 1998

従来型レイアウト(つまり、印刷された領域が矩形であるもの)ではない 出版物の数は、常に増大しつつある。 テキスト段落とグラフィックエリアは任意の形状を取りうるし、それぞれに 回転したり、あるいは任意の並びを取ることもある。 これまでのドキュメント解析技法は、そうした複雑なレイアウトにうまく合わない。 本稿では、ドキュメントページ画像の新しいセグメンテーション方法を紹介する。 ページのレイアウトは、従来型でも複雑型でもよい。 基本となるアイディアは、柔軟な記述を効率よく作り出す、ということにある。 柔軟な記述のため、ページ画像の印刷領域を囲む背景領域についての、 タイルを用いた記述を用いる。 空白領域の記述を用いることで、印刷領域の外形境界をかなりの精度で検出 することができる。 新しいアプローチが高速であるのは、一つには、スキュー検出・補正の必要 がないためである。 さらには、処理対象として画素単位のデータではなく背景記述を用いており、 しかもその上で行われる操作は、簡単かつわずかなものであることによる。

Sz

Copyright(c) 1998 Academic Press, Inc.


領域ボロノイ・ダイアグラムを用いるページ画像セグメンテーション
Segmentation of Page Images Using the Area Voronoi Diagram

Koichi Kise, Akinori Sato, and Motoi Iwata

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.70, No.3, June, pp.370-382. 1998

本稿では、ページセグメンテーションの方法について述べる。 これは、近似的な領域ボロノイ・ダイアグラムに基づいている。 提案手法の特徴は、以下の通りである。

(1)ボロノイ・ダイアグラムにより、非マンハッタンレイアウトでスキューのある ページ画像から、ドキュメント要素の境界候補を得ることができる。

(2)候補を利用して、文字間および文字行間のギャップを、推定する ことができる。このときに、境界選択において、対象分野に依存す るパラメータを必要としない。

実験を行った。 対象は、非マンハッタンレイアウトで0度〜45度のスキューをもつ ものが128画像であり、マンハッタンレイアウトのものが98画像である。 その結果、確信されたのは、この方法は本文領域の抽出に有効であり、 連結成分解析に基づく他の方法と同じくらい効率的だということである。

Sz

Copyright(c) 1998 Academic Press, Inc.


手書き数字列を対象とするモデル・ベースの切り出し法
A Model-Based Segmentation Method for Handwritten Numeral Strings

Jianming Hu and Hong Yan

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.70, No. 3, June, pp. 383-403, 1998

Keywords: touching numeral strings, contour analysis, character segmentation, structural method, handwritten character recognition.

手書き接触文字の切り出しは、OCRにおける重要な課題である。 手書き数字列を対象として、新しいモデルベースの切り出し法を提案する。 この方法は、数字列の輪郭解析に基づいている。 輪郭解析によって、新しい特徴集合が抽出される。 これらの特徴は、境界構造の大局的な解釈に用いられる。 そして、共通の接触パターンに対する様々なモデルが作られる。 そのため、切り出しの信頼度が高まり、処理時間が削減されるのである。 本稿では、主として2個所の単純接触に対する切り出し法の記述に絞るが、 この方法は、他の接触状況における数字切り出しに拡張されうるものである。

Sz

Copyright(c) 1998 Academic Press, Inc.


隠れマルコフモデルに基づく単語認識とフランス小切手の単語的数値の読取への応用
Hidden Markov Model Based Word Recognition and Its Application to Legal Amount Reading on French Checks

S. Knerr, E. Augustin, O. Baret, and D. Price

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.70, No.3, June, pp. 404-419, 1998

HMM(隠れマルコフモデル)ベースの単語認識アルゴリズムについて述べる。 対象は、フランスの銀行小切手から得られる単語的数値である。 (注意:legal amounts は、数値表現でなく単語表現である数のこと) このアルゴリズムは、A2iA INTERCHEQUE認識システムの一部である。 このアルゴリズムは、二値の小切手画像から自動的に切り出された 手書き単語の画像から処理を始める。 完全な数の小文字ゾーンの検出に続き、単語の傾き補正を行い、 単語を graphemes へと切り出す。 この graphemes から特徴量を抽出する。特徴ベクトルをベクトル 量子化して、各単語に対する記号列とする。 HMM集合を用いて、すべての単語クラスの尤度を計算する。 このHMM集合は、viterbi あるいは Baum-Welch のアルゴリズムの いずれかを用いて、既に学習されているものとする。 システムの様々なパラメータを識別し、それらの重要性を評価する。 実世界の大規模データベース(フランスの手書き小切手)に対して、 処理結果を求める。 このHMMベースのシステムは、 発見的な単語認識器よりも、A2iA INTERCHEQUE 認識システムの 他のHMM的単語認識器よりも、優れていることを示す。 単語認識率は、26単語に対しておよそ89%である。26単語というのは、 フランスの銀行小切手の読取に不可欠な語彙である。 より最近になって、NNとHMMの複合型が設計されたが、こちら はより優れた認識率を与えた。

Sz

Copyright(c) 1998 Academic Press, Inc.


一般統合的線分検出アルゴリズムとそのオブジェクトプロセス仕様
A Generic Integrated Line Detection Algorithm and Its Object-Process Specification

Liu Wenyin and Dov Dori

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.70, No.3, June, pp. 420-437, 1998

Keywords: line detection, dashed line detection, arc segmentation, object-process methodology, object-process diagrams, graphics recognition, line drawings, engineering drawings interpretation, raster-to-vector conversion, CAD conversion.

GILDA(一般統合的線分検出アルゴリズムの省略形)について述べる。 GILDAは、一般的な図形認識アプローチに基づいている。 それは、図形認識という問題を抽象化して、図形対象物の複数の構成要素の 段階的復元と見なし、対象−過程法によって詳述される。 工学図面に現れる線分を12のクラスとして定義し、これらを用いてクラス継 承階層をつくる。 この階層は、線分抽出処理に必須の線分特徴を高度に抽象化するものである。 仮説−試行パラダイムに基づき、 選ばれた最初のキー要素の両端を段階的に拡張することによって、 線分が検出される。 それぞれの拡張サイクルにおいて、対象とする線分の形状とスタイル条件にもっとも よく合致するものが、新たにその線分に追加される。 線分クラスが異なることは、線分の属性値を制御することで検出される。 実験で示すように、このアルゴリズムは、きれいな人工合成図面であっても、 複雑でノイズのある実世界の図面であっても、高い性能をもつ。

Sz

Copyright(c) 1998 Academic Press, Inc.


地図解釈のための多重アプローチと分散的一貫性:市街地地図への応用
Multilevel Approach and Distributed Consistency for Technical Map Interpretation: Application to Cadastral Maps

Jean Marc Ogier, Remy Mullot, Jacques Labiche, and Yves Lecourtier

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.70, No.3, June, pp. 438-451 1998

Keywords: graphics recognition, technical document, city map, cadastral map, map interpretation, contextual information modeling.

フランス市街地地図の画像を自動的に解釈することのできるシステムのア ーキテクチャについて論ずる。 このアプローチは、地図の階層的記述における多重知覚に基づいている。 また、地図の特定スタイルの先験的モデルに導かれる。 本質的には、画像の複数のビュー視点に関する潜在的な不整合について、 抽出を試み、それからそれらを整合させることを試みる。 多くのタイプの意味的な不整合に出くわすことがある。 これを解決するにあたり、高次レベル処理と低次レベル処理との間に、 フィードバック・サイクルの計算を導入した。 複雑でノイズのある画像を処理対象として、信頼できる解釈例について論じる。

Sz

Copyright(c) 1998 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.71, No.1

交差比を用いたエピポールの検出
On the Detection of Epipoles Using Cross-Ratios

Q. T. Luong, O.D.Faugeras

Computer Vision and Image Understanding Vol.71, No.1, pp.1-18, July, 1998

2つの対になった校正されていない画像からエピポールの位置を算出する 問題を扱う。 このアプローチは、エピポーラ変換による交差比の不変量に基づくものであり、 点の対応づけによって得られる代数的制約を用いて、エピポールのみを含む解 を与える。 この方法は、基礎行列式だけに基づいて計算する方法とは対極にある。 これらの事柄は、新たなエピポーラの順序に関する制約条件とともに、最初に 述べられている。 3つの解法が順次考察された。 第1の方法は、いわゆるSturm法と呼ばれている方法によって得られる 閉じた形式の統計を利用する。 第2の方法は、決定論的手続きによって intersect plane cubicを利用し、 第3の方法は、交差比の差を非線形に最小化する手法に基づいている。 これら各々の欠点を論じ、数値実験結果を比較して、解法のエレガントさと、 ノイズに対する頑健さには一長一短があることを示す。 交差比に基づく方法は、基礎行列式に基づく方法に比べて、一般的に解が得 られる代案と言うわけではないことが分かった。

Ej

Copyright(c) 1998 Academic Press, Inc.


オフライン筆記の認識
Recognition of Off-Line Cursive Handwriting

I.S.I.Abuhaiba, M.J.J.Holt, S. Datta

Computer Vision and Image Understanding Vol.71, No.1, pp.19-38, July, 1998

全く新規で、柔軟性に富む、オフラインの手書きアラビア文字認識が ここに示される (I. S. I. Abuhaiba, PhD thesis, Loughborough University,1996)。 細線化されたストローク画像は、まず、直線によって近似される。 オフライン・ストロ−クが直線近似されたあと、元の書き順を再現す ることを目指した新規なアルゴリズムによって1次元表現される。 そして、ストロークの1次元表現からトークンが抽出される。 このトークンを認識するために、ファジーな順序機械が定義される。 ストロークのトークンは、意味のあるトークン列へと再結合される。 未知ストロークを構成するトークン列を、最も良く表す基本形状の 集合が見つけ出される。 手書き文書から行を切り出し、書いたのと同じ順序に主要ストローク を並べ、補助ストロークを主要ストロークに付与する、という処理を 行う一つの方法が開発される。 付与された補助ストロークは、基本形状に組み合わされる。そして、 その割り当て問題を定式化して解くことによって、最終的な文字が得 られる。 割り当て不明の補助ストロークは、個々に処理される。 このシステムは、20種類の手書き文書で試された。 その結果、サブワード(単語より短い単位の文字列)と文字について の認識率は、それぞれ55.4%, 51.1%であった。

Ej

Copyright(c) 1998 Academic Press, Inc.


未構造化3Dデータにフィットさせるための、パラメータによる変形可能モデル
A Parametric Deformable Model to Fit Unstructured 3D Data

Eric Bardinet, Laurent D. Cohen, Nicholas Ayache

Computer Vision and Image Understanding Vol.71, No.1, pp.39-54, July, 1998

多くのコンピュータビジョンや画像理解の問題において、与えられた 未構造化3Dデータにフィットする滑らかな表面を見つけるのは、重 要なことである。 なるほど、一般的な変形可能モデルに基づく方法でも、満足できる結 果は得られるし、特に表面を局所的に記述する場合はその通りである。 しかしながら、それらが高解像度の3D画像を扱う場合には、大規模 な線形系を解くことになる。 超2次曲面のようにパラメトリックで変形可能なテンプレートを用い る利点は、形状を記述するのにパラメータの数が少なくて済むことで ある。 しかし、超2次曲面で記述できる形状には限りがあり、複雑な表面を 精密に近似することはできない。 この理由によって、初期近似を精緻化するために、ハイブリッドな方 法で記述するモデルを導入する。 本論文では、変形可能な超2次曲面モデルを導入する。このモデルは、 まず超2次曲面フィットに続き、自由形状変形を行うことで、未構造 化3D点群にフィットさせるのに使われる。 さらに、適当な数のパラメータを追加することによって、自由形状変 形法は、より密着したフィッティングが可能になり、立体変形のフィ ールドが与えられる。 まず、この方法を、数学的・アルゴリズム的に詳細に示す。 次に、我々は医学応用に関心があるので、多数の3D心臓画像から、 左心室を再構成するような医学的応用例を示す。 この方法は、空間−時間画像(4Dデータ)による解剖学的構造の追 跡へと拡張された。その内容については、比較論文を参照されたい。

Ej

Copyright(c) 1998 Academic Press, Inc.


多重スケールの輪郭セグメンテーションとその近似: 整列した刻印多角形の幾何に基づくアルゴリズム
Multiscale Contour Segmentation and Approximation: An Algorithm Based on the Geometry of Regular Inscribed Polygons

Robert Bergevin, Marielle Mokhtari

Computer Vision and Image Understanding Vol.71, No.1, pp.55-73, July, 1998

本論文は、輪郭を円弧と線分で分割・近似するアルゴリズムについて述べる。 本アルゴリズムは、輪郭形状を記述する適当な円弧と線分を見つけだす。 その結果、以前のどの方法よりも多様な形状記述の基準を、保持することが できる。 この基準によれば、効率的、汎用的、ユニークで、形状保存性があり、局所的、 ロバスト、安定で、不変な、多段解像度で、コヒーレントで、階層的な、複数 部品からなる形状認識が可能となる。 アルゴリズムの適任性は、これが拠り所としている正規の計算理論から直接得 られる。 得られる記述は、センサー精度、サンプリングステップの大きさ、最小および 最大輪郭曲率、および、大きさに依存しうる。 これらデータ集合と、課題の特殊性に関連する少数の閾値を使って、アルゴリ ズムがパラメータ化される。 アルゴリズムに上記の性質に関する若干の知識を与えると、実データと突き合 わせるときに、処理がどの程度うまく行くかの予測が可能になる。 色々な複雑度に対応する輪郭データに対して、比較実験をした結果が示されて いる。

Ej

Copyright(c) 1998 Academic Press, Inc.


3Dオブジェクト認識における測光学的不変量の利用
Using Photometric Invariants for 3D Object Recognition

Kenji Nagao, W. Eric L. Grimson

Computer Vision and Image Understanding Vol.71, No.1, pp.74-93, July, 1998

本論文では、測光学的、幾何学的不変量を組み合わせて、3Dオブジェクト を認識する効率的アルゴリズムについて述べる。 3D空間において、カメラ、あるいは光源に対して、照度やオブジェクトの 相対的動きに不変な、いくつかの測光学的性質を導く。 我々は、認識には色が常に一定である必要はないことを示す。 それよりもむしろ、認識のためには、照明条件やオブジェクトの姿勢が変化 する中で、不変な何かがあるだけでよい。 オブジェクト表面における色不変量や空間的制約を組み合わせ、対応する特 徴量グループの位置の重心不変量を使って、モデルとデータ空間の座標値の 対応位置を同定する。 テストの結果、我々の3Dオブジェクト認識が安定で効率的であることが示 された。

Ej

Copyright(c) 1998 Academic Press, Inc.


クラスタリングとグラフ解析によるビデオのセグメンテーション
Segmentation of Video by Clustering and Graph Analysis

Minerva Yeung, Boon-Lock Yeo, Bede Liu

Computer Vision and Image Understanding Vol.71, No.1, pp.94-109, July, 1998

多くのビデオプログラムには、ストーリ構造がある。 これを認識するには、ビデオ・コンテンツの低次な視覚プリミティブをクラス タリングして、構成要素の時間的配列によって課される高次な構造を解析する ことだ。 本論文では、ビデオの視覚的特徴や時間的な動きを考慮して、類似する視覚的 内容を持つビデオ画面のマッチングやクラスタリングの定式化手法を提案する。 さらに、ビデオから抽出された時間構造を解析するために、シーン遷移グラフ (scene transition graph)表現を拡張する。 この解析により、シーンやストーリ・ユニットの自動的なセグメンテーション が得られるが、これは従来の映像境界検出法では検出できないものである。 そして、ビデオのコンテンツのコンパクトな表現が構築される。 さらに、圧縮されたビデオから抽出された、よりコンパクトなデータセット からでもセグメンテーションは実行できるし、広範な種類のビデオプログラ ムに対しても効果的である。 かくして我々は、ビデオをストーリの流れに沿って、意味のある階層的なコン パクトな表現に分解することができる。 これによって、ビデオの効率的なブラウジングや構成手段を提供することがで きる。

Ej

Copyright(c) 1998 Academic Press, Inc.


特徴量の構造に基づく変化の定量的測度:固有値と固有ベクトル
Quantitative Measures of Change Based on Feature Organization: Eigenvalues and Eigenvectors

Sudeep Sarkar, Kim L. Boyer

Computer Vision and Image Understanding Vol.71, No.1, pp.110-136, July, 1998

現場のモニタリングにおける一つの重要な課題は、変化を、空中画像か ら検出することである。 変化といっても、一般的には、様々なタイプがありうる。 そこで本論文では、ある現場の開発における変化の問題を取り上げるこ とにする。 例えば、 これまで開発されていない地域に新しい建設があれば知りた いし、できうるならば工事の進捗状況も知りたいであろう。 モデルに基づくアプローチは、この種の変化には適さない。 というのは、それは普通はモデル化されていない地域で起こるものだか らである。 局所特徴を評価し、これを予測することによって、工事に伴なう動きを 推測することは困難であるから、我々はより広範な統計的指標に頼るこ とにする。 本論文のテーマは、人的活動で生じた変化が、視覚的特徴の構造変化か ら推測できることである。 個々の画像特徴の属性が変わるだけでなく、これらの関係が変化してい く。 工事の進行に伴って、画像特徴間の構造が増加するのを見ることを期待 するというものだ。 我々は、この新たに出現してくる構造や組織を、変化を予想するのに有 効利用する。 本論文では、個々の特徴およびその関係についてのグローバルな統計的 特徴を定量化するために、4つの測度を提案する。 これらの測度は、グラフスペクトル理論に基づいて記述される。 色々な撮影条件のもとで、これらの測度のロバスト性を徹底的に解析し、 このような構造化に基づく測度が、開発の進展に伴なうゆっくりとした 変化を検出可能であることを示す。

Ej

Copyright(c) 1998 Academic Press, Inc.


実時間障害物検出のための地表面変換モデリング
Modeling the Ground Plane Transformation for Real-Time Obstacle Detection

Fuxing Li, Michael Brady

Computer Vision and Image Understanding Vol.71, No.1, pp.137-152, July, 1998

地表面上の障害物検出は、稼動ロボットにとっての共通の問題である。 以前の研究において色々な手法が研究されてきた。 しかし、どれもアクティブな視覚系で実用化できるほどではない。 本論文では、平面変換に基づく、アクティブな立体視系において、実 時間で障害物を検出する手法を紹介する。 同じ高さの1対のステレオヘッドから得られるステレオ画像対の地表 面変換をモデル化し、次にカメラ固有のパラメータを同定し、このパ ラメータでヘッドのフィードバック状態を利用して、実時間で地表面 変換計算できることを示す。 したがって、この結果を地表面の障害物を実時間で検出するために利 用することができる。 さらに、この地表面上の障害物検出の定式化によって、以前の予測地 表面の不一致に基づく手法や、固定幾何配置によるステレオカメラに よる地表面変換予測手法が、統合化できることを示す。

Ej

Copyright(c) 1998 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.71, No.2

多方位ビデオ画像からの、実時間でビュー依存な画像生成によるテレプレゼンス
Telepresence by Real-Time View-Dependent Image Generation from Omnidirectional Video Streams

Yoshio Onoe, Kazumasa Yamazawa, Haruo Takemura, Naokazu Yokoya

Computer Vision and Image Understanding Vol.71, No.2, pp.154-165, August, 1998

本論文は、大きな時間遅延なくして、動画像の実世界へ仮想旅行できる、遠 隔地表示 (テレプレゼンス;telepresence)の新しい手法について述べる。 新しいコンセプトとして、「インスタツアー(訳者注:造語)」を提案する が、これは動的な実世界の視覚化された空間を簡単に見回せるようにすると いうものである。 この「インスタツアー」は、以下のような2つのステップから成っている。

(1)ビデオレートでの多方位画像の取得。

(2)多方位ビデオ画像からの、実時間でビュー依存のある遠近画像の生成 (訳者注:見たい方向の遠近画像の生成のこと)

ここに提案する方法は、見たい実世界が観察者から遠隔地にあるような場合に 適用できる。 なぜなら、表示画像のビュー方位を変更しても、その時間差は、遠隔地との距 離に依存しないからである。 さらに、多数のユーザーが、同一視点からの動的な実世界の任意方向の画像を 同時に見回すことができる。 提案する手法は、あらかじめ記録された全方位ビデオ画像を利用する、他のタ イプのテレプレゼンスにも有用である。 我々は仮想インスタツアーシステムを試作し、実時間動画の実験に成功した。

Ej

Copyright(c) 1998 Academic Press, Inc.


ビデオ画像分類のための効果的なシーン変化検出とカメラの動き解釈
Efficient Scene Change Detection and Camera Motion Annotation for Video Classification

Wei Xiong, John Chung-Mong Lee

Computer Vision and Image Understanding Vol.71, No.2, pp.166-181, August, 1998

ビデオ画像データの急速な成長に伴って、ますますビデオの分類や管理が 重要になっている。 ビデオを分類する上で、ビデオの分割(訳者注:時間軸に沿って、どこで 分割するかということ)と特徴抽出とは、2つのキー技術である。 本論文では、シーン変化の検出と、カメラの動き抽出の革新的な手法を紹 介する。 ビデオ画像の分割には、中断のないビデオ・ショット集合(訳者注:場面 のこと)の境界を検出する処理が含まれる。 場面境界は、2種類に分けることができる。すなわち、漸進的な 変化と突然の変化(カメラブレイクと呼ばれる)とである。 漸進的な変化は、検出の難しい問題と考えられており、ほとんど研究報告 がなされていない。 我々は、「ステップ変数」と呼ばれる効果的な方法について論ずる。 本論文では、ビデオ・ショットにおける主要なカメラ動作を分類する新規 な方法について述べる。 本方法は、分割された画像から検出されたオプティカルフローを解析する ことによって行われる。 まず、我々のカメラモデル(カメラの動きは、1シーン中で1種類だけ)に 従って、画像を部分領域に分割する。 これら分割領域のオプティカルフローは、それぞれに、x,y成分別に投 影され、別々に解析される。 異なるカメラの動きは、これら計算値と、既知のパターンとを比較して、 認識される。 我々の手法は、いくつかの平均値と標準偏差値を用いるだけなので、効率 的かつ効果的である。 解析と詳細な結果が、本論文には示されている。 また、本提案手法の有効性を示すために実験結果も示されている。

Ej

Copyright(c) 1998 Academic Press, Inc.


不変量に基づく画像データベースからの形状検索
Invariant-Based Shape Retrieval in Pictorial Databases

Michael Kliot, Ehud Rivlin

Computer Vision and Image Understanding Vol.71, No.2, pp.182-197, August, 1998

画像情報検索の最大の手がかりの1つは、形状である。 しかし、対象物は見る方位に依存して色々に変形して見えるために、 形状というのは、大変扱いにくくもある。 現在、画像を形状から検索することは、一般に普及するための最も大 きな障壁の1つと思える。 我々は、画像の不変特徴に基づいて、画像データベースから形状検索 をするアプローチについて述べる。 特に、半局所的な多値の不変特徴とグローバルな特徴の両方の組み合わ せを用いる。 類似性を計算する前に、空間的な関係と、グローバルな性質を利用して、 無関係の画像を除外する。 本提案手法の特長は、以下の三つである。 第一に、異なる視点から見たときに変形して見える画像も扱えること。 第二に、画像が部分的に見えない場合(オクルージョンによって見 えなくなっている場合や、検索用の質問語として描くスケッチの一部が 欠けている場合)にも適用可能であること。 第三に、効果的なインデックス生成能力を持つこと。 我々は雑多なデータベースの、スケッチによる質問で強化された、SQL に似たユーザインターフェースに実装化した。 これは、商用のデータベースシステム上に構築され、Webから作動させ ることができる。 我々は、本提案手法の実験結果から、その有効性を示す。

Ej

Copyright(c) 1998 Academic Press, Inc.


2値画像検索のための、内容に基づくプログレッシブな形状圧縮法
Progressive Content-Based Shape Compression for Retrieval of Binary Images

Corinne Le Buhan Hordan, Touradj Ebrahimi, Murat Kunt

Computer Vision and Image Understanding Vol.71, No.2, pp.198-212, August, 1998

本論文は、2値の形状画像の、内容に基づく圧縮を扱っている。 本提案手法は、形状輪郭の多角形近似に基づいている。 近似をプログレッシブにするために、形状解析や境界パターンマッチング のようなコンピュータビジョン応用でよく知られている近似アルゴリズム を採用する。 高速にブラウジングするための、粗い形状表現から、細密な描画のための 誤差のない表現まで、色々な品質レベルに対応する符号化法が得られる。 プログレッシブな形状情報を効率よく圧縮するために、離散幾何学的な拘 束条件を用いる。この拘束条件は、画像格子の量子化に付随するものである。 提案する方法は、(ビットマップ・ブロックでなく形状境界を用いるとい う意味で)内容に基づいた、品質調節可能な表現を与えるいっぽうで、 圧縮効率に関しても、このような機能を持たない最新の符号化法に匹敵する 性能を保っている。

Ej

Copyright(c) 1998 Academic Press, Inc.


人間の顔認識:証拠集め型アプローチ
Human Face Image Recognition: An Evidence Aggregation Approach

Ali Reza Mirhosseini, Hong Yan, Tuan Pham

Computer Vision and Image Understanding Vol.71, No.2, pp.213-230, August, 1998

本論文では、分析に基づく新規な顔認識システムが提示される。 これは、認識タスクにおいて、顔の個々の部品の重要性に応じた統合化 を可能とするものである。 40人分の画像データが利用され、画像中から、顔領域と頭の境界の部分 が同定された。 このシステムにおいて、 目は、学習グラフテンプレート(訳者注:いわゆるニューラルネットワ ーク)によって検出される。 口は、変形可能なテンプレートによって検出される。 鼻の位置は、口と目の位置に基づく積分投影(訳者注:部分領域内で、 濃度を水平方向に投影したプロファイルのこと。つまり、水平に長い 高濃度の影は大きな積算ピーク値を持つ)によって検出される。 頭の3Dモデルを利用することで、顔が回転しても認識されるように、 回転が推測される。 顔の凸部による影響は、全体的な認識指数によって評価され、このとき 求められた最適値(指数)が残りの実験に利用される。 個々の顔特徴量が、分類器に証拠を与え、これにより認識の信頼度が変 化する。 さらに、ファジーな情報融合手法が適用されて、ファジー的証拠集め法 で導出される個々の分類器の、それぞれの結果が結合される。 個々の分類演算の信頼性は、学習段階でファジー密度測度(訳者注:学 習サンプルを利用して密度を計測し、この結果を認識に利用した)を利 用して、専門家に評価してもらった。 顔全体の分類はファジー証拠を統合化することで求められた。 システムの効率評価は、色々な角度に顔を回転させ、その累積スコアを 用いて行った。 この累積スコアによって、通常の認識率とともに、第2位候補も得られる。

Ej

Copyright(c) 1998 Academic Press, Inc.


3Dモデリング、描画、仮想ビュー生成のための画像解析
Image Analysis for 3D Modeling, Rendering, and Virtual View Generation

Ebroul Izquierdo M., Silko Kruse

Computer Vision and Image Understanding Vol.71, No.2, pp.231-253, August, 1998

テレプレゼンスシステムや、対話系におけるビュー、遠隔地の3Dシーン中 に浸ってしまうような、仮想環境を生成することは、今後発展し、将来性の ある分野であろう。 これに必要な技術においては、一組の遠近感のある実画像を使って、任意の遠 近感を与える画像を合成することが課題となる。 このようなシステムでは、2つの主要な構成部分を区別する必要がある。 すなわち、多視点画像解析と視点の生成とである。 多くの方法に比べて、多視点画像解析は、コンピュータビジョンにおいてし ばしば出くわす困難な3つの課題から成っている。 すなわち、対応画素の推定、オブジェクト抽出、およびカメラパラメータの 校正である。 さらに、画像合成にとって、多視点画像合成は必要な基盤となっている。 本論文では、ステレオ画像解析、3Dモデリング、そして、ビュー合成のた めのロバストな枠組みを示す。 画像解析の部分では、改良ブロック・マッチング・アルゴリズムと、モルフ ォロジーを利用した、深さに基づくオブジェクト認識によって、マッチング の不整合度合いを推定することができる。 このシステムの基本的アイデアは、これらの課題を、他の課題とやりとりす ることによって、直接解こうというものである。 対応する問題を部分的に解いて得られた結果で、セグメンテーションが非常 に簡単になったし、その逆でもあった。 画像合成部分では、2つの課題が考えられた。 すなわち、任意の中間視野が直接合成され、これが、マッチング不整合を起 こすかどうか評価され、この結果とカメラパラメータを利用して3D構造が 抽出される。 このシステムによって、仮想ビュー合成と3Dモデリングによるオブジェク ト操作を示すことができた。

Ej

Copyright(c) 1998 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.71, No.3

遺伝的アルゴリズムによる学習を利用したセルラー・ニューラルネットワー クによるテクスチャー分類とセグメンテーション
Texture Classification and Segmentation by Cellular Neural Networks Using Genetic Learning

Tamas Sziranyi, Marton Csapodi

Computer Vision and Image Understanding Vol.71, No.3, pp.255-270, September, 1998

我々は、セルラー・ニューラルネットワーク(CNN)のアーキテクチャーに基づくワン チップのテクスチャー分類器を示す。局所的に相互接続した2次元状のCNNセル アレイの動的状態を調べることによって、テクスチャー分類やセグメンテーション に有用な、新しい理論的方法を開発した。 この手法は、従来のコンボリューションに基づく特徴抽出法とは、以下の点で異なる 。 すなわち、フィードバック・コンボリューションを用いること、およびネットワーク の最適カーネル行列を求めるために遺伝的アルゴリズムを用いることである。 我々がテクスチャー認識を行う場面で見出したCNN演算子は、異なる初期ビジョン効 果を結合することになるかも知れない。 カーネル行列が、コンボリューション/デコンボリューションや非線形効果用のネッ トワークの状態方程式から、どのようにして導かれるかを示そう。 全プロセスは、テクスチャー画像のヒストグラム等化処理、学習したカーネル行列に よるフィルタリング処理、そして、フィルター処理済み画像の平均濃度やテクスチャ ーエネルギーに基づく決定とから成る。 デジタルCNNのシミュレーションモデルを使って、ノイズ、回転、スケールに対する 感度実験を行った結果を示す。 プログラム可能な22×20(入力画素数)の光入力のCNNチップ(実行時間は数ミリ秒 ) を応用してテストした結果も報告する。 単純な3×3のCNNカーネルからなるこのCNNによって、4つのテクスチャーが安定に分 類できることを見つけた。 判定用のテンプレートをより多く持つことによって、より多くのテクスチャーが分類 でき、1%以下の誤差で適切なテクスチャーセグメンテーションが可能になることを 信じている。

Ej

Copyright(c) 1998 Academic Press, Inc.


可変光源下のシーン画像を解析する
Analyzing a Scene's Picture Set under Varying Lighting

Martin Bichsel

Computer Vision and Image Understanding Vol.71, No.3, pp.271-280, September, 1998

本論文は、光学の物理法則に則って、種々の光源の条件下における一連の写真画像 を、物理的に完全に記述する方法が解析的に求められることを示す。 ここにおいて、カメラ、シーン、光源はすべて一定であるが、各光源の光量変化は 任意であるとする。 このような画像集合は、画像空間において1つの凸領域を形成し、各画像は高次元 のベクトルで表される。 全ての光源強度が同時に変化し、凸領域の次元を1にすることができるような、最 適な輝度不変な投影条件が求まる。 強度が変わりつつあるような2つの光源で照明されるシーンの実験によって、この 理論の正しさが確認された。 単純な光源不変条件での認識アルゴリズムが導かれ、顔の認識に試用された。こ の新しいアルゴリズムと標準的なアルゴリズムの比較が示されており、光源強度やそ の方向が変化しても、照明不変認識法が遥かに良いパーフォーマンスを与えることが 分かる。

Ej

Copyright(c) 1998 Academic Press, Inc.


個別のオブジェクトの境界抽出
Boundary Extraction of Discrete Objects

Yukiko Kenmochi, Atsushi Imiya, Akira Ichikawa

Computer Vision and Image Understanding Vol.71, No.3, pp.281-293, September, 1998

コンピュータビジョンにおける1つの目的は、3次元世界のオブジェクトの幾何学的 、 位相幾何学的性質を得ることである。 まず最初に、オブジェクトを計測し、次に、計測値をオブジェクトの幾何学的・位相 幾何学的性質に変換する。 計測値と幾何学的・位相幾何学的性質の中間表現として、コンピュータのための表現 が望まれる。 本論文では、組合わせトポロジーに基づくオブジェクトとオブジェクト境界の表現方 法を提案し、計測データから境界を抽出する方法を開発する。 オブジェクト形状に関する情報には、内部状態は不要であるので、境界に関する情報 だけを抽出する。 更に、本アルゴリズムによって境界はユニークに決定されることを証明する。

Ej

Copyright(c) 1998 Academic Press, Inc.


偏りの少ない芯線(スケルトン)を得るための、ベクトル解析による消去可能な潜在 画素を利用した並列細線化法
Hidden Deletable Pixel Detection Using Vector Analysis in Parallel Thinning to Obtain Bias-Reduced Skeletons

Yung-ShengChen

Computer Vision and Image Understanding Vol.71, No.3, pp.294-311, September, 1998

パターンの重要な幾何学的特徴を保存してスケルトン抽出を改良することは、 非常に重要である。 1つの好適なアプローチは、既知の並列アルゴリズムに、細線化の偏りを減少 させる方法を埋め込むというものである。 ここで、偏りはしばしば幾何学的特徴を劣化させるから、偏りの減少は大切である。 我々の観察によると、偏ったスケルトンが生じるのは、90度かより小さい角 度で交差する部分にである。 本論文では、「潜在する削除可能な画素(HDP=hidden deletable pixel)」という ものを新たに定義する。これは、凹側の境界画素を取り除く速度に影響を与える。 擬似的に1サブサイクルで並列処理を行う並列細線化アルゴリズム(CH)に基づいて、 より大きなサポート(サポートとは、処理に参照する画素の組であり、通常は3× 3が最も一般的であるが、ここでは2組のL画素ベクトルを利用する。なお、サポ ートはよく利用されるk×k形式の正方領域ではない)で演算される。 各細線化処理の繰り返し毎の、中間的ベクトルの解析結果によって、このような偏 りの少ないHDPが開発されたが、これに要する処理演算コストは適度である。 HDPによって接続が破れた部分を復元し、しかも並列処理が可能な改良アルゴリズ ムについても考察され(CYS)、CHやHDPによる演算でも、接続部分の保存が保証さ れる。 人工的な画像にスケルトニングを適用し、このアルゴリズムの幾何学的特性が評 価され、Lの値を変化させて細線化のばらつきを調べた。 この解析から、CYSについては3≦L≦9の値が適当であると判断された。 CYSは、同一画像を対象にして、小さなサポートを有するアルゴリズム(AFP3やCH) と、大きなサポートを有するアルゴリズム(VRCT)と比べて評価された。 パフォーマンスは、繰り返し処理数(NI),CPUタイム(TC)、不適画素数 (Nu;これは偏り減少の目安として)で計られた。 TCによる評価では、CYSは、他に比べて2−3倍遅く、NIによる評価では、4つのアル ゴリズムはほとんど同じパーフォーマンスを示した。 Nuによる評価では、CYSは他にくらべて2−3倍遅かった。 ノイズ耐性は、1画素の境界ノイズが考慮された。 ノイズ耐性は、CYSでもCHでも同じであるが、AFP3よりも良かった。 結論として、偏りの少ないCYSは、計算コストを考慮して、適度と思われる。

Ej

Copyright(c) 1998 Academic Press, Inc.


基本行列を推測する際の、劣化した構成データのロバストな検出
Robust Detection of Degenerate Configurations while Estimating the Fundamental Matrix

P. H. S. Torr, A. Zisserman

Computer Vision and Image Understanding Vol.71, No.3, pp.312-333, September, 1998

データにノイズが沢山あるとき(ミスマッチ)に、ロバスト性に重点を置いた基本行 列の推定における多数解、あるいは劣化の検出を求める新しい方法を紹介する。基本 行列は、2視点からの画像に対応する画像特徴から得られるカメラの動きや内部の全 パラメータを内含している。これはしばしば、動きから構造を求めるアルゴリズムの 第1ステップとして利用されている。もし、対応関係の組が劣化すると、構造が正確 に復元されなくなり、結果として多数の解がデータと矛盾しなくなってしまう。この ようなことが起きるときには、警告がでることが重要である。現在利用できる特徴 マッチング法がミスマッチしやすいのであるから、劣化の度合いを判定する検出法 は、孤立点(平均から離れた点)にもロバスト(頑健)でなければならない。本論文 では、劣化度合いの定義が与えられ、2視野の非劣化や劣化の場合について一覧表化 されているが、これは、解析幾何学から、求められる多様性表現を論理的に導入した ものである。次に、これら各々のケースが、画像の対応付けによって、我々が開発し たスコアー関数を利用して、ロバストに決定できることを示す。このアイデアによっ て、劣化や孤立点を同時に検出する手法が定義される。この方法は PLUNDER-DL と 呼ばれ、ロバストな推定方法である RANSAC の一般化となっている。 この方法は、色々な異なる実画像対について評価された。 特に、孤立点が存在するような場合、劣化のモデル化を適当に実行することで、ミ スマッチが検出できた場合を示す。 これは、他の方法では検出不能だったものである。 点マッチング、劣化検出、孤立点検出を含む全ての処理は、自動的である。

Ej

Copyright(c) 1998 Academic Press, Inc.


輪郭特徴によって指標付けする自由形状3Dオブジェクトの認識
3D Free-Form Object Recognition Using Indexing by Contour Features

Jin-Long Chen, George C. Stockman

Computer Vision and Image Understanding Vol.71, No.3, pp.334-355, September, 1998

我々は、一枚の2次元濃淡画像から自由形状の3次元オブジェクトを認識する 問題について述べる。 与えられたモデルを整列させることによって認識する、という「モデルに基づ く方法」について示すが、これは3つの主な課題から成っている。それは、モ デル作成、マッチング、そして指標付けである。 モデリングの問題は、どんな方向から見ても分かるような輪郭形状(シルエッ ト)を形成することである。 マッチング問題は、候補モデルの輪郭図形を、初期姿勢に基づいて観察された 輪郭形状に合致させようとする。 本論文の主要な貢献は、指標付けの方法と、認識ができるようにモデリングと マッチングを組み込むことである。 指標付けは、候補モデルの見え方と、大体の姿勢と大きさの両方を特定化しな がら仮定を作っていく。 仮定は、予め蓄積されたモデルの知識と、観察されたオブジェクトの視覚的証 拠に基づき、もっともらしさの順に並べられる。 20個の3Dオブジェクトと、80個の2Dオブジェクトから形成された658個のモデ ルを有するデータベースによって、実装化されたプロトタイプは、認識と位置同定の 実験に使われた。 ベンチテストとシミュレーションの結果から、散らかったシーンに適用しても、 多くのオブジェクトが正確にかつ効率的に処理されることが示された。 我々の提案する、整列させながら認識をする、という方法による3Dオブジェ クト認識は有益であることが結論付けられる。

Ej

Copyright(c) 1998 Academic Press, Inc.


形状推定における見かけの形状への誤差の影響
Effects of Errors in the Viewing Geometry on Shape Estimation

LongFah Cheong, Cornelia Fermueller, Yiannis Aloimonos

Computer Vision and Image Understanding Vol.71, No.3, pp.356-372, September, 1998

動いているセンサーによって読み取られた画像には、3次元のセンサー情報と、画像 の形状情報が含まれている。 ここ数年に行われてきた興味深い研究は、二つの誤差を特徴付けようとするものであ る。一つは、3Dの動き(カメラ自身の動き)推定の計算に伴なう誤差であり、もう 一つは、シーンの構造推定(動きからの構造推定)に起因する誤差である。 これまでの研究を特徴づけるのは、 結果として生じる誤差のために表現を回復するようなシーンに特別のアルゴリズム やモデルを採用することのみならず、解析に利用するオプティカルフローや特徴対 応付けなどである。 本論文は、ノイズが存在する中での3D的動きと形状の関係を特徴づける幾何学的 なフレームワークを示す。 動いている単眼の観察者によって復元される3次元空間が、どのように歪んでいる かを調べる。このとき、観察者の3次元的動きは、誤差を伴って推定される。 我々は、歪んだ空間をレベル(等級)で表現する。 すなわち、等誤差表面の族によって体系的に歪みを特徴づけ、これによってシーン 中の1点の深さが、同じ倍率だけ歪んでいる軌跡を表すことができる。 このようにして導入されたフレームワークは、多様な展開が可能である。 見えている表面は正の深さを持っている(可視条件)わけであるから、歪み因子が 負である空間範囲を探索することで、すなわち、可視条件が満たされないところを 探索することで、動きの推定に曖昧さを与えるような状況を明確化できる。 これは、用いられるアルゴリズムから独立である。 正常なフローから解析される3Dの動きについて、解の一意性を解析する方法を述 べる。 我々は、3Dの動きや、オブジェクトの動きや、独立に動くオブジェクトが、動く 観察者に観察可能であるような深さの制約条件について研究し、3Dの動きを正確 に推定するための加速度センサーに対する定量的な要求精度を導く。

Ej

Copyright(c) 1998 Academic Press, Inc.


DPマッチングに基づく分岐・結合法を用いた混在文書画像の解析
Analysis of Mixed Korean Documents Using the Branch and Bound Algorithm Based on DP Matching

Dong-Gyu Sim, Young Kug Ham, In Kwon Kim, Rae-Hong Park

Computer Vision and Image Understanding Vol.71, No.3, pp.373-384, September, 1998

本論文は、手書き文字とグラフィックな画像が混在する文書画像の 効果的で自動的な解析システムを紹介する。 前処理の段階では、入力画像が2値化され、連結成分のチェインコ ードによって、テキスト領域からグラフィック領域が分離される。 文字認識の段階では、2種類の文字種を認識する。すなわち、ハン グル認識と英数字認識である。 ハングルの構造的な複雑さと多様性を考慮して、母音部分の認識と、 ダイナミックプログラミングに基づく分岐と結合アルゴリズムによ って、基本音素を抽出し、部分パターンに分離する。 (訳者注:ハングルは、母音と子音を表す構成要素からできている) 最後に、認識結果をより有効にするために、辞書と知識が利用される。 50枚のテスト文書によるコンピュータシミュレーションの結果、こ こに提案するアルゴリズムが混在文書を効率的に解析していること が示される。

Ej

Copyright(c) 1998 Academic Press, Inc.


空間的スケールの自動選択機能を有する特徴追跡
Feature Tracking with Automatic Selection of Spatial Scales

Lars Bretzner, Tony Lindeberg

Computer Vision and Image Understanding Vol.71, No.3, pp.385-392, September, 1998

動的な世界を観察するときには、時間とともに見る画像の構造サイズは 変化するであろう。 本稿は、特徴追跡アルゴリズムにおいて、自動的にスケールを選択する 明確なメカニズムが必用なことを強調しているが、その理由は、(i)局 所的な画像構造に局所的サイズを適応させ、(ii)時間の経過に伴なって 変化するサイズの変化に適応させる、ためである。 コーナー検出とブロッブ(訳者注:塊状の画像)検出は、詳細に述べら れ、これらを組み合わせた特徴追跡について紹介する。 統合化されたアルゴリズムでは、サイズの変動が大きな連続画像におい て、固定倍率に追跡法で露呈される固有な限界を克服することができる。 スケール記述の経時変化に対する安定性を利用して、マッチングの多面 的類似度に利用できることも示す。 本アルゴリズムによるコーナーとブロッブ追跡の実世界画像への適用実 験が示されている。

Ej

Copyright(c) 1998 Academic Press, Inc.


再配置可能なバスシステムを有するプロセッサアレイ上の、最適な高速性を可能にす る並列テンプレートマッチングアルゴリズム
Optimal Speed-Up Parallel Image Template Matching Algorithms on Processor Array with a Reconfigurable Bus System

Horng-Ren Tsai, Shi-Jinn Horng, Shun-Shan Tsai

Computer Vision and Image Understanding Vol.71, No.3, pp.393-412, September, 1998

画像のテンプレートマッチングは、画像処理、パターン認識、コン ピュータビジョンなどの分野における基本的問題の1つであると同 時に、それらの分野における多くの応用をもつ。 これは、フィルター処理、エッジ検出、画像の位置合わせ、オブジ ェクト検出に有用な演算である。 本論文では、3Dプロセッサーアレー上に、(p^2)(N^2)プロセッサ を持つ、2つの O[(M^2)/p^2]log log(M)]と O[(M^2)/p^2 + (M/p)log(log(p))] 倍の並列画像テンプレートマッチングアルゴリズムを始めて設計し た。 各プロセッサは、それぞれ、1≦p≦M≦NのO(1)と O(M/p)限定メモリ を持ち、N×NとM×M画素のテンプレートを持っている。 プロセッサのメモリを増加させることで、各々、時間の複雑度を (p^2)(M^(1/C))N^2、およびp^(2+1/C) N^2 個のプロセッサーを使う事によって、これら2つのアルゴリズムは、 O(M^2/p^2)倍の高速化ができる。 ここで、Cは、C≧1の定数である。 さらに、O(1)倍は、M^(2+1/C)N^2プロセッサーによっても達成でき る。 これらの結果から、今まで知られている最高の性能限界を改善でき、 時間的にも、複雑さからも最適なものが達成できる。

Ej

Copyright(c) 1998 Academic Press, Inc.


顔画像の処理:特徴検出と姿勢の正規化
Preprocessing of Face Images: Detection of Features and Pose Normalization

Daniel Reisfield, Yehezkel Yesburun

Computer Vision and Image Understanding Vol.71, No.3, pp.413-430, September, 1998

どんな顔認識システムであっても、顔の位置や大きさが既知であれば、 信頼性、スピード、複雑性は格段に改善される。 我々は、前後関係に依存しない「一般化された対称的変換」と、顔に 関する知識とによって、目と口を、自動的でロバストに認識する方法 を提案する。 特徴抽出は、強度勾配画像からなされ、つぎに顔画像を正規化するた めに使われる。 固定点が、2つの目と口であるようにアフィン変換を施す正規化の手 続きによって、汎用的な顔認識の分類手法の効率が格段に改善できる ことを示す。 他の、背景除去や照明条件均一化などの正規化のための手続きも道具 として有用であることがわかった。

Ej

Copyright(c) 1998 Academic Press, Inc.


多数の3D断面マップの同時位置合わせのための、領域に基づくマッチング
Area-Based Matching for Simultaneous Registration of Multiple 3-D Profile Maps

Oli Jokinen

Computer Vision and Image Understanding Vol.71, No.3, pp.431-447, September, 1998

我々は、大まかな位置関係は既知だがそれらの対応付けは未知であるよ うな複数の3Dデータ集合についての、領域(area)ベースの同時位置合 わせ手法を提案する。 この方法は、単一の数値でパラメータ表現された表面のデータ集合にも 適用できる。 ここで導入する表現は、「3D側面(profile)マップ」と呼ばれ、 光ストライプによって得られるデータを対象とするものである。 位置合わせ処理の間、異なる視点から撮られた「側面マップ」の相対的 な方位関係が、オーバーラップする領域についてパラメータ表面のマッ チング処理を繰り返すことによって、次第に精度を向上させていく。 このとき、表面間の重み付き距離の2乗和が最小になる方向に処理を続 ける。 ありえないマッチング条件は、適応的重み付けによって拒絶され、全て のマップについて同時最小化の課題が解かれる。 階層的手法を利用することで、グローバルな最小点を見つけることと、 高速化が達成される。 コンピュータ演算は、画像代数の記号で定式化され、並列処理手法が実 現されている。 これによって更に計算時間が減少した。 実際のデータとともに結果が示されている。

Ej

Copyright(c) 1998 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.72, No.1

2分決定グラフを用いた高速な二値画像処理
Fast Binary Image Processing Using Binary Decision Diagrams

L. Robert and G. Malandain

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.72, No.1, October, 1998

多くの伝統的な画像処理の課題は、画像サブセット上のブーリアン関数の 評価として実現できる。 例えば、3D細線化に用いられる単純性テストには、各voxel(3次元画素)の 26の隣接voxelを検査し、これらの入力の一回ブーリアン関数計算を行うこと が必要である。 本稿では、そのような関数のための非常に効率的でコンパクトなコードを、 自動的に生成するために、2分決定グラフ(Binary Decision Diagrams)がいか に用いられるかを示す。 生成された関数で実行される総演算数は、最大でも各入力値に対して一回 のテストと一つの分岐(branching)である。(3D細線化の場合、26回のテ ストと分岐である) この関数について保証されるのは、各ステージで、関連する入力データ(すな わち、結果に影響を与える値)の検査のみである。 一例として、デジタルトポロジーにおける3D単純性テストと細線化プロセス を考える。 ここで生成される関数は、我々が従来最適化して実現したものや、我々の知る 限りのいかなる実現よりも、大幅に高速である。 3D単純性テストでは、平均すると各voxel当たりで検査されるのは、わずか 8.7ヶ所の隣接voxel値である。

Na

Copyright(c) 1998 Academic Press, Inc.


Flow Fieldからの被照明運動の再帰的予測と形状の同時復元
Recursive Estimation of Illuminant Motion from Flow Field and Simultaneous Recovery of Shape

S. G. Deshpande and S. Chaudhuri

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.72, No.1, October, 1998

Keywords: total least squares estimator, illuminant or photo motion, source from shading, shape from shading, incremental shape recovery.

点光源による被照明オブジェクトの画像系列を観測することで、その点光源の 運動を追跡するための全最小二乗推定に基づく方式を提示する。 オブジェクト初期形状の推定には、一枚の画像フレームを対象とする「陰影か らの形状・光源法」のような、任意の既存技術を用いる。 この形状推定が、実際の形状に対してノイズを含む測定であることを考慮した うえで、全最小二乗的な定式化を用いる。 この方式は、flow fieldからの連続フレーム間の被照明運動を追跡する。 2枚の連続フレームからのデータだけを利用して、この2枚のフレーム間の被 照明運動を推定するためのアプローチが開発される。 このアプローチはさらに拡張され、全ての既出画像フレームからのデータを用 いて被照明運動を追跡するための再帰的手法が開発される。 ここで提案される被照明運動推定を用いて、形状を順次的に復元する方式も提 案される。 この方式は、さらに拡張されて、環境照明が存在したり、複数の被照明物があ るときでも扱えるようになる。 典型的なシミュレーションの結果により、ここで提案される被照明運動と形状 の更新方式の有効性を示す。 連続フレーム間を関連つける特徴点は不要である。 さらに、この方式は全ての反射マップに適用することができる。

Na

Copyright(c) 1998 Academic Press, Inc.


能動的な三角測量による構造マッチング
Structural Matching with Active Triangulations

Richard C. Wilson, Andrew D. J. Cross and Edwin R. Hancock

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.72, No.1, October, 1998

本論文は、マシンビジョンにおける関係マッチング問題の新しいアプローチに ついて述べる。 静的なシーン記述をマッチングするかわりに、本アプローチはマッチされるデ ータの能動的表現を採用する。 この表現は、 Dalaunay の三角測量に基づいており、繰り返し再構成すること によって、再構成マッチングプロセス中の関係構造モデルとの位相的な適合性 の程度を高める。 関係構造の能動的再構成は、MAP更新プロセスにより制御される。 最終的に再現されたグラフ表現は、マッチングしようとしているオブジェクト の利用可能な属性に関して、最大の事後確率を持つという意味で最適である。 この技術の与える利点は、雑然とした(cluttered)合成開口レーダーデータを デジタル地図形式のモデルにマッチさせることで、実験的に示される。 実運用上の限界については、シミュレーション研究で確立される。

Na

Copyright(c) 1998 Academic Press, Inc.


基本マトリックスの正確でロバストな推定
On Accurate and Robust Estimation of Fundamental Matrix

M. Bober, N. Georgis and J. Kittler

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.72, No.1, October, 1998

Keywords: correspondence analysis, optical flow segmentation and estimation, general motion estimation.

本論文は、基本マトリックスの正確でロバストな推定に関するものである。 ここで示そうとするのは、ある条件が与えられたときに、基本的な線形アルゴ リズムが最新アルゴリズムよりも優れた精度(場合によっては二桁ほど)を達 成しうる、ということである。 この成功の鍵となる要素は、変位予測の相対的な精度を入力として用いること と、エラーの統計的分布を用いることである。 我々は、低レベルかつ勾配ベース(特徴ベースに対して)であり、ハフ変換に 基づくアルゴリズムを提案し、これによって低次測定値を抽出する。 我々は、中間表現(これはoptic-flowである)のエラーを取り除くには、この方 法が計算時間と最終予測精度の両面で、複雑な非線形アルゴリズムで最終予測 を改善する試みよりも、大幅に効率的なことを示す。 実験結果も提示される。

Na

Copyright(c) 1998 Academic Press, Inc.


カラー画像系列における高速追跡のための、制約された能動的領域モデル
Constrained Active Region Models for Fast Tracking in Color Image Sequences

Jim Ivins and John Porrill

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.72, No.1, October, 1998

コンピュータビジョンにおいて、画像のセグメント化は基本的な問題であり、 その部分的な解決を与えるものとして、変形可能モデルがある。 ほとんどの変形可能モデルは、何らかのエッジ検出を伴いながら動作するので あり、相補的な関係にある(訳者注:エッジ検出に対して)領域成長法はそれ ほど使われてこなかった。 その結果、エッジでなく領域を追跡する変形可能モデルは、現在でも大いに研 究されるべきものとなっている。 能動的領域モデルというのは、比較的新しいタイプの変形可能モデルであり、 これは、画像の統計的特徴の関数である領域エネルギーにより駆動される。 本論文で述べるのは、制約された能動的領域モデルの使用法であり、その処理 対象は、広く入手可能なコンピュータハード上のカラービデオ画像のフレーム レート追跡である。 この目的のために、今日用いられている数多くのカラー表現法のうち、二つの 方法を概観する。 一つは、輝度ベースのRGB空間である。 もう一つは、より直観的なHSV空間である。 正規化RGB空間とは、基本的には色相と彩度の測度であり、そのために照明変 動に不変で、簡単で高速なソフトウェア変換を通して数多くのフレームグラ バーから得られる。この理由から、正規化RGB空間は、一般的に好まれる表現 となっている。 制約された変形可能モデルの3つのタイプの運動が調べられる。 画像特徴に適合させるうえで、剛体モデルにできるのは、平行移動と回転だけ である。 等角モデル(conformal models)は、さらにサイズ変更が可能である。 アフィンモデルは、これらに加えて、2種類のせん断が可能である。 制約を受けない所望の運動が与えられたときに、これに対応するアフィン運動 を生成する2つの方法について述べる。ただし前者は、モデル境界に垂直なエ ネルギー極小値を探すことによって計算されるものとする。 反復型の勾配下降法(iterative gradient descent)に基づく既存の方法は、平 行移動、回転、変倍やせん断など複合して、アフィンや他のタイプの運動を生 じる力を計算する。 より高速で正確な方法は、最小二乗法による最小化を用いて、所望の運動を近 似するものである。 この方法により、剛体運動と等角運動向けの特定の方程式を導き、垂直探索法 における開口不具合を修正することができる。 新しい最小二乗法の長所は、カラービデオ画像におけるロボットアームの運動 を、フレームレートで追跡するアフィン変換を通じて、能動的領域モデルを駆 動することによって示される。

Na

Copyright(c) 1998 Academic Press, Inc.


スケール空間におけるコーナー点の安定性:小さな非剛体変形の効果
Stability of Corner Points in Scale Space: The Effects of Small Nonrigid Deformations

Marta Fidrich

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.72, No.1, October, 1998

Keywords: scale space, registration of medical images, differential geometry, singularity theory.

医療画像登録の基礎を与えるために、我々はスケール空間アプローチを用いた 信頼度の高い特徴点を探索する。 我々の主な関心は、2D画像にある。増加するスケールにおいて、微分不変量 により定義されるコーナー点を分析する。 コーナー点の数と位置は、スケールが拡大する空間で変化するのだが、これら が、移動経路または軌道を定義するのである。 これらの特徴点を抽出するために、高速で信頼度の高いアルゴリズムを用いる。 それは、iso-surface法に基づいており、スケール空間において対応する特異 点を自動的に探索するものである。 次に、軌道表現を求める。 これは、粗いスケールでの検出と、精細スケールでの局在化との両方に対して、 きわめて都合がよい。 我々は、このコーナー点の有意性が、この点の属するスケール空間の生存期間 に依存するだけでなく、曲率彎曲点にどのように関連しているかにも依存する ことを発見する。 画像変換の後で見られる、軌道の位相的な変化について、いくつかを調べる。 次に、複数のスケールで安定している特徴点は、様々な形態の変形に対しても 安定かどうかについて調査する。 このようにして、登録に関する異なる安定性基準の有用性について比較するこ とができる。 さらに、変形とスケールパラメータの種類への依存性の統計的な結果を示す。

Na

Copyright(c) 1998 Academic Press, Inc.


IR画像システムでオブジェクトを認識するための 幾何学的、代数的、熱物理的技法
Geometric, Algebraic, and Thermophysical Techniques for Object Recognition in IR Imagery

J. D. Michel, N. Nandhakumar, Tushar Saxena and Deepak Kapur

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.72, No.1, October, 1998

赤外(IR)画像の不変特徴点を計算する新しいアプローチについて述べる。 我々のアプローチがこの分野でユニークなのは、それが考慮するのが、不変特 徴の特定化における表面反射と表面形状だけではなく、不可視波長で検出され た画像に影響を与えるオブジェクト内部構造と熱的状態をも含む点である。 まず、画像化されたオブジェクト表面のエネルギー保存則を用いて、非線形の エネルギー平衡方程式を定める。 次に、オブジェクトの材質パラメータと検出された物体表面の拡散反射だけに 依存する特徴を導出する。 これらの特徴は、シーン条件や環境温度や風速などの駆動条件のシーン間の変 換に対して、独立である。 不変特徴を導出するアルゴリズムは、非線形なオブジェクト対画像関係の変換 の代数的な消去に基づいている。 絶対不変量を計算する消去アプローチは、一般的な手法であり、与えられた変 換に対して不変な多項式関係を導出・分離することに基づくもの である。 IR画像によるオブジェクト認識のための完全なモデルベースのアプローチが述 べられる。 オブジェクトの同一性と姿勢とについての仮説を作るために、幾何学的な不変 特徴が用いられる。 これらの仮説は、熱物理的特徴によって肯定されたり否定されたりする。 現実のオブジェクト認識のための複数のクラスのオブジェクトを扱えるIR画像 システムの結果が特徴と手法の性能を示すために示される。

Na

Copyright(c) 1998 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.72, No.2

単眼濃淡画像からの建物検出と記述
Building Detection and Description from a Single Intensity Image

Chungan Lin and Ramakant Nevatiat

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.72, No.2, November, 1998

通常の視点からの単眼の航空写真画像から建物を検出し、その建物の3D 形状を記述する方法について述べる。 グルーピング処理により、入力画像から抽出された断片的線形特徴から 2Dの屋根仮説を生成する。 2D的な根拠といくつかの局所的な3D的根拠から、適当と思われる仮想 屋根が選択される。 次に、これらは、屋根と側面の影で構成される、3D根拠を探すことで検 証される。 このプロセスは、見つけられた建物の3Dモデル構築にも役に立つ。 3D構造間のオーバーラップや包含関係が分析され、矛盾が解決される。 この手法は、複数の画像から得られる結果の統合も可能である。 このシステムは、大量の実画像サンプルを用いて検証され、良好な結果が 得られた。 本書には、これらのいくつかの画像やその評価結果が含まれている。

Na

Copyright(c) 1998 Academic Press, Inc.


中間および高解像度の航空写真画像からの建物検出と再構成
Building Detection and Reconstruction from Mid- and High-Resolution Aerial Imagery

N. Paparoditis M. Cord, M. Jordan, and J.-P. Cocquerez

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.72, No.2, November, 1998

本稿では、航空写真画像からの建物検出と再構成の手法について述べる。 これらの手法は、都市と郊外の分析を意図しており、異なる解像度 (ピクセルあたり1mから10cm)の画像に適用された。 画像マッチングのための、様々なアルゴリズムが調べられた。 これは階層的処理を含み、さらに建物認識や建物特徴グルーピングに興 味深い特性を持つ、新らしい相関法などを含んでいる。 2D(単眼)と3D(立体的)の情報を協調的に組合せることで、観測され たシーンの完全な描写や、特に建物などの人工的立体構造の検出が可能 となった。 対応する地上の実際の対象物との比較のために、シミュレーション画像 による性能評価が考慮された。 我々の研究によると、中間レベルの解像度の手法を高解像度の画像に直 接的には応用できないことが示される。 密集した都市を3D再構成するためには、古典的なアルゴリズムを適応 的に用いねばならず、さらに新しい技法の定義を行った。

Na

Copyright(c) 1998 Academic Press, Inc.


Ascenderシステム:複数の航空写真画像からの自動サイトモデル作成システム
The Ascender System: Automated Site Modeling from Multiple Aerial Images

Robert T. Collins, Christopher O. Jaynes, Yong-Qing Cheng, Xiaoguang Wang, Frank Stolle, Edward M. Riseman, and Allen R. Hanson

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.72, No.2, November, 1998

Ascenderシステム(Automated Site Construction, Extension, Detection and Refinement)は、較正された航空写真画像から、3D幾何サイトモデル の獲得、拡張、精細化を行うものである。 新しいサイトモデルを獲得する際に、一つの画像に対し自動建物検出ソフ トが作動し、仮想屋根候補を探し出す。 仮想屋根探索の支持根拠は、制約付き探索領域におけるエピ極線マッチン グを経て他の画像に位置づけられる。 次に、正確な3D形状と各々の建物の位置が決定されるのだが、これには、 複数画像の三角測量が用いられる。このとき、3Dにおける線分と平面と の直交度、平行度、同一線分上にあること、同一平面上にあることなどの 幾何学的制約が用いられる。 これらの多角体建物モデル上へ画像の輝度情報を投影マッピングすると、 現実的なサイトモデルが構築でき、その後高速なグラフィックスを用いた レンダリング描写ができる。 サイトの新しい画像が入手できるに従い、以前は見えていなかった建物の 追加と、既存の3D建物モデルの幾何学的精度の改善を行うために、モデ ルの拡張と精細化処理が行われる。 このように、このシステムは徐々に根拠情報を集め、サイトモデルをより 完全で正確にしてゆく。 要素アルゴリズムとシステム全体の性能評価は十分に行われた。 2D建物検出精度と3D建物再構成精度が、代表的なデータセットととも に提示される。

Na

Copyright(c) 1998 Academic Press, Inc.


3D建物再構成のためのカラー属性と類似性グルーピングの役割
The Role of Color Attributes and Similarity Grouping in 3-D Building Reconstruction

Olof Henricsson

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.72, No.2, November, 1998

本稿では、2つの主要な問題について述べる。 すなわち、3D建物再構成と、カラー属性と類似性グルーピングの果たす 役割についてである。 我々は、ARUBAという複数のカラー航空写真画像から自動3D建物再構成 するための一般的なフレームワークを提案する。 まず、理論的体系について強調し、フレームワークと2Dと3D処理モジ ュールについて簡潔に記述した後、再構成された屋根を正確な参照データ に対して評価する。 本稿の後半では、形状は確かに重要ではあるが、再構成プロセスにおいて 利用する唯一の情報源ではない、ということを示す。 主たる目的は、(1)カラーは一般的な対象の再構成の非常に重要な鍵であ ること、(2)全体の処理連鎖を通して全ての情報を保持しておくことが重 要であること、(3)一般的な対象の部分はエッジと線分を類似性に基づき グルーピングすることにより効率的に抽出できること、そして、(4)2D と3Dの相互関連が重要であること、を実証することである。

Na

Copyright(c) 1998 Academic Press, Inc.


2Dと3Dにおける階層的な集合を用いた航空写真画像からの建物の抽出
Extracting Buildings from Aerial Images Using Hierarchical Aggregation in 2D and 3D

Andre Fischer Thomas H. Kolbe Felicitas Lang Armin B. Cremers Wolfgang Forstner Lutz Ppumer Volker Steinhage

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.72, No.2, November, 1998

Keywords: explicit 2D modeling, coupling of 2D and 3D modeling. multilayer aggregation, building modeling, multiimage correspondence analysis, midlevel feature aggregates, aspect hierarchies, constraint logic programming.

航空写真画像から自動的に建物の3D抽出を行うモデルベースのアプロー チを提案する。 ここでは、建物の少数クラスに限定されない再構成方式について、焦点を 当てる。 したがって、適切に定義された建物の部品モデルの組み合わせによる、汎 用のモデリングアプローチを採用する。 建物の部品はその屋上のタイプにより分類される。 低レベルの画像特徴からスタートし、多段階の集合階層の、データに基づ くプロセスとモデルに基づくプロセスを組み合わせ、強く結合された2D の画像と3Dのオブジェクトモデリングを用い、複雑な形状と位置関係の 3Dの建物の予測が行われる。 全てのレベルのモデリングとデータ集合におけるモデルベースの2Dと3 D記述の観点で適切に定義されたプロセス状態の明示的な表現のために、 このアプローチは信頼性の高い建物抽出の多大な可能性を示す。

Na

Copyright(c) 1998 Academic Press, Inc.


2Dの建物情報を用いた都市表面モデルの解釈
Interpretation of Urban Surface Models Using 2D Building Information

Norbert Haala and Claus Brenner

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.72, No.2, November, 1998

3Dの建物再構成において、画像データに、 デジタル表面モデル(Digital Surface Model: DSM)を加えるか、または その代わりに用いるならば、解釈プロセスを簡略化することができる。 DSMは、航空写真画像のステレオマッチングにより得られるか、レーザー 走査により直接的に計測される。 画像は大量の情報を持っているが、その結果として派生する複雑さは、 このタイプのデータの自動解釈を非常に困難にする。 DSMの情報は、表面の形状に限定されるため、不必要な細部が欠如してい ることにより、解釈プロセスは簡略化される。 それにもかかわらず、特にこれらの応用分野では、DSMの空間情報と品質 とが不充分であるために、追加の情報源を用いてはじめて最適な結果を得 ることができるのである。 本稿で示されるアプローチにおいては、DSMによる2D表面の分割は、既 存のグランドプランにより支持される。 この2Dの建物情報はまた、分割された平面の3D境界表現を導くために、 仮想の屋根形状を作り出すのに用いられる。

Na

Copyright(c) 1998 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.72, No.3

楕円弧検出と近似のためのハフ変換から新方法へ
From the Hough Transform to a New Approach for the Detection and Approximation of Elliptical Arcs

Christian Daul, Perre Graebling, Ernest Hirsch

Computer Vision and Image Understanding Vol.72, No.3, pp.215-236, December, 1998

単純な幾何形状(すなわち、人工物)部分のエッジは、例えば、検査の際これら部分 の次元解析を行うような場合には、一般的に直線線分と楕円弧で十分精度良く近似す ることができる。ハフ変換は直線線分を検出するためのロバストな方法であるが、そ のままでは楕円弧検出に適しているわけではない。このような場合、処理時間と必要 メモリーサイズはきわめて重要である。我々は本論文において、通常のハフ空間と同 様に定義された2次元量子化パラメータ空間を使って、(楕円についての)新しい手 法を紹介する。この新しい方法は、主軸と副軸が4画素ほどの短い楕円や角張った小 さな開口の楕円弧さえも検出することができる。

Ej

Copyright(c) 1998 Academic Press, Inc.


シーン表現や理解のための動的な投影画像の生成
Generating Dynamic Projection Images for Scene Representation and Understanding

Jiang Yu Sheng, Saburo Tsuji

Computer Vision and Image Understanding Vol.72, No.3, pp.237-256, December, 1998

本論文は、スリットカメラによって動的シーンを走査することによって生成された興 味ある画像投影について探索する。歪曲を伴う知覚というコンセプトに基づいて、見 る人とシーンの相対的動きが均一である場合、スリットで撮影された1次元の連続す るスナップショットによって撮影された3次元シーンが、どのようにして2次元の動 的投影画像として形成されるかを調べる。3D環境でカメラを動かすことによって、 あるいは、被写体を動かすことによって、いろいろな動的投影画像を得ることができ る。これら動的投影画像には、少数のデータ中に主要な空間的・時間的情報を含んで いる。その結果、この投影法は、備忘録、位置合わせ、連続画像のインデックス付け などの応用に向いている。また、合成画像は動画の動き特性のいくつかも直接示して いる。もし、カメラと対象物の相対的動きがあらかじめ決められているなら、予想さ れる測光特徴と共に、動的投影画像は対象物のテクスチャーも得ることができる。 従って、動的投影は動的なオブジェクト認識、3D構造把握、画像圧縮、カメラと対 象物の安定な動きのすべてを得ることができる。この方法による、ビジョン、ロボ ティックス、マルチメディアへの様々な応用に関する全体像を示し、このような動的 投影画像を生成するためのカメラの動きのタイプとセッティングに対する総括を行 う。

Ej

Copyright(c) 1998 Academic Press, Inc.


確率過程の微分方程式を利用した不連続点を保存した表面再生
Discontinuity-Preserving Surface Reconstruction Using Stochastic Differential Equations

Nitin M. Vaidya, Kim L. Boyer

Computer Vision and Image Understanding Vol.72, No.3, pp.257-270, December, 1998

我々は、深さ方向の顕著な不連続性を認識し保存したまま、不等間隔な、疎でノイズ の多い距離画像から表面を再構成する問題について述べる。表面モデルとして、確率 的マルコフ・ランダム場モデルから始めようと、機械的なあるいは薄膜モデルから始 めようと、究極的にはある種のエネルギー関数のグローバルな最小値問題に帰着する と言うことは良く知られている。深さ方向の不連続正を保存すると言うことはエネル ギー関数を非凸で複数の局所的最小条件を満たすことになる。我々は、適当なItoベ クトルの確率的微分方程式(SDE)を数値的に解いた結果によって、不連続点を保存す る再構成する新しい方法を紹介する。方程式に置いてSDEを解くことになる確率的拡 散過程のサンプル経路に追従することによって再構成された表面が見つかる。もっと も大きな寄与は、確率的微分方程式を画像問題を解くことに応用し、効率的に解ける ことを示した点にある。従来知られているフローバルな最小値による再構成を得る手 法と比べて、我々の最終的結果はずっと改良されている。

Ej

Copyright(c) 1998 Academic Press, Inc.


オプティカルフローを導くアルゴリズムにおける精度と効率の兼ね合い 
Accuracy vs Efficiency Trade-offs in Optical Flow Algorithms

Hongche Liu, Tsai-Hong Hong, Martin Herman, Ted Camus, Rama Chellapa

Computer Vision and Image Understanding Vol.72, No.3, pp.271-286, December, 1998

オプティカルフローを求めるアルゴリズムには2つの有力な方向性がある。1つは、 精度に重点を置く手法で、他の1つは高速実装を目的とする。しかしこれら2つのや り方は、精度と効率の兼ね合いを論ずることなく、独立に追究されてきた。精度と効 率の特性はアルゴリズムに依存するものであるが、実世界の課題に関するアルゴリズ ムの評価に関する限り、アルゴリズムの評価を一般的に類型化して理解することは極 めて重要である。これによって、しばしば多様な性能要求に応ずることが出来る。本 論文は、かつて無視されていた多様な実装化に関する事柄、例えば、出力信号列の時 間軸フィルタリング、アルゴリズムの柔軟性、ノイズに対するロバスト性、サブサン プリング等、について論じている。これらの中で、特に精度と効率についての影響が 強調されている。より高効率を目指す各種手法に関する調査結果を紹介すると共に、 精度と効率の兼ね合いに関する現状の実験結果を示す。この、兼ね合いがアルゴリズ ム設計に及ぼす影響の詳細な解析について、2つの最新のアルゴリズムである勾配 法、及び、相関法を例題として紹介する。本論文の最終目的は、精度と効率の2通り の方法の橋渡しをすることにある。

Ej

Copyright(c) 1998 Academic Press, Inc.


画像の輪郭を利用して、複雑に曲がった3次元オブジェクトを不変量に基づいて認識
Invariant-Based Recognition of Complex Curved 3D Objects from Image Contours

B. Vijayakumar, David Kriegman, Jean Ponce

Computer Vision and Image Understanding Vol.72, No.3, pp.287-303, December, 1998

本論文は、たった1つの写真画像から得られた輪郭形状を基に、滑らかな表面で被わ れた3次元オブジェクトを認識する問題について述べる。ここに提案する手法は、オ ブジェクトの幾何形状と、弱い遠近投影の制約下での画像特長の関係、すなわち視点 に依存しない関係、に依っている。画像特長そのものは視点に依存する。従って、す べての可能なシルエットの複接線(bitangent)とは、共通の接線方向を有する輪郭点 に沿った、視点の5パラメータファミリの隠輪郭上に存在する1次元の表面点列の投 影されたものである。これらの画像特徴は、1パラメータの同値クラスのファミリを 形成する。また、これら各クラスは、対応する視点の5次元集合にわたって一定とな る数値属性を持つことが示される。これが、高次元空間に埋め込まれた「不変」曲線 によってオブジェクトを記述する基礎となるものである。カメラの前でオブジェクト 動かすだけでモデル化が可能で、オブジェクトとカメラの間の変換の知識は不要であ り、暗示的、あるいは明示的な3次元の形状再構成も必要ない。認識時、1つの画像 から計算される属性がモデルのデータベースを検索するのに使われ、質的、かつ、量 的な確認手続きによって、マッチングにおける間違いの可能性を減少させる。この手 法は実装化され、その例も示す。

Ej

Copyright(c) 1998 Academic Press, Inc.


姿勢(ポーズ)クラスタリングの並列処理によるオブジェクトの位置
Object Location by Parallel Pose Clustering

W.J.Austin, A.M.Wallace

Computer Vision and Image Understanding Vol.72, No.3, pp.304-327, December, 1998

本論文は姿勢(ポーズ)クラスタリングを並列化することを利用して、深さ、あるい は輝度データ中における3Dオブジェクトの位置について記述する。ここではリー ダーが分割を推定し、これに基づいてクラスタリングを実行するアルゴリズムを採用 する。その理由は、通常の状態ではポーズクラスターの数は前もって分かっているわ けではないから、この数をリーダーが与える必要があるからである。以前の研究と比 べて異なる点は、データパターンの数や分布、あるいは、複数のプロセッサーの配置 がこの分布に合致している必要がある、と言った仮定がないことである。並列処理の ボトルネックを克服し、超線形(superlinear)なスピードアップ示すことを示そう。 これが可能なのは、並列システムでは、全体の計算量は減少するからである。初期段 階を過ぎると、真のクラスターを見失う確率は小さくなるから、独立したポーズ推定 はクラスタースペースから取り除ける可能性がある。このアルゴリズムはトランス ピューターで作ったMIMDアーキテクチャーを使って、人工的データと実データの両方 に対してテストされた。

Ej

Copyright(c) 1998 Academic Press, Inc.


直接的な可視表面の内挿
Direct Visible Surface Interpolation

Baining Guo, Joseph Liu

Computer Vision and Image Understanding Vol.72, No.3, pp.328-339, December, 1998

可視の表面を算出する方法は、薄膜や膜スプラインに基づく組織化の枠組みの中で定 式化されている。離散的に扱う場合には、この定式化は大規模で疎な線形系を扱うこ とになる。ほとんどの表面補間手法はこれらの疎な系を繰り返し計算によって解く。 ここでは、直接解法を示す。正則化演算子を注意深く解析することによって疎に離散 化したとき多数のゼロが生じるが、このゼロを有効利用することによって直接解法を 導いた。実験結果によれば、繰り返し補間法に比べて、我々の示す直接法は一般的に 競合しうるし、不連続を含むような問題を解く場合には著しい高速化がはかれる。こ こに示した方法は可視表面の補間計算に利用できるだけでなく、柔軟に変形する表面 の計算にも時間の有効化がはかれる。

Ej

Copyright(c) 1998 Academic Press, Inc.


幾何学的特徴と関連付け学習を利用した3D形状マッチングと検査
3D Shape Matching and Inspection Using Geometric Features and Relational Learning

Terry Caelli, Erol Osman, Geoff West

Computer Vision and Image Understanding Vol.72, No.3, pp.340-350, December, 1998

本論文では3Dを読み取ったデータを、モデルにマッチングさせ、モデルとデータの対 応関係をロバストに、かつ、効率的に解いて欠陥個所を調べる問題について考察す る。我々は、対応関係(姿勢(ポーズ)推定)の特効率的方法としてマシンラーニン グの可能性を検討し(特に、関連付け学習)、同時にトレーニングデータから許容可 能な姿勢の変動を求めるルールを自動的に生成する可能性も調べる。更に、必用な付 加事項として、曲率のような表面形状特徴を決定するために利用される表面特徴を抽 出するための、視点に依存しない共分散手法について考察する。このような特徴は関 連付け学習モデルにおいて利用されている。

Ej

Copyright(c) 1998 Academic Press, Inc.


形状復元と認識のための画像変形
Image Warping for Shape Recovery and Recognition

Alan L. Yuille, Mario Ferraro, Tony Zhang

Computer Vision and Image Understanding Vol.72, No.3, pp.351-359, December, 1998

多数の反射状態を与える関数集合に対して、画像の変形と、これに直接対応する3次 元オブジェクトの幾何学的変形の関係がある。この対応関係はマッチングする画像の 輝度を計算によって2次元の画像変形として求めオブジェクトを認識する手法にとっ て、隠れた部分の幾何学的仮定を説明するのに役立つ。更に、我々が「画像変形から の形状予測」と呼んでいる「陰影からの形状予測」法に属する新規な形状表現法を提 案することが可能になる。これは、オブジェクトの3次元形状は、そのオブジェクト 画像が、既知の典型的な形状画像に比較してどれほど変形しているかを決定すること によって予測する、というアイデアに基づいている。従って、既知の典型的形状に比 較してどれほど画像が変形しているかを決定することは、オブジェクト画像の形状復 元が可能と言うことになる。我々は、この形状変形に関する性質を導き、顔の形状を 復元することによって結果を図示した。

Ej

Copyright(c) 1998 Academic Press, Inc.


情景画像の代数関数に基づくインデックス化
Indexing Based on Algebraic Functions of Views

George Bebis, Michael Georgiopoulos, Mubarak Shah, Niels da Vitoria Lobo

Computer Vision and Image Understanding Vol.72, No.3, pp.360-378, December, 1998

本論文では、インデックスに基づくオブジェクト認識に代数関数を利用することを提 案する。インデックス付けの間、モデル点群を考慮し、全ての情景画像をハッシュ テーブルに表現する。モデル点の群が生成することのできる画像は、情景画像の代数 関数を使った少数の参照情景像を組み合わせた計算によって作られる。この手法の基 本となるものは、その手順にある。特異値分解と区間代数を基礎にして、代数関数が とり得る値の範囲を推測する。認識過程においては、一群の情景画像は、ハッシュ テーブルから情景画像群を作れる可能性の最も高いモデル群を検索するために利用さ れる。このようなインデックスに基づく認識に、情景画像の代数関数を利用すること は、多数の利点がある。まず第1に、1オブジェクト当りの参照画像が少数であって もハッシュテーブルができる。これは、現在利用している、大量の参照画像を使う か、あるいは、多数の3Dモデルを使う方法と良い対比をなす。最も重要なことは、 認識は参照画像と新規な画像の類似性に依存している訳ではなく、新規な情景画像が 少数の参照画像と共通の点群を含んでいると言うことである。第2に、結果確認がよ り単純化されることである。その理由は、候補モデルが線形変換によって少数の参照 画像中に逆投影されるからである。最後に、提案手法はより柔軟で拡張性がある。な ぜなら、情景画像の代数関数、多様な変換や投影を受けても依然として存在するから である。この手法による認識性能は、人工画像と実画像に対して試された。

Ej

Copyright(c) 1998 Academic Press, Inc.


凸体のサポート関数表現と、その幾何的演算への応用、および関連表現
Support Function Representation of Convex Bodies, Its Application in Geometric Computing, and some Related Representations

Pijush K. Ghosh, K. Vinod Kumar

Computer Vision and Image Understanding Vol.72, No.3, pp.379-403, December, 1998

凸体の表現、操作、そして解析にとって、サポート関数の重要性は、信号処理におけ るフーリエ変換に相当する。サポート関数を直感的に言えば、凸体の支持平面と原点 との符号付き距離である。本論文ではフーリエ変換領域におけるかけ算が2つの信号 の畳み込み(コンボリューション)であるように、サポート関数における同様に単純 な代数演算が、対応する幾何学的オブジェクトの幾何学的操作に対応することを示 す。事実、サポート関数は実関数であるから、これら単純な演算は、加算、減算、逆 数、最大-最小のような代数演算に外ならず、これらがミンコフスキー加算(膨 張)、ミンコフスキー減算(収縮)、極双対(polar duality)、連合交差 (union-intersection)、に相当する。更に、この論文で多数の表現形式(例えば、ル ジャンドル変換、拡張ガウス画像、スロープ・ダイアグラム表現、正規変換、スロー プ変換)は、一見非常に異なった表現に見えるが、同じクラスのサポート関数表現に 属することが示される。最後に、新しく思いもよらない幾何学的演算を導くサポート 関数の代数的操作を示す。非凸オブジェクトのサポート関数についても触れられてい る。

Ej

Copyright(c) 1998 Academic Press, Inc.


距離によって順序づけられたホモトピックな芯線化:3D画像のための芯線化 アルゴリズム
Distance-Ordered Homotopic Thinning: A Skeletonization Algorithm for 3D Digital Images

Chris Pudney

Computer Vision and Image Understanding Vol.72, No.3, pp.404-413, December, 1998

距離順序ホモトピック芯線化(DOHT)と呼ばれる2値の3D画像の芯線化(スケルトン 化)アルゴリズムを紹介する。DOHTは、ホモトピックで、中央を通る芯線化を与え る。この方法は、距離の遠いところから順次点を除去し、これ以上トポロジーを変化 させないでは除去出来ないところまで処理することによって達成される。この距離情 報は面取り方向(chamfer;ボクセルの斜め方向)の距離であり、整数化されたユーク リッド距離を利用している。点を保存する2つの方法に基づく2つのDOHTアルゴリズ ムが示されている。その1つは、中央軸端、あるいは中央面のエッジを保存する方法 であり、もう1つは、面取り距離から内接する最大球を想定し、その中心を保存する 方法である。この距離をある閾値で処理することで、芯線に表現された特徴のサイズ を制御することができる。2Dと3Dの人工、及び、実データに適用した結果を示 す。

Ej

Copyright(c) 1998 Academic Press, Inc.


[前の年][次の年]