[次の年]

Computer Vision and Image Understanding (Academic Press) Vol.62, No.1

ポインタベースの4分木の並列処理のためのハイパキューブアルゴリズム
Hypercube Algorithms for Parallel Processing of Pointer-Based Quadtrees

Frank Dehne & Andrew Rau-Chaplin

Computer Vision and Image Understanding, Vol.62, No.1, pp.1-10 (July, 1995)

従来、並列処理における4分木は、木のノードあるいは葉ノードを 前順探索したものを蓄積する線形(linear)4分木が用いられている が、本論文においては、標準的な4分木である、ノード間のポイン タによって蓄積を行なうポインタベースの4分木が並列処理に適し ていることを述べている。まず、二値配列表現(binary array)およ び境界線符号化表現(boundary coded)された二値画像それぞれにつ いて線形およびポインタベースそれぞれの4分木構造をハイパキュー ブ(hypercube, 超立方体網)構造を持つマルチプロセッサへの効率 的に実装するアルゴリズムについて述べ、次に、それぞれの4分木 の比較を行なっている。比較の結果、ポインタベースのアルゴリズ ムは、予想される場合(in the expected case)においては線形の4 分木に比べて空間的複雑度(space complexity)は同等であるが時間 的複雑度(time complexity)を軽減させる。最悪の場合(in the worst case)においては、線形の4分木と比較して空間的複雑度は 増加するもののそれは時間的な複雑度の軽減を下回っている。した がってて、ポインタベースの4分木構造は、きめ細かい(grained, プロセッサ数が10000個以上)ハイパキューブ構造に適している。


幾何学的ハッシング法によるモデルマッチングへのベイズ理論の適用
A Bayesian Approach to Model Matching with Geometric Hashing

I. Rigoutsos & R. Hummel

Computer Vision and Image Understanding, V62, No.1, pp.11-26 (July, 1995)

幾何学的ハッシング法は与えられたモデルの特徴を、そのモデル画像が観察さ れる条件による変形をあらかじめ予想しておき、これらのパラメータをセット として記憶する。このときパラメータは適当な大きさに量子化され、その「場 合の数」だけ投票箱が用意される。この方法は特徴抽出の後、マッチンングに 際して多数の候補と比較する代わりに、そのパラメータをアドレスとする箱に 票を入れるだけでよいため、高速に画像を認識したり、更に並列処理する場合 に適している。ところが、もとのデータにノイズが大きい場合は、箱の大きさ を大きくする必要があるが、そうすれば認識感度は低下してしまう。本論文で はノイズの大きい信号に対して認識感度を低下させる事なく幾何学的ハッシン グ法を適用するため、投票に重みをつけ、しかもその重みが対象画像の正規化 したパラメータに依存し、かつ、重みとして条件付確率の対数を使った。この ような工夫により、飛行機や自動車などの乗り物のモデル32個を使った実験 ではほぼ完全な認識結果を示した。


推論用ネットワークを用いた画像理解システムPINの提案
Using Perceptual Inference Networks to Manage Vision Process

S.Sarkar & K.L.Boyer

Computer Vision and Image Understanding, Vol.62, No.1, pp.27-46 (July, 1995)

Bayes推定に基づいた推論機構を有する画像理解システムPIN(Perceptual Inference Networks)を提案する。PINは、特徴抽出などの特定の分野に 依存した既存の画像処理アルゴリズムを利用することができる。従来、画像 理解においては、矛盾解消のために詳細解析用の特徴抽出モジュールを 用いることが一般的であるが、この詳細解析には多くの計算コストが費や されてしまう。そこで、矛盾解消のために最も効果的な特徴抽出モジュールと その適用位置(ノード)を決定するために、計算コスト当たりの情報量(エン トロピー減少量)を選択の規準とした。簡単な画像では、すべてのノード に対して特徴抽出を行なう場合の15〜20%の計算量で済むという結果を得た。 また、feature type という概念の導入により推論用のBayes network のノード数を大幅に削減することができた。


等高面の組を追跡して:陰影からの形状復元問題の一解法
Tracking Level Sets by Level Sets: A Methods for Solving the Shape from Shading Problem

R. Kimmel & A. M. Bruckstein

Computer Vision and Image Understanding, Vol.62, No.1, pp.47-58 (July, 1995)

輝度イメージから物体の3次元表面を復元する方法はいくつか提案されている。 その中の1つにlevel set(光源から見た等高面)を利用した等高境界の伝搬法 (equal-height contour propagation)があり、良好な結果が報告されている。 この方法は観察方向と光源を共に真上に取り、物体表面の反射係数や放射照度 などによる反射率の関数から等高線を求めていくものである。 本論文では光源方向の一般化を図り、人工および自然画像に対して適用した。 人工画像では良好な結果が得られ、自然画像(人間の顔)においても大まかに は良好な結果が得られた。


オプティカル・フロー予測のロバスト(頑強)なアルゴリズム
A Robust Algorithm for Optical Flow Estimation

P. Nesi, A. Del Bimbo, & D. Ben-Tzvi

Computer Vision and Image Understanding, Vol.62, No.1, pp. 59-68 (July, 1995)

オプティカル・フロー予測の現在のほとんどの方法は、それぞれの画素に対して 定義された拘束方程式を基本としている。このようなアルゴリズムは「gradient- based」と呼ばれている。この拘束方程式の構造の為に、不良設定問題となってい て、過去に正則化に基づいた解法が提案されている。

反対にもし注目画素かすぐ隣の画素に対して別の拘束方程式が得られれば不良設 定問題とはならず、解は方程式の決定系か優決定系を解くことによって見つけら れる。このような理由によっていくつかのオプティカル・フローを評価するアル ゴリズムが文献に提案されている。これらのほとんどは方程式を最小2乗法を使 って解いている。

本論文では最小2乗法や正則化を用いた方法の欠点を無視できるか、ほとんどな くすことのできる新しい試みを提案する。これは組合せハフ変換(Combinatorial Hough Transform)の修正バージョンに基づいている。

この方法は従来の最小2乗法や正則化に基づいた方法の比較の結果、計算量に関 しては特に効果的ではないが、最良の予測をすることが可能である。


並列細線化のための新しいシングルパス・アルゴリズム
New Single-Pass Algorithm for Parallel Thinning

Steven S.O.Choy, Clifford Sze-Tsan Choy, & Wan-Chi Siu

Computer Vision and Image Understanding, Vol.62, No.1, pp.69-77 (July, 1995)

OCR等に広く利用される細線化における、並列アルゴリズムの提案である。 並列細線化には、幅2画素の線の両境界点を同時に削除すると連結性が失われ るといった問題がある。サブサイクルという逐次性を持つ処理の導入によりこ れを回避する方法もあるが、同時に処理の並列性も失われてしまう。

ここでは、処理対象ウィンドウを広く取ることで対処している。ウィンドウは、 通常の3×3画素に上下左右の4画素を加えた13画素の菱形領域であり、そ のなかで2種類のテンプレート(削除画素検出用、訂正用)を繰り返し適用す るという方法である。サブサイクルを持たないため、シングルパスと言われる。 9種類の並列アルゴリズムとの比較実験により、処理量と細線化結果の品質に 優れることを示し、さらに、細線化に要求される5つの基準(連結性の保存、 削り過ぎの回避、無冗長性、位置の正確さ、耐ノイズ性)の全てを満たす唯一 のアルゴリズムであると結論付けられている。


多重基底による構造的特徴の抽出
Structural Feature Extraction Using Multiple Bases

Hirobumi Nishida

Computer Vision and Image Understanding, Vol.62, No.1, pp.78-89 (July, 1995)

手書き文字認識システムの研究開発に最も難しい課題は文字変形の多様化の 対処である。伝統的な方法の多くは、位置依存の特徴に基づくため、文字の変 形の対処に正規化を施すことは基本である。しかし、完璧でない正規化は文字 の形状にさらなるゆがみを与え、誤認識の原因にもなる。その打開策として、 数種類の「定性的な」特徴、つまり、準位相 的な特徴(凹凸)、方向的な特 徴、及び特異点(分岐点と交差点)、を用いる ことは有効的である。本論文 は、2^mの方向特徴(m=2,3,4,...)と準位相(凹凸)特徴に基づく単純弧(或は 閉曲線)の構造解析と記述方法を提示し、多段階方式を採用した手書き文字認 識システムでの応用を述べる。


画像解析とコンピュータビジョンの論文調査:1994
Image Analysis and computer Vision:1994

A. Rosenfeld

Computer Vision and Image Understanding, Vol.62, No.1, pp. 90-143 (July, 1995)

画像解析とコンピュータビジョンに関する1994年の論文1900件以上 をまとめた。このシリーズの最初の調査はACM Computing Surveys in 1969 としてまとめられているがこの時は408件の論文しかなかった。次の調査 は1969ー71年で、580件であった。それ以来23回の調査が行なわ れCVGIPに報告されている。今回まとめられた論文は以下の様に処理手法で 分類をされている:特長抽出とセグメンテーション、マッチングと立体視、 3次元復元と解析、3次元形状、動画像。また、いくつかの論文はトピック ス、たとえば幾何形状とグラフィックス、センサー、視覚、ニューラルネッ ト、AI、パターン認識。


Computer Vision and Image Understanding (Academic Press) Vol.62, No.2

即興作業中での機能的と物理的な物体特性と物体認識
Functional and Physical Object Characteristics and Object Recognition in Improvisation

Jack Hodges

Computer Vision and Image Understanding, Vol.62, No.2, pp.147-163, (Septempber 1995)

即興とは問題解決者の、(問題が置かれている)情勢、制約条件、及 び入手可能な物体の性能を特定することが要求される作業である。見付けた物 体の性質に関する情報が特に持っていないため、問題解決者は経験に基づいて それらの物体に「性質」を何とか付けなければならない。

本論文では、物体の物理的な性質、機能的な表現、および問題解決中での用途 の三者の関係について探索する。「性質付与(property attribure)」と呼ばれ ている表現構成法を用いて、成功する機能的応用の状況中での物体に属する機 能的性質を表現する。この方法は問題解決の過程における物体認識に役立つ。

物体認識と問題解決におけるこの性質付与法の応用を説明するため、 純粋力学の機能的本体論(Functional Ontology for Naive Machanics, or FONM)の表現モデルの概略と理論的事例につても述べる。

FONMとは、装置の機能を、低レベルの構造と動き、及び問題解決状況での用途 の両側面から表現できる整合した理論である。FONMは、(装置の)動きと性能 を表現する因果的な原始要素(causal primitives)に基づいて、高いレベルで の因果性を抽出する。このアプローチは三つの相互依存している抽出階層から 成り立っている。これらは、(1)装置の静的状態、(2)装置の動的状態、 (3)装置の応用状態である。


機能的部品による認識
Recognition by Functional Parts

Ehud Rivlin, Sven J.Dickinson and Azriel Rosenfeld

Computer Vision and Image Understanding, Vol.62, No.2, pp.164-176( Sep. 1995 )

部品単位の形状から物体を認識するこれまでの枠組を、機能ベースへと拡張 した。すなわち、stick,strip,plate,blobという4種類の形状プリミティブ は機能プリミティブへとマッピングされ、同時に形状プリミティブ間の関係は 機能プリミティブ間の関係となり、これら機能的部品を用いて、要求される 作業を行なうのに適した物体かどうかを認識する。

形状プリミティブを分類するのに、元の画像から部品の幅、高さ、奥行きを知る 必要がある。このため画像に超2次楕円面(superquadric ellipsoid)を あてはめ、そのパラメータからサイズを計算する。 そこから機能プリミティブが得られれば、ボトムアップな認識(そこに何があるか)も トップダウンな認識(求める物がそこにあるか)も可能である。

ここでは、柄(handle)と頭(end-effector)という機能的部品からなるハンマー を取り上げ、上のアプローチによってこれが識別できることを示す。


潜在的機能推論を通しての関節を持った対象物の一般的認識
Generic Recognition of Articulated Objects through Reasoning about Potential Function

Kevin Greem, David Eggert, Louise Stark and Kevin Bowyer

Computer Vision and Image Understanding, Vol.62, No.2, pp.177-193, Sep. 1995.

Keywords: (none)

本論文は対象物の機能的特性の推論に基づいた,関節を持った対象物の一般的 識別法を提案する.ここでは特に識別対象として「はさみ」を採り挙げた. 対象物が, 向かい合った指穴を持つ, 向かい合った刃を持つ, (二つの)指穴が近付くと(物を)切ることが出来る, といった条件を満たすと「はさみ」として認識される. カテゴリ「はさみ」に属する対象物を認識するシステムについて報告する.

従来はハンマーやドライバといった固定形状を対象とした研究は存在したが, 関節を持った連結により結びつけられたパーツから対象物の機能を推論し, 対象物の識別を行なった研究はこれまでになく,本研究が初めである. システムは対象物の3-D形状表現から関節を持った形状モデルを生成する. このモデルは(対象物を構成する)パーツとそれらの関係からなる.このモデ ルを用いて対象物の機能的特性を推論し,認識を行なう. 認識のための対象物の機能的定義はカテゴリ定義木から得る.カテゴリ定義木 は木構造をした知識表現で,ノードに応じた判別基準が設定されており,その 基準をクリアすると次のノードに移る.この基準をクリアできなければ「はさ み」とはみなされない. さまざまな形状を含む24形状を用いた実験から,本手法の有効性が確認された.


機能的性質(Functionality)のインタラクティブな表現と認識
Interactive Recognition and Representation of Functionality

Luca Bogoni and Ruzena Bajcsy

Computer Vision and Image Understanding, Vol.62, No.2, pp.194-214( Sep. 1995 )

りんごを切るというタスクを考える。ナイフという道具を用いるとすれば、こ のタスクを実行することは可能である。このようにあるタスクに対する道具の 適用可能性のこと機能的性質(Functionality)と定義することにする。 機能的性質は、硬いとか尖っているといった道具に固有の性質のみならず、ど のような環境でいかにふるまうかといった相互作用的性質をも含むものである。

ここでは、ナイフやハサミといった道具を制御するアーム状のロボットと、そ れがいかにふるまうかを観察するカメラ制御ロボットの二つを統合して制御す ることを念頭に置いている。こうした環境において、どの道具にどのような機 能的性質があるのか、その機能的性質を裏付ける性質とはいかなるものか、あ るタスクを実行するのに相応しい道具はいかなるものかといったことを調べる という課題に応える研究の一環であるといえる。

こうした背景のもとに、本稿では機能的性質の一つの表現方法を導入し、その 再現方法を示すものである。ここでは離散事象系理論と活動的知覚パラダイム とに基づく一つの定式化をする。この定式化により、調査タスクは有限オート マトンの形式で表現され、そこでの相互作用が制御・観察されることになる。

また、再現された機能的性質を統合し分類することにおいては、そのための手 段として、力(force)−形状(shape)マップというものを導入する。

現段階では、手操作に関する相互作用−特に突き刺すこと−に関する機能的性 質に焦点が絞られているが、目指しているのは先に述べたような課題に応える 拡張的なシステムである。


シーンの因果関係の理解
Causal Scene Understanding

Paul R. Cooper, Lawrence A. Birnbaum, and Matthew E. Brand

Computer Vision and Image Understanding, Vol.62, No.2, September, pp.215-231, 1995

コンピュータビジョンのシステムにとっては、シーン解析を行なって何がどこ にあるのかを見つけ出すことより、なぜそのようになっているのかやどのよう な状態なのかを理解する方が重要になる。そのことを理解するためには、 シーンの因果関係やシーンを構成する要素の相互関係を説明し記述しな ければならない。これにはどのように行動すれば良いかといった問題や各要素 の機能的性質の説明の問題も含まれる。

本論文では静的な平衡状態にある物体間の因果関係、特に物体間の支持関係に 焦点を当てて説明する。3つのビジョンシステムで異なる目的でシーン理解す る場合を取り上げ、シーンの画像から因果関係を理解する方法を述べる。これ らは、複数の積木を重ねた状態のシーン、物体の重なりによってocclusionが 発生するシーン、マグカップを握って運ぶシーンである。 この中でocclusion, focus of attention, grasp planning の問題を含む、ビ ジョンやロボティックスの昔からの問題のいくつかに対し、新しい解決方法を 提案する。また、この因果関係の記述と実際のシーンとの間のやり取りをどの ように行なえば良いかも合わせて示す。


自動航行における対象物の機能(Functionalities)
Navigational Functionalities

Ehud Rivlin, and Azriel Rosenfeld

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.62,No.2,September,pp.232-244,1995

自動航行するエージェントは3つの基本的な方法で周囲に存在する対象物と 干渉できる。その方法とは 逃避(avoidance)(例えば物体が脅威(threat)や障害の場合。)/ 捕獲(interseption)(例えば物体が獲物や食物の場合。)/ 参照(reference)(例えば物体が目印として利用可能な場合。)である。 我々はエージェントが単純な廊下清掃ロボットの場合の 対象物の機能に関するこの分類について、その実例を示す。 このロボットは壁(および壁と床の境目)を参照として利用し、 独立して移動する物体を脅威として、また 多くの文房具を障害として取り扱い、 そして小さい文房具を”獲物”として取扱う。(掃き出してゴミ箱へ)


Computer Vision and Image Understanding (Academic Press) Vol.62, No.3

単眼画像の分類(Monocular Groupings)と隠蔽(occlusion)の解析を利用した 階層的な記述によるステレオ画像認識システム
Use of Monocular Groupings and Occlusion Analysis in a Hierarchical Stereo System

Ronald Chung and Ramakant Nevatia

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.62,No.3,November,pp.245-268,1995

知覚(perceptual)による分類技術を用いて各画像から表面の階層的な記述を算出し、 得られた記述に対してそれぞれの階層でマッチング処理を行なう 階層的ステレオシステムについて述べる。

記述とそれに対応するプロセスが協力することで、 高レベルの抽象的な記述を用いて 対応の曖昧さを減らすことが出来、 さらに複数の画像を用いて 画像中の異なるレベルでの記述をより確実なものに出来る。

また、隠蔽は複眼画像の解析において大きな問題であるが、 明白には取扱われない場合がある。 本論文では 複眼視における隠蔽の基本的特性とその構造記述から隠蔽を 「深度の不連続な隠蔽 (隠蔽している面と隠蔽されている面が不連続な場合)」 「オリエンテーションの不連続な隠蔽 (隠蔽している面と隠蔽されている面が連続かつ 縁になっていない場合)」 「縁による隠蔽 (隠蔽している面と隠蔽されている面が連続かつ 縁になっている場合)」 の3つのタイプに分類して取扱った。

最後に本論文では曲線を持つ物体と複数の隠蔽の存在する画像に対する いくつかの実験結果を示す。


円弧の中心を求める頑健なアルゴリズム
The Robust Algorithms for Finding the Center of an Arc

Zhongquan Wu, Lide Wu and Aicheng Wu

Computer Vision and Image Understanding, Vol.62, No.3, pp.269-278, Nov. 1995.

Keywords: (none)

本論文では,円弧から円の中心を求める方法として,ノイズに対しても頑健な 2種類のアルゴリズムを提案する.円弧の中心を求める方法としては,古くは Hough変換を利用したものが主流であったが,実行速度などの問題から近年は 最小2乗平均法を利用するが提案されている.最小2乗平均法を利用した方法 では方程式が非線形になり,初期解を適切に与えないと限られたステップ内で 収束することができないという問題がある.

本論文で提案される2種類のアルゴリズムは,最小2乗平均法に基づいており, 上の問題を解決するため,方程式の線形化を行なっている.円の中心を求める 精度は弦の長さに依存するため,一つ目のアルゴリズムは弦の長さに応じた重 み付けを導入し,精度よく中心を求めている.二つ目のアルゴリズムでは誤差 関数を定義し,誤差の最小化を行なっている.方程式の項を効果的に近似しな がらも,非常に高い精度を維持することができることを数学的に証明している.

実験の結果,提案されたアルゴリズムは非常に精度良く,従来提案されていた 手法よりも正確に円の中心を求めることができることがわかった.さらに, 本手法が有効に中心を求めることができる弧の中心角の下限は他の手法の約1/3 であることが分かった.またマイクロスコープを用いたウエハの中心検出での 本手法の有効性が確認された.


2画像における複数特徴のマッチングとセグメンテーションの統合
Integrated Matching and Segmentation of Multiple Features in Two Views

Sanghoon Sull and Narendra Ahuja

Computer Vision and Image Understanding, Vol.62, No.3, November, pp.279-297, 1995

本論文では、ステレオ画像のような二つの画像における特徴の対応付け の新しい方法について述べる。複数の特徴のマッチングとそのセグメンテーショ ンを同時に行なうことにより良好な結果を得ることができることを示す。 一般に画像間の特徴の対応付けは隠蔽部分の発生などにより難しい 問題である。従来はフロー空間を利用するものか、個別の特徴点をそれぞれ マッチングするものであった。 フロー空間を利用する方法では特徴抽出とマッチングを必要としないが、 画像間の動きが大きい時に対処できない。 また個別に特徴点をマッチングする方法は、特徴点の相対位置の整合を 最大にするものである。したがって相対位置が保存されなくなる画像境界 で失敗する。また、光源方向に沿った動きの時に特徴が大きく変化するの に対応しきれない。 本方式は、画像間の動きを6つのパラメータを使用したローカルアフィン変換 で表現する。そしてこの6つのパラメータすなわち6次元を2つの 3次元で計算することで、また最初は粗く後に詳細に計算することで、 処理時間を減らす。 本論文では特徴として点、領域、そして線分を使用する。これら特徴のマッチング とグルーピングを同時に行なうことによって精度よく対応付けを行なう。 多くの画像に適用して良い結果が得られた。本論文ではそのうち4例を示す。


オクルージョンと反射によるハイライト部分を同時に同定するロバストな 両眼視
Robust Vergence with Concurrent Identification of Occlusion and Specular Highlights

Wee-Soon Ching, Peng-Seng Toh, and Meng-Hwa Er

Computer Vision and Image Understanding, Vol.62, No.3, November, pp.298-308, 1995

ビジョンシステムから得られる実際のシーンには、オクルージョンや物体表面 での反射光によるハイライト部分が含まれることが多い。ところが、多くの両 眼視によるビジョンシステムではこの問題を扱ってこなかった。

本論文ではステレオ画像の対応付けを行なう際に、おのおのの画像の濃度ヒス トグラムのピークの位置や濃度ヒストグラムの相互相関を計算した時の変化量 をマルチスケールのウィンドウ内で求め、スケールを変化させることでオクル ージョンとハイライト部分の同定を行なう。このアルゴリズムを Adaptive-Feedback MultiScale Correlation (AFMSC) と呼んでいる。 この方法では、対応付けと同時に処理することで計算コストが低減される こととオクルージョンとハイライト部分によって対応付けが困難となっていた シーンもロバストに処理することが可能となった。


複数の特徴グループと複数のビュー情報を統合した3次元物体認識システム
Integration of Multiple Feature Groups and Multiple Views into a 3D Object Recognition System

Jianchang Mao, Patrick J.Flymn and Anil K.Jain

Computer Vision and Image Understanding, Vol.62, No.3, pp.309-325( Nov. 1995 )

モデルベースの3次元物体認識システムの問題点の一つに、検証ステージ に渡される仮説の数が多いがゆえの計算量の膨大さが挙げられる。ここで はこの問題を解決するために導入された二つのアプローチについて述べる。

システムは主として多面体を対象としており、2次形式で表される表面を プリミティブとする。モデルや入力された物体は、プリミティブの集合に よって表現される。

マッチングにおける不変特徴としてプリミティブの角度と距離とが用いら れている。この二次元特徴を量子化して、あらかじめ定められたテーブル を検索することで仮説の列挙がなされるのだが、モデルの数が増えると仮 説の数も膨大になるところに問題がある。

第一のアプローチはここに投票制度を導入するものである。最大の得票を 持つ仮説(複数あればすべて)に絞り込むことで、その数のかなりの削減 ができる。

第二のアプローチは、複数の表面グループから推定された物体の姿勢の一 貫性を調べる方法である。ここで、表面のグループは一つまたはそれ以上 のビューから得られる。複数のビューを使うと、一貫性に基づく絞り込み が進む。

我々のシステムと既存のものとの顕著な違いは、物体モデルやテスト画像 の数が大規模になるところに現れる。

大規模な3次元物体データベースを用いた実験によれば、単一ビュー(5 85枚)で平均60%、複数ビュー(117組)で平均90%の仮説を排除 することができた。また、幾つかの実際の距離画像に対するテストによれば、 認識時間の実質的な改善が示された。


画像列のための形態論的な演算子
Morphological Operators for Image Sequences

John Goutsias, Henk J.A.M. Heijmans, and K. Sivakumar

Computer Vision and Image Understanding, Vol.62, No.3, November, pp.326-346, 1995

格子理論(Lattice Theory)は一種の抽象的な代数学道具であり、スカラー形態 論(つまり、単一画像 single images)の理論的な枠組として広く使用されて いた。本論文は、格子理論を用いて画像列(或は、ベクトル値画像 vector-valued images)を形態論的に処理する問題に対処する統合したアプロー チを提案し、ベクトル形態論に数学的な基本を提供する。

ベクトル形態論に関する2つのアプローチを考察した。一番目のアプローチで は、ベクトル形態論は周知のスカラー形態論の自然的な拡張として捉えられる。 このアプローチはWilson氏の行列形態論を形式化かつ一般化して、Wilson氏の 行列形態論を周辺ベクトルの順序付けの直接結果として見なす。しかし、この アプローチは成分的な変換を含んでおり、成分間に相関があった場合、このア プローチは旨くいかない。二番目のアプローチはより複雑で、慎重な対処を要 する。このアプローチは、周辺ベクトルの順序付けの一歩手前のベクトル変換 の直接結果である。このベクトル変換が恒等変換(identity transformation) である場合、前記の二つのアプローチは同一ものになる。

本論文で提案した理論の画像処理と分析の数多くの問題への応用性は多数の事 例によって示された。


ステレオ画像を用いた自動車追跡システムにおけるカメラの動きの誤差解析
Error Analysis of Camera Movements in Stereo Vehicle Tracking System

N. D. Kehtarnavaz and W. Sohn

Computer Vision and Image Understanding, Vol. 62, No. 3, Nov., pp. 347-359, 1995

屋外での走行環境においては、自律の自動車やロボットのカメラに制御不可能な 動きが加わることが条件とされる。 本論文ではステレオ画像を用いた自動車の追跡システムにおける、この様なカメラの 動きの影響について解析する。 言い換えれば、先導車への距離と角度の計算がカメラの動きとしてどの程度影響 するかを示す。 このステレオシステムのパラメータ空間は、基準線を含む制御可能な部分空間と、 カメラの相対的な動きと先導車を追跡する点の座標を含む制御不可能な部分空間に 分けられる。 制御不可能な部分空間の最適な基準線はミニマックス推定量と最小平均2乗誤差 推定量を使って求められる。 ミニマックス推定量は起こり得る最悪の場合に使われ、一方最小平均2乗推定量は 通常の場合に使われる。 この解析に基づいて、距離と角度の誤差を最小化するために、いかにステレオ画像を 用いた自動車の追跡システムの最適な幾何学的計算をするかを示す。


大局的手法を用いた陰影からの3次元形状復元
Global Shape from Shading

Ron Kimmel and Alfred M. Bruckstein

Computer Vision and Image Understanding, Vol. 62, No. 3, Nov, pp. 360-369, 1995

本論文では,「なめらかな」表面を持つ物体の3次元形状を2次元多値画像か ら再構成するための新しい方法を提案する.この方法は画像の画素値が物体表 面と照明の位置関係に依存することを手がかりとする shape from shading の 考え方に基いている.従来の shape from shading に基く方法は,明るさの極 値をとる画素(特異点: singular point )の周辺の点から特異点が極大,極 小,鞍点のいずれに該当するかを分類し,その結果をもとに特異点を含む局所 領域の表面を再構成し,それらをつなぎ合わせて表面全体を構築するものが多 かった.このような方法では,局所領域の表面をつなぐ際に整合性をとるため 境界条件を利用するが,表面全体の再構成の際に誤りを生じることが多い.

本論文の方法では,なめらかな表面のトポロジー的な性質も利用する.まず, それぞれの特異点において重み付き距離変換を行なって,特異点の型を求める. 次に,それぞれの特異点の型の解について,トポロジー的な性質を表す Morse の条件を満たすものを選択していき,すべての特異点について条件を満たすま で繰り返す.

本方法では局所的な境界条件を用いず,可能な解をすべて求めてから表面全体 の性質についての条件を満たすものを選択するため,局所的な原因による誤り を生じることなく,表面の再構成を実行することができる.


位相や微分幾何学特性を保存したデジタル化
英語タイトル Digitizations Preservig Topological and Differential Geometric Properties

Ari Gross and Longin Latecki

COMPUTER VISION AND IMAGE UNDERSTANDING Vol.62,No.3,November,pp.370-381,1995

本論文では、位相や微分幾何学特性を保存したデジタル化を提案する。 この方法では、2次元平面上または3次元空間中の対象物の境界 bd A 上の点 a において、接線に垂直で外側に向かう長さ r の ベクトル n(a,r) を考える。 境界上のすべての点の n(a,r) が交差しない場合、 par(r,+)-regular であるとし、交差することがある場合、 par(r,+)-regular ではないとする。 同様に、接線に垂直で内側に向かう長さ r のベクトル -n(a,r) に ついても、 par(r,-)-regular であるかを求め、 このような情報を基に対象物のデジタル化を行なうことにより、 位相や微分幾何学特性を保存(例えば、対象物の連結性を保てる、 境界点の凹部を凸部にはしない)することができる。


距離マップと等値点集合からの骨格化
Skeletonization via Distance Maps and Level Sets

Ron Kimmel, Doron Shaked, and Nahum Kiryati

Computer Vision and Image Understanding, Vol.62, No.3, pp.382-391( Nov. 1995 )

本論文では骨格化の新たなアプローチを与える。その手順はまず、図形の輪郭線を 曲率が極大となる点で分割する。次に分割された各々の輪郭部分に対して、そこ からの距離を平面上の各点に付与した距離マップを作成する。骨格は二つの距離 マップ上の値が等しく、かつその値が他のどのマップよりも小さいような点の 集合から、図形外の点と輪郭から伸びる枝部を除いて得られる。

以上の手法を最初に連続平面上の二値図形に対して展開し、離散平面に適用する ときには図形を多値画像で入力させ、サブピクセル単位の情報を補間して 精度を向上させている。例として、一つのホールを持つ輪状の図形や矩形状の 図形に対して、本手法を用いて骨格化を行なった結果を示す。


[次の年]