AbstractClub - 英文技術専門誌の論文・記事の和文要約


[インデックス] [前の年] [次の年]


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.17, No.7


連続データあるいはミックスモードデータに対する帰納的学習の為の クラス依存量子化
Class-Dependent Discretization for Inductive Learning from Continuous and Mixed-Mode Data

John Y. Ching, Andrew K.C. Wong, and Keith C.C. Chan

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, No. 7, pp.641-651, July 1995

帰納的学習では実例を分類する為の知識を必要とし、それを利用することで効 果的な学習が可能となる。現存する多くの記号学習アルゴリズムを連続データ に適用する為には、連続データを量子化アルゴリズムを用いて順序付けられた 離散データに変換する必要がある。本論文では管理(supervised)学習の為に最 適化された情報理論を用いた新しい量子化手法について述べる。本手法では離 散間隔とクラスラベルの間の相互依存の冗長性の最大を探すことで、自動的に 帰納的学習アプリケーションにとって最も適切な離散間隔数を決定出来る。連 続データを含むいくつかの帰納的学習例について、クラス依存量子化を用いる ことで、現存する多くの学習アルゴリズムで劇的に分類の精度が向上すること を確認した。


仮説評価の有効な資源配分に関する一つの統計的なアプローチ
On the Efficient Allocation of Resources for Hypothesis Evaluation: A Statistical Approach

Steve Chien, Jonathan Gratch, and Michael Burl

IEEE Trans. Pattern Anal. Mach. Intell., Vol.17, No.7, pp.652-665 (July, 1995)

本論文は不完全な情報(例えば、有限個の観測)に基いで、ある代替案の集合 から戦略を選択するような意思決定問題について考察する。このシステムはい つでもある特定の戦略を取ること、または、一定のコストを払いて、追加的な 情報収集を決定することができる。ここで、我々が強調したい中心的な問題は、 新しい情報の期待効用と情報取得のコストとの釣合(バランス)である。

我々のアプローチでは、与えられた問題に対するある特定の戦略を適応するこ とのコストと効用をある母数分布の確率変数として表現する。確率的に選んだ 問題のサンプルに対する各戦略のパフォーマンスを観測することより、パラメ ータ推定技法を用いて、一般の問題母集団に対するパフォーマンスの統計的な モデルを推測することができる。これらのモデルを用いて、次のことを推定す ることができる、1)追加的な情報を取得することの効用とコスト、2)選択 肢の集合からある特定の戦略を選出しることの好ましさ。

提示された実験結果は、NASAアンテナ予定アプリケーションのシステムパラメー タの調和に仮説推定技法の有効性を示している。


形状認識の性能の限界
Bounds on Shape Recognition Performance

Michael Lindenbaum

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, No. 7, pp.666-680, July 1995

認識に関する多くの研究がなされてきたが、 しかし理論と実際の間のギャップが大きく、理論的な基礎が 十分に確立されたとはいい難い。 位置特定(localization)と認識(recognition)という課題は 確率モデルに依存するものであり、使用される認識方法に 依存するものではない。 本論文では対象の位置特定に有効な十分に正確な 測定方法(measurements)の集合の、確率的に厳密な限界(bounds)を導出した。 この限界によって、測定方法の数とか位置の不確定などの多様な位置特定問題 の難しさを定量化できる。 認識問題についても同様な定量化が行なえた。 認識/位置特定という課題の難しさを一つのパラメータで 特徴づけられるので、異なる課題を比較することを可能とした。 また今までその対象の違いなどによって比較が行なえなかった、 実験に基づいて測定された位置特定/認識の方法の性能についても、 比較が行なえる理論的ベンチマークが得られた。


形に制限のない表面を認識するための物体の球面表現
A Spherical Representation for Recognition of Free-Form Surfaces

Martial Hebert, Katsushi Ikeuchi, Herev'e Delingette

IEEE Trans. Pattern Anal. Machine Intell., Vol. 17, No. 7, pp.681-690, July 1995.

形に制限のない自由な曲面を含む物体表面を認識するために,表面の新しい表 現方法 SAI(Spherical Attribute Image)を導入する.SAIでは,物体 の距離画像データや幾何学的モデルからつくられた,離散的なメッシュで表面 を表す.そのメッシュは,標準的な物体(例えば楕円体)のメッシュを,物体 の表面に合致するまでゆがませていくことで算出される.我々は,このような メッシュが満たすべき局所的正則条件を定義し,物体表面を表すメッシュと標 準物体のメッシュとの正しいマッピングを規定する.SAIのパラメータとし て表面の曲率がメッシュのすべてのノードで算出されるが,これは視点に依存 しない.我々は,SAIを参照物体のモデルと観測された物体のモデルとを比 較して認識することに用い,参照物体のモデルと観測された物体のモデルの類 似性をどのように評価しうるか,また,観測されたシーン中で参照物体のモデ ルの向きがSAIを用いてどれだけ容易に計算されるかについて述べる.

SAIを3次元物体のモデル化や認識に用いることで,主に下に挙げる3つの 利点があることを,実際の距離画像での実験結果によって表す.

 1)従来の手法では処理できないような複雑な形状の曲面にも適用できる.  2)球面のモデル間の類似性を計算するという,認識上の困難を軽減する.    とりわけ,本方法では組合わせ論的な探索を必要としない.  3)球面のマッピングに基いていても,隠れがある画像や一部しか観測され    ない画像を処理することができる.


尺度不変の拡張クラスと帰納的尺度空間フィルタ
An Extended Class of Scale-Invariant and Recursive Scale Space Filters

Eric J. Pauwels, Luc J. Van Gool, Peter Fiddelaers, and Theo Moons

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, No. 7, pp.691-701, July 1995

本論文では,重要な条件の数によって尺度空間フィルタの機能の表現形式が どのように決定されるかを調べた.特に,空間尺度フィルタが線形である(等 方性畳み込みフィルタ)と仮定した場合,二つの条件(機能性,尺度不変)によっ て,考え得るフィルタ集合から性質形状を決定するパラメータに依存する,ふ さわしいフィルタ群を絞り込むことが出来る.ガウシアンフィルタはこの形状 パラメータの一つの特別な値に相当する.他の値に対して,フィルタの増幅, 抑制範囲のパターンはより複雑なものとなる.これは,視覚系の神経生理学と 大いに関係がある.最近の研究によって,LGN(lateral geniculate nucleus) の,古典的に中心を囲まれた感覚機関の場(field)と猫の網膜神経節細胞の外 部に広範な抑制領域が存在することが示された.これらの領域はガウシアンの 2次導関数に基づくモデルによって説明することは出来ない.最後に,この研 究が,フィルタ群の準半群特性に焦点を合わせた,他の尺度空間演算記号の公理 の研究(Lindeberg, Alvarezらによる)にどのように結び付くかを調べる. フィルタの離散的部分集合だけが,不完全な微分方程式によって特徴づけられる 旋回(evolution)を生み出すことが示された.


ファジイ関数を用いた続け字認識のための異綴り体(allograph)モデリング
A Fuzzy-Syntactic Approach to Allograph Modeling for Cursive Script Recognition

Marc Parizeau and Rejean Plamondon

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, No. 7, pp.702-712, July 1995

本論文は続け字のための異綴り体(allograph)モデルを生成し、認識する新し い方法を提案する。これは続け字認識の形態論の面に注目する方法である。 本方法は通常の異綴り体の形態論的特性をファジイ関数を用いた文法で定義する。 ここで形態論的特性とは、筆記者に依存しない認識システムを開発するための基 本的な知識となるものである。本システムは言語的な知識は用いていないので、 未知の続け字の単語認識に相当する。

この認識手法をランダムな続け字を複数の人が書いたデータを用いてテストした。 1人あたり600文字の続け字(1単語5〜7文字)を10人が書いたデータに対して平均 84.4%(1位候補のみ)〜91.6%(10位候補まで)の認識率であった。この結果は筆 記者に依存する調整は行なっていないものである。同じデータベースで人間の認 識率を測定したところ、平均96.0%、最低78.3%であった。このことは、本システ ムの認識結果は人間のそれと高い相関があることを示している。


適応スケールフィルタリング:テクスチャから形状を得る一般的な方法
Adaptive Scale Filtering: A General Method for Obtaining Shape from Texture

J.V. Stone and S.D. Isard

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 7, pp.713-718, July 1995

適応スケールフィルタリングという、画像を先に幾何学的なテクスチャ要素 (texel)に分割しておいたり、フィルタをかけた後の画像にしきい値処理を 施したりせずに、テクスチャ面を透視画的に射影した画像 から形状(ここでは、面の向き)を抽出する一般的な方法を導入する。

もしも与えられた面上のtexelが判れば、その面の向いている方向が得られる けれども、任意のテクスチャに対してtexelを一般的に特徴づけることはできない。 さらにtexelの大きさと形が面上のどこでも同じであったとしても、 それを透視画的に射影すると、大きさも形も確実に同じでなくなる。

適応スケールフィルタリングは、すべて互いに等しいフィルタの組を初期 セットF0として、画像の各々の位値ごとに一意に定まるフィルタの組FNを 反復的に求める方法である。 FNの各要素は面の3次元構造に合わせてある;すなわちFNに含まれる 画像フィルタは、すべて同一の形と大きさに逆射影する。 こうして、画像の大きさは様々に異なるが面上では単一の空間スケールを持つ texelが、画像の各所で見つかる。テクスチャから形状を決める従来手法と 組み合わせれば、FNを使って抽出したエッジから面の向きを精度良く 推定できる。ここでは平面に対する結果を示す。


DDS(Dynamic Disparity Search)を用いた 細長い障害物が存在する場合のステレオマッチング
英語タイトル Stereo Matching in the Presence of Narrow Occluding Objects Using Dynamic Disparity Search

Umesh R. Dhond and J.K. Aggarwal

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, No. 7, pp.719-724, July 1995

この論文で対象とする画像は、細長い障害物などにより障害物の影(後ろ) の部分が隠れてしまった画像である。例えば、柵越しに撮影した写真のように、 柵によって後ろの部分が隠れてしまった画像である。

このような画像の場合、ステレオマッチングに用いる複数の画像の視点が 移動した場合、障害物と障害物の周囲との位置関係が変わってしまうため、 ステレオ画像の対応づけが困難になる。

従来のステレオ画像の対応づけの方法は、画像内の平面上の位置関係の 整合性と画像の解像度や構造的な記述の多重化によっても一貫性が保存される ことを前提としたSHM(Spatial Hierachy Mechanism)を基に特徴点を対応 づけていた。

この論文では、このSHMに基づいた方法の誤りを分析し、 DDS(Dynamic Disparity Search)を用いた方法を提案した。 この方法を用いることにより、既存の二つのアルゴリズムに比べて誤りを 少なくすることができた。


文字認識における多値画像からの直接的な形状特徴抽出方法
Direct Extraction of Topographic Features for Gray Scale Character Recognition

Seong-Whan Lee and Young Joon Kim

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, No. 7, pp.724-729, July 1995

常に文書はグレイスケール(多値)の画像で入力、保存されているにも関わら ず、従来のOCRは2値画像を対象としている。しかし、多値画像を2値化する ことで文字の重要な形状特徴が欠落したり、バックグランドにノイズが生じた りしてしまう。この問題を避けるために多値の文字画像から直接特徴を抽出し、 2値化による情報の欠落を最小限にする方法を開発することが必要になる。

本論文では、多値の文字画像から直接特徴を抽出する新しい方法を提案する。 提案した方法は効果的に主の曲率方向を計算することで形状特徴抽出の性能を 向上させ、しかも不必要な特徴を抽出しないという特長を持つことをWangと Pavlidisの方法と比較し明らかにする。また、多値画像からの芯線化に非常に 効果があることもLeviとMontanariの方法と比較し明らかにする。


二次形式の距離関数を用いるための効率的なカラーヒストグラムインデキシング
Efficient Color Histogram Indexing for Quadratic Form Distance Functions

J. Hafner, H.S.Sawhney, W. Equitz, M. Flickner, and W.Niblack

IEEE Trans. on PAMI, Vol.17, No.7, pp.729-736 (July, 1995)

画像検索の手段には様々なものがあるが、ここでは色分布に着目する。 二つのカラー画像の整合を測る尺度として、それらの画像のカラーヒ ストグラム間の重み付き距離が用いられることが多い。

しかしながら、この距離尺度というのは計算量の多さに問題がある。 というのは、Nをヒストグラムの数とすれば、単純に考えてもO(N^2)、 最良でもO(N)と、もともと計算量が多いうえに、次元数の高い特徴(O(N)) を計算対象としているからである。

ここでは、少ない次元数で二つの色分布の間の距離尺度を求める方法 を導入することを提案し、これがヒストグラム間の距離尺度の下限と なることを示す。

画像データベースから大量の画像を用いて、カラーヒストグラムのマッ チング実験を行なったが、その結果によれば、より単純な距離尺度に よってあらかじめフィルタリングを行なっておくことにより、計算量 をかなり削減できることが判った。二次形式のヒストグラム間距離を 求める処理は計算量が多いのであるが、フィルタリング後のわずかな 画像を対象とするならば全体では高速になるからである。

もちろんこの方法は、データベースのインデキシングに用いることも できるものである。

・・・
IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.17, No.8


確率的弛緩法を用いたコンピュータビジョンの構造的マッチング
Structural Matching in Computer Vision Using Probabilistic Relaxation

William J. Christmas, Josef Kittler, and Maria Petrou

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 8, August 1995, pp.749-764

我々は2D画像から抽出された特徴量のマッチングに適用できる確率的弛緩法 の理論を開発した。このような特徴量は一般に限定的であり、研究者達がマッ チングの問題に直面した際ヒューリスティック導入されたもので、その適用条 件は明らかになっている。上空から撮影された道路網の画像に対し て、この理論を応用し、道路のネットワークモデルに基づいたマッチングと認 識の問題、および、一組のステレオ画像からエッジをマッチングさせる問題を、 正しく解くことができた。 この例では、道路ネットワークは属性付きリレーショナルグラフで表現されてお り、各ノードはある種の属性と、その他のノードとの関係を2値の関係で表す、 線分セグメントで表されている。


トラッキング時のカメラの動き
Analysis of Camera Behavior During Tracking

Swarup Reddi and George Loizou

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 8, August 1995, pp.765-778

カメラが動き回るロボットに装着されており、ロボットを基準にして2つの軸の 周りに回転することが出来る。このような環境で撮影された画像のオプティカル フローフィールドを利用し、いかにしてカメラの中心に目標物を捕えることが出来る かを示す。ただし、目標物がカメラの2つの回転軸に近すぎない条件の元で。 目標物がカメラの視野の中心付近にある場合、1つの回転軸の周りの角速度の大 きさは目標物のフローベクトルの大きさを越えることはない。しかし、他方の回転 軸の周りの角速度は、目標物の回転軸からの距離に逆比例する。つまり、距離が 短くなれば角速度は大きくなる。 ロボットと環境の相対運動が並進的と見做せるような特別なケースにおいて、カメラ の角速度と加速度が大きくなるような状況について考えてみた。トラッキング戦略の 良否の評価実験はコンピュータで合成したオプティカルフローの場で行なった。


認識のための代数関数
Algebraic Functions For Recognition

Amnon Shashua

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 8, August 1995, pp.779-789

一般的に、ある対象物の3つの透視像の座標間には、3つの線形関係で表現される3重線形形式 (trilinear)関係があることが示される。この3重線形形式は、方位に依存した直接再投影法に よる画像認識にとって実用的手法であることがわかる。そして、これはカメラの変形、画像の 構成、エピポーラー幾何(epipolar geometry)を横断的に扱う直接的再投影法(reprojection method)である。 また、これが、再投影に必要な最低限の数の点を使って解を得る方法であることが理論的に言える。 更にこの方法が色々な平面上で規則性を保ち、また、新しい視覚的不変要素(view invariants)を 導くのを見ると、これの理論的な証明は将来の楽しみとして残しておこう。シミュレーション 画像や実写画像で実験してみた結果は現実的な頑強性(robustness)と、高い効率を持っている ことを示している。


平均値シフト、中央値(モード)探索そしてクラスタリング
Mean Shift, Mode Seeking, and Clustering

Yizong Cheng

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 8, August 1995, pp.790-799

平均値シフト(mean shift)とは、各データ値をデータの局所平均値だけずらせる反復 法であるが、この方法の一般化のための解析を行なった。この一般化によれば k-mean クラスタリングは特種解の1つとみなせる。また、この平均値シフトはカーネルの影 (shadow)で形成される表面上で、中央値(mode)を探す手続きと同等であることが示される。もし カーネルがガウス関数であれば、平均値シフト法は勾配写像(gradient mapping)と 等価となる。この平均値シフトを反復する場合の収束性も論じられる。このような観 点から、クラスター分析はデータの平均値シフトの定常点を見つける決定論的問題と して扱うことが出来る。これを使った、クラスタリングと Hough 変換の例を示した。 平均値シフト法は多数の始点からグローバルな最適化問題を解くための画期的戦略と 考えられる。


科学的応用のためのチューブ状分子のトラッキング
Tracking of Tubular Molecules for Scientific Applications

B.A. Parvin, C. Peng, W. Johnston and F.M. Maestre

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 8, August 1995, pp800-804

ここでは画像中にあるチューブ状分子を検出してトラッキングするためのシステムを紹介する。 これら分子の自動的検出と、形状、場所、動きの特徴をつかむことはある種の科学分野における 新しい実験の手順を提供することになる。ここに提案するシステムの特徴は2点ある:(1)マクロ レベルでは、対象物の幾何学的性質を利用してトラッキングと位置決めの両方出来るシステムを 提供出来ること;(2)ミクロレベルでは、対象物の検出とトラッキングをモデル化するのに、「上位の 制約条件」と「下位の制約条件」を使うことである。この対象物検出の基本的考え方は、まず、認識 に重要な特徴を画素レベルの画像から抽出し、次に、上位の手掛かりから詳細な輪郭を決定することにある。 チューブ状分子の場合は、知覚に重要な特徴として「反平行な線分」、あるいは同等な特徴として 「対称軸」があげられる(チューブの中心を通る線に対称な平行線)。この対称軸は、対象物の外接 多角形を大まかに分類するのに使える。また、この多角形はダイナミックプログラミングを使っ ての詳細な処理手続きをするための境界条件を与える。時間系列画像中の対象物をトラッキング するために、より洗練された分子の輪郭が、連続する画像フレーム上に投影される。


局所的な色情報を使って”ウォーリー”のような目標物を見つける
Finding Waldo, or Focus of Attention Using Local Color Information

Francois Ennesser and Gerard Medioni

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 8, August 1995, pp.805-809

カラー画像中の目標物の存在場所、より正確に言えばそれらしい場所を、を言い当てる 方法について述べる。目標物の色分布はあらかじめわかっており、カラー空間処理が可 能であると仮定する。以前から知られている、Swain と Ballard の逆投影法に比べ、 同等な複雑さであるが、新しい方法はより多くの情報を利用する。もっと詳しく言えば 、新しい方法は、モデルの局所的ヒストグラムのマッチングを使い、従来のように画素 を一つ一つ目標物の確信度で置き換えるようなことをしない。このアルゴリズムを単純 な形で実現した場合、最悪のケース、逆投影法にまで退化する。また、モデルの大きさの 見積り方法も示す。 これを、かの有名な "Where is Waldo"(日本名、「ウォーリーはどこだ」)をディジタル 化した画像に適用した結果を示す。この時、最適カラー空間と量子化条件は注意深く選んだ。 我々は、更に、重要な色の変化が期待できる場合には、共起ヒストグラムを利用する ことを提案する。


複数の2D点集合の間の相似やアフィン変換に不変な距離
Similarity and Affine Invariant Distances Between 2D Point Sets

Michael Werman and Daphna Weinshall

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 8, August 1995, pp.810-813

我々は、アフィン変換や相似変換に依存しないが、両者の対応関係は既知であるような二つの 2次元の点集合の間の距離を表現する方法を開発した。両画像を比較する前に、画像の距離が 2つの画像について対称であるような(どちらの画像から計っても等しい)画像正規化法につ いて論じた。それから、相似やアフィン関係の画像の間でも不変な距離を与えることが出来る 一般的な距離の定義を与えた。この定義によって、アドホックな(その場限りの)正規化の定 義を避けることができる。さらに、2つの画像が非対称な関係にあるような場合にも、その間 の距離を定義出来る。現実の画像と、合成された画像の両方に適用した結果を示す。


リアルタイムの動き分離と形状のトラッキング
ASSET-2: Real-Time Motion Segmentation and Shape Tracking

S.M. Smith and J.M. Brady

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 8, August 1995, pp.814-819

この論文は、動画の中の動く物体の検出とトラッキングに関するシステムについて述べる。 特徴量に基づいてオプテイカルフローが計算され、対象物を時間的に追跡しながらその オプティカルフローを物体の内部アフィン運動とみなしてクラスターに分離される。この システムはリアルタイムで作動し、正確で信頼性が高い。


コンピュータによる3D物体を作るためのマルチビュー距離データの位置合わせ
Registering Multiview Range Data to Create 3D Computer Objects

Gerard Blais and Martin D. Levine

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 8, August 1995, pp.820-823

この研究はコンピュータで3次元物体の表面を形成する際、距離データのイメージ を位置合わせする問題を扱う。位置合わせするためには、まず並進と回転パラメータをうま く見つけ、部分的な表面が互いにうまく重なり合うように調整する。 利用された方法は、位置合わせの問題を最適化問題で表現する方法である。二つの 距離画像に含まれる部分的表面を位置合わせしたときの「整合品質」を「動きパラメータ」で表す関 数を定義した。この関数は、一方の表面の制御点と対応するもう一方の表面の制御点 のユークリッド距離の和で定義する。この方法の良い点は、距離画像中に散在している点 の対応関係を定義することにある。これはレンジファインダーの補正作業を逆に辿る のと同じで、距離画像中の3次元空間の任意の点の位置を計算する方程式に帰着する。 コスト関数を最小化するために、確率的最適化法、高速シミュレーテッドアニーリング 法(VFSR)を使った。 2方向の画像を使った位置合わせ実験では、適当な計算時間内ですばらしい結果を得 ることが出来た。多数の画像による実験ももちろん行なったが、この場合、処理時間は 大きくなった。これら多数の部分視野から完全な3D物体の表面モデルが構成された。 距離画像で位置合わせをするこの方法が効果的であることから、この方法は3D物体の 表面を復元する多くのアプリケーションに有用であろうと思われる。


大まかに記号列をマッチングのためのVLSI
CASM: A VLSI Chip for Approximate String Matching

Raghu Sastry, N. Ranganathan, and Klinton Remedios

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 8, August 1995, pp.824

記号列 a_1, ..., a_m と b_1, ..., b_n のエディット距離とは、一方の記号列をもう一方の記号列 に、エディット操作で変換するための最小コスト s で定義される。ここに、エディット操作とは 挿入、削除、交換である。この論文では、ある与えられた2つの文字列のエディット距離を計算 する線形シストリックアレイチップの設計と実装について述べる。そのための計算の状態を表す のに必要なビット数を減らすためのコード化体系も提案する。構造はWagnerとFischerが提案した 標準的なダイナミックプログラミングアルゴリズムを並列化したもので、大まかな記号列マッチング を色々なエディットコストで実行できる。更に重要なのは、構造自体は、扱う記号列の長さに制限が ないことである。また、これは単純なセルと、通常の隣接セル間通信を使っているので、VLSI による実装に適している。この素子のプロトタイプは South Florida 大学で作られた。

・・・
IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.17, No.9


ヴィジョン・モジュールの統合:ステレオ、陰影、グルーピング、線のラベル付け
Integrating Vision Modules: Stereo, Shading, Grouping, and Line Labeling

Sharath Pankanti, and Anil K. Jain

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 9, pp. 831-842. September 1995

Keywords: streo, shape from shading, perceptual organization, line labeling, integration, fusion

一般に、個々のヴィジョン・モジュールから得られる情報は、不確かであり、 しばしば曖昧であることが知られている。 このため、現実的な状況下で信頼度が高い性能をもつような、 統合的なヴィジョン・システムの設計に多くの関心が寄せられてきた。 このようなシステムの設計が困難であるのは、 各ヴィジョン・モジュールが、モジュールごとに異なる仮定、さらには、互いに 矛盾するかもしれないような仮定のもとで動作するからである。 本論文では、グルーピング、セグメンテーション、ステレオ、陰影からの形状の復元、 線のラベル付けといったモジュールを統合した多重解像度システムを提案し、 実現した。 いくつかの異なる実際のシーン画像を使って、提案する方法の効果を示す。 統合システムからの出力が、個々のモジュールによって課される制約条件からの 影響が小さいことを示す。 復元された奥行き情報の数値的精度を人工的に合成したデータを使って評価する。 最後に、統合システムから得られた奥行きデータから、 面の法線方向、2次曲面、交差点のラベル付けなどの 幾何学的特徴を再構築することによって、提案する方法を定性的に評価した。 これらの結果は、統合システムが個々のモジュールよりも、 入力されたシーンをより良く再構築することを示している。


相関法と弛緩ラベリングを組み合わせたオプティカル・フロー計算のフレームワーク: 新しい視点からのテンプレート・マッチング
A Correlation-Relaxation-Labeling Framework for Computing Optical Flow- Template Matching from a New Perspective

Qing X. Wu

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 9, pp. 843-853, September 1995

Keywords: Optical flow, dynamic scene analysis, motion estimation, cloud motion fields, template matching, cross-correlation, relaxation labeling

オプティカル・フローの計算については、Horn と Schunk によって、 時間変化する画像のモデルにもとづいた方法が示されている。 本論文では、さらに一般的なモデルにもとづいて、 オプティカル・フローの計算について論ずる。 特に、画像間のずれが大きい動画像とともに、コントラストが低い画像や、 非剛体的な運動をしたり、形が時間変化するような運動をする物体を含むような 画像への応用を述べる。 このような応用においては、テンプレートマッチングが、 点対応や勾配を用いた方法より優れていることが知られている。 テンプレート・マッチングと特徴点対応のどちらにでも、 特徴マッチングにおいては、2つの基本的な不確定性があることを論じ、 尤度尺度をもとに相関テンプレート・マッチングを構築する。 テンプレート・マッチングと弛緩ラベリングを組み合わせることにより、 オプティカル・フローの新しい計算方法を開発する。 この方法では、まず、 各テンプレートに対するずれの候補と、それぞれの候補の尤度尺度を決定する。 そして、弛緩ラベリングを用いて、 各候補の尤度を、運動の場の中で滑らかになるように、 反復計算により更新して行く。 気象衛星で撮った実際の雲の画像を使って、この方法をテストする。 この応用例で、新しい方法によって、 テンプレート・マッチングにおける多峰性の相関分布から生じる 不確定性に効果的に対処できることを示す。 雲の追跡に実際に使われたきたMCC法や、 点対応と弛緩ラベリングの組合せをもとにずれを推定する Barnard と Thompson の方法に比べて、新しい方法の結果には著しい改善が見られる。


欠損値をもつデータに対する主成分分析と、 その多面体物体のモデリングへの応用
Principal Component Analysis with Missing Data and Its Application to Polyhedral Object Modeling

Heung-Yeung Shum, Katsushi Ikeuchi, and Raj Reddy

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 9, pp. 854-867, September 1995

Keywords: Computer vision, 3D object modeling, multiple view merging, range image processing, principal component analysis.

観測に基づく物体のモデリングにおいて、しばしば、異なる視点からの形状記述の 統合が必要となる。 現在、通常に用いられている方法では、いくつかの視野を順番に統合して行くために、 各視野において面の各パッチの記述が正確にわかっていることと、 隣接する視野間の変換が正確に復元できることが必要である。 しかし、ノイズを含むデータや不整合があるときには、 復元された変換は誤りを含むものになる。 さらに、変換の誤差は、統合の最中に蓄積、伝搬して行くので、 結果として不正確な物体モデルが得られることになる。 これらの問題を解決するために、 中間的なステップとしてフレーム間の動きを復元することをせずに、 物体形状と異なる視点間の変換を同時に復元する、 重みつき最小二乗法(WLS)を開発した。

レンジ画像列からの物体のモデリングが、欠損値をもつデータに対する主成分分析 (PCAMD)の問題となることを示す。 PCAMD は、重みつき最小二乗和の最小化問題として一般化できる。 PACMD 問題を解くための効率的なアルゴリズムを考案する。 各視野においてレンジ画像を平面領域に分割し、 画像列全体においてその領域を追跡した後、 すべての可視領域について、面の法線の測定値の行列と、 面から原点への法線方向に沿った距離の測定値の行列をそれぞれ構築する。 ノイズ、occlusion, 不整合などのために多くの欠損値を持つ、 これら2つの測定値の行列により、複数の視野を統合する問題を 2つの WLS の組合せとして定式化することが可能になる。 そして、平面の記述と異なる視野間の変換を同時に計算する 2つのステップから成るアルゴリズムを提示する。 面の方程式を抽出した後、 多面体モデルを構築できるように、これらの面の間の連結関係を構成する。

人工的に合成したデータと実際のレンジ画像を使った実験によって、 提案する方法がノイズや不整合にロバストであり、すべての見える面にわたって 平均化することによって、正確な物体モデルを生成することを示す。 実際のレンジ画像列から多面体物体モデルを再構築する例として、 2つの例を提示する。


動的ステレオヴィジョン
Active/Dynamic Stereo Vision

Enrico Grosso and Massimo Tistarelli

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 9, pp. 868-879, September 1995

Keywords: Active vision, dynamic vision, time-to-impact, stereo vision, motion analysis, navigation.

自動化されたロボット制御における困難な問題の1つに、 視覚情報に基づく自動操縦がある。 危険な環境や無人交通のような多くのロボットの応用では、 安全な軌道を見つける上で、自動的に障害物を検知し、避けることが必要である。 ここで、 ロボットの軌道に沿った、空いている通路の検知は、 複雑な視覚情報処理を必要とする、非常に重要な機能である。 ほとんどの場合には、カメラの能動的制御を活用することができる。

本論文では、 シーンの構造を推定し、空いている領域を決定するために、 運動の情報とステレオ視を用いた、協調的方法を提案する。 シーンの相対奥行き情報を得るために、 いくつかのステレオ画像から計算される視差情報を、 同じ画像列から得られるオプティカル・フローと組み合わせる。 衝突回避時間と 空間内の固定点からカメラとの距離によってスケーリングされた奥行きの両方が、 精度の良い、相対的な測定量となる。

能動的制御の活用により、補正パラメータの必要性をかなり減らすことができる。 カメラはロボットの運動と独立に空間中の1点を追跡し、 ステレオ画像データから、 未知のロボットの運動を含むヘッドの回転が完全に得ることができる。

実際のロボットの応用におけるこの方法の実現可能性を、 実際の画像データで行なったいくつかの実験で示す。


アレンジメント:トモグラフ画像の断面の類似性を評価するための部分間の空間的関係
Arrangement: A Spatial Relation Between Parts for Evaluating Similarity of Tomographics Section

Hemant D. Tagare, Frans M. Vos, Conrade C. Jaffe, and James S. Duncan

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 9, pp. 880-893, September 1995

Keywords: Arrangement, image databases, recognition from parts, medical image processing, tomography, Voronoi diagram

医用トモグラフ画像は、画像面と物体の交差によって作られる。 画像面が変化するに従って、物体の異なる部分が見えたり、消えたりする。 しかし、画像面の変化が小さいときには、 ほとんどの部分が見え続け、それらが画像へ埋め込まれている様子は、 定性的には似たままである。 したがって、部分が埋め込まれている様子の類似性を、 画像面の類似性を推論するのに使うことができる。 「部分の埋め込み」は、他の応用においても、役に立つ特徴である。

部分が埋め込まれている様子を記述するために、「アレンジメント」とよばれる 空間的関係を提案する。 この関係によって、 各部分がその隣接した部分にどのように囲まれているかを記述される。 さらに、部分のヴォロノイ図によってアレンジメントを表することによって、 アレンジメントに対する距離を定式化する。

アレンジメントとその距離は、 心臓の磁気共鳴画像データベースにおいて、画像面の類似度を使って、 画像を検索するのに用いられる。 データベースを用いた実験によって、 部分の埋め込みの類似度から画像面の類似度が推論できることを確認し、 アレンジメントに基づく画像検索の性能を専門の放射線学者と比較する。


高速なレンジ評価のための VLSI アーキテクチャ
VLSI Architecture for High-Speed Range Estimation

Raghu Sastry, N. Ranganathan, and Ramesh C. Jain

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 9, pp. 894-899, September 1995

Keywords: Range estimation, image processing, very large scale integration (VLSI) implementation, intensity gradient, systolic algorithm, special purpose architecture, hardware algorithm.

多値画像からの奥行き情報の復元は、コンピュータ・ヴィジョン、 ロボット・ヴィジョンの重要なテーマである。 Intensity gradient analysis (IGA) は、 位置移動を受けるセンサによって得られた画像系列から奥行き情報を推定するための ロバストな方法である。 IGA は、画像間の対応付け問題を解くことを必要としないので、 レンジ評価の効率的な方法である。 多くのアプリケーションにおいて、 非常に高速のフレームレートのリアルタイム処理が必要である。 IGA の計算は、特定のハードウェアの設計により、かなり高速にできる。 本論文では、IGA による高速なレンジ評価のための2つの VLSI アーキテクチャを 提案する。 提案するアーキテクチャは、 高速な処理を達成するために、パイプライン処理と並列処理の原理を十分に 活用している。 設計は、概念的に単純で、VLSI での実現に適している。


文字列間の正規化編集距離の高速計算
Fast Computation of Normalized Edit Distances

Enrique Vidal, Andres Marzal, and Pablo Aibar

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 9, pp. 899-902, September 1995

Keywords: Normalized edit distance, Levenshtein distance, pattern recognition, string correction, editing, spelling correction, optical character recognition, speech recognition, fractional programming, fast algorithms.

2つの文字列 X と Y の間の正規化編集距離(NED)は、 X を Y に変換するのに必要な編集操作の重みつき和とこれらの操作に対応する 編集パスの長さの商の最小値として定義される。 最近、Marzal と Vidal によって、 m と n を X と Y の長さとするとき、 O(mn^2) の計算複雑度を持つ NED の計算アルゴリズムが提案された。 本論文で提案するアルゴリズムは、実際には、 通常の正規化しない編集距離と同じ O(mn) の計算を必要とすることが 実験的にわかっている。 このアルゴリズムの性能を、実際のデータを使った、 チェインコード表現に基づく手書き数字認識(OCR)実験と 人工的に合成したデータを使った実験を通して示す。


セグメンテーションをしない文字認識
Character Recognition without Segmentation

Jairo Rocha and Theo Pavlidis

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 9, p. 903-909, September 1995

Keywords: character recognition without segmentation, broken character recognition, touching character recognition, homeomorphic subgraph matching, relative neighborhood graph.

知識に基づく単語解釈モデルの一つとして、 セグメンテーションをしない OCR の方法を提案する。 この新しい方法は、すでに定義されている文字のプロトタイプに同型な 部分グラフの認識をもとにしている。 計算論的知覚で使われている相対近傍の概念の変形をもとにして、 文字の一部の可能性のあるギャップを特定する。 このシステムでは、 たとえ、その部分グラフが、 切れたりや他の文字へ接触している文字に対応するものであっても、 文字のプロトタイプとのマッチングにより、単語中の至るところで認識される。 文字は、マッチングの結果に応じて決められる順番にしたがって検出される。 認識された各部分グラフは、特徴グラフに現れる特徴の異なった解釈を表す 有向ネットワークのノードになる。 そのネットワークのパスは、単語の構成文字の連なりを表している。 この方法によって、重なりあったり、アンダーラインが引かれている文字を 認識できる。 ある基準の下で、最適なパスを探索することにより、最終的に単語特徴の最良の 解釈を得る。 文字認識では、 抽出された個々の特徴を柔軟にグループ化することによって、 プロトタイプの特徴との柔軟なマッチュングをとる。 切れた文字は、文字の一部として解釈が可能な、特徴間のギャップを探すことにより 認識される。 接触文字は、マッチングにおいて、 特徴に整合しないストロークを許すことによって認識することができる。 USPS データベースの 24,000 以上の印刷数字と、手書き単語に対する 認識結果により、提案する方法がロバストであることが示された。


相対距離を使ったパターン認識のための探索手法
A Search Technique for Pattern Recognition Using relative Distances

Thomas E. Portegys

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 9, pp. 910-914, September 1995

Keywords: Pattern recognition, optical character recognition, nearest neighbor, distance metric, branch and bound, NIST digit samples.

相対距離を使ったパターン木を構築、探索する手法を提案する。 探索の目的は、与えられたパターンの nearest neighbors を見つけることである。 木の構造は、探索時間がテストパターンとその nearest neighbors の間の 距離に比例するようになっており、 それによって、 平均してより近い近傍を含むような大きな木が、より小さい木よりも 高速に探索できるという、変わった可能性があることがわかる。 NIST データを使った手書き数字認識にこの手法を使った結果、 7000 パターンからなる木を使って 97% が正しく認識された。


文字認識のための並列細線化方法の評価
An Evaluation of Parallel Thinning Algorithms for Character Recognition

Louisa Lam and Ching Y. Suen

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 9, pp. 914-919, September 1995

Keywords: Thinning, parallel algorithms, image processing, character recognition

骨格化アルゴリズムは OCR システムの前処理段階において重要な役割を果たしてきた。 本論文では、 大量のデータを使った性能評価結果と、 異なる細線化アルゴリズムの OCR システムへの効果を調べることにより、 OCR の視点から最近の10の並列細線化アルゴリズムの性能について報告する。


セグメンテーションされたレンジ画像からの正しい境界表現(B-表現)の抽出 ディジタル画像中の形状の重要点の検出
Extracting a Valid Boundary Representation from a Segmented Range Image On Critical Point Detection of Digital Shapes

Adam Hoover, Dmitry Goldgof and Kevin W. Bowyer Pengfei Zhu and Paul M. Chirlian

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 9, pp. 920-924, September 1995 IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 8, August 1995, pp.737-748

Keywords: Experimental computer vision, range image processing, 3D shape, model reconstruction.

単一のレンジ画像から3次元形状モデルを抽出する新しい方法を提示する。 新しい点の1つは、 そのモデルが、物体の見えている面と、 物体に隠されている部分と見える部分の境界面の両方を表現することである。 もう1つの新しい点は、 レンジ画像が完璧にセグメンテーションされている必要がないことである。 低レベルのセグメンテーションでは、 モデル構築のプロセスにおいて、 位相構造と幾何的特徴の食い違いが起こり得るが、 そのような問題に面したときに、 「柔らかく失敗する」ようにモデル構築のプロセスを設計する。 そして、3次元形状のばらつきを最小にするように、3次元モデルの各部分を 「張り合わせる」。 その目的は、より高レベルの処理に適した正しい境界表現(B-表現)を 生成することである。 3つめの新しい点は、 オペレータの相互作用なしで、さらに、すべてのパラメータを固定した条件下で、 200 以上の多面体のレンジ画像を使ってこの方法を評価した結果、 97% に対して正しい境界表現が得られたことである。

2次元のディジタル画像中形状の重要点(CPD)検出の非線形アルゴリズムについて述べる。 このアルゴリズムは、通常発生する、曲率近似とガウス関数によるフィルタリングの問題 を回避している。クリティカルレベルを定義することで、初めて効果的なCPDアルゴリズム を設計するための基準を確立した。連続する3つの擬重要点(pseudocritical points)で 規定された領域の重要度合いを定量化することで単純で効果的なアルゴリズムが開発できた。 このアルゴリズムとその他の多くのCPDアルゴリズムを比較したところ、本アルゴリズムは いろんなレベルの細かさで画像を抽出出来る点で優れているだけでなく、どのレベルでも 積算誤差が小さいと言うことが解かった。また、色々な複雑さの画像に適用した実験から 本アルゴリズムは信頼性が高く、ノイズにも強いことが解かった。

・・・
IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.17, No.10


コンピュータビジョンに対する新ロバスト評価法
MINPRAN: A New Robust Estimator for Computer Vision

Charles V. Stewart

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 10, October 1995

MINPRAN は,50%以上の孤立点を含むデータから,適合するものを見つけ ることができる,新しいロバスト評価法である.孤立点の割合が高い場 合に適用される他の方法と違い,MINPRAN による評価は,良好なデータ と既知の誤差が存在する境界に依存しない.ただし,不適切なデータは センサのダイナミックレンジ内にランダムに分布しているものと仮定し ている.これに基づきMINPRAN では,適合(ほとんど起こらないが,ラ ンダムに発生する内部点を含む)を見付けるために,ランダムサンプリ ングを行なっている. 評価の時間計算量はO(N^2 + SN log N)である.ただし,Sはランダムサ ンプル数,Nはデータポイント数である.MINPRAN がランダムデータから 適合するものをうまく区別し,真の内部点の割合に関わらず,正確な適 合と内部点数を大体正しく見つけることができることを証明する.また 合成データ上でMINPRAN の特性を実験的に確かめ,最小2乗メジアンの 比較に好都合であることを示す.最後に,複雑なシーンより得られるデ ータ中の孤立点を取り除くために,MINPRAN をいくつかに区切られた平 面の区画に適用した.


カラーのテクスチャー画像の教師なしセグメンテーションのための マルコフ場モデル 複数の識別方式を使用した個人識別
Markov Random Field Models for Unsupervised Segmentation of Textured Color Images Person Identification Using Multiple Cues

Dileep Kumar Panjwani and Glenn Healey Roberto Brunelli and Daniele Falavigna

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, No. 10, Oct 1995 IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 10, October 1995

マルコフ場(マルコフ・ランダム・フィールド)モデルを用いた、カラーテ クスチャー画像の教師なしセグメンテーションアルゴリズムを提案する。 このモデルにおいて、テクスチャーを特徴づける要素は二つある。一つはそ れぞれのカラープレーン内における空間的相互作用であり、いま一つはカラ ープレーン間の空間的相互作用である。 セグメンテーションアルゴリズムは、階層的クラスタリングに基づいている。 ここでは画像の条件付き疑似尤度というものを考え、それらの大局的な性能 を表す関数の値が最大となるように、繰り返しの各段階で統合を行なうよう にしており、これがアルゴリズムの核心である。疑似尤度が急速な変化する 場合に、クラスタリングの終了テストは行なわれる。 カラーテクスチャーモデルを用いる利点を実験結果により示すとともに、カ ラーの自然画像を対象として、このアルゴリズムの性能を示す。 セグメンテーションにおけるほとんどの処理は局所的であり、高性能な並列 的実現に向いている。 ---

本論文では音声とビジュアルな特徴に基づいた個人識別システムについて述べ る。このシステムは様々な識別部から構成され、それらの出力は正規化後に統 合される。特に、2つの音声特徴を利用した識別部と3つのビジュアル特徴を 利用した識別部は、最終的な判断を行なう統合モジュールへ結果を渡す。

新しい方法として、ハイブリッドな階層あるいは測定レベルでの複数の識別部 の統合方法において"HyperBF networks"が用いられている。 また、登録されていない人物をリジェクトする方法として2つの異なる方法を 用いている。 音声特徴だけを用いるシステムやビジュアル特徴だけを用いるシステムに比べ て、複数の方式を統合した本システムの性能が優れていることを示す。

個人識別システムは、個人のアクセス記録や若干の変更で個人照合システム にも利用できる。


剛的と非剛的形状回復と再表現での三次元と四次元の表面調和関数の応用
The Use of Three- and Four-Dimensional Surface Harmonics for Rigid and Nonrigid Shape Recovery and Representation

Art Matheny and Dmitry B. Goldgof

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 10, (October, 1995)

剛的と非剛的形状再表現での球面調和関数の使用は周知のものである。本論 文は、領域を球面の代わりに四次元の球面に定義することによって、この方法 を表面調和関数まで拡張する。球座標では表現できないが、他の座標系での大 域関数として表現できるような形状については、このような表面調和関数を使 用すれば表現できる。例として、扁長と扁円の表面高調波及び円柱調和関数は このような有用な表面調和関数である。

非剛的形状は空間と時間の関数として表現できる(時間依存性を一つの別の 要素として含める、または、四次元の球面調和関数を使用する)。本論文では、 色々な表面調和関数を剛的と非剛的の合成データと実データのある集合に適 合し、その誤差を比較する。これらのすべてのケースにおいて、与えられた範 囲内のデータへの適合は、線形最小2乗法を使用する。

本論文では、次のことを発見した。いくつかの形状において、望まれた精度の 達成に必要な関数の数が異なるような幾何学的な変動があった。特に、左心室 の動きを表現するには、四次元球面調和関数が改善したモデルを提供している。


曲線画像に対する論理/線形オペレータ
Logical/Linear Operators for Image Curves

Lee A. Iverson and Steven W. Zucker

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 10, October 1995

early visionに適した、画像を評価するオペレータの設計手法を提案する。 それらのオペレータは線形作用素論とブール論理の側面を統合した ものなので、論理/線形(L/L)オペレータと呼んでおり、曲線画像の 低次の微分構造を評価するのに適している。 L/Lオペレータは線形モデルを、曲線が存在するためのある構造上の必要条件が 確実に成り立つような、論理要素に分解することによって得られる。 接線方向に関する条件によって連続性が保たれ、一方、法線方向に関する条件 によってコントラストを示す輪郭が選択され、分類される。 その結果得られたオペレータは、エッジおよび直線状の特徴を うまく分離できるほか、線微分構造(方向と曲率)の大雑把な評価を 可能とする。 こうして偽の正値レスポンスの発生を減らすことにより、これらの オペレータは、同じクラスの特徴を分割しようとする(しきい値処理された) 線形オペレータよりも相当に良くなっている。


オブジェクト基調の階層的計画による画像解析処理の統合
Composition of Image Analysis Processes Through Object-Centered Hierarchical Planning

Leiguang Gong and Casimir A. Kulikowski

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 10, October 1995

本論文では、知識ベースによる画像の解析/理解の処理を統合する 新しいアプローチについて述べる。 統一的な、オブジェクトを基調とする階層設計のフレームワークによる 画像解析処理の統合の方法を、VISIPLAN(VISion PLANer)というシステム で実現した。 複数の方法によって得られた(multi-modality)生物医学画像の十分に広いクラス の解析/理解問題を扱うのに、本アプローチが柔軟であることがテストに よって示される。 その課題に特化された画像解析と認識処理 がより効率的で効果的に 生成されることができる、一般的なデザインまたは計画(planning)の フレームワークを本方法は与える。 この方法では、理解プロセスの最終実装ステージがほとんど 不変の課題でそしてドメインに特化されたものであっても、 一般性がデザインと計画の段階で得られる。


非因果律的なヒドゥンマルコフモデルを用いたテクスチャの分類
Texture Classification Using Noncausal Hidden Markov Models

Bennett R. Povlow and Stanley M. Dunn

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 10, October 1995

この論文では非因果律的なヒドゥンマルコフモデルを用いたテクスチャの 分類について論じる。非因果律的なモデルにおいては、それぞれの画素の 状態はその画素の全方向での近傍画素によって定まる。テクスチャの非因果律的 なヒドゥンマルコフモデルのパラメータを学習する手法と、学習済みのモ デルを用いてある入力画像を学習したカテゴリのいずれかに分類する手法を新 たに提案する。また本アルゴリズムを用いた結果を示す。


尺度空間作成に用いるガウシアンカーネル(Gaussian Kernel)の 最適なL1近似
Optimal L1 Approximation of the Gaussian Kernel With Application to Scale-Space Construction

Xiaoping Li and Tongwen Chen

IEEE Trans. on Pattern Anal. Machine Intell., Vol. 17, No. 10, October 1995.

ガウシアンフィルタによる尺度空間の作成には,信号と裾野の広いガウシアン フィルタとのコンボリューションを,様々な標準偏差のフィルタに対して計算 する必要がある.本論文では,ガウシアンカーネルを,少数の基底関数の線形 結合という,L1関数による最適な近似を行なう効果的な方法を提案する.ガ ウシアンカーネルの確実性を探求するにしたがい,この方法は以下のような性 質があることがわかる.

1.最適な基底関数はやはりガウシアンであり,そのことは解析的に得られる.

2.連続体をなす尺度に対する尺度空間が容易に計算され得る.

3.計算回数や記憶容量の大幅な削減が可能である.さらに,この研究は,多 重尺度の画像処理へのガウシアンモデルの使用に関するいくつかの問題に ついて光を投げかけている.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.17, No.11


視覚運動を計算するためのOccamアルゴリズム
Occam Algorithms for Computing Visual Motion

Haim (Shvaytser) Schweitzer

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 11, November 1995

視覚運動を計算する標準的なアプローチはピクセル対応に依存している。これ らの計算のスキーマは、ピクセル対応に直接関連しなくても、付加的な制約 (例えば、運動ベクトル場の平滑性と連続性)が必要としている。本論文は、 このような制約の多いアプローチの一つ代替案を提唱する。

機械学習で類似性を発見することにより、運動は枠(フレーム)を正確に予想 できるような関数として計算されている。Occam-Rzaor則によれば、一番目の 枠から二番目の枠を正確に予測する関数群の内、最も良い予測関数は最も簡潔 なものであり、簡潔さはエンコーディングレングス(encoding length)によっ て厳密的に定義できる。

ある実用的なアルゴリズムの実施が述べられている。本物のビデオシークエン ス(まとまりのある一連のシーン)による実験でこのアルゴリズムの予測を検 証した。そこで、典型的なシークエンスはいくつかのパラメータによって正確 に予測できることが分かった。我々の独特な選択によって選ばれた予測関数は、 正確さとコンパクト性において、他の画像流動(image flow)に関するアルゴリ ズムに比べて、非常によりよい結果を得られた。但し、三次元の運動と構造を 正確に復元するには多大な制約を受けるだろう。


拡張自己相似モデルによるテクスチャーの粗さの解析と再構成
Texture Roughness Analysis and Synthesis via Extended Self-Similar (ESS) Model

Lance M. Kaplan and C.-C. Jay Kuo

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 11, November 1995

2次元フラクショナルブラウン運動は尺度不変な粗さを持つ表面のテクスチャー をモデリングするのに役に立つ道具となる。 尺度不変な粗さのテクスチャーを表現するために、 本研究で我々は拡張自己相似モデルを提案する。 我々は実際のテクスチャーのデータからモデルのパラメーターを抽出する 評価アルゴリズムを提案する。 さらに拡張自己相似モデルを2次元で実現するために 新しいインクリメンタルフーリエ統合アルゴリズムを提案する。 最後にその評価法と表現法を統合し、実際のテクスチャーの表面を再現する。


機械図面理解システムにおけるベクトルベースの弧分割
Vector-Based Arc Segmentation in the Machine Drawing Understanding System Environment

Dov Dori

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 11, November 1995

工学図面において、弧は重要なプリミティブである。弧は直線(bars)と 共に図面に表わされる対象の記述に大きな役割を持つ。辞書的分析 (lexical analysis)のフェーズにおけるこのプリミティブの抽出は、 機械図面理解システムにおいての工学図面の構文的また意味的理解の 必要条件である。直線は直角ジグザグベクトル化アルゴリズム (orthogonal zig-zag vectorization algorithm)によって検出される。 検出された直線の中には弧に線形近似されるものもある。 それ自体で弧分割の基ともなる。弧は直線のつながりと、その線上の 三つ組の点により決定される。弧の中心を初めに三つの点の弦の 垂直二等分線の交点によって決まる三角形の中心に近似しておき、 再帰的に最適な三つ組を求めていき、2、3回繰り返すと収束する。 このアルゴリズムは実際の工学図面を用いた実験で他の空間変換方法と 同等の性能が得られた。これは raster-to-vector 変換や 巨大な計算が必要な画素レベルの演算を用いなかったことが要因である。


ウェーブレットとZakaiの方程式を用いたフィルタリング画像の記録
Filtering Image Records Using Wavelets and the Zakai Equation

Ziad S. Haddad and Santiago R. Simanca

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 11, November 1995

S/Nの低い連続的な自然画像を用いて,「本質的に定常な」背景中を動いて いるかすかな物体を検出し位置を確定する問題を考えよう.ふつうの方法は, まず観測画像を離散的なスナップの組に「デジタル化」することと,件の物体 を十分(おそらく正確ではない)マッチしたならば適切な確率論的フィルタを 用いて物体を「追跡」することから成る.追跡は,低いS/Nを補うことを期 待されるものであるが,これにより,ノイズの低減と物体の位置確定のために 連続画像を「一貫して(coherently)」処理することが可能となるのである. したがって,ここでの「追跡」は検出してから追跡するというような普通に用 いられている意味で使われず,むしろ検出するために追跡するのである.それ から,最適な(必要ならば非線形の)フィルタと同様に適切な画像の表現形式 を選択することも問題の一つとなる.我々は,ウェーブレットとZakaiの 方程式を用いて,正しいもしくは近似的な解答を提案する.用いられるウェー ブレットの平滑性は,フィルタを与える条件つき密度に対する発展方程式の微 分作用素の中で要求され,ウェーブレットの直交性は,アルゴリズムの中で効 率的に Ito- and change-of-gauge-terms の計算を実行することを可能にする.


距離画像から二次超曲面(hyperquadric)の再生
On Recovering Hyperquadrics from Range Data

Senthil Kumar, Song Han, Dmitry Goldgof, and Kevin Bowyer

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 11, November 1995

本論文では,コンピュータビジョンでの二次超曲面モデルの応用,とりわけ距 離画像からの二次超曲面の再生について述べる.二次超曲面は,立体的 (volumetric)な形状モデルで,特別な場合として超曲面(superquadric)を 含む.二次超曲面モデルは,任意の数の項(term)から構成することができ, その幾何学的境界は任意の convex polytope である.二次超曲面は,超曲面 よりも複雑な形状をモデル化することができる.また,二次超曲面は,他にも 多くの都合の良い性質(コンパクトさ,準局所的操作性,直感的な意味)を有 する.二次超曲面のパラメーターを再生することが困難なのは,エラー関数に おいて極小値(local minima)が多数存在するだけでなく,何ら意味のある形 状に対応しないような無限小という最小値(global minima)の存在のためで もある.我々の提案するアルゴリズムは,三次元で六つ(二次元なら四つ)の 項だけ用いて粗くフィットさせることで始め,フィッティングを改善するのに 必要な項のみ加えていく.適合条件は,最適な収束を確かなものにするために 用いられる.二次元と三次元のデータに対する実験の結果を示す.


変形可能な輪郭線:モデリングと抽出
Deformable Contours: Modeling and Extraction

Kok F. Lai and Roland T. Chin

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 11, November 1995

Keywords: Deformable model, rigid template, snake, active contour, boundary extraction.

本論文ではノイズを含む画像から任意の変形可能な輪郭線をモデリングし抽出 する問題を考える。ここで提案するのは安定(stable)かつ再現可能な形状マ トリックスに基づく大局的な輪郭線モデルであるが、これは固定的な動きのも とで不変でありかつ唯一である。

モデルの局所的な変形にMarkov Random fieldを組み合わせることで、この方 法では変形が大局的なモデルに影響を及ぼす予測が可能となる。そして事後 の推定で抽出の問題を扱うのをやめ、それが一般化された能動的な輪郭線モデ ルのエネルギー最小化問題と等価であることを示す。

本論文は、形状の学習、エネルギー最小化、直線を探索する方法、最大最小の 正規化、一般化ハフ変換の初期化について論じている。最後に実験結果を示し、 固定的なテンプレートマッチングと性能を比較する。


線分のクラスタリングによる消失点検出
Vanishing Point Detection by Line Clustering

G.F. McLean and D. Kotturi

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 11, November 1995

特徴抽出におけるエラーの有無を判別し、 また人間が判断したりしきい値を特化したりすることによらない、 サブピクセルの線分表現をベースとする消失点検出の新しい方法を提案する。

画像から直線を抽出し、 各線分の”線分らしさ”の測度を進展させ、 消失点の数とその近似方向を推測し、 そしてクラスタリングと最適化によって最適な消失点を計算する という首尾一貫したスキームに 画像処理と解析が統合される。

アルゴリズムの性能に関する定量的/定性的な評価を示す。


ステレオマッチングにおける制限付き動的フィードバック学習モデル
A Constraint Learning Feedback Dynamic Model for Stereopsis

Amol Bokil and Alireza Khotanzad

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 11, November 1995

本論文では Marr と Poggio のアルゴリズムを基にしたステレオマッチングに ついて提案する。本論文での大きな拡張部は二つあり、グレイレベルの画像に も対応、モデルの重みを"独自性(uniqueness)"と"連続性(continuity)"の制限 により設定するわけでなく学習により決定 の二つである。 このモデルの学習には不一致な地図をグレイレベルのステレオ画像の組として 用いた。この学習システムはRDS(random dot stereograms)をグレイレベルの ステレオ画像の組として学習したものよりうまくいった。 性能については最近のステレオマッチングアルゴリズムと比較した。


曲線関数の最適化による平面形状の強調
Enhancement of Planar Shape Through Optimization of Functionals for Curves

E.J. Pauwels, P. Fiddelaers, and L.J. Van Gool

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 11, November 1995

ノイズと不要な詳細記述を削除すると同時に 閉曲線を表現する顕著な特徴を保存可能な 曲線展開(curve-evolution)に Nordstrom and Mumford-Shah 関数の最適化が利用出来ることを示す。 曲線を中心角の関数(angle-function)で表現し、 それに適切な力学を適用する手法を用いている。 収束した後には、得られた表現から輪郭の結果形状を復元出来る。


複素Zernikeモーメント不変量の完全系と擬不変量の役割
Complete Sets of Complex Zernike Moment Invariants and the Role of the Pseudoinvariants

Ake Wallin and Olaf Kubler

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 11, November 1995

コンピュータヴィジョンにおいて、モーメント不変量は重要な形状記述子であ る。これに対し、任意の次数で与えられた複素Zernikeモーメントの、回転不変 量の完全系を構成するための規則を与える。また、回転不変量から逆に、正規 化された画像パターンを再構成することによって、擬不変量の妥当性を示す。


ピラミッド状コンピュータモデルでのM−フィルタを用いた画像の取り扱い
Image Manipulation Using M-filters in a Pyramidal Computer Model

M.E. Montiel, A.S. Aguado, M.A. Garza-Jinich, and J. Alarcon

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 11, November 1995

Keywords: Mathematical morphology, multiresolution, image pyramids, image segmentation, parallel algorithms.

本論文は形態論的変換が,異なる格子上の集合表現とどのように関係するかに ついて述べる.構成要素の階層的な定義は,¥PSI_kのクラスに伝えられる. ¥PSI_kは領域の離散的表現の変化を取り扱う多格子変換である.階層的構造に おいて,変換は上方または下方への処理にあたる.多格子変換に基づき,時間 計算量がO(log n)であるnxn画像内の不完全に分離された対象の表現法を示す. 本手法では,集合はグレイレベル領域であるとし,階層構造を通じて幾何学的 取り扱いを行なう.集合の階層的表現に対処する境界概念の拡張のために,画 像中の境界を識別する第2の方法について議論する.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.17, No.12


2視点画像間の線分の同定による画像内の動きと構造の推定
Estimating Motion and Structure from Correspondences of Line Segments between Two Perspective Images

Zhengyou Zhang

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 12, December 1995

本論文では、2つの視点からの画像間の線分の同定によって対象の3次元 の動きと構造を決定するアルゴリズムを示す。 我々の知る限りでは、動きの中での線分と構造を利用する初めての研究である。 既存の方法は幾何学的な特徴、例えば直線、を使用していたが、その場合動き と構造を決定するには3枚の画像が必要であった。 この論文では、線分を使用することで2つの画像から動きを復元することが可 能であることを示す。 2つの適合した線分は、空間において一致する線分の共通部分の射影を含む (すなわちオーバーラップする)という仮定の上に成り立っている。 実際に、異なる値を持つ線分をマッチングさせるのにこの仮定を使用する。 またこの仮定によって、動きのパラメータ空間における開集合において 2つの画像間における可能な動きを特定する。 合成画像と現実画像をアルゴリズムのテストに使用した。 線分を多く含む実画像データにおいても非常に良い結果が得られた。


曲線を様々な図形で表現するためのノンパラメトリックな分割方法
Nonparametric Segmentation of Curves into Various Representations

Paul L. Rosin and Geoff A.W. West

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 12, December 1995

Keywords: 2D, 3D, curve representation, segmentation, circular, elliptical, superelliptical, parabolic arcs, least square elllipse fitting, multistage, significance, nonparametric.

本論文は、曲線を直線、円弧、楕円弧、超楕円弧、多項式のような表現の組み 合わせに分割する方法と性能について述べ説明する。このアルゴリズムは、ス ケール不変、ノンパラメトリック、適応範囲が広い、そして効果が大きいとい う多くの興味深い性質がある。


連続的な特徴としての対称性
Symmetry as a Continuous Feature

Hagit Zabrodsky, Shmuel Peleg, and David Avnir

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol.17, No. 12, December 1995

対称性は連続的な特徴として扱われる。そして、形状の対称性からの隔たりの 連続的な尺度が定義される。 形状の対象性距離は、オリジナルの形状の点を動かして左右対称の形状を得る 際の最小2乗誤差平均として定義される。 対称性を測る尺度のこの一般的な定義によって、異なる形状間の対称性や一つ の形状の異なる対称性についての「量」を比較することが可能とする。 この尺度は、いかなる次元のいかなる対称性についても適用することができる。 対称性距離から、隠蔽された形状の対称性を再構成する方法が得られる。 この方法は、雑音が多くてあいまいなデータの対称性を扱うため拡張される。 最後に、グレイスケールの画像を3次元の形状とみなして、画像からの左右対 称の物体の方向を見つけるとともに、画像中の局所的に左右対称な領域を見つ けるために対称性距離を用いる。


顔の自動認識のための特徴ベクトルの拡張
Extending the Feature Vector for Automatic Face Recognition

Xiaoguang Jia and Mark S. Nixon

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 12, December 1995

Keywords: Automatic face recognition, feature extraction, feature vector.

人間の顔を叙述するための特徴はたくさんあるが,それらは組み合わせて利用される ことは少ない.直交する基準集合を用いた拡張特徴ベクトルによって,マッチングの 基準の変動を抑制することができ,顔の識別性能が向上する.本論文では,顔の識別 のためにどのような特徴が単独で利用でき,どのような特徴が統合して特徴ベクトル として利用できるのか述べる.

本研究では, ・特徴定義の改良と顔の正面からの画像からの抽出, ・識別基準の拡張と組み合わせ に的を絞っている.これらは幾何学的距離,目の領域,顔の輪郭に基づく拡張特徴ベ クトルを形成する.このうち,顔の輪郭,目の領域はWalshパワースペクトル,正規化 フーリエ記述子,正規化モーメントによって記述できる.幾何学的識別基準と他の集 合の間にはいくらかの相互関係があるものの,そのベース(距離,形状記述,連続性, 統計量)は直交しており,この研究に適したものとなっている.

顔画像のデータベースは,特徴集合要素の個別制御を発展させる,二つのマッチング 基準を用いて解析される.マッチングは分離した特徴集合と,拡張特徴ベクトルの両 方の基準について評価される.その結果,単独の利用で十分な認識が可能な特徴は存 在しないが,拡張特徴ベクトルを利用すれば効果的に顔の区別ができることが証明さ れた.


ロバストな分割GA(Genetic Algorithm)手法を用いたオプティカルフロー の領域分割と動きの推定
Optic Flow Field Segmentation and Motion Estimation Using a Robust Genetic Partitioning Algorithm

Yan Huang, Kannappan Palaniappan, Xinhua Zhuang, and Joseph E. Cavanaugh

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 12, December 1995

Keywords: motion estimation, optic flow field segmentation, linear regression, robust estimation, genetic algorithm.

オプティカルフローにおけるモーションの解析は、コンピュータビジョンにお ける視覚情報処理の重要な一連の技術である。オプティカルフローが複数の独 立に動く物体のシーンから得られたものの場合には、オプティカルフローを同 方向の動きのグループに分割し、それぞれの動きの方向を推定することは、非 常に挑戦的で重要な問題である。この問題はオプティカルフローのデータにノ イズがのっていたり、部分的に正しいデータではない場合にはもっと複雑なも のとなる。

本論文では、改良したGAを用いて従来のロバストな推定方法を組み合わせ、 このようなオプティカルフローを扱う新規な枠組を述べる。使用した基本的 なモデルは、計算量が少ないという理由から線形オプティカル・フローモーシ ョン・アルゴリズムである。一般化線形回帰(GLR)モデルの統計的な性質は、 完全に調べ尽くされており、ノイズが含まれるデータに対する動きの推定の感 度は定量的に確立されている。従来の複数のロバストな推定方法が、全体の誤 差や平均から大きく外れたデータを減らすために線形回帰モデルで結合される。 しかし、正しくないデータが多くの割合で含まれるオプティカルフローや多数 の動きのグループがある場合の分割では、従来のロバストな推定方法だけでは 実現不可能なロバスト性が要求される。この問題を解決するために、自己適合 と呼ぶGAの操作によりロバストな推定方法をエレガントに組み合わせる分割 GA手法を提案する。


二値化方式の目的指向の評価
Goal-Directed Evaluation of Binarization Methods

・vind Due Trier and Anil K. Jain

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 12, December 1995

本論文では、低レベルの画像解析を行なう諸方式を評価するに際して、その 方法論を与える。低レベル画像解析の例として、ほとんどの文書画像解析 システムにおいて最初のステップである、濃淡画像の二値化を対象とする。

入力された画像領域に対して適切な二値化方式を選択することは、難しい 問題である。二値化された画像を人間の専門家が評価する場合、その人の '見た目'が基準となるのが典型的であるが、客観的な評価を下すためには、 次ステップの解析処理が二値化後の画像ついてどれだけうまくはたらくか を調べる必要がある。

目的指向の評価と呼ぶこのアプローチは、他の低レベル画像処理の諸方式 を評価するのにも同様に用いることができる。 ここでは数字認識における二値化方式の評価ということで、文字認識 モジュールの性能を客観的な尺度として定め、11の異なる局所的適応 二値化方式を評価したところ、Niblackの方式が最高の性能を与えた。


Leaving-One-Outによる「小」確率の推定
On the Estimation of 'Small' Probabilities by Leaving-One-Out

Hermann Ney, Ute Essen, and Reinhard Kneser

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 12, December 1995

本論文では、Leaving-One-Outの概念を用いた「小」確率(つまり、トレーニ ングサンプルの数が可能なクラスの数より遥かに小さい場合での確率)の推定 について論ずる。このような枠組でのTuring-Good式を導出した後、元の Turing-Good式の問題点を避けるため、数個の特別なモデル(制約モデル、絶 対割り引きモデル、および線形割り引きモデル)を導入した。これらのモデル はbigram-based確率論的な言語モデルの問題に応用した。ドイツ語と英語の資 料での実験結果が示された。


アクティブビジョンに関する奥行き推定の手がかりとしての 立体視,輻輳運動,焦点合わせの性能解析
Performance Analysis of Stereo, Vergence, and Focus as Depth Cues for Active Vision

Subhodev Das and Narendra Ahuja

IEEE Trans. Pattern Anal. Machine Intell., Vol.17, No.12, Dec., 1995.

本論文では,アクティブビジョンシステムを用いる距離推定に関して,双眼 による立体視や輻輳運動(vergence:対象が奥行き方向へずれると,その追跡 のために両眼が互いに逆方向へ回転する.そのような動き方のこと.)という 手がかりと,単眼による焦点合わせという手がかりの性能を比較する.各々の 手がかりの性能は,画像化する際のパラメータの誤差感度によって特徴づけら れる.ランダムな量子化誤差の影響は,結果として奥行きの誤差の標準偏差に よって表される.各々の手がかりを用いる推定での系統的な較正誤差の影響も 調べられている.各々の手がかりの性能の特徴づけは相対的な性能の評価のた めに役立つ.また,そのような特徴づけに基き,相当する推定過程の計算機的 な観点や信頼性の観点を考慮し,どの手がかりを選択するかの方法についても 論じる.


ノイズの多いデータ中の堅物体の回転評価
On the Estimation of Rigid Body Rotation from Noisy Data

Daniel Goryn and Sφren Hein

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 12, December 1995

ノイズの多い3D画像中の堅物体の回転を評価する問題に対する確かな解法 を導いた。 提案する手法は Total least squares (TLS) に基づいた処理を行なうが、 これまで提案されている TLS を用いた手法とは異なり、 変換行列が直行するという制約条件を設けている。 この場合、ノイズの多いデータにおける評価の問題に対する解法は ノイズの少ないデータの場合と同じ形式になることが明らかになった。 つまり堅物体の回転評価には”無理やり標準に合わせる問題( standard Procrustes problem )”に対する解法が適用可能であると言える。


弱い配景での3次元姿勢の一意性:ある幾何学的な証明
Uniqueness of 3D Pose Under Weak Perspective: A Geometrical Proof

Thomas S. Huang, Alfred M. Bruckstein, Robert J. Holt, and Arun N. Netravali

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 12, December 1995

本論文では、次のことに関するある純幾何学的な証明を提示する。つまり、弱 い配景モデルにおいて、3点配置の3次元姿勢はそれの2次元射影での鏡映に よって一意的に決定されている。


立体的な道具の未知な外部パラメータを含む一つの動きからの4点の動きと構造
Motion and Structure of Four Points from One Motion of a Stereo Rig with Unknown Extrinsic Parameters

Zhengyou Zhang

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 12, December 1995

我々は、立体的な道具の一つの動きから、4つ以上の点の3次元の動きと構造 を再生する解析的な方法を示す。 外部パラメータは未知である。立体的な道具の動きも未知である。 情報の冗長性を利用しているので、次の点において従来の「動きからの動きと構造」 というアプローチを越えている。すなわち必要とされる特徴と動きがより少ない ので、動きと構造のロバストな推定を得ることができる点である。 解析的な方法では回転行列の拘束条件を十分に利用することはできないので、 結果を改善するために、非線形な最小化を用いた。 画像平面上において、計測された位置と予測された位置の差を最小化することに よって、動きと構造を直接推定する方法を提案する。 シミュレートされたデータと現実のデータを用いて提案されたアルゴリズムが 有効であることを確認し、大変良い結果を得た。


超関係グラフ法を用いたCADにおける境界線表現からの3次元物体の特徴の抽出
Extraction of 3D Object Features from CAD Boundary Representation Using the Super Relation Graph Method

Ching-Yao Kao, Soundar R.T. Kumara, and Rangachar Kasturi

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 12, December 1995

本論文ではCADにおける機械部分の境界線表現から、柱を抽出する方法として、 超関係グラフ(SRG)法を提案する。 超関係の定義と特徴量の妥当性を用いて、本手法は特徴を3種の相互関係 (面分割、面統合、エッジ切断)として認識する。


学習なし続け字認識における知識ベースのアプローチ
A Knowledge-Based Approach for Script Recognition without Training

P.V.S. Rao

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 12, December 1995

本手法のアプローチは手書きの経験的なパラメーターモデルに基づいている。 そのパラメーターは、筆者に依存しない幅広い形状情報とその変化性を 保つように選ばれている。 見本文字の連結で認識用のレファレンスの続け字を構成するので、 学習は不要である。認識率は90%を越えた。


ブール型ニューラルネットワークを用いた教師付き識別器の設計
Design of Supervised Classifiers Using Boolean Neural Networks

Srinivas Gazula and Mansur R. Kabuka

IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 17, No. 12, December 1995

本論文ではブール型ニューラルネットワーク(BNN)を用いた二つの 教師付きパターン識別器を提案する。その二つの方法は、

1)nearest-to-an-exemplar (NTE)(一つの見本に対する最近傍)

2)Boolean k-nearest neighbor (BKNN) classifier(ブールk近傍)

これらの方法は、単純、頑健でハードウェアでの実装も容易である。 この識別法は、radius of attraction (ROA)のアイデアを用いている。 本論文で提案したアルゴリズムの数学的分析ではその可能性を証明した。 また、二値連続特徴データを用いてテストを行い、既存の類似の識別法と 比較を行った。


[インデックス] [前の年] [次の年]