AbstractClub - 英文技術専門誌の論文・記事の和文要約


[インデックス] [前の年] [次の年]


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.20, No.1


QSIMのためのL'Hopitalフィルター
L'Hopital's Filter for QSIM

A.C.Cem Say

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 1, January 1998

Keywords: Qualitative reasoning, qualitative simulation, spurious behaviors, QSIM, state filtering

我々は定性的シミュレーションアルゴリズム"QSIM"の内部に潜む疑似予測の原 因を確認した。そのアルゴリズムはL'Hopital's 規則の違反に対するチェック に失敗し、それは行動ツリーへの不一致状態の追加を引き起こす。

我々が提案した解決方法は要求された制御を行なうために新しい状態フィルター の追加を必要とするが、入力セットへの追加や制限は全く必要としない。我々 は多くの束縛を広げながら拡張された対応点の値を使用する。アルゴリズムへ の必要な改良が説明され、サンプルへの適応を示す。他の疑似行動を排除する 方法と組み合わせれば、このアプローチはより複雑なシステムを扱うQSIMの 性能を向上させるだろう。

M.T.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


水中の音響画像の統合された再構築と復元への確率的なアプローチ
A Probabilistic Approach to the Coupled Reconstruction and Restoration of Underwater Acoustic Images

Vittorio Murino, Member, IEEE, Andrea Trucco, Student Member, IEEE, and Carlo S. Regazzoni, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 1, January 1998

Keywords: Reconstruction, restoration, Markov random fields, underwater acoustic imaging, beamforming, confidence-based approach, physics-based vision.

本論文は水中の音響画像の統合された再構築と復元のための確率的なテクニッ クについて述べる。それは画像形成プロセスの物理学に基づいている。音響画 像で広く使われているビームフォーミング方法が散乱されたエコーから距離画 像を作るのに使われる。そして、その距離画像には観測点ごとに信頼性を表現 する別の情報が関連づけられている。不運なことに、この種類の画像はその信 号の性質や関連するセンシングシステムによる問題で悩まされる。

提案したアルゴリズムでは、距離画像と信頼性の画像は確率分布が単一のエネル ギー関数で規定されたマルコフ・ランダム・フィールドとしてモデル化される。 この関数は音響システムや想定されたシーン、ノイズの影響の事前の知識をモ デリングすることによって、また両方の画像の統合され同時に起こる再構築 と復元が可能なように信頼性の情報を統合することによって、音響画像形成プ ロセスの物理学が十分反映されるようにデザインされている。 再構築された距離画像と復元された信頼性の画像の最適な(事後確率が最 大なる)推定はsimulated annealingを使用してエネルギー関数を最小にする ことによって得られる。

実験結果は信頼性の情報を無視し再構築と復元プロセスを分離する他の方法に 比べ生成された画像が向上していることを示す。

M.T.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ニューラルネットワークによる顔の検出
Neural Network-Based Face Detection

Henry A.Rowley, Student Member, IEEE, Shumeet Baluja, and Takeo Kanade, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 1, January 1998

Keywords: Face detection, pattern recognition, computer vision, artificial neural networks, machine learning.

ニューラルネットワークに基づいた真正面の顔を検出するシステムを提案する。

網膜状に結合されたニューラルネットが画像上の小さな窓で検査し、その窓の 範囲に顔の画像があるかどうか決定する。このシステムは単一のネットワーク の性能を向上するために複数のネットワークの調整を行なう。学習は顔のサン プルを提示しストレートフォワードで行なう。拒否のサンプルを集めるために ブートストラップ・アルゴリズムを使用した。これは学習を進める時に学習セッ トの中に誤りの検出を加えるものである。このことで、顔画像でない画像の全 空間に及ぶ学習サンプルを手動で選択するという困難な作業を省いた。また、 画像の中では顔は滅多に重ならないというような簡単なヒューリスティックス が一層精度を向上させた。

現状のいくつかの顔検出のシステムとの比較が示され、本システムが検出率と 誤り率の項目で他のシステムに匹敵する性能であることがわかった。

M.T.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ビューによる人間の顔の検出のための例示による学習
Example-Based Learning for View-Based Human Face Detection

Kah-Kay Sung and Tomaso Poggio

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 1, January 1998

Keywords: Face detection, object detection, example-based learning, example selection, pattern recognition, view-based recognition, density estimation, Gaussian mixture model.

複雑なシーンでの人間の顔の真正面のビューの位置検出のために例示による学 習のアプローチを示す。これはいくつかのビューに基づいた顔と顔以外のモデル 群による人間の顔のパターンの分布を形つくる。おのおのの画像の位置で差分 特徴ベクトルが画像パターンと分布に基づくモデルとの間で計算される。

差分特徴ベクトルを計算するために採用した距離計算方法と分布に基づくモデ ルに含まれる顔ではないモデル群の両方がこのシステムでは重要であることを 経験的に示す。

M.T.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


どの位のサイズのテストセットがエラー率の推定に良いか?
What Size Test Set Gives Good Error Rate Estimates?

Isabelle Guyon, John Makhoul, Fellow, IEEE, Richard Schwartz, and Vladimir Vapnik

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 1, January 1998

Keywords: Pattern recognition, test set, test set size, benchmark, hypothesis testing, designed experiment, statistical significance, estimation, guaranteed estimators, recognition error.

エラー率の期待値の関数として、どの位のサイズのテストセットであれば文字 認識で統計的に意味のある結果を保証するかを決定するという問題を扱う。

例えば、期待された誤認識率が約1%ならば、少なくとも統計的に独立な10,000 の手書き文字(100人が100文字ずつ書くことで得られるだろう)によって95% の信頼性で保証されることを示すというような統計的な分析を提供する。 この場合は、期待される誤認識率の値は1.25Eより悪くなく、2つの認識系の 誤認識率の差が0.3Eであることが重要である。ここで、Eはテストセットで計 算された最も良い認識系の誤認識率である。

この枠組は文字認識に応用して開発したが、音声認識やその他のパターン認識 の問題へも十分応用できる。

M.T.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


統計的な文脈自由文法における一般的な問合せ
Generalized Queries on Probabilistic Context-Free Grammars

David V. Pynadath and Michael P. Wellman

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 1, January 1998

Keywords: Probabilistic context-free grammars, Bayesian networks.

統計的な文脈自由文法(PCFGs)は文脈自由な言語における文の分布の特定の クラスを表現する簡単な方法を提供する。PCFGについて特定の問合せへの答え に対する効率的な解析アルゴリズムが開発され、多数のパターン認識の問題へ 応用された。いくつかの方法で答えることができる問合せのクラスを拡張する。 これらの方法は、(1)文あるいは文節に誤りのトークンを許す、(2)特別な語尾 でないものの存在のように中間的な構造についての問合せを維持する、(3)多 くの証拠のタイプに柔軟に対応する、ことである。

本方法は与えられたPCFGにより誘発された解析ツリーの分布を表現するため にベイジアン・ネットワークを構成することで実現される。そのネット ワーク構成は標準パーザのチャートの構成を反映し、ダイナミック・プログラ ミングのようなアプローチを使って作られる。PCFGからベイジアン・ネットワー クを構成するアルゴリズムを示し、ネットワーク上の問合せや問合せのパター ンがどのようにPCFGの注目する問合せに対応するかを示す。 ネットワークの形式もまた統計的に依存した構造の中で多くの文脈への感度を エンコードするような拡張をサポートする。

M.T.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


高速な語彙アクセスのための音声セットのインデキシング
Phonetic Set Indexing for Fast Lexical Access

Ramesh R. Sarukkai and Dana H. Ballard

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 1, January 1998

Keywords: Speech recognition, lexical access, phonetic set indexing, fast matches, sets, pattern recognition, word prefetching.

新しい不連続インデキシング機構(音声セットのインデキシングと名付けられ たもの)が高速な単語の事前選択の目的で評価される。語彙アクセスの問題を 扱う本方法は、単語の継ぎ目に現れる音声のセットが語彙に渡ってまばらに分 布し、単語の可能性のリストを検索するためのインデキシング・キーとして好 ましいという最初の観測に由来する。

M.T.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


3次元モデル構成のための複数の物体ビューの登録と統合
Registration and Integration of Multiple Object Views for 3D Model Construction

Chitra Dorai, Member, IEEE, Gang Wang, Anil K. Jain, Fellow, IEEE, and Carolyn Mercer

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 1, January 1998

Keywords: Automatic 3D object modeling, free-form objects, registration, view integration, range images, digital interferometry.

実在の物体のCADモデルが現状では使えないか有効でないので、自動的な3次 元モデル構成は工業から娯楽までの用途に渡り重要なものである。距離データ から複数の物体のビューを自動的に登録し統合するプロトタイプシステムを記 述する。そして、その結果は物体の幾何学的モデルを構成するのに使用される。 複数ビューに関わる変形のロバストな推定や欠落のない表面を形作るために登 録されたデータのシームレスな統合が提案され、システムの中にインプリメン トされた。

レーザー距離スキャナと同じくらいの精度のinterferometricセンサを使用し て得られた実物体の表面に対する実験結果では良好な性能を示した。

M.T.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


テクスチャー分類における縮小された多次元の共起ヒストグラム
Reduced Multidimensional Co-Occurrence Histograms in Texture Classification

Kimmo Valkealahti and Erkki Oja, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 1, January 1998

Keywords: Texture classification, multidimensional histograms, vector quantization, self-organizing map, feature selection.

テクスチャーはしばしば与えられた相対位置関係の2つの画素のグレーレベル の共起ヒストグラムを使用して記述される。共起画素値の解析はテクスチャー の記述には良いかも知れないが、ヒストグラムのサイズの指数関数的な増大に よって妨害される。多次元のヒストグラムを使用するためにその縮小の方法が 開発された。この方法は線形な圧縮、次元の最適化、ベクトル量子化を使用す る。

実際のテクスチャーでの結果は、新しい方法で縮小された多次元ヒストグラム がチャンネル・ヒストグラムとwavelet packet signaturesよりも高い分類性 能を提供することを示した。

M.T.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.20, No.2


神経病理学的な変形の特徴付け
Characterization of Neuropathological Shape Deformations

John Martin, Alex Pentland, Member, IEEE Computer Society, Stan Sclaroff, Member, IEEE Computer Society, and Ron Kikinis

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 2, February 1998

Keywords: models, finite element method, modal analysis, principal component analysis, eigenanalysis, clustering.

人間の脳の内部構造の変形の解析に対する枠組を示す。 形状が大小の物理的過程に影響されるような脳の構造の変形を記述する 数理的モデルを開発する。 我々の方法を使って、全体の変形を有限要素モデリングから得られる、 変化の解析的モードと、サンプル・データから得られる、変化の統計的モードに 分解する。 我々の方法は一般的であり、物体のクラスにおいて重要な変形を重要でない変形から 分離することを目標とするような多くの問題に適用できる。 本論文では、脳の形状構造に影響する病気の分析に焦点を絞る。 これらの構造の形状は、病状ばかりでなく、脳の全体形状にも影響されるので、 病気の分別は難しい。 脳の弾性的性質をモデル化することにより、形状変化の非病理学的モードの いくつかを補うことができる。 これにより、病気の過程を示す変化のモードを実験的に特徴付けすることができる。 健康者のボランティアとともに、 精神分裂症、アルツハイマー病、正常圧水頭症の患者の脳のMR画像に、 我々の方法を用いた。 その分類結果を示す。

HN

(c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


曲線構造の不偏検出子
An Unbiased Detector of Curvilinear Structures

Carsten Steger

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 2, February 1998

Keywords: scale-space, contour linking, low-level processing, aerial images, medical images.

曲線構造の検出は、多くの応用があるコンピュータ・ヴィジョンでの重要な 低レベル演算である。 既存の多くの演算子は、検出する線に対して単純なモデルを用いており、 線の周囲を考慮していない。 このことは、外側と異なるコントラストを持つ線が抽出されるところでは常に 間違った場所に線が抽出されるという望ましくない結果につながる。 それに対して、本論文で提案するアルゴリズムでは、線とその周囲についての 明確なモデルを用いている。 モデル線の側面の尺度空間の性質を解析することにより、 非対称な線によって導かれる偏りがどのようにして取り除かれるかを示す。 さらに、アルゴリズムは、部分ピクセル精度のでの線の位置ばかりでなく、 線の各点について線の幅もまた部分ピクセルの精度で返す。

HN

(c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


組み立て作業における視覚的センシングの方針のタスク指向生成
Task-Oriented Generation of Visual Sensing Strategies in Assembly Tasks

Jun Miura, Member, IEEE, and Katsushi Ikeuchi, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 2, February 1998

Keywords: CAD-based vision, vision-based assembly.

本論文では、組み立て作業の知識をもとにした、視覚的センシングの方針の 体系的な生成方法について述べる。 通常、視覚的センシングは限られた資源を用いて行なわれるため、 必要な情報だけを効率的に得るように、 視覚的センシングの方針を立てなければならない。 視覚的センシングの方針を適切に生成するためには、 どのような情報を抽出するのか、どこでそれを獲得するのか、 どうようにしてそれを得るのかを知ることが必要である。 これは、どの物体が操作に取り込まれるか、 それらがどのように組み立てられているか というような作業の知識によって、容易になる。 提案する方法では、物体間の面の接触関係をもとにした作業解析を使って、 現在の操作に必要な情報をまず抽出する。 そして、視覚的特徴と獲得する情報の間の関係を記述する、 センサの知識を使って、観測する視覚的特徴を決定する。 最後に、予測した成功確率をもとして実行可能な視覚的センシング方針を評価し、 最善のものを選ぶ。 我々の方法を、レーザ・レンジ・ファイダをセンサとして使い、実装した。 実験結果は、方法の実現可能性を示しており、さらに、 視覚的センシング方針のタスク指向評価の重要性を示している。

HN

(c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


強化学習を用いた閉ループの物体認識
Closed-Loop Object Recognition Using Reinforcement Learning

Jing Peng and Bir Bhanu, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 2, February 1998

Keywords: optimization, generalized learning automata, learning in computer vision, model-based object recognition, multiscenario recognition, parameter learning, recognition feedback, segmentation evaluation.

基本的な方法が開ループ、または、フィルタのような現在のコンピュータ・ ヴィジョンのシステムでは、通常、物体認識アルゴリズムの前に画像分割を 使っている。 これらのシステムは、多くの実世界の応用に対しては頑健でない。 それに対して、ここで提案するシステムでは、 入力画像から対応する分割パラメータへの写像を導入するための強化学習を 用いることにより、頑健な性能を達成する。 モデル照合の信頼レベルを、学習の間に分割パラメータを 探索する学習オートマトンの組への強化信号として用いることによって、 これは行なわれる。 認識アルゴリズムを画像分割の評価関数の一部として使うことが、 認識ストラテジーの自動生成によるシステム性能の多大な向上をひき起こす。 様々な環境条件での屋内・屋外のカラー画像を使った実験により、 システムの性能を確認する。

HN

(c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


シーンの後ろを見る:逆投影ぼかしモデルによる遮蔽エッジの測光的性質の解析
Seeing Behind the Scene: Analysis of Photometric Properties of Occluding Edges by the Reversed Projection Blurring Model

Naoki Asada, Member, IEEE Computer Society, Hisanaga Fujiwara, Member, IEEE, and Takashi Matsuyama, Member, IEEE Computer Society

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 2, February 1998

Keywords: projection, shift-variant point spread function, finite depth of field.

本論文では、遮蔽エッジの測光的性質を解析し、近くの物体の後ろにある物体の 表面が、遮蔽エッジを越えて部分的に観測可能であることを証明する。 まず、畳み込みをつかった画像ぼかしモデルの限界を議論し、 逆投影ぼかしモデル(RPB)モデルと名付けた、 光束をもとにしたぼかしモデルを示す。 Nguyen et al. によって提案された多重要素ぼかしモデルと異なり、 RPBにより、深さが不連続なところで現れる、 偏移が不定な点広がり関数によって生じる光学的現象を発見することができる。 RPBモデルを使って、遮蔽エッジの性質を理論的に解析し、 2つの特有な現象を示す: (1)遮蔽された表面の輝度が一様なとき、 ぼけた遮蔽エッジは、遮蔽している物体上の表面エッジに対して予測されたのと 同じ輝度プロファイルを生成する。 (2)遮蔽された物体が表面エッジをもつとき、ぼけた遮蔽エッジにおいて、 非単調な輝度の遷移が観測されることがある。 実画像を使った実験結果により、 ぼけた遮蔽エッジに特有な現象の観測可能性とともに、 RPBモデルの正当性が示された。

HN

(c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


一般的なグルーピング・アルゴリズムとその定量的解析
A Generic Grouping Algorithm and Its Quantitative Analysis

Arnon Amir and Michael Lindenbaum

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 2, February 1998

Keywords: clustering, maximum likelihood, Walds SPRT, performance prediction, generic grouping algorithm.

本論文では、知覚的グルーピングの一般的方法とその期待されるグルーピングの 質の解析を示す。 そのグルーピングの方法はかなり一般的である: 様々なタイプのデータ特徴のグルーピングや、 異なるサイズの特徴集合上で働く異なるグルーピングの 手がかりを取り入れるのに使える。 提案する方法は、 可能な知覚的グルーピングのグラフ表現の構築と そのグラフのグループへの「最善の」分割の発見の2つの部分に分けられる。 最初の段階には、多重特徴から成る手がかりから得られる情報を、 非常に信頼性の高い2つの特徴からなる手がかりに統合するための、 手がかりの強調手続きを含む。 両方の段階を、WaldのSPRTアルゴリズムと最大尤度基準のような、よく知られている 統計の道具を使って実現する。 このグルーピング基準の理論的解析により、 期待されるグルーピングの質が手がかりの信頼度とともに増化するという、 直観的な期待と予測を定量化できる。 それはまた、グルーピングのアルゴリズムでより多くの計算を行えば、 より良いグルーピングの結果につながることを示している。 この解析は、最大尤度基準のグルーピング能力を定量化しているが、 それはグルーピングの対象に独立である。 われわれの知るところでは、グルーピング過程のこのような解析は、 ここで初めて与えられたものである。 3つの異なる対象での3つのグルーピングのアルゴリズムを、 我々の一般的な方法のインスタンスとして合成する。 それらは、このグルーピング方法の応用可能性と一般性を例示している。

HN

(c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


グルーピングをもとにした非加法的な照合
Grouping-Based Nonadditive Verification

Arnon Amir and Michael Lindenbaum

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 2, February 1998

Keywords: perceptual grouping, maximum likelihood, graph clustering, Kullback Leibler distance.

照合は多くの物体認識の過程の中での最後決定段階である。 それは、それぞれの仮説に対するスコアを評価し、 最高のスコアを持つ仮説を選ぶことにより行なわれる。 本論文では、仮定した物体に属するデータ特徴のグループは「良いグループ」に なるはずであるという観察事実によって、グルーピングをもとにした照合方法を示 す。 したがって、それは、 グルーピング関係によって画像から得られる知覚的グルーピング 情報を支えるはずである。 提案するスコアは、これらのグルーピングの手がかりの結合尤度であるが、 それは確率論の枠組でこの観察事実を定量化するものである。 合成・実データを使った実験により、難しい場合において、 提案方法がより良い性能を示すことを確認する。

HN

(c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


流体の乱流における3次元渦巻の抽出
Extracting 3D Vortices in Turbulent Fluid Flow

Jialin Zhong, Member, IEEE Computer Society, Thomas S. Huang, Fellow, IEEE, and Ronald J. Adrian

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 2, February 1998

Keywords: and extraction, critical points, pattern recognition.

本論文では、3次元の流体乱流から、渦巻構造と呼ばれる、 顕著なパターンを検出するための計算論的枠組を示す。 これらの構造は、速度場での主要な回転運動と、 対応する渦巻場での主要な強度集中の領域として特徴付けされる。 流れの場の運動を近似するために点ごとの線形表現を用い、 流体運動を運動解析、または、位相的パターンによって分類する。 渦巻構造の領域は、回転運動によって支配されているもの、または、 焦点タイプの特異点のものとして認識される。 3次元渦巻の特別な場合としての2次元渦巻は、 渦度集中の領域を探索することにより検出される。

HN

(c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


レンジ画像の頑健な適応的分割
Robust Adaptive Segmentation of Range Images

Kil-Moo Lee, Member, IEEE, Peter Meer, Senior Member, IEEE, and Rae-Hong Park, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 2, February 1998

Keywords: segmentation, surface fitting, autonomous image analysis.

残差平方のk次統計量を最小にする、 頑健な適応的最小k次平方(ALKS)推定子を用いた 新しい画像分割方法を提案する。 データからkの最適値を決定し、手続きにより、 ピクセルの大部分を表現する一様な曲面パッチを検出する。 ALKSは、他の最近提案された類似の方法 (Minimize the Probability of Randomness (MINPRAN)、 Residual Consensus (RESC)) よりも構造化された外れ値に対して、より高い許容度を示す。 新しい、完全に自立して動くレンジ画像分割アルゴリズムの性能を、 いくつかの他の方法と比較する。

HN

(c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


分割と因子分解をもとにした長い画像系列のための運動と構造の推定
Segmentation and Factorization-Based Motion and Structure Estimation for Long Image Sequences

Christian Debrunner, Member, IEEE, and Narendra Ahuja, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 2, February 1998

Keywords: segmentation, image segmentation, image motion factorization, motion understanding, motion estimation, trajectory detection, point tracking.

本論文では、複数の運動物体から成る画像の密な時系列が与えられているとき、 画像を異なる物体を表す領域に分離し、回転している物体に対しては、 3次元構造と運動を計算するためのアルゴリズムを示す。

HN

(c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


線形計画法による陰関数表現の多項式の当てはめ
Linear Programming Fitting of Implicit Polynomials

Zhibin Lei and David B. Cooper

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 2, February 1998

Keywords: programming, distance approximation, fitting algorithms, user interface.

新しい陰関数表現の多項式(IP)の当てはめ方法を示す。 それは、非線形最適化方法とは異なる、IP当てはめ問題の見方を与える。 その計算量はより少なく、自動的にも、対話的にも計算できる。 線形計画法(LP)を当てはめに用いる。 様々な距離尺度や大局的な幾何学的拘束条件を、 その方法に採り入れることができる。

HN

(c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


遺伝的アルゴリズムを用いた任意形状で二値形態学的構造化要素の分解
Decomposition of Arbitrarily Shaped Binary Morphological Structuring Elements Using Genetic Algorithms

Giovanni Anelli, Alberto Broggi, Member, IEEE, and Giulio Destri, Student Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 2, February 1998

Keywords: structuring element decomposition, genetic algorithms.

凸の二値形態学的構造化要素と、 非凸のものの特定の部分集合の両方の分解のための 数多くの異なるアルゴリズムが文献に述べられてきた。 それにも関わらず、これまで、任意形状の構造化要素の分解の問題について、 決定論的な解が見つかっていない。 本研究では、最初の構造化要素の形状に対する制約条件も、 与えられた集合から選ばれる基本因子についての仮定もないような、 遺伝的アルゴリズムにも基づく新しい確率論的方法を提案する。

HN

(c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.20, No.3


識別器の結合について
On Combining Classifiers

Josef Kittler, Member, IEEE Computer Society, Mohamad Hatef, Robert P.W. Duin,and Jiri Matas

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 3, March 1998

Keywords: Classification, classifier combination, error sensitivity.

我々は、それぞれに異なるパターン表現を用いる識別器を結合すること に関して、共通の理論的枠組みを開発した。 この手法の立場に立てば、既存の多くの構成は、この複合的な識別の 特殊なケースと見なすことができる。複合的な識別においては、すべて のパターン表現は結合され、一つの決定がなされるのである。 いろいろな識別器を組み合わせて使う構成を比較実験した結果、最も拘 束の強い仮定である統合ルールの条件下で開発された組み合わせルール が、他のものを遙かに凌駕することがわかる。 色々な体系による推定誤差がどのくらいであるか、その感度解析が実行 された結果、上記結論の正しさが実証された。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


機械学習によるベイズ・ネットワークの精緻化
Bayesian Network Refinement Via Machine Learning Approach

Wai Lam

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 3, March 1998

Keywords: Knowledge base refinement, uncertainty reasoning, Bayesian networks, machine learning, data mining.

新しいデータからベイズネットワーク構造を精緻化する新方法が開発された。 ほとんどの従来研究は、ネットワークの条件付き確率のパラメータを精緻化 することのみを考えており、ネットワークの構造の精緻化には触れていなか った。 我々は、最小記述長(MDL)の原理に基づく機械学習の手法を利用してこの問 題に取り組んだ。 このMDL原理は、精度、単純さ、そして既存構造との類似性などの諸用件間 のバランスを取ることができるので、このような問題に良く適している。 この精緻化手法の、もう一つの際立った特徴は、部分的に仕様記述されたデ ータを利用して、ネットワーク構造の精緻化がはかれることにである。 さらに、記述長の計算効率を計るために、局在化した条件探索手法が開発さ れた。 もし、直接に全体を探索・評価するのであれば、指数関数的時間資源が必要 となるからである。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


選択的弛緩法を利用した、マルコフ・ランダム場モデルによるテクスチャー画像の教 師なしセグメンテーション
Unsupervised Segmentation of Markov Random Field Modeled Textured Images Using Selectionist Relaxation

Philippe Andrey and Philippe Tarroux

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 3, March 1998

Keywords: Unsupervised texture segmentation, Markov/Gibbs random fields, partition function approximation, genetic algorithms, selectionist relaxation.

既存のテクスチャー・セグメンテーションの中で、マルコフランダム場 に依る手法が特別な注目を浴びてきており、教師付きモードでは非常に 効果的であることが分かってきた。 しかしながら、教師なしモードでマルコフランダム場を使うことは、パ ラメータ推測の問題によって進展していなかった。 この困難を克服するために提案された最近の解答では、入力画像におけ るテクスチャー領域形状やテクスチャー数に関する仮定を設けている。 もちろんこの仮定は、現実には満たされないかもしれない。 本論文では、マルコフランダム場でモデル化されるテクスチャーを、教 師なしモードで分割する問題の解として、進化論的な手法、すなわち、 適者生存による弛緩法が提案される。 適者生存的弛緩法においては、単純で局所的な進化ルールによって、繰 り返し進化するユニット(単位集団)間に演算を分布させている。 各ユニットは、ラベルとテクスチャー・パラメータベクトルとが結合さ れたものである。 尤度の高いユニットは、画像中に拡散して、データから適性が低いと判 断されるユニットを置き換えることが許される。 その結果、あるラベルを有するユニットは成長するが、他は消滅する。 初期のランダムな集団からスタートして、この進化論的プロセスの結果、 画像が安定なラベルに到達し、これがセグメンテーション結果とみなさ れる。 この研究において、一般化されたイージングモデル(Ising model)を、テ クスチャーデータ表現として使ってみた。 このモデルでは分割関数が面倒な性質を持っているため、単位尤度評価 を可能にする高温近似が用いられた。 人工的、あるいは、自然のテクスチャーを有する多様な画像について報 告する。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


パラメトリックなモデル・フィッティング: 集団内データの特徴付けから例外データの検出まで
Parametric Model Fitting: From Inlier Characterization to Outlier Detection

Gaudenz Danuser and Markus Stricker, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 3, March 1998

Keywords: Parametric models, generalized least squares, errors in variables, data snooping, classify-while-fit, self-diagnosis, straight lines, planes.

モデルをパラメータで表現する方法は、科学技術全般に重要な役割を果 たしている。 本論文は、パラメトリックなモデルのフィッティングについての有効な 枠組みを紹介する。 これは、一般化された最小二乗問題の解に基づくパラメータ推定と誤差 伝搬手続きのモジュールから成っており、これは入力データ点の幾何学 的配置とその精度の両方を評価する。 誤差の伝搬結果は、精度推定とともに各モデルパラメータを補足するた めに利用され、各抽出モデルに合致することを支持する内部データ点を 設定し、先験的には不明であったデータ中の意味のあるモデルの総数を 決定する。 モデルは順次抽出されるのであるが、最終結果はほとんどいつも抽出順 序には依存しない。 モデル間相互で内部データを交換するような統計処理をさらに進めること によって、この順序非依存性が達成される。 その結果、異なるモデルが挿入されたり、互いに接触したりするような 領域においても、頑健な分類だけでなく、健全な分類が保証される。 入力データや、その精度から離れて、この手法はたった1つの追加パラ メータに依存している。つまり、データに対する色々な統計検定やモデ ル分類が遂行される確信度に依存している。 コンピュータ・ビジョンやパターン認識での応用問題である2次元空間 での直線回帰、3次元空間での平面回帰による実験で、このアルゴリズ ムの効率を実証する。 この手法の頑健性と精度を示すために人工的データが利用された。 この応用性や実世界問題、すなわち、画像特徴抽出への実用性を示すた めに、画像データや距離画像データも利用した。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


データ可視化のための階層的隠変数モデル
A Hierarchical Latent Variable Model for Data Visualization

Christopher M. Bishop and Michael E. Tipping

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 3, March 1998

Keywords: Latent variables, data visualization, EM algorithm, hiera rchical mixture model, density estimation, principal component analysis, factor analysis, maximum likelihood, clustering, statistics.

多変数のデータを解析したり解釈したりする場合に、可視化は強力で応 用性の広いツールであることが明らかとなってきた。 ほとんどの可視化アルゴリズムは、データ空間から2次元可視空間への 投影を見つけだすことを目指している。 しかし、高次の空間の複雑なデータを単に2次元に投影したからといっ て、すべての興味ある構造が明らかになるとは思えない。 従って我々は、データ点のより深いレベルのクラスターや部分クラスタ ーを可視化できる、完全データの可視化が可能な階層的可視化アルゴリ ズムを紹介する。 このアルゴリズムは、階層的に混在している潜在的変数モデルに基づい ており、このパラメータは予測最大化アルゴリズムによって予測される。 我々は、例題によるデータでこの手法の原理を示し、次に、石油パイプ ラインの多相流シミュレーションから得られた12次元の合成データの 可視化に応用し、さらに、人工衛星画像から得られた36次元のデータ に応用する。 これに、Matlabソフトウエアを実装化したアルゴリズムが、 World Wide Webに公開されている。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


文書表現とそのページ分割への応用
Document Representation and Its Application to Page Decomposition

Anil K. Jain, Fellow, IEEE, and Bin Yu, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 3, March 1998

Keywords: Document model, document storage and retrieval, page segmentation, region identification, document image analysis.

紙文書を電子化し、効果的に蓄積、検索、解釈などに適した形にするこ とは、未だに困難な課題である。 この問題を解くためには、効率的な文書の表現手法が必要である。 文書表現には、閾値の設定、スキューの検出、幾何学的な配置の解析、 論理的な配置解析などが含まれる。 これによって得られる表現法は、文書の蓄積や検索に利用される。 雑誌をスキャニングして得られる画像を表現するのに、ページセグメン テーションは重要である。 文書理解システムの能力は、セグメンテーションと、テキスト領域、表 領域、画像領域、あるいは、図面領域などの異なる領域のラベル付けの 性能に大きく依存する。 本論文では、伝統的に利用されている連結成分抽出に基づくボトムアッ プ手法を効率的に実装して、ページのセグメンテーションと分類を行う。 トップダウン的生成情報を保存する新しい文書モデルを提案する。この モデルは、文書の論理的表現に基づくものであり、対話的な編集、蓄積、 検索、伝送、および論理的な解析に利用される。 我々のアルゴリズムでは、SGI Indyワークステーションを使うと、モデ ル生成に約1.4秒かかる。 これには、包囲の推定、セグメンテーション、(テキスト、画像、図面、 定規)の領域分類を含んでいる。画像は、300dpiでスキャニングした 2550×3300の典型的な雑誌のページを用いた。 この方法は、多様な技術雑誌の文書に応用可能であり、適度なスキュー やノイズにも対処することができる。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


オフライン手書き文字認識システム
An Off-Line Cursive Handwriting Recognition System

Andrew W. Senior, Member, IEEE, and Anthony J. Robinson, Member,IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 3, March 1998

Keywords: Off-line cursive handwriting recognition, optical handwritten character recognition, preprocessing, feature extraction, recurrent neural networks, hidden Markov models, out-of-vocabulary word models.

本論文は、オフライン手書き文字認識の完全なシステムについて述べて いる。 前処理としての、単語画像を切り出し、正規化し、その結果スケールや、 傾斜(slant)、傾き(slope)、ストロークの太さに不変とする処理につい ても述べる。 画像の表現法について考察し、利用された芯線抽出やストローク特徴につ いて述べる。 芯線表現された文字の確率推定には、再帰性ニューラクネットワークが 用いられる。 認識候補単語の中での最良単語の算出には、隠れマルコフモデルが用い られるが、それについても述べる。 語彙の選択、拒否、語彙外の単語の認識についても考察する。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


疑似ランダム符号化した構造を持った照明光
Structured Light Using Pseudorandom Codes

Raymond A. Morano, Cengizhan Ozturk, Member, IEEE, Robert Conn, Member, IEEE, Stephen Dubin, Stanley Zietz, and Jonathan Nissanov, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 3, March 1998

Keywords: 3D imaging, structured light, perfect maps, pseudorandom arrays, active stereo vision, correspondence.

能動的ステレオビジョンにおける対応関係問題を解くのに、新しく疑 似ランダム符号化された構造化光を用いる。 この符号化法は、オクルージョン(隠蔽)が存在しても、うまく働く。 カラー符号化が可能な場合には、たった1枚の画像から3次元情報を 得ることができる。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


カラー画像合成・解析のためのマルチスペクトル・ランダム場
Multispectral Random Field Models for Synthesis and Analysis of Color Images

Jesse Bennett and Alireza Khotanzad

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 3, March 1998

Keywords: Color texture models, color texture synthesis, color text ure analysis, multispectral random fields, multispectral simultaneous autoregressive models, multispectral Markov random field models, multispectral pseudo-Markov random field models, least squares estimation.

本論文では、従来の中間調による並列自己回帰(SAR)とマルコフランダ ム場(MRF)モデルを、マルチスペクトルに拡張することについて考察する。 さらに、マルチスペクトル・マルコフモデルの特徴を保持する疑似マル コフモデルに関して、新しい画像モデルを提案するが、これは単純なパ ラメータ推測法に帰着する。 これらのモデルは、カラー画像の解析やモデル化に良く適している。 考えた各モデルについて、パラメータ推定と画像合成のための手続きが 開発された。 既知の画像モデルと自然テクスチャーサンプルに基づく実験結果はこれ らの結果の妥当性を実証している。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


最近接問題としてのステレオマッチング
Stereo Matching as a Nearest-Neighbor Problem

Carlo Tomasi, Member, IEEE, and Roberto Manduchi

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 3, March 1998

Keywords: Stereo vision, stereo matching, correspondence problem, disparity, ambiguity, occlusions, search, nearest-neighbor search, dynamic programming.

固有曲線(intrinsic curve)と呼ばれる、ステレオマッチングの探索問 題を最近接問題に変換する画像表現法を提案する。 固有曲線とは、局所画像記述子の集合が画像の走査線として左から右に 追跡した軌跡である。 この固有曲線は理想的には、画像の不均衡に対して不変である。 従って、ステレオ対応付けは、理想的な場合には単純な表参照 (table-look-up)問題に帰着する。 我々は、この固有曲線を、ノイズや輝度の偏り、コントラスト変動、適 度な幾何的変形、画像の曖昧さ、オクルージョンに対してどのように利 用するかを示す。 そうすれば、マッチングは、変異が大きい場合にも最近接問題に帰着す る。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


エッジ検出への応用のための2D移動メディアンフィルターの同時分布の計算
Computing Joint Distributions of 2D Moving Median Filters With Applications to Detection of Edges

Dawei Huang, Member, IEEE, and William T.M. Dunsmuir

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 3, March 1998

Keywords: Image analysis, moving medians, joint distributions, edge detection, edge miss probability.

本論文は、移動窓を通して、2次元のノイジーな画像にメディアンフィ ルターをかけたときの同時分布(joint distribution)について述べる。 ここに述べる一般的定式化は、エッジの存在を見逃す確率や、存在しな いエッジを誤って検出する確率を評価するのに必要な確率分布を導いて くれる。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


印刷パターンの空間的サンプリング
Spatial Sampling of Printed Patterns

Prateek Sarkar, Student Member, IEEE, George Nagy, Senior Member, IEEE, Jiangying Zhou, Member, IEEE, and Daniel Lopresti, Member, IEEE,

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 3, March 1998

Keywords: Spatial sampling, random phase sampling, digitization, optical character recognition, document defect models, scanner models, modulo-grid diagram, locales.

印刷パターンの走査によって得られるビットマップは、走査格子がパタ ーンに対して相対的にどの位置でサンプリングするかに依存する。 我々は、デルタ関数による規則格子で理想的なサンプリングを考える。 格子のパターンに対する相対的な変位はランダムであり、単位格子につ いて定義される均一な確率分布に従う。 ランダムな位相でのサンプリングは、サンプリングされたエッジ画素に 影響を及ぼす。 その結果得られる個々のビットマップ数とその相対的頻度は、原パター ン境界の単位格子への射影によって予測可能である(モジュロ-格子ダイ アグラムと呼ばれる)。 この理論は、シミュレーションと実験の両方によって確かめられた。 モジュロ-格子ダイアグラムは、OCRにおけるエッジ画素変動の影響を理 解するために有用かもしれない。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


チェンとヤンのスケール・空間定理について
On the Scale-Space Theorem of Chen and Yan

Paul T. Jackway

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 3, March 1998

Keywords: Scale-space filtering, mathematical morphology, morpholog ical opening, zero crossings, monotone theorems.

チェンとヤンの先の論文では、モルフォロジカルなオープニング操作 (訳者注:収縮・膨張を行う操作のこと)のもとでの、境界曲率のゼ ロ交差定理について述べられた。 この件について、反例によってこの定理の問題を指摘し、定理をどの ように正すべきかを示す。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.20, No.4


頑健な、再重み付けされた最大事後推定(MAP)による動き推定
Robust Reweighted MAP Motion Estimation

Dong-Gyu Sim, Student Member, IEEE, and Rae-Hong Park, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 4, April 1998

Keywords: Motion estimation, regularization, MAP estimation, robust statistics, LMedS.

本論文では、動きが不連続であってもノイズを含んでいても、頑健(ロバスト)な動 き推定アルゴリズムを提案する。本提案法は、ロバスト統計が与える最小メディアン 平方(LMedS)を最大事後推定(MAP)結果とする方法で構成されている。動きを正確に推 定しようとするときの困難さは、なめらかさに対する制約とノイズに対する感度の制 約に起因する。これらの問題にロバストに対応するために、メディアン演算子と再度 重み付けされた最小2乗法(RLS)の考え方がMAP動き推定に応用され、その結果再重み 付けされたロバストなMAP(RRMAP)が得られた。ここに提案するRRMAPによる動き推定 アルゴリズムは複数画像フレームにも適用できるよう一般化された。各種合成画像系 列に対するシミュレーションの結果、本提案アルゴリズムは、M推定に基づくもの、 全最小2乗に基づくもの、ハフ変換に基づくもの、の3種類の既知のロバストな動き 推定アルゴリズムに比べて、誤差を減少させる。さらに、提案手法は統計的に高効率 であり、ガウスノイズやインパルスノイズの加算に対して頑健である。更に、提案手 法は、実画像系列に対して、適度な性能を示す。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


誤差によってガイドされた3Dビジョンシステム
Error Guided Design of a 3D Vision System

N. Georgis, M. Petrou, Member, IEEE, and J. Kittler, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 4, April 1998

Keywords: Performance evaluation, projective geometry, 3D reconstruction.

我々はここで、ある手法が現実的に有用であるためには、感度解析を実行する必要が あり、計測誤差に対して頑健(ロバスト)であることを調査する必要があることを議 論する。投影幾何に基づく3D再構成手法の感度解析の結果を示す。90度の角度離れ たカメラによって撮影される画像から花崗岩の形状を推定する撮影システムを最適に 設計するために、この感度解析を利用する。このシステムは実画像と合成画像に四手 テストされた。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


同期したランダム場と画像の復元
Synchronous Random Fields and Image Restoration

Laurent Younes

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 4, April 1998

Keywords: Random fields, image processing, parallelism, Monte-Carlo sampling.

我々は、一般化された、同期した格子状ランダム場モデルを提案する。これは、画像 解析のための、ベイズ確率に基づくギッブス分布と類似しており、大規模な並列演算 装置を実装化のためのアルゴリズム設計を可能にする。このモデルについて理論的に 述べた後、画像復元へ応用する場合の実験例について述べる。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


対称的台形による線画の特異性と正則性
Singularities and Regularities on Line Pictures via Symmetrical Trapezoids

Jairo Rocha and Rafael Bernardino

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 4, April 1998

Keywords: Contour trapezoid, maximal trapezoid set, regular region, singular region, skeleton.

線画を特異領域と正則領域に分割するアルゴリズムを紹介する。我々は、正則領域を 構成ブロックとして輪郭台形を定義し、正則領域の核として最大台形集合を仮定す る。そして、多角形の最大台形集合を計算するためのアルゴリズムについて述べ、輪 郭を多角形で近似する場合の骨格化のやり方について述べる。この新しい考え方を実 画像に適用した場合、以前のアルゴリズムと比較して本アルゴリズムの振る舞いを示 しながら実験の説明がされている。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ハフ変換とアップライト
The Hough Transform Versus the UpWrite

Robert A. McLaughlin and Michael D. Alder

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 4, April 1998

Keywords: Hough transform, probabilistic Hough transform, randomized Hough transform, hierarchical Hough transform, UpWrite.

本論文は線分、円、楕円の検出のためのハフ変換法とアップライト(UpWrite)法につ いて比較する。どちらの場合も、理想的な画像と、ノイズの含まれる画像についてテ ストされた。摂動ノイズを含むような画像に対してはアップライト法がより頑健であ ることが分かった。理想的画像や、スペックルノイズ画像に対しては検出されるオブ ジェクトの複雑度に依存していることが分かり、複雑であるほどアップライト法が有 利である。これらのアルゴリズムによる実験を希望する読者はWWWの以下のアドレス を参照。http://ciips.ee.uwa.edu.au/Papers/Journal_Papers/1998/02/Index.html.

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


画像サンプリングにあまり依存しない画素の非類似度測
A Pixel Dissimilarity Measure That Is Insensitive to Image Sampling

Stan Birchfield and Carlo Tomasi

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 4, April 1998

Keywords: Dissimilarity, stereo matching, correspondence.

画像のサンプリングによる制約のために(つまり、同一被写体を異なる条件で再度撮 影するために)、ノイズや劣化の影響がなくても、従来の画素の非類似度として、2 つの対応するステレオ画像対に大きな値を与えていた。我々は、おそらくサンプリン グに敏感でない非類似度の測度を提案するが、敏感でない理由は、画素を取り囲む線 形補間された輝度を利用するからである。実画像での実験によると、ほんの少しの計 算時間を上乗せするだけで、この測度はサンプリングの問題を軽減してくれる。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


領域境界の高速チェインコード化
Fast Chain Coding of Region Boundaries

Primo Zingaretti, Member, IEEE, Massimiliano Gasparroni, Member, IEEE, and Lorenzo Vecci, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 4, April 1998

Keywords: Boundary representations, chain coding, run-length coding, multivalued images, image coding, image processing, shape analysis.

ラスター走査された多値画像をチェインコード化する高速で単一パスのアルゴリズム を紹介する。1組のテンプレートに従ってラスター走査された画像からチェインの断 片(複数)が生成され、チェイン断片数に比例した計算時間で、すべてのチェイン コードが得られる。定式化された結論と、アルゴリズムの複雑度と性能解析の結果が 示されている。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


画像の対応関係を表す順序測度
Ordinal Measures for Image Correspondence

Dinkar N. Bhat and Shree K. Nayar

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 4, April 1998

Keywords: Image matching, stereo, ordinal measures, correlation, correspondence.

ステレオ画像における対応画像の関連性を表す順序測度を与える。輝度分布間の相関 や差分二乗和のような線形対応関係は、不安定なものとして知られている。ウィンド ウ内の強度値の相対的順序であるランク順列に基づく順序は、頑健であることが実証 される。2つのランク順列間の距離測度を利用することによって、順序測度が定義さ れる。これらの測度は絶対輝度スケールに独立であり、2つの画像間のガンマの差異 のように、単色の強度変換には不変である。これらを効率的に実装化する事が可能な 簡単なアルゴリズムを開発した。実験によると、非理想的な条件では既存の手法より も順序測度の方が優れていることが示唆された。これらの測度は動き推定やテクス チャーに基づく画像検索のような、他のビジョン問題へ応用可能なイメージマッチン グの汎用ツールとして役立つ。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


積み上げ方式による円弧のセグメンテーションとその評価
Incremental Arc Segmentation Algorithm and Its Evaluation

Liu Wenyin and Dov Dori

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 4, April 1998

Keywords: Arc segmentation, vectorization, performance evaluation, graphics recognition.

円弧の一部をベクトル化して得られたベクトル化した円弧断片から、1ステップずつ 円弧を復元する円弧セグメンテーションアルゴリズムを紹介する。適当な閾値を選 び、推定される円弧上に並ぶかどうかを常にチェックすることで、このアルゴリズム は正確に入力ベクトルから円弧を構築する。半径が5から50画素で、開いた角度が 1/8πから2πまでの200個程度の合成円弧や、線幅が1から9画素に至る画像につ いて実験と評価が行われた。約200個の円弧を含む6つの実物図面も処理された。 半径が10画素以上、角度がπ/4以下、線幅が1画素の場合は、アルゴリズムがうま く作動する。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


デジタル化した工業図面からのテキスト領域の検出
Detection of Text Regions From Digital Engineering Drawings

Zhaoyang Lu

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 4, April 1998

Keywords: Document image analysis, engineering drawings, text segmentation, pattern recognition, image processing.

本論文ではテキストとグラフィックスの分離アルゴリズムを紹介する。このアルゴリ ズムの基本的な原理は、テキストやグラフィックスが混ざった工業図面から、直接テ キスト部分を抽出するのではなく、非テキスト部分を消去していく。このアルゴリズ ムでは、欧文文字や漢字、寸法、記号を抽出でき、図面の種類やノイズの大きさの制 限を受けることがほとんどない。テキストがグラフィックスに接触する場合や、文字 のフォントや、記入する方位にも頑健に対応できる。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


隙間特徴量を累積することによってパターンを分類する決定則
Decision Rule for Pattern Classification by Integrating Interval Feature Values

Takahiko Horiuchi, Member, IEEE Computer Society

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 4, April 1998

Keywords: Bayesian classification, Dempster-Shafer theory, integration, pattern classification, probability.

ベイズ統計決定理論に基づくパターン分類では、分類を実行するためには完全な確率 知識が必要となる。実際のパターン分類においては、一般的にノイズの影響もあって 完全な知識を定常特徴の値として得ることは不可能である。従って、パターン分類の ためには、より柔軟性のある、より頑健な理論を構築することが必要である。本論文 では、デンプスター・セーファー理論の枠組みの中で、閉区間で定義される特徴量を 利用したパターン分類理論を定式化する。それから、欠如した情報を埋め合わせるた め、累積アルゴリズムを提案する。これはいくつかの情報源から観察される情報を、 情報源の値を考慮して統合する。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.20, No.5


オブジェクトの立体/図式的な周波数領域表現と、そのポーズ不変顔認識 への応用
A Volumetric/Iconic Frequency Domain Representation for Objects With Application for Pose Invariant Face Recognition

Jezekiel Ben-Arie, Member, IEEE, and Dibyendu Nandy, Student Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 5, May1998

Keywords: Volumetric frequency representation (VFR), object representation, projection-slice theorem, 4D Fourier space, face pose estimation, pose invariant face recognition.

3Dオブジェクトを表現するために、観察者と、中心に置いたモデルを統合する新規 な方法を提案する。統合3D周波数領域表現(周波数の立体表現=VFR=Volumetric Frequency Representation)によってオブジェクトの空間的構造とそのデータ構造の 描画の連続性をカプセル化する。本方式で、任意の方向から見たオブジェクトの周波 数領域の画像を直接抽出する事ができるが、これは投影スライス理論を拡張した結果 である。この投影スライス理論は、立体周波数表現を平面でスライスしたフーリエ変 換画像となっている。このVFRは、顔のような複雑なオブジェクトを、姿勢(ポー ズ)に依存しないで認識するために採用された。認識とポーズの推定には、4次元 フーリエ空間での効率的なマッチング手法を利用している。いろいろな顔のポーズで のポーズ推定や、認識の実験例が示されている。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


適応的ガボールフィルターを利用した2D画像の自然なスケール
The Selection of Natural Scales in 2D Images Using Adaptive Gabor Filtering

J. Fdez-Valdivia, Member, IEEE Computer Society, J.A. Garcia,Member, IEEE Computer Society, J. Martinez-Baena, and Xose R. Fdez-Vidal

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 5, May1998

Keywords: Natural scale selection, data-driven multichannel scheme, activated sensors, complex 2D Gabor filters.

本論文は、2D画像からどのようにして形状の大きさを表す自然なスケール が得られるかを議論している。空間的情報は、空間的変数と空間周波数変数 の両方に感度を有する複数の単位について解析された。対象とする形状の大きさの推 定には、強く反応する検出結果のみを利用した。検出器(2Dガボールフィルターで 計算された)の反応で有意義な構造を持つものは、自然な解像力での比較的鮮鋭で はっきりした輪郭を有するものであった。自然スケールは、スケールの範囲で各種周 波数のフィルターをかけた検出器の相対的鮮鋭度が局所的に極小を示すレベルとして 定義された。次の段階として、最初の荒っぽい自然スケールを改善するために、検出 器の反応が活性を示す顕著な特徴が存在するスケールを直接選択するように基準が書 き直された。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


適応的なカラー構造化光による距離画像形成
Range Imaging With Adaptive Color Structured Light

Dalit Caspi, Nahum Kiryati, Senior Member, IEEE, and Joseph Shamir, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 5, May1998

Keywords: Color, computer vision, multilevel Gray code, range sensor, shape from X, structured light, video and data projector.

時間多重による構造化された光による距離画像形成においては、精度、頑健さ、デー タ取得時間との間に妥協が必要である。データ取得時間は、投影するパターンの種類 と、1画面を得るために必要な時間の積によって下限が設定される。本論文では新規 な構造化された光による方法について述べる。映像取得プロセスの1つとして、投影 パターンの数と形状を対象シーンの特徴に応じて適応させる。耐ノイズ性閾値を実際 のノイズレベルに合致させ、投影パターンの投影数を必要最小限にまで減少させる。 カラーは投影光の同定のために利用される。投影パターン数を増加させることなくパ ターン空間の次元(耐ノイズの閾値)がこのようにして増加する。多色画像を多色光 で照明した画像のような場合でも、投影カラー光の同定が可能なことを示す。同定は 局所的に行われ、空間的カラーの順序には依存しない。従って、他の構造化光による 照明法に比べて滑らかさや画像の色中立性の条件が緩和される。この提案手法は実装 化され、理論的な結論からもこれが支持されている。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


相関ノイズによって劣化した画像のセグメンテーション
Segmenting Images Corrupted by Correlated Noise

Thomas C.M. Lee, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 5, May1998

Keywords: Correlated noise, image segmentation, merging algorithm, minimum description length.

画像のセグメンテーションは多くの画像解析問題にとって基本的なものである。その 目的はディジタル画像をオーバーラップしない一様な領域の組に分割することであ る。本論文が貢献する主な点は、相関ノイズによって劣化した画像を分割するよう意 図された新たなセグメンテーションの手続きを開発したことである。この新しいセグ メンテーションの手続きはRissanenの最小記述長(MDL=Ressanen's minimum description length)原理に基づいており、また、次の2つの構成要素を有している :i) MDL-に基づく判定基準;最良セグメンテーションはこの基準の最小値として与 えられる:ii)合併アルゴリズム;これが最小値になるような判定基準を局在化させ ることで合併を判定する。この手続きが効率的であることは、その確かな結果と共に シミュレーションによって図説されている。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


エラー耐性を持ったサブグラフ同形写像検出の新しいアルゴリズム
A New Algorithm for Error-Tolerant Subgraph Isomorphism Detection

Bruno T. Messmer and Horst Bunke, Member, IEEE Computer Society

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 5, May1998

Keywords: Graphs, subgraph isomorphism, graph matching, error-correcting graph matching, search, graph algorithms, graph decomposition.

本論文ではモデルグラフから未知の入力グラフへのエラー修復可能なサブグラフ同形 写像を検出する新しいアルゴリズムを提案する。この表現は、オフラインの前処理に よるモデルグラフ集合から得ることができる。本提案手法の主な利点は、異なるモデ ルグラフの共通サブグラフはたった1回だけ表現されることである。従って、実行中 に未知の入力グラフが与えられたとき、各モデルグラフを入力グラフにマッチングさ せる試みは一回しか行われない。その結果、この新しいアルゴリズムはモデルグラフ の数にサブリニアー(sublinear)に依存しているに過ぎない。更に、この新しいアル ゴリズムは未来コストの予測手法と結びつくことによって大きく実行時の効率をあげ ることができる。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


葉脈化:柔軟な芯線化のための新しい形状記述
Veinerization: A New Shape Description for Flexible Skeletonization

Marc Pierrot Deseilligny, Georges Stamon, and Ching Y. Suen, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 5, May1998

Keywords: Digital skeleton, veinerization, skeletonization, context adaptation, digital topology, graphs, fractal sets.

芯線化を「形状の中心線」と直観的に解釈することはできても、実際にすべての「良 い」性質を持った芯線化アルゴリズムを得ることは驚くほど難しい(すなわち、しっ かりと中心を捉え、しっかりと連結性を保ち、回転不変で、効率的で、頑健で、正確 に形状を反映するような)。本論文では、新しい概念である「葉脈化」を紹介する が、これは、多様な芯線を導くのに必要なすべての「トポロジカル」な情報を持った グラフを生成する。理論的には、本論文の趣旨はデジタル葉脈化に関する他の研究に 述べられている主な概念を統合化した均一なフレームワークを提供することにある。 実用的には、この手法の新側面は、与えられた応用に最も適した芯線化を選択する異 なる基準をユーザーに提供することにある;すなわち、ユーザーは「ノイズの枝がな い芯線化」と「初期形状を反映する芯線化」の間での任意のバランスを持つ結果を得 るための望ましい閾値を選択できる。本アルゴリズムは、形状の複雑さで良く知られ たフラクタル集合のような異常なパターンを含む数多くのパターンに対してテストさ れた。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


符号列エディット距離の学習
Learning String-Edit Distance

Eric Sven Ristad, Member, IEEE, and Peter N. Yianilos, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 5, May1998

Keywords: String-edit distance, Levenshtein distance, stochastic transduction, syntactic pattern recognition, spelling correction, string correction, string similarity, string classification, pronunciation modeling, Switchboard corpus.

多くの応用において2つの符号列の類似度を決定することが必要になる。広く利用さ れている符号列の類似度を表現する方法はエディット距離である:符号列を入れ替え るに必要な、挿入、削除、交換の最小値、と定義される。本論文では、符号列のエ ディット距離の確率論的モデルを紹介する。この確率論的モデルによって例文集から エディット距離関数について学習することが可能になる。我々は本手法を会話におけ る発音を学習するという困難な問題に応用して、この手法の実用性を示す。本応用例 では約1/5の誤り率を持つ未学習のLevenshtein距離について符号列エディット距離を 学習した。我々の方法は、ラベル付けされた原型のデータベースに対して類似関数を 利用して解くことができるような、どんな符号列の分類問題にも適用できる。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


均一および不均一なガウシアンランダム場のためのベイズ推定
Bayesian Estimation for Homogeneous and Inhomogeneous Gaussian Random Fields

Robert G. Aykroyd

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 5, May1998

Keywords: Adaptive smoothing, compound Gauss-Markov random fields, coupled random fields, doubly stochastic random fields, Markov random fields, Metropolis-Hastings algorithm.

本論文はガウス・マルコフランダム場におけるベイズ推定について検討している。特 に、不均一モデルを用いたり、第2のランダム場を用いて記述される空間的変動の度 合いを用いて観察強度を記述する新しい複合モデルのクラスを提案する。連結したマ ルコフ・ランダム場が先験分布として利用され、ガウス・ノイズ場と一緒にして事後 分布が形成され、これに基づいて推定がなされた。全てのモデルパラメータは、ベイ ズ確立の枠内で、Metropolis-Hastingsを利用して推定された。事後推定の全手順は 図解され、各種の人工的な例を使って比較されている。これらの例では、不均一モデ ルは、均質モデルに比べて非常にうまく働き、スムージング度合いの変化や、局所的 テクスチャーの変化を許容する。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


3枚の輝度画像からつくる全立体表現
Full Volumetric Descriptions From Three Intensity Images

Parag Havaldar, Member, IEEE, and Gerard Medioni, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 5, May1998

Keywords: Shape description, grouping, stereo, generalized cylinders.

我々は高度な立体的で部分的(あるいは、部分からなる)オブジェクト記述を輝度画 像から復元する問題について述べる。入力情報として、3つの空間的に近接して撮影 したオブジェクト画像を利用し、これを一般化した円筒(GCCs = Generalized Cylinders)によって復元表現する。3方向の画像から階層化された輪郭画像のグルー プを抽出することから始める。このグループ化は、近接性、平行性、対称性に準拠し ている。3視野像はマッチングによって、輪郭は、表面に垂直/反射による不連続線 を表す「真の」エッジとしてラベル付けされるか、あるいは視点に依存するエッジで ある「腕」エッジのいずれかに対応付けされる。それからGC軸、その断面、スケール 関数を推定する。このGC軸を得るために、見かけ表面における局所的性を備えた直線 や曲線で一般化された円筒の性質が利用される。対象断面は、もし画像中に見えれば 復元されるが、そうでなければGCの性質から推測される。真のエッジ、腕エッジ、あ るいは両方のエッジからなる分類を考察する。最終結果は、立体的な部品から成って いる。最初得られる荒っぽい立体記述は、表面細部を含む輝度画像の細部が表現され るように細密化される。テクスチャーや陰影を有する適度に複雑な実画像に適用した 結果を示す。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


境界条件を利用した輪郭のエネルギー最小化
Energy Minimization of Contours Using Boundary Conditions

Sharat Chandran and A.K. Potty

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 5, May1998

Keywords: Dynamic programming, energy minimization, deformable contours, optimal solutions, active contours.

情景画像からオブジェクトを再構成することは、基本的形状としてエネルギー最小化 スプラインを利用したデータフィッティング問題と見なされよう。「最良」の形状を 得るために最小値を得る手続きは、ある場合には重要である。元の定式化に提案され ているオイラー・ラグランジェの分散による解法[1]は、[2]によって問題点が指摘さ れ、動的プログラミング法(DP)もまた提案された。本論文では、このDPによる解法を 更に発展させる。ある場合には、[2]の離散型解は、各文献[3], [4], [5], [6]に採 用されているが、これも局所最小値を示すことが示され、これを避ける戦略が示され ている。「能動的輪郭」と同様にエネルギーが2次微分に依存する場合の解を導く、 必要性のより強い条件形式を提示する。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


超相互作用法による非線形な動き推定
Nonlinear Motion Estimation Using the Supercoupling Approach

M. Bober, M. Petrou, Member, IEEE, and J. Kittler, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 5, May1998

Keywords: Motion analysis, motion segmentation, supercoupling approach, Markov random fields, stochastic relaxation.

本論文は動きセグメンテーション問題に対して、非常に効率的な多段解像度変換の応 用について述べるが、これは物理の再正規化群の手法に関連している。本提案手法 は、最高解像度を使った方法よりはずっと速く、ずっと良い結果に至る。この問題 は、問題に課せられる制約だけでなく、各種プロセッサーによって得られる情報を結 合してコスト関数を構成し、グローバルな最適値の1つを見つける問題として定式化 される。このコスト関数は、超相互作用多段解像度法(supercoupling multiresolution approach)によって最適化される。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


複数特徴量と多段分類による手書き漢字のオフライン認識
Offline Recognition of Chinese Handwriting by Multifeature and Multilevel Classification

Yuan Y. Tang, Senior Member, IEEE Computer Society,Lo-Ting Tu, Jiming Liu, Senior Member, IEEE Computer Society, Seong-Whan Lee, Senior Member, IEEE Computer Society, Win-Win Lin, and Ing-Shyh Shyu

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 5, May1998

Keywords: Offline Chinese handwriting recognition, multifeature, multilevel classification, overlap clustering, Gaussian distribution selector.

最も困難なトピックスの1つは手書き漢字の認識、しかもオフライン認識である。本 論文では手書き漢字の認識を複数特徴と多段分類によってオフラインで認識するシス テムを紹介する。周辺形状特徴、ストローク密度特徴、ストローク方向特徴などの1 0種類の特徴が使われている。多段分類体系はグループ分類器と5レベル文字分類器 から成っており、 オーバーラップ分類とガウス分布選別器の2つの新規に開発され た技術も含まれている。実験は5,401の日常使われている漢字で行われた。その結 果、1候補の場合の認識率は約90%であり、10候補文字の場合は98%であっ た。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


三角不等式を利用した、複雑度の減少した最近接分類器の設計
Fast Design of Reduced-Complexity Nearest-Neighbor Classifiers Using Triangular Inequality

Eel-Wan Lee and Soo-Ik Chae

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 5, May1998

Keywords: Nearest-neighbor classifier, triangular inequality, computational complexity, NIST database, fast design.

本論文では、高入力次元と多数のクラスベクトルを有する与えられた最近接分類器か ら、ほとんど最小の計算複雑度を持った複雑度の減少した最近接分類器(a reduced complexity nearest-neighbor (RCNN) classifier)を設計する方法を提案する。我々 はNISTデータベース中の手書き数字の分類問題にこの手法を適用する。もし、RCNN分 類器が与えられた分類器の複雑度まで正規化されていれば、求められる分類器の複雑 度は62%であり、これは最適分類器に比べて2%優れている。これは、全探索を実施し て見つけた。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


より正確な分類と誤差推定のための最近接変動の減少について
On the Reduction of the Nearest-Neighbor Variation for More Accurate Classification and Error Estimates

Abdelhamid Djouadi, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 5, May1998

Keywords: Nearest-neighbor risk, nearest-neighbor classifier, Bayes error, asymptotic risk, risk estimation.

最近接(NN)分類器を設計するに際して、漸近法に近い有限サンプル数リスクを有する 方法を提案する。これは、高次の奇数項とともに、サンプル数の一次効果を減少させ ることを試みた方法に基づいている。本方法は、拒否なしで2-NNルールを利用し、偏 極機構を利用する。この解析の正当性を評価するためにシミュレーション結果も示し た。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


最適にトポロジーを保存する写像における固有次元の推定
Intrinsic Dimensionality Estimation With Optimally Topology Preserving Maps

J. Bruske and G. Sommer

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 5, May1998

Keywords: Intrinsic dimensionality estimation, topology preservation, principal component analysis, vector quantization.

高次元の特徴空間における低次元多様体の固有次元(ID)の解析の新しい方法を紹介す る。以前のFukunaga や Olsenの方法に比べて、本方法は、入力空間の次元に対して 三次の計算時間の複雑度ではなく線形の複雑度を有しているだけである。更に、この 方法は以前に比べノイズに対する感度も低い。比較と図解のために、実画像列だけで なく、人工的データに対してID推定推定を行った。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.20, No.6


2Dや3D画像から動くオブジェクトを検出する統一的手法
A Unified Approach to Moving Object Detection in 2D and 3D Scenes

Michal Irani and P. Anandan

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 6, June 1998

Keywords: Moving object detection, rigidity constraints,multiframe analysis,planar-parallax, parallax geometry, layers.

多くの課題に置いて動くオブジェクトを検出することは重要である。この問題に対す る以前の方法は、2つに大別することができる;情景が平面で近似されるか、カメラ が回転とズーミングのみの操作を受けているような2Dアルゴリズム、あるいは、情景 に十分な深さの変化がありカメラがこれをうまく表現しているような場合にのみ働く 3Dアルゴリズム。本論文では、2D,3Dの情景中から、これら2Dと3D両極端のギャップ を埋め合わせる優雅に結びつける、動くオブジェクトを統一的に扱う手法ついて述べ る。我々の手法は動くオブジェクト問題に対して、徐々に複雑さを増すシナリオ戦略 に基づいている。上記戦略に合致する一連の手法を紹介する。これらの手法では2D手 法から3D手法へと徐々に複雑さを増加させる。さらに、ある複雑さのレベルで必要な 解は、次のレベルの複雑さの解を求める初期の処理ステップとなる。我々は実画像列 の例によってこの手法を示す。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


劣化画像解析:不変な解法
Degraded Image Analysis: An Invariant Approach

Jan Flusser and Tomas Suk

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 6, June 1998

Keywords: Degraded image, symmetric blur, blur invariants, image moments, combined invariants, object recognition.

非理想的結像システムによって得られた画像を解析し解釈することは多くの応用分野 での重要問題である。観察される画像は通常、ぶれ、空間的画質劣化、ランダムノイ ズによって劣化している。ブラインド・デコンボリューションのような古典的手法で は、ぶれを生じさせたパラメータを推測し、画像を復元する。本論文では、これに代 わる手法を提案する。劣化を生じさせた点広がり関数(PSF)が中心対称であると言う 仮定のみで、ぶれに対して不変な画像表現の特徴量を導いた。論文で証明されている ようにこのような特徴は2種類存在する:1つは空間領域で、他の1つは周波数領域 で。我々は、幾何的な合成や、ぶれによる劣化に不変な、いわゆる複合不変量も導 く。これらの特徴量を知ることによって、劣化した画像を復元することなくオブジェ クトを認識することができる。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


周波数領域でアフィン不変量を利用した画像認識
Pictorial Recognition of Objects Employing Affine Invariance in the Frequency Domain

Jezekiel Ben-Arie, Member, IEEE, and Zhiqian Wang

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 6, June 1998

Keywords: Affine invariant recognition, model-based segmentation, affine invariant spectral signatures (AISS), multidimensional indexing, Gabor kernels.

本論文では、おおよそ平面的なオブジェクト表面に対応する画像パッチの周波数特徴 を利用した、ポーズに依存しない効率的画像オブジェクト認識について述べる。特異 値分解(Singular Value Decomposition (SVD))に基づいて、アフィン変換が、傾斜 (slant)、傾き(tilt)、揺れ(swing)、スケール(scale)、および、2D変換に分解され る。従来の傾斜に対して不変性を持たないlog-polar表現に対して(すなわち、1方 向に対してだけ遠近短縮)、我々の周波数領域でのlog-logサンプリングは完全なア フィン不変性を有する。画像は、新規なモデルに基づくセグメンテーション法で前処 理されており、基本的な幾何学的形状集合のモデルにアフィン類似するオブジェクト を検出・セグメント化する。セグメント化されたオブジェクトは、次に周波数領域で 表現される多次元画像データ集合の指標特徴によって認識される。実験結果によれ ば、広範囲の3Dポーズパラメータと画像劣化を含む26モデルのデータ集合に対して 100%の認識率を示した:画像劣化は以下の通り;0_360_ の揺れと傾斜, 0_82_ の傾 き (1:7 以上の遠近短縮)、3オクターブ以上のスケール変化、 窓で制限された変 換、高ノイズレベル (0 dB)、顕著な解像度低下 (1:5)。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


連結要素による分割の確率的弛緩とその画像セグメンテーションへの応用
Stochastic Relaxation on Partitions With Connected Components and Its Application to Image Segmentation

Jia-Ping Wang

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 6, June 1998

Keywords: Connected components, Gibbs distribution, simulated annealing,hierarchical segmentation, unsupervised segmentation, multiscale segmentation.

我々は連結要素によって分割されている画像の新しいセグメンテーション法について 示す。我々は、一般グラフの連結要素による確率シミュレーションと、シミュレー テッド・アニーリングの演算コストの少ないアルゴリズムを与える。特に、ハスティ ングアルゴリズムと一般化されたメトロポリスアルゴリズムが、計算の負荷を軽くす るものとして定義された。セグメンテーションの実行には、階層的手法を提案し、各 段階においてグラフの連結要素によって分割される空間の計算コストを最小化する。 このアルゴリズムは中間調画像やカラーやテクスチャー画像のセグメンテーションに 応用された。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


3Dオブジェクト認識のためのサポートベクトルマシン
Support Vector Machines for 3D Object Recognition

Massimiliano Pontil and Alessandro Verri

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 6, June 1998

Keywords: Support vector machines, optimal separating hyperplane, appearance-based object recognition, pattern recognition.

サポートベクトルマシン(SVM)は最近提案されたパターン認識のための新技術であ る。直感的に言えば、2つのクラスのいずれかに属する点集合が与えられたとき、線 形SVMは超平面を点集合のそれぞれの点が本来属するクラスに最大限分割されるよう に設定し、なおかつ各クラスを超平面からできるだけ離すようにする。この超平面 は、サポートベクトルと呼ばれる2つのクラスの部分集合の点で決定され、数多くの 興味ある理論的性質を持っている。本論文では、3Dオブジェクト認識のために線形 SVMを用いる。我々は、100の異なるオブジェクトを持つ7200の画像データベースに適 用してその能力を示す。提案するシステムは特徴抽出を行わず、ポーズの推定をしな いで高次空間の1点と見なされる画像について認識する。すべての実験ですばらしい 認識率を示した結果から、SVMは外観に基づく認識に適していることが分かる。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


多次元画像中の薄い対象物の2値復元
Binary Restoration of Thin Objects in Multidimensional Imagery

Jeffrey E. Boyd and Jean Meloche

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 6, June 1998

Keywords: Binary restoration, image restoration, tomography,x-rays, statistical methods.

爆発物のような薄い対象物を見つけるためのノイズの多いトモグラフィー画像の復元 法を提案する。重み付き平均二乗推定法によって、滅多にないが対象物特有の顕著な 局所的構造を強調する最適解が得られる。実験結果は、非常に高いノイズに対して も、うまく画像が復元されていることを示している。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


アフィン的動きとピンボケを同時に復元
Recovering Affine Motion and Defocus Blur Simultaneously

Zarina Myles, Student Member, IEEE, and Niels da Vitoria Lobo, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 6, June 1998

Keywords: Defocus blur, affine motion, optical flow, defocussed motion.

深さ方向への動きやズーミングはピンボケを起こす。画像中のピンボケがアフィン変 換で同時に復元できることを示す。我々は理論を示し、解法を開発し、理論と解法を 実画像に適応することで、その正当性を示す。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


画像から動きを回帰的に推定するためのリスク感度を有するフィルター
Risk-Sensitive Filters for Recursive Estimation of Motion From Images

M. Jayakumar and Ravi N. Banavar, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 6, June 1998

Keywords: Risk-sensitive estimation, motion parameters, vision.

本論文では、拡張されたリスクセンサー・フィルター(ERSF)を、一連の単眼画像に適 用し、オブジェクトの動きパラメータを回帰的に推定する。推定誤差についてのリス ク因子θを変動させる効果について調べられた。このフィルターの効率は、拡張カル マンフィルター(EKF)と理論的クラマー・ラオ下界と比較された。リスク因子θと測 定ノイズの不確定さが大きいとき、ERSFの初期推定誤差は、対応するEKFのよりも少 ない。ERSFはまた、KFKよりも急速に定常状態の誤差値に収斂することが分かった。 初期推定の不確定性が大きくEKFが発散するような場合、ERSFは小さな誤差で収斂す る。理論での確認によって、ERSFの振る舞いは、ゼロに向かっては、EKFと同じであ ることが分かった。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


組合わせ的複雑さの難問
Conundrum of Combinatorial Complexity

Leonid I. Perlovsky, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 6, June 1998

Keywords: Pattern recognition, neural networks, rule systems, complexity, training, learning, a priori knowledge, fuzzy logic, Aristotelianlogic

本論文はパターン認識アルゴリズムや、ニューラルネットワーク、そしてルールシス テムで遭遇する困難を潜ませた基本的問題について調べる。これらの問題はアルゴリ ズムの計算や必須学習の組み合わせの複雑さとなって現れる。論文は、特別のタイプ の複雑さに関する問題を、先験知識や適応学習の役割に関連付けている。適応学習に 基づく枠組は、トレーニング手続きの複雑さとして現われ、他方、非適応型ルール ベースの枠組みは、ルール系の複雑さになる。先験知識と適応的に結び付けるモデル ベースによる手法は、計算の複雑さとなって現れる。適応性と優先性の結合の難しさ に対する議論が紹介されたが、アリストテレス風の論理では対応できない。この困難 を乗り越える可能性のあるものとしてファジー論理の役割が議論されている。現在の 数学的困難は、過去の哲学的議論に関連している。

Ej

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.20, No.7


単一正面像に基づく顔認識の分析→全体型のアプローチ
An Analytic-to-Holistic Approach for Face Recognition Based on a Single Frontal View

Kin-Man Lam, Member, IEEE, and Hong Yan, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 7, July 1998

Keywords: Face recognition, facial feature detection, head model, point matching, correlation.

本論文は、異なる観察角度変化の下で顔を同定できる分析→全体型の アプローチを提案する。 テスト用のデータベースは、40の正面顔の画像からなる。 最初のステップでは、顔に15個の特徴点を付ける。 一つの頭部モデルが提案される。 顔の回転は、幾何測定を用いることで推定される。 正面画像上の特徴点の対応位置に近づけるように、特徴点の位置が調整される。 これらの特徴点と、データベース中の顔の特徴点とは、類似変換を用いて比較される 。 第二のステップでは、目・鼻・口に対して、観測用の窓を設ける。  これらの特徴窓と、データベース中の特徴窓とは、相関性によって比較される。 実験結果によれば、 このアプローチは、顔の観察方向が異なっても同レベルの性能を 出せることが示される。 異なる観察角度変化における全体の認識率は、上位1位で84%、 上位3位で96%である。

LXP

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


接合:その検出、分類、および再構築
Junctions: Detection, Classification, and Reconstruction

Laxmi Parida, Davi Geiger, Member, IEEE, and Robert Hummel

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 7, July 1998

Keywords: Junctions, corners, feature detection, low-level vision, minimum description length (MDL) principle, energy minimization.

接合(Junctions)は画像解析にとって重要な特徴であり、 物体認識のような画像理解タスクにおいて、決定的なアスペクトを作り上げている。 我々は、画像中の接合について、その検出(接合の中心位置)、 分類(ウェッジ・線、角、T又はYのような三接合、Xのような四接合の数で分ける) 、 および再構築(半径のサイズ、各ウェッジの角度、各ウェッジの強度を用いて) について、統一されたアプローチを提案する。 我々の主な貢献は、接合のモデル化である。 このモデルは、上記の問題を扱うのに、十分に複雑であり、 かつまたDP法を効果的に導入するのに、十分に簡単である。 大ざっぱに言えば、テンプレート変形の枠組みを用いるのだが、 これをある勾配基準にしたがって用いることで、 テンプレート中の放射状の部分を検出する。 接合を最良に記述できる最適分割数を求めるのに、MDL(最小記述長)原理 を用いる。 Konaは、このモデルの一つの実施例である。 合成・制御された装置を用い、雑音下のふるまいを解析することで、 この検出器の安定性と頑丈性を(定量的に)示す。 また、実画像に対するふるまいについて、定性的に調べた結果をも示す。

LXP

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


エッジ検出とつぶれ推定のための局所的スケール制御
Local Scale Control for Edge Detection and Blur Estimation

James H. Elder, Member, IEEE, and Steven W. Zucker, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 7, July 1998

Keywords: Edge detection, localization, scale space, blur estimation, defocus, shadows.

エッジ検出の標準的なアプローチは、強度(訳者注:濃度の反対)に 大きな階段状の変化があるというエッジモデルに基づいている。 このアプローチは、 つぶれスケールとコントラストが広範囲で変化する自然画像に対し、 そのエッジを高い信頼度で検出・位置決めすることができない。 主な問題点は、局所推定のための空間スケールの適切さは、エッジの局部構造 に依存するにもかかわらず、それが画像上で予測不能な形で変化していること にある。 ここでは、センサー特性とオペレータ標準に関する知識を利用すれば、 画像の各点において、局所推定のためのユニークで局所計 算可能な最小信頼スケールを定義しうる、ということを示す。 この局所スケール制御方法は、浅いフィールドと影のある画像中の、 エッジの検出・位置決めの問題に適用される。 センサー雑音の二次モーメントだけを入力パラメータとする単一システムにより、 つぶれスケールとコントラストに関して広範囲にわたるエッジを、 正確に再現しうることを示す。 このアプローチの一つの自然な成果は、輪郭の厚さの測度である。これは、 焦点的かつ半影的なつぶれの推定に使えるものである。 局所スケール制御が、複雑な画像中のつぶれ推定に重要なことが示される。 この場合、つぶれスケールが全く異なる近傍エッジ間に、潜在的な干渉が存在するた め、 つぶれの推定は最小信頼スケールで行われることが要求される。

LXP

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


2視点運動解析のための最適化基準について
On the Optimization Criteria Used in Two-View Motion Analysis

Zhengyou Zhang, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 7, July 1998

Keywords: Motion analysis, multiple-view geometry, 3D reconstruction, optimization criteria, algorithmic comparison, structure from motion, uncalibrated images.

2視点運動解析に周知の基準は3つある。 それぞれ、点の間の距離と対応するエピポーラ線に基づくもの、 勾配重み付きエピポーラ誤差に基づくもの、 そして点間距離と再構成点の再投影とに基づくもの、である。 最後の基準は、統計的解釈に優れてはいるのだが、最初の二つに比べると 著しく遅いものである。 本論文で示すのは、次のことである。 すなわち、 エピポーラ幾何に合理的な初期推測を与えられたして、 後二者の基準が等価となるのは、エピポールが無限なときであり、 両者がわずかに異なるのは、エピポールが画像の中にあるときである、 ということである。これは実験でも示される。 最初の二つの基準が等価となるのは、エピポールが無限であり、 かつ、観察物体または景観が二つの画像で同じスケールを有する場 合に限られる。 これは、計算効率からいえば、二番目の基準が実用上は十分であることを意味する。 数千のコンピュータシミュレーションと四セットの実データを用いた実験は、 この分析と一致した。 この結果は、較正・非較正画像の両方に有効である。

LXP

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


INFORMys: ある柔軟な送り状フォーム読み取りシステム
INFORMys: A Flexible Invoice-Like Form-Reader System

Francesca Cesarini, Marco Gori, Senior Member, IEEE, Simone Marinai, and Giovanni Soda, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 7, July 1998

Keywords: Attributed relational graphs, document analysis and recognition, document registration, invoice processing, location of information fields.

本論文は、サービス業で使われている送り状や請求書のような会計書類から、 テキスト情報を抽出できるような、柔軟なフォーム読み取りシステムについて述べる 。 このような書類において、ある情報フィールドを抽出するには、それに対応する 指示フィールドを検出せねばならない。これらの指示フィールドは与えられた領域 の範囲に制約されただけである。 我々は、書類のレイアウトを属性関連グラフによってモデル化する。この方法は、 フォームの登録、指示フィールドの集中探索に非常に効果的である。 この探索は、混合モデルによって実行される。 この混合モデルは、モルフォロジカルな演算と連結成分とに基づく正規の アルゴリズムと、これらをconnectionistモデルで統合したものである。 このシステムの実際の性能を評価するために、実験結果を与える。

LXP

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ベクトル勾配ハフ変換
The Vector-Gradient Hough Transform

Rita Cucchiara and Fabio Filicori

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 7, July 1998

Keywords: Hough transform, shape detection, visual inspection, feature extraction, image analysis, object recognition.

本論文は、グレースケール画像中の細長い形状を同定するための新しい変換、 すなわち、ベクトル勾配ハフ変換と呼ばれるものを提示する。 この目的は、物体のエッジ情報を収集するのみならず、 それらの光度の横断的なプロフィールを再構築することによって達成される。 この新アプローチの主な特徴は、ベクトル空間の定式化と、 光度勾配のすべてのベクトル情報をうまく利用できる能力とに に関連している。

LXP

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


回転不変テクスチャ特性および自動スクリプト同定での応用
Rotation Invariant Texture Features and Their Use in Automatic Script Identification

T.N. Tan, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 7, July 1998

Keywords: Texture, rotation invariance, Gabor filtering, script and language recognition, document image processing.

本論文は、回転不変テクスチャ特性の抽出および文書画像中のスクリプト同定への この特徴の応用について述べる。 回転不変テクスチャ特性は、一般の多重チャンネルGaborフィルタリング技法の拡張 に 基づいて計算され、その有効性は15のBrodatzテクスチャの300のランダム回転 サンプルで検証される。 このような特性は、機械印刷文書のスクリプトの同定という、文書画像処理中の実用 的だが今までもっとも見逃されている問題の解決に応用される。 多国言語の環境でのOCRと翻訳製品の効率的かつ正しい使用において、自動スクリプ トと 言語識別は基本的な先頭処理である。 スクリプト同定でのこのようなテクスチャに基づくアプローチの潜在的能力を 試すために、六カ国の言語(中国語、英語、ギリシャ語、ロシア語、ペルシャ語、 およびマライ語)が選ばれた。

LXP

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ボロノイ図算出とユークリッド距離変換へのリスト処理アプローチ
A List-Processing Approach to Compute Voronoi Diagrams and the Euclidean Distance Transform

Weiguang Guan and Songde Ma, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 7, July 1998

Keywords: Voronoi transformation, Voronoi diagram, Euclidean distance, distance transformation, coherence.

本論文は、列のセグメントリストを用いてボロノイ図を構築する効率的な ボロノイ変換アルゴリズムを提示する。 このアプローチの重要な特徴は、最近傍情報の表現と伝播のための基本単位に、 ピクセルの代わりにセグメントを利用することである。 セグメントリストは、スキャンされる過程で動的に更新される。 故に、ボロノイ図のセグメントリストの表現から距離マップは容易に計算される。 実験結果は、その高い効率性を示している。 より高い次元でのこのアプローチの拡張も議論される。

LXP

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


「分水界曲線の測地線における突起部と階層的分割」へのコメント
Comments on "Geodesic Saliency of Watershed Contours and Hierarchical Segmentation"

Cedric Lemarechal, Roger Fjortoft, Philippe Marthon, Member, IEEE, and Eliane Cubero-Castan

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 7, July 1998

Keywords: Hierarchical segmentation, watershed algorithm, basin dynamics, edge dynamics.

最近のモルフォロジカルな画像分割に関する論文で、Najman氏とSchmitt氏は エッジダイナミックスという強力な概念を導入した。 このコメントで我々は、ある一定の空間配置において、彼らの方法で計算されたエッ ジ ダイナミックスに誤った結果が生じ、我々の新しいアルゴリズムではいつでも正しい エッジダイナミックスが得られれることを示す。

LXP

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


「分水界曲線の測地線における突起部と階層的分割」へのコメントへの回答
Response to the Comment on "Geodesic Saliency of Watershed Contours and Hierarchical Segmentation"

Michel Schmitt

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 7, July 1998

Keywords: Mathematical morphology, watershed, dynamics, segmentation.

本論文では、Transactions on Pattern Analysis and Machine Intelligence, vol. 18, no. 12, pp 1,163-1,173 に概述され、この号で批評された流域アルゴリズムの詳細 を示す。 まず、floodingリストの正式的な定義、およびこのアルゴリズムの重要データ構造が 与えられる。 次に、floddingリスト及び流域の構築が記述され、証明される。

LXP

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.20, No.8


部分的分類:決定延期の利点
Partial Classification: The Benefit of Deferred Decision

Yoram Baram

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 8, August 1998

Keywords: Classification, pattern recognition, hypothesis testing, decision making, machine learning, stock trading, medical diagnosis.

ここで示されるのは、部分的分類というものは、データ空間のある領域 における不決定を許すものであり、これがある利益関数(benefit function) を増大させうるということである。 ここでいう利益関数とは、正確な決定の確率と不正確な決定の確率との差分 として定義され、意思決定がなされる事象と結合するものである。 これが特に当てはまるのは、データサンプルが少ない場合であり、この 場合には、推定分離表面が、対応する確率密度関数間の交差表面から大 きく偏ることがある。 ある特定の密度推定法を用いることにより、不決定領域を一つのパラメ ータにより自然なかたちで定義し、利益関数を最大化する最適サイズを、 データから得ることができる。 利益関数は、ストック・トレーディングにおける利益(profit)へと翻訳さ れることが示される。 医学的データと経済的データとを用いて示されることは、 部分的分類は、平均すると、全分類よりも高い利益値を生み出すというこ とである。これは、それぞれの新しいオブジェクトを一つのクラスに割り 当てることでなされる。 さらに、部分的分類のぎりぎりの利益は、データ・サイズの増大につれて 減少することも示される。

Sz

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


指紋画像の強調:アルゴリズムと性能評価
Fingerprint Image Enhancement: Algorithm and Performance Evaluation

Lin Hong, Student Member, IEEE, Yifei Wan, and Anil Jain, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 8, August 1998

Keywords: Biometrics, fingerprint, minutiae, enhancement, Gabor filters, performance evaluation.

指紋の自動マッチングにおけるきわどいステップは、マニューシャを、 入力された指紋画像から、自動的かつ確実に抽出する過程である。 しかしながら、マニューシャ抽出アルゴリズムの性能は、入力指紋画像の 品質に強く依存している。 自動指紋識別/検証システムの性能が、入力指紋画像の品質に関してロバスト であることを保証するためには、マニューシャ抽出モジュールに、指紋強調 アルゴリズムを取り入れることが不可欠である。 ここでは、高速な指紋強調アルゴリズムを提案する。 これは、入力指紋画像の尾根・谷構造の明瞭さを、推定局所尾根・谷方向と その頻度に基づいて、適応的に改善することができる。 画像強調アルゴリズムの性能の評価にあたり、抽出されたマニューシャの良好指数 とオンライン指紋検証システムの認識精度とを用いた。 実験結果によれば、強調アルゴリズムの導入により、いずれの尺度に おいても改善が見られる。

Sz

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ATRの行列リー群推定のためのヒルベルト・シュミット下限
Hilbert-Schmidt Lower Bounds for Estimators on Matrix Lie Groups for ATR

Ulf Grenander, Michael I. Miller, Senior Member, IEEE, and Anuj Srivastava, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 8, August 1998

Keywords: Pose estimation, ATR, Hilbert-Schmidt bounds, Bayesian approach, performance analysis, orthogonal groups.

観測画像の変形可能テンプレートによる表現は、行列リー群の動きを通じて、 対象姿勢の多様さをモデル化する。 本稿では、姿勢推定のための特殊な直交系であるSO(n)についての、最小平均二 乗誤差推定の構成について調べる。 SO(n)は、非平面幾何なので、最適推定とその特徴づけのための標準的なベイズ 定式化は、修正を要することになる。 SO(n)を含むより大きな群であるGL(n)の上で定義されるヒルベルト・シュミット 尺度を用いると、平均二乗基準はSO(n)で定義される。 ヒルベルト・シュミット推定(HSE)は、SO(n)に制限される最小平均二乗誤 差推定であると定義される。 HSEに伴う期待誤差は、他のいかなる推定法でも生じる誤差の下限であるこ とが示される。これは、ヒルベルト・シュミット境界(HSB)と呼ばれる。 地上走行時および飛行時の対象物の二つの場合について、HSEとHSBを評価する ために、その解析とアルゴリズムが提示される。

Sz

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


決定論的アニーリング機構における教師なしテクスチャー分割
Unsupervised Texture Segmentation in a Deterministic Annealing Framework

Thomas Hofmann, Jan Puzicha, Student Member, IEEE, and Joachim M. Buhmann, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 8, August 1998

Keywords: Image segmentation, pairwise clustering, deterministic annealing, EM algorithm, Gabor filters.

教師なしテクスチャー分割のための新しい最適化機構について述べる。 これは、均質性を測る統計的テストに依存している。 テクスチャー分割は、疎な近接データに基づくクラスタリング問題として定式化 される。 テクスチャー領域のペアの相違度は、多重ガボア・フィルター画像表現 から求められる。 不変原理から体系的に導出されるクラスタリング目的関数の一つのクラスに ついて、論じかつ比較する。 ここでは、一般的な最適化機構として、平均場近似に基づく決定論的 アニーリングを提案する。 この機構で用いるクラスタリング・アルゴリズムを導出する正規の方法と、 平均場アニーリングの効率的実現方法と、これらに密接に関連するギブズ 検査について述べる。 アニーリング変形を、Brodatzのようなマイクロ・テクスチャー、および実世界の 画像に対して適用する。

Sz

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


n次元モーメント不変性とn次元固体認識の概念的数学理論
n-Dimensional Moment Invariants and Conceptual Mathematical Theory of Recognition n-Dimensional Solids

Alexander G. Mamistvalov

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 8, August 1998

Keywords: n-ary quantics, algebraic invariants, affine transformation, n-dimensional moments, moment invariants, geometric concepts, n-dimensional solids, metric characteristics, affine classification.

n次元パターン認識のための、モーメント不変性を一般化した基礎定理 (GFTMI)の証明を行う。 1962年には、Huが2次元パターン認識のためのモーメント不変性の基礎定理 (FTMI)を定式化した。これは、一般的な線形変換に従っている。 1970年には、筆者は、FTMIが実際には不正確であることを示し、修正された FTMI(CFTMI) を定式化した。 1974年には、証明はなされていないが、これをn次元の場合へと一般化した。 TFTMIを基礎づけるものとして、アフィン変換に関して、そのモーメント不変性と サブグループとを定めた。 これらの不変性を用いると、幾何的図形・固体を認識するための概念的な 数学理論およびそれらのn次元への一般化がなされる。 この理論によって、まず、多角形や多面体のみからなるシーンの解析が 可能となるだけでなく、曲線的な輪郭・表面をもつ幾何的な形状・固体 からなるシーンの解析までもが可能となるのである。 一般的にいえば、この理論は、ロボット・ビジョンの非常に重要な進歩 に向けての有用なステップであると同時に、人工知能の創造に向けての 有用なステップである、というのが筆者の意見である。 機械は、異なる一般性と寸法についての幾何的概念を用い、さらにそれら の概念を関連させることにより、思考することができるようになる。

Sz

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


決定林(Forests)構築のためのランダム部分空間法
The Random Subspace Method for Constructing Decision Forests

Tin Kam Ho, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 8, August 1998

Keywords: Pattern recognition, decision tree, decision forest, stochastic discrimination, decision combination, classifier combination, multiple-classifier system, bootstrapping.

決定木に関する関心のほとんどが当てられたのは、これまでのところ、 分割基準および木サイズの最適化に関してであった。 過適応と精度最大化の間のジレンマは、めったに解決されることがない。 筆者は、提案する決定木に基づく識別器の構築法を提案する。 これは、学習データに対する最高精度を維持しつつ、より複雑な場合に 精度の一般性を高めるというものである。 この識別器は、特徴ベクトルの構成要素から擬似ランダム的に選んだ 部分集合によってシステマティックに構築される複数の決定木からなる。 つまりは、決定木は、ランダムに選ばれた部分集合において構築される のである。 実験により、この部分空間法を、単一木型の識別器および他の林構成法と 比較する。対象は、広く利用可能なデータセットである。この実験により、 提案手法が優れていることを示す。 さらに、一つの林のなかの木々の独立性について論じ、結合型識別器の精度 との関わりについて述べる。

Sz

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


共分散伝搬を用いるブレークポイント検出
Breakpoint Detection Using Covariance Propagation

Qiang Ji and Robert M. Haralick

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 8, August 1998

Keywords: Corner detection, arc segmentation, error propagation.

本稿では、チェイン符号化されたディジタル弧からブレークポイントを 検出するための、新しい統計的アプローチについて述べる。 弧上の点は、以下の条件を満たすときにブレークポイントとされる。 すなわち、その点から左右への弧セグメントにフィットする二つの 直線の推定方向が、統計的に大きく異なるという場合である。 この研究の主な貢献は、二つある。 ひとつは、近似直線パラメータの共分散行列を、解析的に推定する方法を 開発したことである。もうひとつは、各弧点に関連する摂動を特徴づける 摂動モデルを提案したことである。

Sz

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


UAV(Unmanned Aerial Vehicle)画像とビデオにおける人工的領域の識別
Identification of Man-Made Regions in Unmanned Aerial Vehicle Imagery and Videos

J.L. Solka, D.J. Marchette, B.C. Wallet, V.L. Irwin, and G.W. Rogers

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 8, August 1998

Keywords: Region of interest identification, unmanned aerial vehicle, video processing.

本稿では、UAV(unmanned aerial vehicle)における人工的領域の識別のための 低レベル特徴利用についての、我々のグループの最近の研究を詳細に述べる。 我々が試した特徴集合は、古典的な統計特徴である。 たとえば、画素近傍のウィンドウの変動係数や、 局所的に求められるフラクタル次元や、 ウエーブレット境界が存在するときに求められるフラクタル次元など がそうである。 我々は、特徴を識別する我々のアプローチに沿って、この特徴抽出技法を論ずる。 識別に関しては、新しい準パラメトリックな確率密度推定法を用いることについて、 焦点を置いた。 さらに、関心領域を識別する結果について述べる。 これは、最近のUAVテスト飛行の画像集合に基づくものである。

Sz

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


2変数フーリエ記述子による3D表面の表現
Representation of 3D Surfaces by Two-Variable Fourier Descriptors

Ming-Fang Wu and Hsin-Teng Sheu

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 8, August 1998

Keywords: Two-variable 3D Fourier descriptor, surface reconstruction, shape representation, striped lighting.

縞状の光線系から2変数3Dフーリエ記述子を直接に生成する方法を開発した。 提案されるのは、反復型のアルゴリズムであって、これは、軸対称/軸非対称 の対象物についての2変数3Dフーリエ記述子を計算するためのものである。 さらに、収束テストの公式が導かれる。 3D対象物の集合に対して実験を行った結果、 この反復型アルゴリズムの収束は速く、2変数3Dフーリエ記述子による表現 は正確に実行されることが示された。

Sz

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


自動焦点化と焦点からの距離測定(Depth-From-Focus)のための最適な焦点測度の選択
Selecting the Optimal Focus Measure for Autofocusing and Depth-From-Focus

Murali Subbarao and Jenn-Kwei Tyan

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 8, August 1998

Keywords: Focus measure, focusing, autofocusing, depth-from-focus, focus analysis.

受動的な自動焦点機構と 焦点からの距離測定(depth-from-focus)の応用 において、与えられた焦点測度集合から、濃淡ノイズに関して最適 なものを選択する方法について述べる。 この方法は、二つの新しいメトリックに基づいており、この両者は、 異なる焦点測度のノイズ感度を推定するために定義されたも のである。 最初のものは、AUM(自動焦点化の不確かさ測度)であり、 これは、濃淡ノイズと、自動焦点化におけるレンズ位置決めに発生する誤差 都の間の関係を理解するのに役立つものである。 第二のものは、ARMS(自動焦点化の平均二乗)誤差であり、 これは、AUMの改良版であって、関連もきわめて深い。 AUM および ARMS誤差というメトリックは、焦点測度の理論的なノイズ感度解析 に基づいており、両者は単調表現によって関連づけられる。 理論的な結果は、現実およびシミュレーション的な実験により裏付けられて いる。 与えられたカメラにとって、精度が最適となる焦点は対象物によって異なる 可能性がある。これは、焦点の合わされた画像に依存する。 したがって、与えられた集合から最適な焦点測度を選ぶには、その集合の すべての焦点測度を計算することになる。

Sz

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


大規模並列型のデータクラスタリング
Large-Scale Parallel Data Clustering

Dan Judd, Philip K. McKinley, Member, IEEE, and Anil K. Jain, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 8, August 1998

Keywords: Data clustering, mean square error, data mining, image segmentation, parallel algorithm, network of workstations.

ここで述べられるのは、平均二乗誤差を求める計算を大幅に削減できる データクラスタリングを可能とするための、アルゴリズム的拡張について である。 これらの改良は、ワークステーションのネットワーク上で実行されるように 設計された P-CLUSTER と呼ばれる並列なデータクラスタリング・ツールと して結合される。 標準的なテクスチャー画像の教師なしセグメンテーションについての実験がなさ れた。 いくつかのデータセットに対しては、計算量の96%が削減された。

Sz

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


印字特徴を用いる最適フォント認識
Optical Font Recognition Using Typographical Features

Abdelwahab Zramdini and Rolf Ingold

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 8, August 1998

Keywords: Optical font recognition, typographical features, font models, multivariate Bayesian classifier, document analysis, OCR.

大局的な印字特徴に基づく新しい統計的アプローチを提案する。 これは、フォント認識というほとんど考慮されずにいた問題のためのものである。 その目的とするところは、画像ブロックから、テキストの内容に関する知識を 用いることなく、その字面と重みと傾斜とサイズとを識別することである。 この認識は、多変量的なベイズ識別器に基づいており、対象は既知フォント 集合である。 280種類のフォントに対する実験により、このアプローチの有効性 が調べられた。 フォント認識精度は、画像品質がよければ、およそ97%であった。 また、重みと傾斜の認識精度は、99.9%を越えていた。 さらに、ドキュメント言語およびテキスト内容に対するシステムのロバスト性 と、テキスト長に対する過敏さが示された。

Sz

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


サンプル・クェリーを用いるインクリメンタルな学習
Incremental Learning With Sample Queries

Joel Ratsaby

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 8, August 1998

Keywords: Incremental learning, sample querying, nearest-neighbor algorithm, active learning, model selection.

パターン認識の古典的な理論は、以下の仮定を置いている。 すなわち、ラベル付けされた例が、未知クラス条件付き確率密度関数( パターンクラスは、先験的確率にしたがって受動的な方法でランダムに選ばれる) に従って出現するという仮定である。 本稿では、インクリメンタルな最近傍学習アルゴリズムの結果を示す。 このアルゴリズムは、先験的確率に反するが、クェリー・ルールにしたがって、 異なるパターンクラスからサンプルを能動的に選ぶものである。 このクェリー・ベースのアプローチが、受動的バッチ・アプローチをしのぐ 度合いは、ベイズ・ルールの複雑さに依存する。

Sz

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


二つの木の近似的共通副構造の最大を検出するアルゴリズム
An Algorithm for Finding the Largest Approximately Common Substructures of Two Trees

Jason T.L. Wang, Bruce A. Shapiro, Dennis Shasha, Kaizhong Zhang, and Kathleen M. Currey

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 8, August 1998

Keywords: Computational biology, dynamic programming, pattern matching, pattern recognition, trees.

順序付きラベル木とは、 各ノードがラベルをもち、子の探索順序が(もし子があれば)左から右へ と固定されているもののことである。 このような木は、多くの応用分野をもち、ビジョンやパターン認識、 分子生物学、自然言語処理に及ぶ。 順序付きラベル木Tの部分構造が、Tの連結部分グラフとなる条件について 考察する。 二つの順序付きラベル木T1とT2、および整数d(編集距離の閾値)が 与えられたとしよう。 近似的共通副構造の問題とは、T1の部分構造U1と、T2の部分構造U2 とについて、U1がU2の編集距離d以内にあるという条件を満たすもの を見つけることである。 ただし、ここで、 T1の部分構造V1とT2の部分構造V2とについて、これらが距離の 拘束条件を満たし、かつV1とV2のサイズの和がU1とU2のサイズ の和より大きいような、そのようなV1とV2が存在してはならない。 この問題を解くための、DPアルゴリズムを示す。 これは、最速の既知アルゴリズム(ただし、二つの木の編集距離の計算に おいて、共通部分構造として許容される距離が入力木とは独立な定数であ る場合)と同じくらい高速に動作する。 このアルゴリズムの有用性を示すために、 多重RNAの二次構造(これは順序付きラベル木である)のモチーフを発見する という応用について論ずる。

Sz

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.20, No.9


時空上の類似性に基づいた領域統合によるビデオ画像の分割
Spatiotemporal Segmentation Based on Region Merging

Fabrice Moscheni, Sushil Bhattacharjee, and Murat Kunt

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 9, September 1998

Keywords: Automatic spatiotemporal segmentation, object segmentation, region merging, modified Kolmogorov-Smirnov test, weighted directed graph.

ビデオ画像中の物体を見分けるための、時空上での情報を用いた画像の 分割技術を提案する。 この技術では、ビデオ画像中の2つの連続する画像を同時に取り扱い、 画像中の物体を見分けるために、領域統合の手法が用いられる。 最初は、必要以上に現在の画像を細かく分割し、その後、領域統合処理 を繰り返すことで画像中の物体を生成する。 細かい領域の統合は、時空上の相互の類似性に基づいて判断される。 時空上の類似性は、時間と空間の両方の情報を考慮に入れている。 ただし、時間の方により重きをおいて類似性を算出している。 時間上の類似性を算出する手法として、 修正 Kolmogorov-Smirnov テストの手法を提案する。 このテストは、残差分布および動作の媒介変数表示において、 時間上の情報を効果的に用いている。 領域の統合は重み付け有向グラフに基づいて行なわれ、強いルールと弱い ルールの2つのルールを用いた、補グラフによるクラスタリング手法を提 案する。 それぞれのルールは、グラフ中に表現されている自然な構造に対して優位 性を持つように工夫されている。 さらに、そのルールは起こりうるエラーとグラフ中で示される不確実性を も考慮している。 ここで、弱いルールは強いルールの後に適用され、それぞれのルールは交 互に繰り返し用いられる。 また、グラフはそれぞれの繰り返し毎に更新される。 様々な画像に対する実験結果は、提案手法が自動的に画像をそれぞれの構 成要素に分割する可能性を示している。

mNt

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


最小化に基づいたエッジ保存凸平滑化の為の閉形式による解法とパラメータ選択
Close-Form Solution and Parameter Selection for Convex Minimization-Based Edge-Preserving Smoothing

Stan Z. Li

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 9, September 1998

Keywords: Convexity, edge preservation, energy minimization, image smoothing, Markov random field (MRF), maximum a posteriori(MAP), parameter selection, regularization.

最小化に基づいたエッジ保存凸平滑化の解析とパラメータ選択に関する 新しい手法を提案する。 凸平滑化モデルを理想的なステップエッジに適用した場合、全体的な解 は閉形式で導かれる。 閉形式による解を解析することで、 データ中のエッジに対して得られる結果がどの程度最適であるか、 あるいは、 パラメータの値が結果として得られるエッジにどの程度影響を及ぼすか に関する識見が得られる。 そして、得られた識見に基づいて、 エッジに対する望ましい結果を得るための、 パラメータ選択手法を提案する。 また、実験により、この理論の妥当性を示す。

mNt

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


「動画像の構造抽出」の導出:動画像に対する一般的枠組み 第1部 モデリング
Reducing "Structure From Motion": A General Framework for Dynamic Vision Part 1: Modeling

Stefano Soatto and Pietro Perona

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 9, September 1998

Keywords: Visual motion estimation, epipolar geometry, motion decoupling, compensation, fixation, parallax, output stabilization, model reduction.

1つのカメラによる動画像の構造と動作を帰納的に評価する文献は、 明らかに無関係なモデルおよび評価手法を多く含んでいる。 動的システムの導出に関する以下のアイデアに沿って、 これまでに提案されてきた全てのモデルを導き、 また比較することを可能とする枠組みを提案する。 厳しい制約と投影モデルから導かれるその「自然な」動的モデルは、 まず動作の構造(の深さ)を明らかに緩和することによって導かれる。 そして、未知のパラメータは定数のままに放置された関数が導入されている (これまでの)緩和の手法がいかなるものかが探究される。 このような関数を適宜選択することで、我々は文献に示されているモ デルを説明するのみならず、すぐれた関数を導くことができる。

mNt

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


「動画像の構造抽出」の導出:動画像に対する一般的枠組み 第2部 実装と評価実 験
Reducing "Structure From Motion": A General Framework for Dynamic Vision Part 2: Implementation and Experimental Assessment

Stefano Soatto and Pietro Perona

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 9, September 1998

Keywords: Computer vision, structure from motion (SFM), shape estimation, recursive filter, nonlinear implicit extended Kalman filter.

動的モデルに基づいた連続画像からのシーン解析と自動作(ego-motion)の 評価に関しては多くの方法が文献で紹介されている。 全ての手法が「自然」な動的モデルから統一された枠組の中で導かれている にも関わらず、工学の見地から見ると、そこには多くのトレードオフが存在し、 それゆえにアプリケーションや目的に依存した異なる手法が導かれている。 本論文では、 工学者が特定のアプリケーションにとって適切な手法を選択できるように、 それぞれのモデルの特性について、その特徴を見究め、比較を行なうことを目標とし て、 様々な条件下におけるそれぞれの動的モデルから導かれるフィルターの特性を解析し 、 見積もりの精度や、ノイズに対する頑強性、初期状態と視角に対する感度、 低浮き彫りと閉塞の影響、画像の数とサンプル間隔に対する依存性を評価した。

mNt

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


オプティカルフローの新しい定義: 動的シーン解析の為の放射分析と幾何学のキューの統合
Revised Definition of Optical Flow: Integration of Radiometric and Geometric Cues for Dynamic Scene Analysis

Shahriar Negahdaripour

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 9, September 1998

Keywords: Motion vision, optical flow, time-varying image analysis, dynamic visual cues, integration of radiometric and geometric cues.

一般的にオプティカルフローは連続画像中において、 はっきりと観測される画像の輝度パターンの動きとして定義される。 本論文では、幾何学変換の見地からのみオプティカルフローを解釈 することによって生じる欠点を克服する、新しい定義を提案する。 新しい定義では、動的な像における幾何学的、放射分析的な変化を 完全に表現できる。 その定義は、さまざまなシーンのイベントによって誘発されるオプ ティカルフローの一般的な解釈として、より首尾一貫していること を示す。 このことから、時間の異なる像において、幾何学的、放射分析的な キューの両方を統合、統一して取り扱うことを基本とする、動的シ ーン解析における問題の調査に対する一般的枠組を導くことができる。 新しい定義に関して、一般的動画像モデルを含むいくつかのモデル について、オプティカルフローの評価を行なった。 その中で、多くの異なる3次元のシーン情報が、幾何学的、放射分 析的な構成要素によって、オプティカルフローに符合化/復号化さ れることを示す。 また、実画像に対する実験結果をいくつか紹介する。

mNt

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


Minkowski和を用いた凸形状の類似性・対称性測度
Similarity and Symmetry Measures for Convex Shapes Using Minkowski Addition

Henk J.A.M. Heijmans and Alexander V. Tuzikov

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 9, September 1998

Keywords: Similarity measure, symmetry measure, convex set, Minkowski addition, Brunn-Minkowski inequality.

本論文は、 Minkowski和とBrunn-Minkowskiの不等に基づいて定義された 凸形状の類似性、対象性測度に関して、 つまり、 多くの文献に紹介されている輪郭に基づいて考案された測度と異なり、 領域に基づいた測度について論じる。 本論文で考案されている全ての測度は移動に対して不変な測度である。 さらに、これらの測度は回転/複製/反射、もしくはアファイン変換 に対して不変となるように選択できる。 一つの凸多角形ともう一つの凸多角形をある角度以上に回転したもの との混合物は、区分的凸関数となることが示される。 本論文中で示されている結果は、 与えられた測度を効果的に計算するアルゴリズムの開発の基礎を形作っている。 論文中では、様々な実験結果が示される。 本論文では2次元の場合について論じているが、 多くの理論的な結論は、高次元の場合についてもそのまま当てはまる。

mNt

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


臨界点(Critical-Point)フィルターを用いた 制約の無い自動画像マッチング
Unconstrained Automatic Image Matching Using Multiresolutional Critical-Point Filters

Yoshihisa Shinagawa and Tosiyasu Kunii

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 9, September 1998

Keywords: Image matching, multiresolution, nonlinear filters, critical-point filters, singularity, homotopy, image interpolation, morphing, volume rendering.

本論文で述べる画像マッチングの手法は、 全自動モルフィング、物体認識、ステレオ写真測量や立体の再構成など 様々なアプリケーションに適用可能な優れた手法である。 与えられた画像間の最適マッピングは、各解像度の画像における注目点 を抽出する多解像度の非線形フィルターを用いて自動的に計算される。 計算に用いるパラメータは、人間の視覚系に類似した動的な計算によって 完全に自動的に算出され、物体に対する事前の知識は不要である。 異なる2つの視点から物体を見た画像が与えられた場合、中間点を視点と した画像を生成する為にマッチング結果を用いることができる。 また、モルフィングに用いる場合には、本手法では自動的に与えられた 画像を変換するため、2つの画像間の対応点を手作業で特定する必要は無い。 立体の再構成においては、中間画像間の距離が遠く、断面の形状が広く異 なっている場合でも、本手法は断面間の中間画像を高精度に再構築できる。 本手法の有用性と能力は、多くの実験により確認されている。

mNt

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


類似性解析を用いた位置・密度ベースの階層的クラスタリング手法
Location- and Density-Based Hierarchical Clustering Using Similarity Analysis

Peter Bajcsy and Narendra Ahuja

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 9, September 1998

Keywords: Point patterns, clustering, hierarchy of clusters, spatially interleaved clusters, density-based clustering, location-based clustering.

本論文では、点群の階層的クラスタリングに関する新しいアプローチを提案する。 点の位置あるいは点の分離において、クラスタ内の類似性とクラスタ間の非類似 性が満たされる様にグループ分けを行なう、位置・密度ベースの階層的クラスタ リング手法を2つ開発し、他の4つの手法との比較を行なった。 本手法を画像の分割において、 それぞれの点が各領域の重心と平均色を示す2段階のテクスチャ解析に適用した。

mNt

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


混合識別法を用いた手書き中国語のオフライン文字認識
Off-Line Handwritten Chinese Character Recognition as a Compound Bayes Decision Problem

Pak-Kwong Wong and Chorkin Chan

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 9, September 1998

Keywords: Off-line handwritten Chinese character recognition, Chinese language modeling, compound Bayes decision, contextual vector quantization, Chinese word segmentation.

未知画像の全画素に対するCVQ(文脈ベクトル量子化)に基づいた 手書き中国語のオフライン認識系を構築した。 本手法において、それぞれのテンプレートはコードブックとして表現される。 未知画像をテンプレートと照合するに当たっては、それぞれの画素は、 その画素で観測された特徴ベクトルのみならず、周辺画素の特徴量並 びに量子化値をも考慮して、関連するコードブックを用いて量子化される。 各画素で観測される、ストローク数のような構造的情報は、 cellular特徴ベクトルを形作るために抽出される。 中国語の4616語彙と英数字と句読点に対して、 筆記者未制限の場合に平均77.2パーセントの認識率であった。 そこで、システムの認識性能を向上させるのに効果的な、後処理における3つ の統計的言語モデルについて検討を行なった結果、その中では、CVQによる言 語モデルが最も効果的であり、認識率を平均で10.4パーセント向上させること ができた。

mNt

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.20, No.10


パラメトリックな幾何学/照明モデルを利用した効果的な領域追跡
Efficient Region Tracking With Parametric Models of Geometry and Illumination

Gregory D. Hager, Member, IEEE, and Peter N. Belhumeur

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 10, October 1998

対象物がカメラ視野内を移動することにより,物体のイメージは劇的に 変化する場合がある. この場合の変化とは,単に物体が並行移動することによるものだけではなく, 物体の姿勢や,光源との関係や,隠蔽などがあり,こうしたことが問題を 難しくしている. 本論文では,これらの問題を扱うための,効果的で一般的な枠組み について説明する. まず最初に,姿勢変化によって生じる幾何学的歪みを扱う方法として, 計算能率の高いものを示す. このアルゴリズムは,照明変化のための調整なしで追跡するのに必要な 計算量だけで,大画面領域を追跡するものである. 最後に,強健な統計量に基づく技術によりこれらの方法を強化して, 物体の隠蔽領域を統計的孤立点として取り扱う. ライブビデオシーケンスにおける実験データを使って, 本方法の有効性と効率を示す.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


B−スプラインに基づくスケールスペース
Scale-Space Derived From B-Splines

Yu-Ping Wang and S. L. Lee

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 10, October 1998

よく知られているように,コンピュータビジョンにおける 線形スケールスペース理論は,主にガウスカーネルをベースと している. 本論文では,B−スプラインカーネルをベースとしたスケールスペース 理論について述べる. 我々の目的は2つある.

まず,スケールスペース表現についての一般的な枠組みを与えたうえで, B−スプラインが、様々なスケールスペース表現(連続スケールスペース, dyadicスケールスペースフレーム,そしてコンパクトなスケールスペース表現) をデザインする柔軟なツールをいかにもたらすかを示す。 特に,我々は,連続スケールスペースとdyadicスケールスペースフレーム表現 のデザインを主眼とする. 有理数スケールにおける連続スケールスペースの高速な実現のための 一般的アルゴリズムについて示す. 画像の幾何的情報を解析するための効率的なフレームアルゴリズムを 導出するのに、B−スプライン手法を利用する. さらに,マルチスケールの局所偏導関数によって,画像を合成することが できる. また,いくつかのスケールスペース・アプローチ間の関係について探求する. 特に,従来のスケールスペース・フィルタリングから来るウェーブレット理論の 発展は,B−スプラインによってより良く理解することができる. 第二の目的として,エッジモデルの挙動/完全性のプロパティ/因果関係/ 当該スケールスペース表現のその他のプロパティ等が,B−スプライン の枠組みによって調べられる. ガウシアンカーネルから引き継ぐ良好な特徴に加えて, スケールスペースから得られるB−スプラインは 視覚の仕組みをモデリングするための多くの利点を持つ. それは効率性/コンパクト性/方向特性/そして並行構造といった点である.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


光度空間における曲線方向からのガウス曲率の正負
Sign of Gaussian Curvature From Curve Orientation in Photometric Space

Elli Angelopoulou and Lawrence B. Wolff

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 10, October 1998

純粋に幾何学な定義を用いたガウス曲率の符号(正負)について計算する. 滑らかな表面S上の点pと,点p周辺のγについて考える. 単位標準ガウス球上のγのイメージは新しい曲線βとなる. 点pにおけるガウス曲率は,点pにかかるγと同様にβに囲まれた領域のうちγに 囲まれた領域の割合として定義される. pにおけるガウス曲率の符号は,閉曲線γおよびβの相対的な方向に よって決定される. 我々の方法は,輝度データから該二つの曲線の相対方向を、直接に計算するもの である. また,光度散布プロットを作るための,3つの未知の照明条件を用いる. このプロットは,相互に照明された表面の正規量を含むガウス球単位の部分集合と 一対一の関係にある. このことにより,表面の正規量の復元なしに,ガウス曲率の符号を直接に計算する ことができる. 我々の方法は,反射係数に不変である. 我々は拡散反射を想定しているが,自然の拡散反射は一般的かまたは未知である. シミュレーションイメージにおけるエラー解析により,本方法の正確さが 示される. 同様に,経験的なデータを用いて,本方法の性能を論証する.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


DNAシーケンス分析のためのローカル言語の学習とその応用
Learning Local Languages and Their Application to DNA Sequence Analysis

Takashi Yokomori, Member, IEEE, and Satoshi Kobayashi

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 10, October 1998

本論文は,陽性データによって厳しく局所的にテストすることができると 言われている言語の学習に有効なアルゴリズムに関するものである. また本論文では,アミノ酸シーケンスにおけるa-chain領域蛋白質を識別 する応用についても述べる. 最初に,線形時間アルゴリズムについて示す. このアルゴリズムは,厳しく局所的にテストすることができる言語 において,陽性データのみに制限される決定論的な有限状態オートマトン を学習(識別)するものである. これにより,シーケンス分析の特定のコンセプトドメインを学習するための 実際的で効果的な方法が得られる. 上記で示した学習アルゴリズムを使ったいくつかの実験結果について 示す. あるタイプのアミノ酸シーケンスは局所的にテストできる言語によって 表現可能であることを強く示す理論的考察に従って,本学習アルゴリズムを, ヘモグロビンのアミノ酸シーケンスにおける蛋白質a-chain領域を識別するため に適用する. 実験においては,陽性データの識別で95%,陰性データで96%を 示した.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


陰的多項式正準曲線の決定
The Determination of Implicit Polynomial Canonical Curves

William A. Wolovich, Fellow, IEEE, and Mustafa Unel, Student Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 10, October 1998

カーテシアン座標x,yにおいて、均一で偶数次の陰的多項式(つまり円 錐曲線式の積)によって定義される、閉じた/境界を持つ/フリーフォ ーム曲線を識別し、比較するための新しい方法について述べる. 本方法は,陰的多項式の新しい表現を与えるものであるが、このときの 陰的多項式は.互いに共通の中心(つまり円錐因子の頂点)をもつよう な円錐曲線式の円錐因子の積からなるものである。 同様に,陰的多項式曲線の特異点も定まる. 円錐因子の中心と特異点は,アフィン変換によって直接対応付けられる ものであるという意味で、有用な関連点であることが示される。 特に,当該点の陽的な決定は, 曲線の正準形式と,アフィン等価曲線に関する変換マトリクスとの 両者を意味する.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


三角スプラインを利用した画像からのモデル自動構築と姿勢推定
Automatic Model Construction and Pose Estimation From Photographs Using Triangular Splines

Steve Sullivan and Jean Ponce, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 10, October 1998

本論文では,数少ないシーンから複雑なスプライン・オブジェクトモデル を自動構築する問題について述べる. 我々の方法は, トポロジー不明のオブジェクトのG1連続三角スプライン近似を構築する ために,入力画像から得たシルエットを統合するアプローチをとる. また,モデル化されたオブジェクトの姿勢を単画像から推定する 同様な最適化処理を適用する. いくつかの複雑なオブジェクトについて,モデル構築と姿勢推定の 実験結果を示す.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


パターン認識と公開鍵暗号による安全な識別ドキュメント
Secure Identification Documents Via Pattern Recognition and Public-Key Cryptography

Lawrence O'Gorman, Fellow, IEEE, and Irina Rabinovich

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 10, October 1998

パーソナルな識別ドキュメント,例えば写真IDカード,の 利用がますます増加している.例えば金融業務における制限エリアへの入退出. また,医療/政府/商業活動(特に航空会社)における個人特定などである. このような状況では,これらドキュメントの偽造への対抗もまた必要と なってくる. そこで我々は,パターン認識と公開鍵暗号を用いた写真IDドキュメントの認証 方法について示す.本方式は, 光学ラミネートおよびホログラムのような既存の物理的なカード保護機構 に比べてセキュリティアドバンテージを持つ. 本方式のパターン認識部は,ドキュメント上の写真イメージの簡潔な 表現である写真署名に基づくものである. この写真署名は,遠隔認証時にはDBに保持され,またスタンドアローン 認証時にはカード上の暗号化されたフォームで保持される. IDドキュメントの認証は,写真イメージと,機械可読なテキスト情報フォーム の両者をスキャンして,写真署名を決定し,参照情報と比較することに よって行なわれる. 本論文では,方式についての説明と,ノイズを含む状態での写真-署名照合 を大量データについて実験した結果について示す.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


相補類似寸法を使うグラフィカルなデザインを持つドキュメントヘッドライン のテキストライン抽出と文字認識
Text-Line Extraction and Character Recognition of Document Headlines With Graphical Designs Using Complementary Similarity Measure

Minako Sawaki and Norihiro Hagita, Member, IEEE Computer Society

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 10, October 1998

グラフィカルなデザインの文字を認識する方法について述べる. 背景とテキストラインを分別する新しい射影特徴と,置換照合時の適応 しきい値を導入した. グラフィカルなデザインの新聞見出しで実験し,97.7%の認識率を得た.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


能率的なエラー訂正ビタビパージング
Efficient Error-Correcting Viterbi Parsing

Juan C. Amengual and Enrique Vidal

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 10, October 1998

挿入−削除−置換エラーモデルと有限状態マシンを使った エラー訂正パージング(ECP)課題について述べる. Viterbiアルゴリズムは、ECP実行にそのまま拡張できるが, 多くの応用にはその計算複雑性が壁となりうる. ビームサーチ高速化技術と互換性のあるViterbiライクなECPの能率的な実装を 実現するために,3つのアプローチを提案する. 言語処理と形状認識実験において,本提案手法の性能を示す.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.20, No.11


多層パーセプトロンは、パターン認識や認証に適しているか?
Are Multilayer Perceptrons Adequate for Pattern Recognition and Verification?

Marco Gori, Senior Member, IEEE, and Franco Scarselli

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 11, November 1998

Keywords: Multilayer perceptrons, pattern recognition, pattern verification, function approximation, closed hemisphere problem.

本稿は、典型的なパターン認識・認証問題におけるデータの確率分布を、多層パーセプトロンがモデル化する能力について論ずる。

各素子の出力関数にシグモイド関数を使用し、隠れ素子の数が入力パターン数以下である多層パーセプトロンについては、パターン空間内おいて開いた分離面を形成するため、典型的なクラスタに分割されるパターン分布をモデル化することができないことが証明されている。

入力パターン数より多くの隠れ素子を使用する場合には閉じた分離面を形成し得るが、残念ながら、ある多層パーセプトロンがパターン空間内に閉じた分離面を形成するか否かを明らかにすることはNP困難であることが証明されている。

本稿の主要な結論は、多くの文献において確信され報告されていることとは多少反するものである。つまり、多層パーセプトロンは、入力パターンの受け入れを確実に拒否する必要のあるパターン認識システムへの応用には明らかに向かないということである。特に、パターン認証タスクへの応用には向かない。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ガウス混合モデリングに対するベイズ流のアプローチ
Bayesian Approaches to Gaussian Mixture Modeling

Stephen J. Roberts, Member, IEEE, Dirk Husmeier, Iead Rezek, Member, IEEE, and William Penny

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 11, November 1998

Keywords: Cluster analysis, unsupervised learning, Bayesian methods, Gaussian mixture models.

未知データに適合しているovercomplexモデルに自動的にペナルティを課すベイズ的方法論が提案されている。我々は、ガウス混合モデルを用いて、そのベイズ流アプローチがモデルにおける最適な数の成分を選択し、データセットを分割することができることを示す。ベイズ方式のパフォーマンスについて、最適なモデルを選択するための他の方式との比較を行い、よい結果を出すことを確認する。それらの方式は、模造データセットと実データセットの両方でテストされる。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


階層的ガウス基底関数を用いた輝度と勾配に基づくステレオマッチング
Intensity- and Gradient-Based Stereo Matching Using Hierarchical Gaussian Basis Functions

Guo-Qing Wei, Member, IEEE Computer Society, Wilfried Brauer, and Gerd Hirzinger, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 11, November 1998

Keywords: Stereo matching, intensity values, intensity gradients, deformation, scale-space, hierarchical Gaussians, ordering constraint, stochastic gradients, response difference compensation.

本稿において、我々は、輝度と勾配のエラーを同時に最小化することによるステレオ対応法を提案する。

画像勾配の従来の使用法とは対照的に、勾配は、変形された画像空間内で利用される。 たとえ一様平滑の制約が課せられたとしても、それは非特徴領域に対してだけ適用される。

関数最小化における極小解を避けるため、我々は、階層的ガウス基底関数によって視差関数のパラメータを決めることを提案する。我々の最小化の枠組において、単一性と順序づけの制約は容易に課せられ得る。さらに、我々は、視差マップとカメラの応答差のパラメータを同時に推定する方法を提案する。

様々な現実のステレオ画像を用いた実験により、我々のアルゴリズムのロバストな性能を示す。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


Steering(方位選択)、Quadrature(求積)、そして規模によるプリミティブ特徴
Primitive Features by Steering, Quadrature, and Scale

Tyler C. Folsom, Member, IEEE, and Robert B. Pinter, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 11, November 1998

Keywords: Edge finders, orientation, steerable filters, quadrature filters, Gabor functions, visual cortex, silicon retina.

哺乳類の脳の視覚皮質におけるニューロンのインパルス応答は、古くから知られている。これらをフィルターとして使用する方法は、多くの仮説へと到達してきた。単一フィルターの応答はあいまいである。なぜなら、その結果は刺激の型、明暗、位置、方位や規模によるためである。

我々は、個々のフィルターの2D応答を明確化できるように、離れた位置でquadratureフィルターのセットが構築され得ることを示す。エッジを抽出することが目下の研究の目標ではなく、我々は適切なエッジを抽出しようと努めている。それゆえ、我々は、局所画像パッチが主にエッジまたはバーにより、関心の大きさに応じて構成されていると仮定する。 このパッチが五つまたは七つの方位(選択性)フィルターによって処理されるとき、一つはその特徴の正確な方位と重心位置を計算することができる。フィルターのセットが二つの異なる規模で適用されたとき、リッジとエッジを区別することと、極性、輝度そして幅を識別することが可能である。また、角や小塊を見つけることも可能である。

これらの計算は、位置や方位に関する画像の移動変化について安定であり、サブピクセル解像度になり得る。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


RIEVL: 手のジェスチャー認識における再帰的な帰納学習
RIEVL: Recursive Induction Learning in Hand Gesture Recognition

Meide Zhao, Francis K.H. Quek, Member, IEEE, and Xindong Wu, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 11, November 1998

Keywords: Hand gesture, hand pose recognition, rule-based induction, feature detection, feature selection, disjunctive norm form, machine learning, variable-valued logic.

本稿では、多値特徴を伴う分離的な一般形表現の手のポーズモデルを獲得することができる、再帰的な帰納学習のしくみを提案する。拡張された可変値論理に基づいて、ルールに基づく我々の帰納システムは、分類のセットを記述するいかなる特徴ベクトルのセットからでも簡潔なルールセットを抽出することができる。

完全性や整合性の条件を満たすそのルールの基礎は、五つの発見的方法を通じて帰納され精緻化される。 RIEVLアルゴリズムにおける再帰的帰納学習のしくみは、解空間における極小解を免れるよう設計されている。

本稿では、RIEVLとID3, NewID, C4.5, CN2そしてHCVといった他の帰納アルゴリズムとの性能比較を行う。手のジェスチャーを用いた実験において、そのシステムは、RIEVLアルゴリズムによって得られた分類ルールに基づいて、各ポーズの区別を立てた一般形描写を生成し、異なった手のポーズを識別した。

RIEVLは、他のすべての帰納アルゴリズムより精度良く、我々のテストセットにおけるジェスチャー画像の94.4%を正しく分類した。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


融合を用いた構造や位相の変化による形状進化
Shape Evolution With Structural and Topological Changes Using Blending

Douglas DeCarlo and Dimitris Metaxas

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 11, November 1998

Keywords: Shape blending, shape estimation from range data, shape evolution, deformable models, shape representation

本稿では、まばらまたは不完全なレンジデータから形状を推定するための枠組について述べる。本稿で示す枠組では、融合と呼ばれる形状表現を使用する。そしてそれは、統合されたモデルへの形状の幾何学的結合を考慮する。つまり、選択された形状成分の領域は、切り出され、お互いに接続される。この表現による形状の推定は、物理学に基づいた枠組を用いて実現される、そしてそれは、適合性を改善するため、モデルの構造や位相の適合のさせ方を決定するための過程を含んでもいる。融合による表現は、形状の穏やかな進化を認めることにより、適合化を行っている間のモデルの幾何の急激な変化を避ける手助けをする。そしてそれは、その技法のロバスト性を向上させる。

我々は、構造的にも位相的にも複雑な物体を与えられたレンジデータから、構造化された表現を自動的に抽出する能力を示す一連の実験を用いてこの枠組みを示す。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


まばらな3Dデータからの、統合された表面、曲線、そして交点の描写の推測
Inference of Integrated Surface, Curve, and Junction Descriptions From Sparse 3D Data

Chi-Keung Tang, Student Member, IEEE, and Gerard Medioni, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 11, November 1998

Keywords: Segmentation and feature extraction, integrated shape description, surface orientation discontinuity, surface and curve extremality.

我々は、ステレオまたは3Dデジタル変換機から得られる3Dデータセットの描写に関心がある。我々はそれゆえ、まばらな点のセットを入力すると、正確な方位情報が連想されるかもしれないということについて検討する。

本稿において、我々は、表面、3D曲線、そして交点のような、統合された高度な描写をまばらな点のセットから推測する問題に取り組む。 GuyとMedioniによって提案された方法は、滑らかな構造に対してすばらしい結果を出す一方、表面の方位不連続性を抽出するだけで、それらの位置を特定することはしない。正確な位置測定のため、我々は、表面、曲線、そして交点がお互いに作用する、繰り返しではない協調アルゴリズムを提案する。初期の推定は、GuyとMedioniによる方法に基づいて計算される。そしてそこで、稠密な突状マップを作り出すために、まばらでノイズがあるかもしれない与えられた点のセットの各点と事前に決められたベクトルマスクとの畳み込みが行われる。これらのマップは、初期の表面と曲線抽出のため、最終的な表面と曲線を抽出する我々の新しいのアルゴリズムに対する入力として働く。これらの初期の特徴は、興奮性や抑制性の場を使用することによって、精緻化され統合される。その結果、交差する表面(曲線)はそれらの交差曲線(交点)に応じて正確に融合させられる。

実データセットと同様のいくつかの模造データセットに対する結果が示される。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


多様なスケールの相対するカラー表現を用いた対称性のモデル化とクラス分類
Modeling and Classifying Symmetries Using a Multiscale Opponent Color Representation

Bea Thai, Student Member, IEEE, and Glenn Healey, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 11, November 1998

Keywords: Symmetry, Gabor filter, opponent, multiscale, color, texture, recognition, opponent color, image retrieval.

多様なスケールの新しい対称特徴は、カラーテクスチャに対して、有用な高水準の表現を与える。これらの対称特徴は、方位の傾きや大きさに選択性のあるフィルターの出力から計算される複素モーメントを使用するカラー画像の帯域内で決定される。

我々は、これらの特徴は対称性の情報を表現するだけでなく、回転、大きさや照明の状態に対して不変であることを示す。カラー帯域で計算された特徴は、人間の視覚における相対過程メカニズムに基づいている。

この特徴セットの性能を表すため、テクスチャの分類や検索に対する実験結果が与えられる。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


二段階EMアルゴリズムによるグラフマッチング
Graph Matching With a Dual-Step EM Algorithm

Andrew D.J. Cross and Edwin R. Hancock

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 11, November 1998

Keywords: EM Algorithm, graph-matching, affine geometry, perspective geometry, relational constraints, Delaunay graph, discrete relaxation.

本稿では、2Dの点のセットにおける幾何学的構造のマッチングに対する新しいアプローチについて述べる。

新しい特色は、変形幾何を推定するタスクと、対応点の適合を識別するタスクとを統合することである。統合は、対応の適合を表す二部からなるグラフ上で混合モデルを構成することと、EMアルゴリズムを用いて最適化に作用することによって実現される。

我々のEMの枠組みに従って、構造的な対応の確率は、変換パラメータの最尤推定に使用される望ましい尤度関数への寄与をコントロールする。これらのゲーティング確率は、グラフ中の適合された近傍の整合性を示す。変形幾何の回復と確かな対応の適合は、望ましい複素尤度関数に対する対の更新演算を適用することによって、交互に行われ、実現される。

この方法において、その二つの過程は、お互い独力で処理が進む。これは、構造的な例外を拒否する手段をもたらす。

我々は、その技術を二つの現実の問題について評価した。一つ目は、3.5インチフロッピーディスクに対する異なる視点での見えのマッチングを要件とする。二つ目の例は、線分走査サンプリング過程の激しい半円形のひずみに左右される、航空写真上のデジタルマップのマッチングによって与えられる。我々は、模造データに基づいた感度研究で、これらの実験を補足する。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


迅速なシーン分析のための、saliencyに基づいた注視モデル。
A Model of Saliency-Based Visual Attention for Rapid Scene Analysis

Laurent Itti, Christof Koch, and Ernst Niebur

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 11, November 1998

Keywords: Visual attention, scene analysis, feature extraction, target detection, visual search.

霊長類の初期視覚システムの神経組織構造と行動によって喚起される、視覚の注視システムが示されている。多様な大きさの画像特徴が、単一の構造的saliency(突出部)特徴マップに合成される。その後、saliency(突出部)を減らす順に、動的ニューラルネットワークが注視位置を選択する。

そのシステムは、効果的な計算方法で、目につきやすく詳細な分析を必要とする位置を迅速に選択することによって、複雑なシーン理解の問題を分解する。

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


脳表面の曲線形状の動的計画生成
Dynamic Programming Generation of Curves on Brain Surfaces

N. Khaneja, M.I. Miller, Senior Member, IEEE, and U. Grenander

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 11, November 1998

Keywords: Brain mapping, deformable templates, curve generation.

マカクやビジブルヒューマンの大脳新皮質上における極端な曲率の曲線や測地線の最短距離を自動的に生成する目的で、動的計画法が提案されている。曲線変動の確率モデルは、Frenet表現における速度、曲率やねじれ率に関する変数に基づいて構築される。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


3D物体認識に対するロバストなアフィン構造マッチング
Robust Affine Structure Matching for 3D Object Recognition

Todd A. Cass

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 11, November 1998

Keywords: Object recognition, geometric feature matching, pose recovery, alignment method, affine structure, model indexing, computational geometry.

我々は、モデルに基づいた物体位置測定について検討する。これは、モデルと画像データ間の局所幾何特徴マッチングに基づくものである。その方法は、幾何学的な状態分析に基づいており、変換空間内で作用する。我々は、多項式時間内での全ての実現可能なマッチングの発見を保証する正式な方法を提案する。そこから我々は、正式な方法の伝統的な近似に基づく、より計算のしやすい現実的な方法を発展させる。

さらに、我々の形式主義は、物体位置測定、アフィンモデルの索引づけ、そして様々な見え方からの構造をお互いに結び付けている。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


手書き文字認識における(状態)持続期間が可変のHMMに対する代替手段
Alternatives to Variable Duration HMM in Handwriting Recognition

Amlan Kundu, Yang He, and Mou-Yen Chen

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 11, November 1998

Keywords: Variable duration HMM (VDHMM), path discriminant HMM (PD-HMM), model discriminant HMM (MD-HMM), nonergodic HMM (NEHMM), variable sequence length HMM (VSLHMM), adaptive length Viterbi algorithm (ALVA).

VDHMM法とPD-HMM法を用いた精度のよい手書き文字認識システムの実現は容易である。本稿の主題は、もし(状態)持続期間が統計的に計算できたら、それをよりよい実験結果のためのMD-HMMアプローチの実現に向けて適用できることを示すことである。本稿では、PD-HMMに基づくHWRシステムについても述べる。この方法では、(状態)持続期間は統計的に陽には計算されないが、それでもその結果はVDHMMに基づくHWRのしくみに匹敵する。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.20, No.12


初期視覚に対する可変ウィンドウアプローチ
A Variable Window Approach to Early Vision

Yuri Boykov, Member, IEEE, Olga Veksler, Student Member, IEEE, and Ramin Zabih, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 12, December 1998

Keywords: Index Terms-- Image restoration, motion, stereo, adaptive windows, visual correspondence.

初期視覚は、平滑化や対応の計算のようなタスクを行うための方形窓に大きく影響される。方形窓は有効ではあるが、近接した物体の境界に対する結果はよくない。

我々は、その形が画素ごとに変化するという前提の下で、任意の形で接続された窓を選択するための効果的な方法について述べる。我々のアプローチは、画像復元や視覚的対応などいくつかの問題に適応することができる。この方法による処理時間は線形であり、従来のベンチマーク用画像に対する処理時間は数秒である。

模造画像と実画像の両方に対するその性能は、高いと思われる。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


個人識別のための顔と指紋の統合
Integrating Faces and Fingerprints for Personal Identification

Lin Hong and Anil Jain, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 12, December 1998

Keywords: Biometrics, fingerprint matching, minutiae, face recognition, eigenface, decision fusion.

指紋または顔をそれぞれ単独で用いる自動個人識別システムは、要求される性能をしばしば満たすことができない。顔認識は高速であるが、信頼性があまり高くない。 一方、指紋認証は確実であるが、データベースの検索において非効率的である。

我々は、顔と指紋を統合した生体計測の試作システムを発展させてきた。そのシステムは、顔認識システムの限界を指紋認証システムと同程度にまで改善する。統合された試作システムは、容認できる応答時間で識別を行う。そのシステムによる識別は、顔認識システムによる識別より信頼性がある。さらに、提案する融合的な判定のしくみは、異なる信頼度で複数の手がかりを統合することによって性能の改善を可能としている。

実験結果は、我々のシステムの性能が大変よいことを実証している。それは、応答時間について、要求される性能を満たす。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


凸多重解像度分析
Convex Multiresolution Analysis

Patrick L. Combettes, Senior Member, IEEE, and Jean-Christophe Pesquet, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 12, December 1998

Keywords: Multiresolution analysis, convex sets, hierarchical signal analysis, nonlinear filter banks, projections.

標準的なウェーブレット多重解像度分析は、ある特性を処理する閉じたベクトル部分空間の単調数列への射影数列によって定義され得る。

我々は、この枠組みの非線形な拡張を提案する。 提案法において、ベクトル部分空間は、凸の部分セットによって置き替えられる。これらのセットは、再帰的で単調な近似のしくみを生成するように選択される。 そのしくみは、調査されるべき様々な信号や画像の特徴を見越しておくというものである。

凸多重解像度分析のいくつかの種類について議論がなされる。 そして、信号処理や画像処理の問題に対する数値の上での応用が示される。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


MCMC法を用いたベイズ関数学習
Bayesian Function Learning Using MCMC Methods

Paolo Magni, Riccardo Bellazzi, and Giuseppe De Nicolao, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 12, December 1998

Keywords: Bayesian estimation, smoothing, inverse problems, system identification, Markov chain Monte Carlo methods, dynamic systems.

本稿は、ノイズの大きい離散サンプルから連続一次関数を再構成する問題を扱う。サンプルが、その関数(線形逆問題、逆畳み込み)に適用された線形オペレーターの出力かもしれないという意味で、その方法は間接的でもあるかもしれない。いくつかのケースでは、その線形オペレーターは、二回目の試行から推定される未知パラメーターを含むことさえ可能である。(識別-逆畳み込み、合同の問題)

ベイズ推定は、この種の問題の統一された処理を生成する。しかし、事後密度の実際の計算は、解析的には処理しにくい積分へと至る。

本稿では、MCMC(マルコフ連鎖モンテカルロ)シミュレーションのしくみを利用することにより、正確なベイズ解法を効率的に実行することが可能であることが示される。特に、その問題の構造が、計算や収束に関する性能を改善するためにどのように利用され得るのかということが議論される。

提案するしくみの有効性が、IVGTT(静脈ブドウ糖吸収テスト)データの分析に対してと同様に、二つの古典的なベンチマーク問題に対して実証される。IVGTTは、静脈ブドウ糖注射の投与に伴うインシュリンの分泌割合の推定にかかわる複雑な識別-逆畳み込み問題である。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


グローバル/ローカル アフィン変換を用いた手書き文字の適応的正規化
Adaptive Normalization of Handwritten Characters Using Global/Local Affine Transformation

Toru Wakahara, Member, IEEE, and Kazumi Odaka, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 12, December 1998

Keywords: Adaptive normalization, deformation model, global and local affine transformation, weighted least-squares criterion, distortion-tolerant shape matching.

手書き文字に対する伝統的な正規化法は、(文字の)カテゴリに無関係なため、前処理演算としての限界がある。本稿では、適応的またはカテゴリに依存する正規化法を発表する。 それは、一般的な変形モデルのように階層的仕様のグローバル/ローカル アフィン変換(GAT/LAT)を用いて、各参照パターンと比較して入力パターンを正規化するものである。さらに、正規化の規準は、各参照パターンと正規化された入力パターン間の最近傍距離の平均の最小化として明確に定義される。上述の規準に従って、最適なGAT/LATが、重み付き最小二乗法の反復使用によって決定される。

矩形型の参照パターンに対して、36人の筆記体による漢字、かな、そして英数字を含む3171文字カテゴリの入力パターンを用いた実験は、提案方法が同じカテゴリ中の手書きによる非常に大きな変動を吸収するだけでなく、その識別能力もまたカテゴリの異なる類似形状に対する過度の正規化の抑制によって大幅に改善されるということを示す。さらに、前処理のための伝統的な形状正規化法によって得られた比較結果が、カテゴリ非依存正規化に対する提案したカテゴリ依存GAT/LAT正規化の優位性を示すために与えられる。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ガウス過程を用いたベイズ流クラス分類
Bayesian Classification With Gaussian Processes

Christopher K.I. Williams, Member, IEEE Computer Society, and David Barber

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 12, December 1998

Keywords: Gaussian processes, classification problems, parameter uncertainty, Markov chain Monte Carlo, hybrid Monte Carlo, Bayesian classification.

我々は、入力ベクトルをp(c|x)の確率でmクラスのうちの一つに割り当てる問題について考える。 2クラス問題に対して、xを与えられるクラス1の確率は、σ(y(x))によって推定される。ここで、σ(y)=1/(1+exp(-y))である。事前ガウス過程はy(x)上にあてはめられ、新しいxに対する予測を得るためにトレーニングデータと組み合わされる。

我々は、ベイズ流の処理を生成する。 それは、事前ガウス過程を制御するパラメータとyにおける不確実性について積分をとることである。 yについて必要な積分は、ラプラスの近似を用いて行われる。その方法は、ソフトマックス関数を用いて多クラス問題に対して一般化される。

我々は、多数のデータセットに対してその方法の有効性を実証する。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


レンジ画像からの動的スケールによるモデル構成
Dynamic-Scale Model Construction From Range Imagery

Adam Hoover, Member, IEEE, Dmitry Goldgof, Senior Member, IEEE, and Kevin W. Bowyer, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 12, December 1998

Keywords: Range image processing, 3D shape, model construction.

レンジデータからの表面モデルの構成は、生じるモデルの細かさを表す連続的なスケールの、どの点においても始められる。(スケールについての)この連続は、構成パラメータとそのモデルのスケールとを関連付ける。

我々は、異なるスケールでレンジデータを動的に再処理する方法を提案する。単一のスケールからの構成結果は自動的に評価され、ユーザーが決めた規準が満たされないとき、異なるスケールでの再構成が引き起こされる。

我々は、400以上のレンジ画像に対する平面境界表現空間包絡線(a planar b-rep space envelope)(シーン表現の一つ)の構成において我々の方法を実演する。その実験は、指定された要求範囲内のスケールで、100パーセント正確なモデルを構成する能力を実証する。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


画像分析に対するZernikeモーメントの性能について
On the Accuracy of Zernike Moments for Image Analysis

J.Bennett and A.Khotanzad

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 12, December 1998

Keywords: Zernike moments, geometric error, lattice points, circle problem, image reconstruction.

本稿において、我々は、不連続エラーや再構成力の見地から、Zernikeモーメントの性能の詳細な分析を与える。円形領域の幾何学的性質のために、Zernikeモーメントの計算精度には固有の限界が存在することがわかる。これは、円内の格子点の見積もりについての解析的理論における有名な問題に対する精度の結果と関連付けて説明される。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


一般化長距離相関モデルを用いたテクスチャ画像のモデリング
Modeling Textured Images Using Generalized Long Correlation Models

Jesse Bennett and Alireza Khotanzad

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 12, December 1998

Keywords: Long correlation, random fields, autoregressive models, Markov medels, texture analysis, texture synthesis, parameter estimation.

長距離相関(LC)モデルは、モデルパラメータをほとんど使うことなく、大きな画像領域に及ぶ相関をモデル化できるランダム場(RF)モデルの一般的なものである。 LCモデルは、モデルのパラメータを推定するための有効な方法が無かったため、その使用が限られてきた。

本研究において、我々は、このモデルの一般的な形式に対する推定のしくみを発展させ、テクスチャモデリングへの適用に対するその妥当性を実証する。その他のRFモデルと一般化LCモデルとの関係、すなわち、並列自己回帰(SAR)やマルコフランダム場(MRF)モデルとの関係が示される。 SARモデルはLCモデルの特別な場合であることが知られている一方で、我々は、MRFモデルもまたこのモデルに含まれることを示す。

従って、LCモデルはSARやMRFモデルの一般化と考えることができる。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


卓上そしてウェアラブルコンピュータのビデオを用いたリアルタイム米式手話認識
Real-Time American Sign Language Recognition Using Desk and Wearable Computer Based Video

Thad Starner, Student Member, IEEE, Joshua Weaver, and Alex Pentland, Member, IEEE Computer Society

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 12, December 1998

Keywords: Gesture recognition, hidden Markov models, wearable computers, sign language, motion and pattern analysis.

我々は、ユーザーの素手を追跡する一つのカメラを用いた文レベル連続米式手話認識のための、リアルタイム隠れマルコフモデルに基づく二つのシステムを提案する。一つ目のシステムは、卓上カメラでユーザーを観測し、92パーセントの単語精度を達成する。二つ目のシステムは、カメラをユーザーのかぶる帽子に付け、98パーセントの精度を達成する。(文法の制限なしで97パーセント)

どちらの実験でも40単語の語彙を用いる。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


曲率尺度空間による画像コーナー(かど)のロバストな検出
Robust Image Corner Detection Through Curvature Scale Space

Farzin Mokhtarian and Riku Suomela

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 12, December 1998

Keywords: Low-level processing, feature extraction, corner detection, multiscale analysis, curvature scale space, Canny edge-detector.

本稿では、曲率尺度空間(CSS)表現に基づく、画像コーナーを検出するための新しい方法について述べる。

最初のステップは、Cannyエッジ検出器を用いてもとの画像からエッジを抽出するというものである。 画像コーナーの点は、エッジの曲率の絶対値が最大となる点として定義される。コーナーの点は、尺度の細かいCSSで検出され、位置の正確性を改善するために、より荒い多様な尺度で追跡調査される。この方法は、ノイズに対して大変ロバストであり、画像コーナーについての既存の検出法よりその性能が優れていることを我々は確信している。 45°と135°のエッジに対するCannyエッジ検出器の応答に関する改善もまた提案される。さらに、通例のコーナーに加えて、CSS検出器は、追加の特徴点(画像の外形エッジの曲率ゼロ交差)を生成することができる。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


手書き文字認識への適用による形状可変パターン認識のためのベイズ流の枠組
A Bayesian Framework for Deformable Pattern Recognition With Application to Handwritten Character Recognition

Kwok-Wai Cheung, Student Member, IEEE, Dit-Yan Yeung, Member, IEEE, and Roland T. Chin, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 12, December 1998

Keywords: deformable models, Bayesian inference, handwriting recognition, expectation-maximization, NIST database.

変形モデルは、近年、形状の大きな変形を処理するその能力のため、多くのパターン認識への適用が提案されてきた。これらの提案されたアプローチは、パターンまたは形状を可変モデルとして表す。 そしてそれは、モデルを入力画像と適合させるためにモデル自身を変形し、その後、抽出された情報を識別器に入力する。モデリング、マッチング、そして識別という三つの構成部分は、しばしば独立したタスクとして扱われる。

本稿において我々は、モデリング、マッチング、そして形状識別に対する一体化されたアプローチとして、形状可変モデルをベイズ流の枠組へどのように統合すればよいかを検討する。

手書き文字認識は、そのアプローチの発展のためのテストベッドとして役立つ。我々のシステムの使用により、認識は、他の手書きによる変動と同様、アフィン変換に対しても不変である。加えて、正規化パラメータや文字幅などのパラメータの手動設定や前処理が必要ない。さらに、モデルの自由度、部分パーツの検出、そしてスピードアップに対する種々の制約について調べられる。

いかなる識別トレーニングもせずに、ただ23のプロトタイプのみを用いたモデルセットの使用により、我々は、NIST SD-1データセットからの手書きアラビア数字の部分セット(100人の筆者による11,791画像)に対して、リジェクション(拒否)なしで94.7%の精度を達成することができる。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


Coarse-Grain(目の粗い)マシンでの画像特徴抽出の並列化
Parallelizing Image Feature Extraction on Coarse-Grain Machines

Yongwha Chung and Viktor K. Prasanna, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, No. 12, December 1998

Keywords: Image processing, parallel algorithms, message-passing machines, MIMD machines, parallel implementations.

本稿において我々は、目の粗いMIMDマシンでの特徴抽出のための高速な並列アルゴリズムを提案する。各ノードにおいてアルゴリズムのスレッド(道筋)を保持することにより、我々のアルゴリズムは、演算装置の利用度を高め、大きなスピードアップを得る。 1,024 x 1,024の画像が与えられたとき、我々の方法は、32ノードSP2および64ノードT3Dに対して27.6および56.0のスピードアップが達成され得ることを示す。

S.I.

Copyright (c) 1998 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


[インデックス] [前の年] [次の年]