AbstractClub - 英文技術専門誌の論文・記事の和文要約


[インデックス] [前の年] [次の年]


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.21, No.1


効率的なモデルベースの視覚のためのイメージのサンプリング
Sampling of Images for Efficient Model-Based Vision

Mohamad Akra, Louay Bazzi, and Sanjoy Mitter, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 1, January 1999

Keywords: Sampling, model-based vision, matching under uncertainty, approximate matching, image understanding.

幾何学的な不確かさがある場合の、平面点集合のマッチング問題に は、重要な応用分野がある。それらは、パターン認識、画像理解、 およびロボティックスである。 点集合として、まずは、いわゆるテンプレートに対応するものがある。 その他のものは、散乱する画像に埋め込まれたテンプレートの変形版 の一つあるいはそれ以上を含む(可能性のある)画像に対応する。 この問題について重要な進歩が重ねられてきており、種々の多項式時 間アルゴリズムが提案されてきた。 本稿では、マッチング結果の品質の低下させることなく、2ー6 ファクター(イメージで一般的に起こる)によって前景点の数nを 減らすことで、線形時間でイメージをサンプリングする手法を示す。 直接的にもたらされる結果は、時間節約という効果であり、O(n^p)の マッチングアルゴリズムに対して、2P-6Pファクターである。 この結果は、利用可能なマッチングアルゴリズムのかなり大きいクラス について、当てはまる。

SR

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


画像セグメンテーションのためのゲーム理論的統合
Game-Theoretic Integration for Image Segmentation

Amit Chakraborty, Member, IEEE, and James S. Duncan, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 1, January 1999

Keywords: Image segmentation, integration, game theory, boundary finding, region-based segmentation, MRF.

画像構造のロバストなセグメンテーションは、いろいろな画 像解析問題に欠くことができない。 しかしながら、従来手法である、領域ベースのセグメンテーション および勾配ベースの境界検出法は、画像品質が低下するとうまくい かなくなる。 ここで提案するのは、ノイズと貧弱な初期化処理とに対してロバス トな統一アプローチを形成するにあたり、ゲーム理論を使って両者 を統合するという方法である。 この方法は、エッジ・データを用いて得られる完全な境界情報の知 覚概念と、二つの計算モジュールを用いて得られる、濃淡レベルの 均質性よりも重要な形状とを結合する。 この方法の新規性は、これが双方向性の枠組であるがゆえに、両計 算モジュールが相互に情報共有できるため、それぞれの結果が改善 するという点にある。 新しいアプローチを評価するために、合成データセットおよび実デ ータセットを対象にして、多くの実験がなされた。そして、この統 合的方法が、従来の勾配ベースの境界検出法よりもよいことが示さ れる。

SR

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


制約された陰的多項式を用いる曲線・曲面当てはめ
Fitting Curves and Surfaces With Constrained Implicit Polynomials

Daniel Keren and Craig Gotsman

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 1, January 1999

Keywords: Implicit polynomials, fitting, free-form shapes, toplogical integrity, starshaped curves and surfaces, positive polynomials.

2D/3Dデータセットに陰的多項式を当てはめるときに、 よく取り上げられる問題として、データセットが単純であるにもかか わらず、望ましくない現象を示すということがある。望ましくない現象 とは、たとえばループ、孔、外来要素などである。 この問題に対して、これまでの研究の取り組み方は、ヒューリスティ ックなコスト関数を最適化するというものであった。この方法は、 フィットにおける位相的問題の幾つかに、ペナルティーを課すもので ある。 この論文で提案するのは、これとは異なったアプローチであり、 多項式に関して、そのゼロ集合がある特定の位相的性質を満たすこと を保証されるような、そのような多項式のパラメータ化された族を設 計するというものである。 すなわち、多項式に関して、そのゼロ集合が、データを囲む楕円を横 切らないか、あるいはそのような楕円に完全に含まれるかが保証され るような、そうした多項式のみならず、星形のゼロ集合を有する多項 式をも加えて、これらの族を作るのである。 これは、処理に失敗して病理的なゼロ集合をもたらしうるヒューリス ティックスを使うよりも、いっそう厳しい。これらの族をパラメータ 化する能力は、正の多項式をパラメータ化する能力に強く依存する。 これを成し遂げるために、実代数幾何学から得られた、幾つかの強力 な最近の成果を使う。

SR

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


適応的かつ非局所的なフィルタリング: 画像強調のための異方性拡散への高速代替
Adaptive Nonlocal Filtering: A Fast Alternative to Anisotropic Diffusion for Image Enhancement

Bruce Fischl and Eric L. Schwartz

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 1, January 1999

Keywords: Segmentation, diffusion, scale-space, anisotropic diffusion, nonlinear diffusion, filtering, permutation filter, nonlocal filter.

非線形異方性拡散アルゴリズムは、線形フィルタと比較して、画像の 向上において重要な改善をもたらす。 しかしながら、非線形の PDEs を解くための計算コストが多すぎるので、 これを実時間ビジョン応用に供することはできない。 本稿では、新しい画像フィルタリングによって二桁の速度向上がもたら されることを示す。このパラダイムにおいて、適応的に定められるベク トル場が、画像フィルタのための非局所的な適用点を決めることになる。

SR

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


MDLと誤差最小制御点挿入戦略とを結合する自動B−スプライン曲線表現
Automated B-Spline Curve Representation Incorporating MDL and Error-Minimizing Control Point Insertion Strategies

Tat-Jen Cham and Roberto Cipolla

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 1, January 1999

Keywords: B-spline fitting, curve fitting, minimum description length, collapse mechanism, active contour

本稿では、スプライン当てはめを自動的に高信頼度で行う構成を開発 することについての、主な問題について論ずる。これは、これまでの 論文やアルゴリズムには十分にカバーされていないものである。 提案方法は、Bースプラインによる能動的輪郭と、最小記述長(MDL) 原理と、エネルギー削減最大化ポテンシャル(PERM)に基づく新 しい制御点挿入戦略とを結合する。試験結果の比較により、 良いとされている既存の方法の一つをしのぐことを示す。

SR

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


Euler角を用いて3つの弱い遠近法画像から動きを求める線形アルゴリズム
A Linear Algorithm for Motion From Three Weak Perspective Images Using Euler Angles

Gang Xu and Noriko Sugimoto

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 1, January 1999

Keywords: Motion, structure, rotation matrix, Euler angles, epipolar equation, weak perspective projection.

本稿では、3つの弱い透視投影から、Euler角を用いて、動きと構造 を求めるための、新しくてシンプルな線形アルゴリズムについて述べる。 最初に各画像対の epipolar 方程式を決定するが、これは、 画像対のあいだの回転を表す第1、第3のEuler角を決定し、第2の Euler角については未確定なままとする。 次のステップでは、 3つの回転結果を結合して、第2のEuler角、Necker 反転現象まで決定する。 非常に単純な線形アルゴリズムにより、3つの回転 結果を結合して、第2のEuler角、Necker 反転現象まで決定する。 合成の、そして本当のイメージの上の実験的な結果が示される。 退化したケースは論じられる。 プログラムは http://www.cv.cs.ritsumei.ac.jp/noriko/motion.html から ftp で入手できる。

SR

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


投影と順列不変量を計算する代数的・幾何学的なツール
Algebraic and Geometric Tools to Compute Projective and Permutation Invariants

Gabriella Csurka and Olivier Faugeras

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 1, January 1999

Keywords: Uncalibrated stereo, projective and permutation invariants, indexation, projective reconstruction, cross ratio, Grassmann-Cayley algebra.

この論文では、非較正カメラから得られる画像ペアの投影不変量の計 算を研究し、点および/または線の構成に対する投影・順列不変量の 詳細な研究を紹介する。 二つの基本的な計算アプローチとして、代数的アプローチと幾何学的 アプローチとが与えられる。 それぞれの場合に、不変量は、投影空間における計算か、あるいは 画像測度から直接に計算される。 最終的に、それらの投影不変量の組み合わせを開発するのだが、この 不変量は、それぞれの基本構成における幾何学的プリミティブの順列 に対して過敏でない。

SR

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


完全なシーン再構成と探究のための能動的ビジョン
Active Vision for Complete Scene Reconstruction and Exploration

Eric Marchand and Francois Chaumette, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 1, January 1999

Keywords: 3D reconstruction, scene exploration, purposive and active vision, perception strategies.

本稿で扱うのは、3D構造推定と、能動的視覚を用いる静止シーンの探 究についてである。 この方法は、幾何学上の基本の3D構造の最適な 推測を得るカメラ動きを制限する制御された動きアプローチから構造に 基づく。 この方法は、制御動作からの構造検出(structure from controlled motion) というアプローチに基づいており、このアプローチは、一つの幾何学的 プリミティブの3D構造の最適推定を得るために、カメラの動きに制約 を課す。 このアプローチには、考慮されたプリミティブの凝視が含まれるので、 我々は、ロバストな推定を継続的に実行しうる知覚戦略を開発した。 これは、視点選択の基礎として、主に既知・未知領域表現を用いる凝視 計画戦略をもたらす。 このアプローチは、シーンについて、可能な限りの完全な再構成を保証 する。

SR

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


副素自己回帰モデルに基づく手書きの平仮名のオンライン認識
Online Recognition of Handwritten Hiragana Characters Based Upon a Complex Autoregressive Model

Yuichi Nakatani, Daisuke Sasaki, Youji Iiguni, Member, IEEE, and Hajime Maeda, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 1, January 1999

Keywords: Complex autoregressive model, PARCOR coefficient, Hiragana character, online character recognition, cross-validation.

手書き平仮名のオンライン認識方法が、複雑なARモデルに基づいて開発される。 手書き文字の大局的性質がうまくモデルに取りこまれるように、ARモ デルの遅延を拡張し、性能向上のために文字切り出し技術が開発される。 異なる二人の筆記者に対して、よい認識得点が得られた。

SR

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


順序統計量の最適な線形結合を用いる語彙駆動型手書き単語認識
Lexicon-Driven Handwritten Word Recognition Using Optimal Linear Combinations of Order Statistics

Wen-Tsong Chen, Paul Gader, Member, IEEE Computer Society, and Hongchi Shi, Member, IEEE Computer Society

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 1, January 1999

Keywords: Lexicon-driven, handwritten word recognition, linear combination of order statistics, dynamic programming, normalized edit distance, fuzzy integrals.

手書きの単語認識において標準的な方法である、切り出しベース のアプローチ(訳者注:文字切り出しと文字認識を逐次的に行う もの)では、単語仮説の確信度を推定するのに、個々の文字クラ ス確信度スコアを、平均化により結合している。 我々は、文字クラス信頼度スコアを結合する方法として、順序統 計量オペレーターの最適線形結合を生成する方法について述べる。 1,000単語を越える画像に対する実験結果が示される。

SR

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


パターン認識ためのウェーブレット係数からの特徴量抽出
Feature Extraction from Wavelet Coefficients for Pattern Recognition Tasks

Stefan Pittner and Sagar V. Kamarthi

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 1, January 1999

Keywords: Feature extraction, fast wavelet transform, signal interpretation.

この論文では、高速ウェーブレット 変換に基づく新しい効率的な特 徴抽出法が示される。 この論文は、特に、処理パラメーターの評価、あるいは測定された処 理信号のウェーブレット係数から抽出される特徴量を用いる所定の応 用における状態の評価を扱う。 全ウェーブレット係数を用いるパラメーター評価は、冗長となったり、 あるいは不正確な結果をもたらすことが多いので、関心のある処理パ ラメーターに関連するロバストな特徴を計算する前処理ルーチンが強 く望まれる。 提案する方法は、算出されたウェーブレット係数のマトリックスを、 低次ベクトルに等しいクラスタへと分割する。 (信号解釈にとって)重要な周波数帯域を表す列は、より重要でない 周波数帯域を表す列よりも、多くのクラスタを有する。 処理信号の特徴は、結局のところ、クラスタのユークリッド・ノルム によって算出される。 この新しい方法の有効性を検証するために、回転過程における側面い たみ推定(flank wear)問題、および、肺疾患診断のための肺異音認識 問題を取り上げた。

SR

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


実時間エッジ結合のためのVLSIアーキテクチャ
A VLSI Architecture for Real-Time Edge Linking

Amjad Hajjar and Tom Chen, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 1, January 1999

Keywords: VLSI, edge linking, real-time image processing.

本稿では、エッジ結合のための実時間アルゴリズムとそのVLSIによる 実現が紹介される。結合プロセスは、ブレークポイントの方向性とと 弱レベルポイントとに基づいている。 提案されるVLSIアーキテクチャは、nは画像ピクセル列数とすると、 (11n+12)クロック・サイクルの遅延のもとで、1クロック・サイクル あたり、結合エッジマップの1画素を出力する能力を有する。

SR

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.21, No.2


形態学的に拘束されたギブス自由場:テクスチャ統合やテクスチャ解析への応用
Morphologically Constrained GRFs: Applications to Texture Synthesis and Analysis

Krishnamoorthy Sivakumar, Member, IEEE, and John Goutsias, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 2, February 1999

Keywords: Gibbs random fields, mathematical morphology, Metropolis algorithm, Monte Carlo simulation, morphological constraints, size density, statistical inference, texture synthesis and analysis.

画像に存在する幾何学的な拘束を、数理形態学を用いてモデリングする 新しいギブス自由場(GRFs)クラスを提案する。 提案する方法は、『形態学的に拘束されたギブス自由場』と呼ばれ、 画像をサイズ密度を用いて予測する方法である。 統計的手法によってサイズ密度が多重分解されると、ギブス自由場は 多重分解情報を画像をモデリングするために取り込む。 本論文では、ギブス自由場に関する重要な特性が研究され、それに関わる テクスチャ統合やテクスチャ解析についても論じている。 ギブス自由場は、実際的なデータにたいするモデリングにも使用できるため 大変有効な技術である。 また、充分に低温かつ自然条件の下で、ギブス自由場のパラメータの最尤 推定量は、数理形態学の重要なツールであるパターンスペクトラムに近似 する事ができる。 よって、数理形態学を用いて統計推測が簡単に行える。 これを使うことで、既に自然テクスチャの分野で大変良好な結果を得ている、 単純な形態論的ベイズ分類を計算によって設計する事が可能となる。

YS

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


見かけ上の輪郭の変形を利用した、画像系列中の動き推定
Motion Estimation in Image Sequences Using the Deformation of Apparent Contours

Kalle Åström, Member, IEEE Computer Society, and Fredrik Kahl

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 2, February, 1999

Keywords: Motion, surface geometry, silhouette, epipolar constraint.

画像に存在する見かけ上輪郭から、もしくは三次元の未知表面のシルエットから、 カメラの動きを推定する方法を提案する。 一つの画像系列の中では、見かけ上の輪郭部において エピポーラ(表極)拘束 が発生するが、この様な拘束は、各々の画像ペアのエピポーラ接点で得られる。 論文では、最尤推定量にもとづき、動きを正確に計算するアルゴリズムを 紹介する。 まず、輪郭部の軌跡のみから、カメラの動きの初期推定を生成する方法を示す。 さらに、理論的に言えば、動きは一つの輪郭の変形から算出されうることを示す。 本アルゴリズムを、いくつかの実画像系列に対して適用し、ユークリッド 再構成および射影再構成を試みた。 また、全く異なる標準的な特徴基本法で計算した結果と、本動き推定結果 とを比較する。 動き推定はカーブなどのシルエットや見かけ上の輪郭を分類するのにも有効である。 (この様に色々なことができると言う事は)動き推定が大変高度な技術だといえる。 本技術が高精度で安定的である事を示すために、統計的な評価も得た。

YS

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


画像処理プログラムを自動的に発生させる知識ベースシステム
A Knowledge-Based System for Automatic Generation of Image Processing Programs

Regis Clouard, Abderrahim Elmoataz, Christine Porquet, and Marinette Revenu

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 2, February 1999

Keywords: Image processing,artificial intelligence, knowledge-based systems, composition of image processing programs, supervision of a library of programs.

画像処理アプリケーションを自動的に生成するシステムの設計について述べる。 ユーザが画像に対して成されるべきタスクを記述すると、システムは特定の プランを構成するのだが、このプランが実行されると所望の結果が得られる。 この問題に関する我々のアプローチは、演算子ライブラリ管理システム のより一般的な部類に属する。 アプリケーションの生成というのは、ここでは、 既存演算子の選択、パラメータ調整、およびそのスケジューリングを通して、 画像処理列を動的に構築すること、と見なされる。 このようなシステムを開発するために、豊富な知識による解法というモデル と、7つの設計ルールを統合することを提案する。 Borgシステムは、上記の規定にしたがって開発された。 Borgシステムは、黒板モデルを情報源として利用することで、日和見的でイ ンクリメンタルなプランニングを階層的に組み合わせるものであり、 プランニング、評価、および知識獲得の問題を考慮することができる。

YS

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


掃線型細線化アルゴリズムを用いた特徴解析
Feature Analysis Using Line Sweep Thinning Algorithm

Fu Chang, Ya-Ching Lu, and Theo Pavlidis, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 2, February 1999

Keywords: Line sweep, thinning, line sweep thinning algorithm, path, junction, regular region, singular region, intersection set, feature analysis, character recognition.

本稿では、掃線型オペレーションに基づく新しい細線化アルゴリズムを提案する。 掃線(line sweep)とは、線がある特定の事象を通過するときに平面図形を平行板に 分割するプロセスである。 細線化される図形の輪郭が多角形で近似されていると仮定すると、 事象がその多角形の節点に相当し、掃線型アルゴリズムは、 各平板内にあるエッジ・ペアを探索することに相当する。 エッジのペアリングは、regular 領域と交差領域とを検出するのに役立つ。 エッジ・ペアが存在すれば regular 領域であり、無ければ 交差領域である。 本アプローチの大きな特徴は、同一の交差領域に接続する regular 領域を、 同時に検出できることにあり、この様な集合を交差集合と呼ぶ。 このアルゴリズムの出力は、交差集合およびスケルトンである。 いずれも、後段の文字認識のための特徴として使うことができる。 さらに、掃線型アルゴリズムは、スケルトンのみを出力する画素ベース の細線化アルゴリズムと比較して、計算効率の高い方法である。

YS

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


区分回帰モデルの超簡易設計のための決定論的なアニーリング・アプローチ
A Deterministic Annealing Approach for Parsimonious Design of Piecewise Regression Models

Ajit V. Rao, Student Member, IEEE, David J. Miller, Member, IEEE, Kenneth Rose, Member, IEEE, and Allen Gersho, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 2, February 1999

Keywords: Statistical regression, piecewise regression, deterministic annealing, parsimonious modeling, generalization, nearest-prototype models.

区分回帰モデルに関する新しい学習アルゴリズムを提案する。 本方法では、空間的分割の回帰関数を設計するために、決定論的な アニーリング技法を使用する。 CART や MARS に代表される、従来的な空間的分割回帰関数が、 単純な木構造分割および階層的な設計アプローチに制限されているのに対し、 決定論的アニーリングアルゴリズムは、 ボロノイ分割に基づく、より強力な区分構造の結合最適化を図ることができる。 本方法は、任意の超平面境界を扱えるように拡張されうるのは もちろんのこと、通常の CART よりも、一貫して良好なパフォーマンスが 得られるように改良されている。 回帰に関する文献から得た、いくつかの基準的なデータに対して行った 比較テストも載せられている。

YS

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


進化論的プログラミングと最小記述長原理を用いるベイジアン・ネットワークの データ・マイニング
Using Evolutionary Programming and Minimum Description Length Principle for Data Mining of Bayesian Networks

Man Leung Wong, Member, IEEE, Wai Lam, Member, IEEE, and Kwong Sak Leung, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 2, February 1999

Keywords: Evolutionary computation, Bayesian networks, unsupervised learning, minimum description length principle, genetic algorithms.

記述長最小定理(MDL)と進化論的プログラミング(EP)を用いて、ベイジアン・ ネットワーク構造を学習するための、新たなアプローチ(MDLEP)を開発した。 本アプローチでは、MDL測度を使用している。これは、 情報理論ではしばしば登場し、探索プロセスを最適化するために、知識指導 型の遺伝的演算を統合するものである。

YS

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


スキャンされた文章から文字正解を自動的に発生させる閉ループ的方法
An Automatic Closed-Loop Methodology for Generating Character Groundtruth for Scanned Documents

Tapas Kanungo, Member, IEEE, and Robert M. Haralick, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 2, February 1999

Keywords: Automatic real groundtruth, document image analysis, OCR, performance evaluation, image registration, geometric transformations, image warping.

スキャンされた実文書画像に対する文字正解は、OCRシステムの性能 評価、OCRアルゴリズムの学習、および文書劣化の確認を行う上で重要である。 残念ながら、実スキャン文書画像から、手作業で文字正解を正確に収集する のは現実的とは言えない。というのも、 (1)文字の外接矩形の描画を正確に行うのは難しく、 (2)きわめて骨が折れる仕事であって時間もかかり、 (3)このような労働に対して払わなくてはならない金額が大きすぎる からである。 本論文では、スキャンされた文書の文字正解を、閉ループ的方法で大変正確に 集める技術について紹介する。 まずは、植字的言語(訳者注:LaTeXを使っている)を使って、理想的な 文書を作成する。次に、その理想的文書の文字正解をつくる。 さらに、その文書を出力してコピーしたものをスキャンする。 登録アルゴリズムは、大局的な幾何変換を推定し、ロバストな局所画素マッチング により両者の整合をとる。 最後に、文字正解は、理想的な文書画像と関連づけられた文字正解が、 推定された幾何変換を用いて変換され、これによってスキャン画像の 文字正解がつくられる。 本方法は非常に汎用的で、いずれの言語、フォントスタイルにも使用できる。 我々は Fax 文書画像と英語、ヒンズー語に対して、本方法で文字正解 を作成するデモを行った。 文字正解を作るためにかかるコストは、本方法を用いれば最小限ですむ。

YS

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


筆記体認識のための選択的な特徴間結合
Selective Feature-to-Feature Adhesion for Recognition of Cursive Handprinted Characters

Cheng-Yuan Liou, Member, IEEE, and Hsin-Chang Yang

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 2, February 1999

Keywords: Handprinted character recognition, topological order, receptive field, Hopfield network, subgraph matching, signature recognition, cell-cell adhesion, selective attention.

筆記体パターンから得られる標本特徴の集合を用いると、 構造的特徴と構造的特徴との結合配置を自然に構成することができる。 これらの特徴は、局所ストロークにおいて最大限にフィットする曲がった楕円 を用いて得られる。 この配置は、非対称という困難さを解決するために、無向グラフへと変換される。 このグラフに関するコンパチビリティーは、さらに改良ホップフィールド型 ネットワークへと定式化される。 この定式化では、特徴間の類似性および特徴結合間の類似性が、コンパチビ リティーへと取り入れられる。 我々は、 手書きパターンにおける部首を全体として認識させるために、このネットワーク を操作して、選択的な注意集中というタスクを実現する。

YS

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.21, No.3


ベイズ識別器のための最適な逐次型実験の設計
Designing Optimal Sequential Experiments for a Bayesian Classifier

Robert Davis and Armand Prieditis

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 3, March 1999

Keywords: Machine learning, Bayesian classifiers, experimental design.

計算パワーが増大するにつれて、実験設計におけるトレンドは、 計算量の少なさを要求する技術から、 計算量を増してでもよりよい結果をもたらす技術へと移ってきた。 本稿は、実験設計のための三つの新しい方法を提供することで、 このトレンドを継続させるものである。 まず、実験設計における従来研究の要約を与え、これによって、 いかにこれらの新しい方法が、それまでの規準を一般化し、 従来よりも正確な解析を与えるものであるかを示す。 実験結果の生成において、第一の方法が、実験結果の不確かさを最大化する ことによるのに対して、他の二つの方法は、パラメータ関数の分散近似値を 最小化することに依拠している。 第三の方法は、分散を決めるのに計算量の多い離散近似を用いる。 これらの方法は、ロジスティック・モデルとベイジアン識別器とを用いて テストおよび比較がなされる。 その結果が示すのは、より多くの計算量を費やすことで、 ベイジアン識別器の決定境界の不確かさをより効果的に減ずる実験設計 が生成されるということである。

Sz

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


疎な画素ベクトル化:アルゴリズムと性能評価
Sparse Pixel Vectorization: An Algorithm and Its Performance Evaluation

Dov Dori, Senior Member, IEEE, and Wenyin Liu

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 3, March 1999

Keywords: Vectorization, line tracking, sparse pixel vectorization, polygonal approximation, performance evaluation.

正確で効率的な線図形ベクトル化は、高次レベル処理にとって不可欠である。 ここでは、細線化が不要な『疎な画素ベクトル化アルゴリズム(SPV)』を示す。 SPVは、wire's 黒画素領域に沿って全ての点を訪れるのではなくて、 選ばれた芯点のみを訪れるという意味で疎である。 その結果として得られるのが素のままの複数の直線であり、これが 冗長点の除去による多角形近似を通して精緻化されるのである。 画素を調べる処理が疎であり、さらには特殊なデータ構造を用いているため、 我々が提案する性能評価基準で評価する限り、SPVは、時間効率がよく正確 だといえる。

Sz

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


マルコフ・ランダム場を構成するパラメータの推定
On the Estimation of Markov Random Field Parameters

Carlos F. Borges, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 3, March 1999

Keywords: Markov random fields, parameter estimation.

ここでは、マルコフ・ランダム場に関するパラメータを推定するために 提案された方法であるヒストグラム法について調べる。 この方法は、ヒストグラム・データから得られる局所相互作用和の推定 に依拠している。 これらの量に対し、明確な意味で最適である推定法を導出する。 さらには、ヒストグラム法の最終ステップがである最小二乗問題の解法が、 方程式の選別をしないときに期待されるものよりも、実質的には高速と なりうることを示す。 また、重み付き二乗問題についても調べることで、データ量が少数の場合 にもよりよい推定法となりうることを示す。

Sz

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


コーナーを伴う凸集合の推定
On the Estimation of a Convex Set With Corners

Peter Hall and Berwin A. Turlach

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 3, March 1999

Keywords: Circular data, diagnostic, kernel, laser radar, robotic vision, smoothing parameter, spline, support function.

レーザー探知測定を用いるロボット・ビジョンにおいて、コーナーを 伴う凸集合のノイズ・データは、その集合の台関数に基づいて導出される。 コーナーは、製造物の隣接辺を表し、その製造物の形状に関する重要な 情報を意味する。 しかしながら、集合推定の単純な方法として、たとえばランダム多角形や 滑らかな集合の当てはめる方法は、アルゴリズムの人工品(artifact) である余分なコーナーを付加するか、あるいはコーナーを滑らかな曲線に より近似するかのいずれかとなる。 とはいえ、コーナーというのは、集合解釈において特別な重要性を有する ものであるから、推定手続きの人工品(artifact)として導入されるべきも のではない、ということには議論の余地があるかもしれない。 本稿では、コーナー診断アプローチを提案する。

これは、以下の3つのステップからなるアルゴリズムである。

(a)コーナーの数と位置とを同定し、

(b)コーナー間の滑らかな曲線を当てはめ、

(c)滑らかな曲線とコーナーとを継ぎ合わせて、凸集合の全体推定を生成する。

コーナー検出ステップは、パラメトリックがふさわしく、 その台関数の高次導関数における変化点を検出することに基づくのだが、 それにもかかわらず、コーナー位置のn根(root-n)の一致推定量を生成する。 いっぽう、滑らかな曲線を当てはめるステップは、全くのノンパラメトリックである 。 継ぎ合わせのステップは、これらの二つの異なるアプローチを一つの 実用的方法にするものである。

Sz

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


多重画像の位置合わせと、そのモザイク化およびレンズ歪み補正への応用
True Multi-Image Alignment and Its Application to Mosaicing and Lens Distortion Correction

Harpreet S. Sawhney, Member, IEEE, and Rakesh Kumar, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 3, March 1999

シーンの画像が複数あるとき、これらは、2D/3Dビュー変換と 線形/非 線形カメラ変換とを通じて、互いに関連づけられる。 これらの変換を計算す る従来技術において、特に濃度勾配に直接的に依拠する ものである場合、一 つの画像とその座標系は理想的であって歪みがないものと の仮定が置かれる のが常であった。 本稿では、真の多重画像位置合わせのためのアルゴリズム を示す。 これは、歪みなし参照画像の測定値には、全く依拠しないものであ る。 このアルゴリズムは、特に、レンズ歪みがあるときのパラメトリック変 換を用いて、 画像の位置合わせとモザイク化を行うために開発されている。 レンズ歪みがある場合は、どの画像も理想的とは仮定されえない。 ここでの 定式化では、 全ての画像は、それぞれの座標系で表現された輝度測定値とし てモデル化され、 その各々は、内部的なカメラ変換と外部的なビュー変換と を通して、理想的な 座標系に関連づけられる。 このアルゴリズムを用いる目 的は、 理想的な座標系を各々のデータ画像と関連づけるところの変換を解き ながら、 理想的な座標系における画像を計算することにある。 本稿で述べら れるこの技術の主な利点は、以下のとおりである。 (i)一つの歪みなし画像に 依拠する、ということがない。 (ii)画像系列中の先頭フレームと最終フレー ムとの間にオーバーラップが存在しな いようなシーンからなる多重画像であっ ても、それを登録し座標変換を計算 することができる。 (iii)同じ枠組みに おいて線形変換と非線形変換との双方を扱うことができる。 レンズ歪みの補 正とビデオ・モザイクの生成に、 このアルゴリズムを適用した結果を示す。

Sz

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


三つのビューからの線形再構成の縮重について:一次線稠と応用
On Degeneracy of Linear Reconstruction From Three Views: Linear Line Complex and Applications

Gideon P. Stein and Amnon Shashua Sz

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 3, March 1999

Keywords: Shape representation and recovery, 3d motion and shape recovery from line correspondences, shape from motion, algebraic and projective geometry.

本稿では、三つのビューにまたがる線特徴から、射影構造を推定する 問題の線形縮重について調べる。 ここで示すのは、三つのビューの3線テンソルを復元する方程式の線形系 の階数は、シーンが一次線稠(空間内において共通直線で交差する線の集 合)である場合に、26ではなく23へと減少するということである。 一次線稠とは、線形にのみ縮重している状況であり、テンソルの許容条件が 計算されるならば、唯一の解を得ることができる。 線の構成が、一次線稠によって記述される場合には、何らかのあいまいな記述 の場合よりもむしろ、実際のところまったく典型的である。 それが含むものとして特定の例を挙げるならば、 カメラがオフィス環境における廊下を移動したり、あるいは街頭を移動したり する場合がそうである。 さらには、一次線稠という状況は、画像の明るさの時空間的導関数から直接 推定を行う際の人工品(artifact)として生じることもある。 それゆえに、縮重の探究とその救済というのもまた、実用上は重要である。

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


弱い遠近動作の幾何学的解釈
A Geometric Interpretation of Weak-Perspective Motion

Ilan Shimshoni, Member, IEEE, Ronen Basri, Member, IEEE, and Ehud Rivlin, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 3, March 1999

Keywords: Weak-perspective projection, structure from motion.

ここで述べるのは、3つの弱い遠近画像から動きを再現する 問題の、幾何学的解釈についてである。 この解釈は、動き推定の問題を、球上にある角度既知の三角形を検出す る問題へと簡約化することに基づいている。 この幾何学的解釈を用いることで、3つの画像を使って動きパラメータを 完全に再現するための簡単な方法を開発することができる。 このアルゴリズムを、実画像に対して適用した結果が示される。 加えて、様々な動きパラメータのうち、どれが2枚の画像から 再現されうるかについても述べる。

Sz

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


方向線素特徴と非対称マハラノビス距離とを用いる手書き文字認識システム
A Handwritten Character Recognition System Using Directional Element Feature and Asymmetric Mahalanobis Distance

Nei Kato, Member, IEEE, Masato Suzuki, Shin’ichiro Omachi, Member, IEEE, Hirotomo Aso, Member, IEEE, and Yoshiaki Nemoto, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 3, March 1999

Keywords: Handwritten Chinese and Japanese character recognition, directional element feature, city block distance with deviation, asymmetric Mahalanobis distance, ETL9B.

本稿では、手書き中国語・日本語認識の高精度システムについて述べる。 それぞれの文字画像から方向線素特徴を抽出するのに先だって、部分傾き検出 を用いて、劣化画像の好ましからざる影響を減ずる。 認識プロセスにおいては、分散を考慮した市街地距離と非対称マハラノビス 距離とを提案する。それぞれ、大分類と詳細分類のためのものである。 この認識システムを用いて、ETL9Bというデータベースの認識実験を行った 結果、正読率が 99.42% に達した。

Sz

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


筆記制限なし手書き数字認識のための、構造的情報と統計的情報の統合
Integration of Structural and Statistical Information for Unconstrained Handwritten Numeral Recognition

Jinhai Cai and Zhi-Qiang Liu, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 3, March 1999

Keywords: Handwritten numeral recognition, hidden Markov model, structural model, hybrid classifiers, outer contours, chain code-based features, macro-states.

本稿では、筆記制限のない手書き数字を認識するために、統計的情報と構造的 情報とを統合するアプローチを提案する。 このアプローチは、従来型HMMにおける状態継続のモデル化を改良するために、 遷移確率に適応する状態継続を用いる。また、HMMによるパターン構造の モデル化における困難さに打ち克つためにマクロ状態を用いる。 提案方法は、従来型アプローチよりも、多くの点で勝っている。 統計的かつ構造的なこのモデルにおいて、方向性は離散的コードブックに符号化され 、 位置分布は結合ガウシアン分布関数によってモデル化される。 実験結果が示すところによれば、このアプローチは、処理速度と精度に関して 高い性能を達成することができる。

Sz

Copyright (c) 1999 Institute of Electrical and Electronics Engineers,Inc. All rights reserved.


関連性に基づく特徴部分集合選択のための公理的アプローチ
Axiomatic Approach to Feature Subset Selection Based on Relevance

Hui Wang, David Bell, and Fionn Murtagh

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 3, March 1999

Keywords: Machine learning, knowledge discovery, feature subset selection, relevance, entropy.

関連性は、伝統的には特徴部分集合の選択と結合するものとされてきたが、 この結合の定式化は試みられてこなかった。 本稿では、特徴部分集合選択のための二つの公理を提案する。 それは、十分公理と必要公理であって、これに基づいて先の 結合が定式化される。 望ましい特徴部分集合とは、関連性を最大化するものであるから、 つまりは、NP困難であることがわかる。 そこで、発見的アルゴリズムを改良して、多項式時間の複雑さを持つよう な、望まれる部分集合を求められるようにする。 実験結果が示すところによれば、このアルゴリズムは、 より高い予測精度をもたらすのに十分な特徴部分集合を発見できる ことがわかる。

Sz

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


8つの走査オペレーションをもつ並列型中心軸変換の計算
Computing the Medial Axis Transform in Parallel With Eight Scan Operations

Afonso Ferreira, Member, IEEE Computer Society, and Stephane Ubeda

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 3, March 1999

Keywords: Parallel image processing, medial axis transform, parallel prefix, BSP algorithms

本論文の主たる結果が示すのは、ブロック・ベースのデジタル中心軸変換が、 一定回数の走査オペレーションを呼び出すことで、並列に計算されうるとい うことである。 これにより、多様な並列アーキテクチャにおいて、 距離ベースおよびブロック・ベースの中心軸変換を並列的に実現する ことが可能となり、しかもこれは時間的に、および/または、ワーク エリアの意味で空間的に最適なものである。 わずか8つの走査オペレーションと10あまりの局所オペレーション のみを実行するだけであるから、このアルゴリズムはプログラミング も適用もきわめて容易である。 このアプローチの独自性は、二つの概念を用いているところにある。 一つは、導出グリッド(derived grid)であり、いま一つは、画像の 過標本化(oversampling)である。 これらを導入するのは、計算量削減のためである。すなわち、 元グリッド上でブロック・ベースの中心軸変換を行うという計算を、 導出グリッド上で距離ベースの中心軸変換を行うという、より簡単 な計算へと置き換えるのである。後者の処理対象となるのが、 画像の過標本(oversampling)である。

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


消失点検出技術の性能評価と解析
Performance Evaluation and Analysis of Vanishing Point Detection Techniques

Jefferey A. Shufelt, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 3, March 1999

ガウシアン球表現に基づく消失点検出アルゴリズムは、 様々なコンピュータ・ビジョンシステムにおいて、 対象物検出に向けての最初のステップとしての、 3D直線方向の抽出に用いられてきた。 典型的には、これらのアルゴリズムは、その適用対象が強い遠近効果を伴い かつノイズやテクスチャがほとんどない画像であり、直線方向のよい解法 となってきた。 しかしながら、これらのアルゴリズムは、遠近効果が弱い場合や、 テクスチャ・エッジが優勢な場合には失敗することがありうる。 すなわち、それらは検出されるべき対象物に関する知識を利用することにも 失敗するのである。 本稿では、ガウシアン球上のロバストな消失点検出のための二つの新しい技術 を示す。すなわち、プリミティブ・ベースの消失点解析と、解釈平面誤差のモ デリングとである。 これらの方法の性能は、文献に示された既存の他の二つの方法とともに、 定量的に評価・比較がなされる。処理タスクは、複雑な空中画像における 建物検出である。

Sz

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.21, No.4


文書画像分類のためのフィルタリング法:比較研究
Filtering for Texture Classification: A Comparative Study

Trygve Randen, and John Hakon Husoy

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 4, pp.291-310, April 1999

Keywords: filtering, feature extraction, Laws mask, ring/wedge filter, dyadic Gabor filter bank, wavelet transform, wavelet packet, wavelet frame, quadrature mirror filter, discrete cosine transform, eigenfilter, optimized Gabor filter, linear predictor, and optimized finite impulse response filter.

本研究においては、文書画像の特徴抽出のためのフィルタリングの主要な手法についてレビューし、これらの相互比較を行う。このフィルタリング法とは、Lawsマスク(5成分のフィルター)、リング/ウェッジフィルター、ダイアディックガボールフィルター、wavelet変換、waveletパケット、waveletフレーム、直角位相ミラーフィルター(サブバンドフィルターの一種)、離散コサインフィルター、固有値フィルター、最適化ガボールフィルター、線形予測子、最適化有限インパルス応答フィルターなどを含む。特徴量とは、フィルター応答の局在エネルギーとして算出される。フィルタリング処理における局在エネルギーと分類アルゴリズムをほとんどの場合同一条件にした上で、フィルターの効果を強調してある。参照として、2つの古典的なフィルターによらない手法である、共生起(統計的)および自己回帰(モデルに基づく)特徴量と比較してある。入念な実験に基づいて試験結果をランク付けした。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


単眼航空写真からの建造物抽出能力の性能評価と解析
Performance Evaluation and Analysis of Monocular Building Extraction From Aerial Imagery

Jefferey A. Shufelt

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 4, pp.311-326, April 1999

Keywords: monocular building extraction, aerial imagery, metrics, detection performance, evaluation methodology.

単眼の航空写真から建造物を抽出する研究においては、3つの分野でその性能評価が行なわれていなかった:つまり、テスト画像の代表的対象物に適用した数量的評価のための、対象物検出と、線画像描写性能の公正な数量化手法、および、建造物を含む画像から対象物を抽出するアルゴリズムの効果を理解するための手法である。本研究では、18箇所において撮影した83枚のテスト画像に対する、画像空間とオブジェクト空間の数量化手法を利用して、既存の4つの単眼による建造物抽出システムを、処理の最初から最後まで性能評価を実施した結果について述べる。この解析は、テストしたシステムが、撮影画像の傾斜具合、対象物の複雑さ、更に、抽出されたエッジが断片化する影響についても、調べた。このような、広範囲に応用可能な性能評価手法の結果、カメラ撮影による図形描写や、画像の種類、情景構造に関する従来の多様な仮定の帰結を際立たせる結果になった。そして、被写体建造物の厳密な空間モデルや、プリミティブに基づく表現の有用性を実証する結果が得られた。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


尾根と谷の検出手法の評価
Evaluation of Methods for Ridge and Valley Detection

Antonio M. Lopez, Felipe Lumbreras, Joan Serrat, and Juan J. Villanueva

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 4, pp.327-335, April 1999

Keywords: Ridge, valley, geometric feature detection

画像解析においては、尾根と谷は有用な幾何学的特徴量である。従来の直感的な尾根/谷検出を定式化するために、別の特徴化手法が提案されていた。本論文では、これらの主要な特徴化を見直し、新しい方法を提案する。その結果、これらの特徴化がどの程度目的の性質を捉えているか、画像解析課題の目的に合致しているかをリストアップし、評価する。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


n-Tuple識別器のための理論的解析と改良判別基準
Theoretical Analysis and Improved Decision Criteria for the n-Tuple Classifier

Thomas Martini Jorgensen and Christian Linneberg

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 4, pp.337-347, April 1999

Keywords: n-tuple classification, skewed training, Bayes estimator, n-tuple network

n-tuple の識別システムにおいては、入力された例が実際に所属するようなcウラスに対して最高のスコアを出力すると予測されている。この識別結果が与えるスコアが、本来の確率分布とどのような関係にあるかを理論的に解析してみた結果、本論文において、上記の予測が必ずしも当たらないことを示す。実験的研究で観察されたこれらの振る舞いは、理論的に説明可能である。また、理論的解析によって、偏った訓練データの影響を、n-tuple識別器をどのように改善するかについて、貴重な示唆が得られる。これは、今までどうやって取り組むべきか困難な問題であった。出力スコアを、特定のクラスが生成する確率データに関連づけることによって、Bayes推測に非常に近似したn-tupleネットを設計することが可能であることを示すことができた。判別基準を変形することによって、この近似が可能であることが、特別に図解されている。現実のデータでは、本来の分布は未知であり、その結果、出力スコアを最適化することは理論的に不可能である。しかし、このような場合でも、n-tupleネットワークにおいて、1点除外(leave-one-out)交差検証法を使うことで、適当なスコア処理をすることが可能である。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


指紋識別のための多チャネル手法
A Multichannel Approach to Fingerprint Classification

Anil K. Jain, Salil Prabhakar, and Lin Hong

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 4, pp.348-359, April 1999

Keywords: Fingerprint, classification, indexing, classification, Finger Code, two-stage classifier.

指紋識別によって、指紋データベースに対して、重要な索引化手法が与えられる。正確で統一性のある識別が可能になったことで、大きなデータベースに対するマッチング時間が大幅に短縮する。我々は以前の報告よりも優れた指紋識別アルゴリズムを提案する。ここでは指紋を5つに分類する;渦巻、右ループ、左ループ、アーチ、テント型アーチ(中央部に柱状の模様があるアーチ)。このアルゴリズムは新規な表現法(FingerCode)を使い、識別には2段階の識別器を利用する。NIST-4の4000画像についてテストされた。5分類課題に対しては、識別精度は90%が達成された(特徴抽出過程で1.8%が拒絶された)。4分類課題(アーチとテント型アーチは2つのクラスにまとめて)では、94.8%(1.8%の拒絶)の精度となる。識別器において、拒絶を許せば、32.5%の画像が拒絶された後、識別精度は、5クラスでは96%に、4クラスでは97.8%に上昇する。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


隠れマルコフモデルを使った、楽音信号の自動セグメンテーション
Automatic Segmentation of Acoustic Musical Signals Using Hidden Markov Models

Christopher Raphael

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 4, pp.360-370, April 1999

Keywords: Sautomatic musical accompaniment, segmentation, music notes, sampled recording, music score, hidden Markov, prior knowledge, unsupervised learning

本論文では、自動伴奏という目標への重要なステップである、セグメンテーション問題について述べる。単旋律の楽譜と、これを演奏した録音サンプルが与えられたとき、楽譜中の音符や休符に対応する連続した一連の領域にセグメンテーションすることを試みる。隠れマルコフモデルの枠内で、先見知識をモデル化し、教師なし学習によってデータのモデルパラメータを獲得し、事後のセグメンテーションエラー数をグローバル最小化するセグメンテーションを実行した。さらに、楽譜の現在位置をオンラインで推測する方法を示した。我々の実験結果を示すが、読者は、我々が実験を通じて得られた実際の音にアクセスすることをお勧めする。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


剛体運動の下での近似的パターンマッチング
Approximate Geometric Pattern Matching Under Rigid Motions

Michael T. Goodrich, Joseph S. B. Mitchell, and Mark W. Orletsky

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 4, pp.371-379, April 1999

Keywords: 3D matching, point-set matching, rigid-body transformations.

2次元、あるいは、3次元における剛体運動下の点集合のマッチング手法を複数個示す。これらの手法の最悪ケースの限界は、これが最適状態から一定少量の範囲内の効率限界であることを証明する。そして実験によって、これらのマッチングアルゴリズムの平均性能は、最悪限界によって予想されるよりも、しばしば良い結果を示す。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


最近傍識別に対するデータ圧縮と局所計測量
Data Compression and Local Metrics for Nearest Neighbor Classification

Francesco Ricci and Paolo Avesani

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 4, pp.380-384, April 1999

Keywords: local distance measure, nearest neighbor classification, high compression rate, prototype extraction, feedback learning

最近傍局所距離に基づく識別ルールは、現実のデータ集合に対して高い圧縮率と高い精度を持つことが示される。まず、ここに提案する方法で、訓練集合から、あるプロトタイプ集合が抽出され、フィードバック学習アルゴリズムによって、この距離計量値を最適化する。たとえプロトタイプがランダムな集合であっても、ここに提案する計量値は、圧縮率においても、精度においても、一般的な編集手続きであるICA(Iterative Condensation Algorithm), RNN(Reduced Nearest Neighbor),あるいは、PNN(Prototypical Nearest Neighbor)といったものを圧倒する。最後に、もし精度が重要であれば、圧縮率を犠牲にしてvoting法で精度を高めることができることを示す。このことから、votingは、事象に基づく手法を取り込んで、以前の思わしくない結果を克服することができることを示している。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.21, No.5


画像検索のための階層的判別分析
Hierarchical Discriminant Analysis for Image Retrieval

Daniel L. Swets, Member, IEEE, and Juyang Weng, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 5, May 1999

Keywords: Principal component analysis, discriminant analysis, hierarchical image database, image retrieval, tessellation, partitioning, object recognition, face recognition, complexity with large image databases.

物体認識のための自己組織的な仕組みについて述べ、画像検索用の階層的データベース構造を記述する。

自己組織化-階層的-最適部分空間-学習推定システム(SHOSLIF; Self-Organizing Hierarchical Optimal Subspace Learning and Inference Framework) は、最適な特徴を自動的に導出するための最適一次射影の理論と階層構造を用いて、対数オーダーの計算量で検索を実現する。空間モザイク木を自動生成する際には、木の各レベルにおける最大表現特徴(MEF)と最大判別特徴(MDF)を用いる。

提案する階層的判別分析の主な特長として以下を含む:

1) 再帰的に小分割された学習サンプルの各セットに対して、再帰的に良くなるようにあてはめられた特徴セットを導出することにより、大域一次特徴(分割面としての超平面)が持つ制限を避けられる;

2) 生成される子木のセル境界が、主成分分析に比べて良好にクラス境界に沿ってサンプルを分割するので、汎化能力が優れている(すなわち分割テストの認識率が高い);

3) データ絞り込みのための木構造を用い、木の各レベルで異なる判別特徴セットを利用することにより、検索を高速化する。

学習時の画像中の物体の大きさと位置に関する擾乱も考慮している。

自然な環境で撮った広い範囲にわたる実物体の大規模画像データベースに関する技法を示し、位置、大きさ、3次元上の方向の変化に対するアプローチの適応性を示す。本論文のねらいはもっぱら特徴空間の階層的分割である。

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


方向画像の分割による指紋分類
Fingerprint Classification by Directional Image Partitioning

Raffaele Cappelli, Alessandra Lumini, Dario Maio, Member, IEEE, and Davide Maltoni

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 5, May 1999

Keywords: Fingerprint classification, directional image, partitioning algorithms, continuous classification, biometric systems.

本研究では、自動指紋分類の新しいアプローチを導入する。方向画像(訳者注:画素値が濃淡値ではなく方向とその強さを表現するもの)を指紋のトポロジーに従った「均質な」連結領域に分割し、分類のベースとして用いられる合成表現を得る。分割には最適化基準とともに動的マスクの組を用いる。マスクを適応させることにより、各指紋を多次元上の一点として表す数ベクトルを得れば、連続的な分類を考えることができる。

連続的かつ排他的な分類による効率的な指紋検索のために、種々の検索戦略について論ずる。

最も広く用いられている指紋データベースに対する実験結果を示し、この新手法を文献で報告されている他のアプローチと比較する:連続的な分類にもとづく指紋検索に関して、本手法は最良の性能と非常に高いロバスト性を示す。

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


多変量分布データの非線形モデリングと形状変換への応用
Nonlinear Modeling of Scattered Multivariate Data and Its Application to Shape Change

Bernard Chalmond and Stephane C. Girard

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 5, May 1999

Keywords: Data analysis, example-based analysis and synthesis, visual learning, face representation, principal components analysis, nonlinear PCA models, dimensionality reduction, multidimensional scaling, projection pursuit, eigenfeatures.

高次元空間上で、例えば物体や顔や手の視覚的な外観を表す点群が与えられたとする。物体の外観をコンパクトに表現するために、それらの点群を多様体で近似する問題について述べる。

点群の分布が近似的に楕円体状であるとき、この問題は主成分分析(PCA) によって知られる解を持つ。しかしながら、物体置換学習や顔学習のようないくつかの状況においては、このような線形手法ではうまく適応させられず、非線形近似を導入しなければならない。

提案手法は非線形PCA(NLPCA)と考えられ、主に難しいのはデータが順序付けられていないことである。ここでは最近接点近傍を保存する座標軸を選ぶという指針を提案する。これらの座標軸がスムージングの際に各点を訪れる順序を決定する。最終的には、「一般化誤差」と呼ぶ新しい判定基準を導入してスムージングレート、すなわちスプラインあてはめに対する節数を決定する。

実験結果にもとづき本論文の結論を導く:本手法を人工データ及び視覚学習で用いられる2つのデータベースに対してテストした。

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


乱雑な3次元シーンにおける効率的な物体認識のためのスピン画像の利用
Using Spin Images for Efficient Object Recognition in Cluttered 3D Scenes

Andrew E. Johnson, Member, IEEE, and Martial Hebert, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 5, May 1999

Keywords: 3D object recognition, surface matching, spin image, clutter, occlusion, oriented point, surface mesh, point correspondence.

乱雑さとオクルージョンを含むシーンにおける多物体同時認識のための3次元形状ベースの物体認識システムを与える。認識は自転画像表現を用いた点マッチングによる面マッチングにもとづく。自転画像とは、メッシュとして表される面のマッチングに用いられる、データレベルの形状記述子である。ここで与えられる自転画像の圧縮手順により、効率的な多物体認識がもたらされる。その効果は20個のモデルを含むライブラリーから多物体を同時に認識することを示す結果をもって確認できる。

さらに、100シーンについての認識試験の解析を通して、乱雑さやオクルージョンが存在するときのロバストな認識性能を示す。

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


コンピュータビジョンを応用したロバストな競合クラスタリングアルゴリズム
A Robust Competitive Clustering Algorithm With Applications in Computer Vision

Hichem Frigui, Member, IEEE, and Raghu Krishnapuram, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 5, May 1999

Keywords: Robust clustering, fuzzy clustering, competitive clustering, robust statistics, optimal number of clusters, linear regression, range image segmentation, motion estimation.

本論文では従来のクラスター分割に関する3つの主要な問題について述べる。すなわち、初期値に対して敏感なこと、クラスター数の決定が難しいこと、ノイズや外れ値に対して敏感なことである。

提案するロバスト競合集団(RCA)アルゴリズムは初期値に対する感度を弱めるために、多数のクラスターから出発し、競合しながら統合していく過程を通じて実際のクラスター数を決定する。ノイズへの耐性をつけるために、ロバスト統計の概念をアルゴリズムに取り入れる。 RCAは各データ点に対し、2組の異なる重みを割り振る: 1つ目は束縛重みであって共有の度合を表し、周囲の競合を作り出してデータセットをファジーに分割させる。 2つ目はロバスト重みに相当し、クラスターのプロトタイプのロバストな評価値を得るのに用いられる。目的関数における適切な距離測度を選ぶことによって、未知数のパラメトリックモデルを同時にあてはめるためだけでなく、ノイズを含むデータセットから未知数のさまざまな形のクラスターを見つけるために、 RCAを用いることができる。

クラスタリング/混合分解や直線/平面あてはめ、距離画像の分割、複数物体の動きパラメータの推定といったようないくつかの例を示す。

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


一般化複素(GC)モーメントによる対称性検出:
Symmetry Detection by Generalized Complex (GC) Moments: A Close-Form Solution

Dinggang Shen, Horace H.S. Ip, Kent K.T. Cheung, and Eam Khwang Teoh

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 5, May 1999

Keywords: Symmetry detection, reflectional and rotational symmetry, symmetric axis, generalized complex (GC) moments, fold number, fold axes, rotationally symmetric image, reflection-symmetric image.

本論文は同一の特徴セット、つまり一般化複素(GC)モーメントの最初の3つの非零要素にもとづき、2次元画像の鏡像対称性と回転対称性を検出するための統一手法を与える。本手法は、より多くの非零GCモーメントを特徴セットに用いるならば、あらゆる2次元画像のすべての対称軸を検出できることが理論的に保証される。さらに、一つの画像における鏡像対称性と回転対称性の間の関係を確立した。それを用いれば対称性検出が正しくできたかどうかをチェックできる。本手法は200以上の画像を用いた実験で確かめられている。

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


楕円の直接最小2乗あてはめ
Direct Least Square Fitting of Ellipses

Andrew Fitzgibbon, Maurizio Pilu, and Robert B. Fisher

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 5, May 1999

Keywords: Algebraic models, ellipse fitting, least squares fitting, constrained minimization, generalized eigenvalue problem.

本研究は分布データに楕円をあてはめるための新しい効率的な方法を与える。従来のアルゴリズムは一般円錐をあてはめるか、もしくは計算量が大きかった。

4ac - b^2 = 1

という制約の下で代数距離を最小化することにより、楕円であるための拘束条件を正規化因子に取り入れることができる。

提案手法はいくつかの利点をあわせ持つ: 楕円に特化しているので、不良データに対してもつねに何らかの楕円を返すだろう。一般化固有系によって自然に解くことができる。非常にロバストであって、効率が良く、実装も容易である。

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.21, No.6


低レベルのイメージ記述のためのマルコフ・Pixon情報による手法
A Markov Pixon Information Approach for Low-Level Image Description

Xavier Descombes, Frithjof Kruggel

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 6, pp.482-494, June 1999

Keywords: Information, Pixon, Markov Random Fields, image restoration, fMRI analysis

本論文では情景の処理の初期に於ける画像からの情報抽出の問題について述べる。我々は新しい手法(MPI手法)を提案するが、この方法は画像修復、セグメンテーションした画像、および、情報表現における局所地図を求めることができる。ベイズ手法を基本とし、本手法はノイズの多い環境での放物型パッチに基づいている。セグメンテーションにはクラスター数やそのパラメータは不必要である。このMPI手法は、fMRAの実験で得られた統計的パラメータ地図を解析するのに利用された。ここで、pixonとはpizel informationのことである。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


英語とアラビア文字のための語彙制限のない自由フォントOCRシステム
An Omnifont Open-Vocabulary OCR System for English and Arabic

Issam Bazzi, Richard Schwartz, John Makhoul

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 6, pp.311-326, June 1999

Keywords: Optical character recognition, speech recognition, Hiddern Markov Models, Omnifont OCR, language modeling, Arabic OCR, segmentation-free recognition

我々は英語とアラビア文字のための語彙制限のない自由フォントOCRシステムを紹介する。本システムは隠れマルコフモデル(HMM)に基づいているが、本モデルは自動音声認識の分野において成功を収めた手法である。本論文ではOCRの2つの側面に焦点をあてる。第1に、普通のフォントとイタリックのような自由フォントで複数の様式を持つデータに対して、別々のモデルを持たないOCRをどのようにして実現するかについて述べる。HMMを利用する上での前提であるデータの条件付き独立性を保つためには、モデル別に訓練するために必要な、各フォント毎の訓練データの量が重要な事柄となってくる。この問題を軽減するために、フォント別の訓練データをどのように配分するかについて、数学的・経験的な実証を行った。第2に、語彙数制限のない文字認識を実現するために、単語単位のHMMをどのように使ったかを示す。それには、文字頻度に基づくtrigram言語モデルも利用した。これら全ての手段を利用して、Washington大学英語文書画像データベースと、DARPAアラビア文字言語データに対して、それぞれ誤認識率1.1%、および、3.3%を達成した。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


幾何学的変形、および、照明環境に対して不変な物体認識
Geometric and Illumination Invariants for Object Recognition

Ronald Alferez , Yuan-Fang Wang

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 6, pp.505-536, June 1999

Keywords: Invariant, recognition, wavelet, spline, shape, color

潜在的には1システムとして併合可能な不変な定式化を提案する。特に、剛体運動、アフィン変換、パラメータ化や情景照明の変化、遠近投影変換、そして、視点変化に対して不変な特徴量を算出する枠組みについて述べる。これは、画像の幾何学的不変性や、照明不変性だけを追求する多数の現状の研究とは異なっている。定式化は、次のような多様な基底表現に対しても広く有効である;ウェーブレット、短時間フーリエ解析、スプライン。色々な解像度における形状や色に関する情報を調べるためにこの定式化を利用して分かることは、この新手法は、全体的な効果だけでもないし、局所的な効果だけでもない。これは準局所的であり、階層的形状解析を可能にする。このことは、グローバルな不変性のように、他の既知の不変的手法には見られない特徴である。更に、この手法は不変量を計算する場合、(局所不変数と異なり)高次微分の推測を必要とせず、従ってより頑健である。この手法が友情で柔軟性があることを実演するために、合成データや現実データに対して実施した多数の実験結果を示す。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


マルチスペクトルランダム場の画像モデルに対する最尤推定法
Maximum Likelihood Estimation Methods for Multispectral Random Field Image Models

Jesse Bennett, Alireza Khotanzad

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 6, pp.537-543, June 1999

Keywords: Maxim likelihood estimation, multispectral image models, color texture models, multispectral random fields, multispectral autoregressive models, multispectral Markov models

本論文は、最尤(ML)法を利用して、マルチスペクトルのランダム場(RF)のパラメータ推定問題を考察する。いま、ガウス分布を仮定する画像があるとき、マルチスペクトル同時自己回帰(MSAR)で、マルコフランダム場(MRF)モデルに対する解析的結果が開発された。これによってML推定値を算出するための実用的手法が求まる。従来、パラメータ推定には最小2乗法が知られていたが、このML法は、ここで紹介する実験的証拠によってその優位は明らかである。カラーテクスチャー画像のモデル化にML推定手法を使ったマルチスペクトルRFモデルの有効性提示されている。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


分散型行動原理エージェントによる適応的画像セグメンテーション
Adaptive Image Segmentation With Distributed Behavior-Based Agents

Jiming Liu, Yuan Y. Tang

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 6, pp.544-551, June 1999

Keywords: Distributed autonomous agents, reactive behavior, evolutionary computation, breeding, diffusion, homogeneous-segment searching, adaptive image segmentation, agent dynamics

本論文は、自律型エージェントに基づく画像のセグメンテーションについて述べる。本手法において、ディジタル画像は2次元多孔性環境と見なされ、その中に住み着いたエージエントは、均質なセグメントをラベル付けしようとする。そのために、エージエントは繁殖と拡散のような応答的行動をとる。特定の均質なセグメントの画素を見つけることに成功したエージエントは、隣接する領域内に子孫エージェントを繁殖させる。こうやって、エージェントは、より均質な画素を見つけるようになるであろう。さしあたり、成功しなかったエージェントはそれ以上周囲を探索せず、不活性化する。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


カスケード基底への簡約化によるマルチパラメータの操縦可能関数の設計
Design of Multiparameter Steerable Functions Using Cascade Basis Reduction

Patrick C. Teo and Yacov Hel-Or

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 6, pp.552-556, June 1999

Keywords: Steerable filters, filter design, low level vision, pattern analysis

ある変換された関数が決まった基底関数の線形結合によって表せるとき、この関数を操縦可能(steerable)という。例えば、2次元ガウシアンの1次微分を回転したものは、ガウシアンのx方向の1次微分とy方向の1次微分の線形結合として表せるので操縦可能である。任意の関数を局所的に操縦するために、最小2乗法によって最適な基底関数を計算する方法について述べる。こ手法には、リー群論と特異値分解手法が組み合わされている。4パラメータ線形変換群のもとで、Gabor関数を操縦するための基底関数の設計を通してその効率を実証する。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ファジーパターンマッチング法を利用したカラー画像からの顔の検出
Face Detection From Color Images Using a Fuzzy Pattern Matching Method

Haiyan Wu, Qian Chen, and Masahiko Yachida

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 6, pp.557-563, June 1999

Keywords: face detection, fuzzy pattern matching, perceptually uniform color space, skin color similarity, hair color similarity, head shape model

本論文はカラー画像中の顔を検出するためのファジー理論に基づく新しい手法について述べる。我々は、肌色と髪の色を記述するために2種類のファジーモデルを作った。これらのモデルにおいては、知覚的に均一な色空間を用い、精度と安定性を増加させた。肌色領域と髪色領域を抽出するために2つのモデルを使い、その後、予め作っておいた頭部の形状モデルとファジー理論に基づくパターンマッチング法を使って比較し、顔の候補を検出した。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


カールマンスネークによる頑健な位置と速度の追跡
Robust Tracking of Position and Velocity With Kalman Snakes

Natan Peterfreund

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 6, pp.564-569, June 1999

Keywords: active contour, Kalman snakes, optical-flow, robust tracking

位置・速度の結合空間における非剛体オブジェクト追跡のために、カールマンフィルターに基づく動的輪郭モデルを提案する。このモデルは勾配に基づく画像ポテンシャルと、システムの計測のために輪郭に沿ったオプティカルフローの計測を利用する。画像の乱れや隠蔽に対する頑健さを改善するために、オプティカルフローに基づく検出手法を提案する。この方法は、先行する画像の動きから推測された測定結果と矛盾するような余計な計測結果は、検出した後、捨てる。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.21, No.7


非フォーカス画像から深さと画質補正の同時達成を狙うMRFモデルに基づく手法
An MRF Model-Based Approach to Simultaneous Recovery of Depth and Restoration from Defocused Images

A. N. Rajagopalan and S. Chaudhuri

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 7, pp.577-589, July 1999

Keywords: Depth from defocus, space-variant blue, space-variant image restoration, Markov random field, smoothness constraint, line fields, Gibbs distribution, maximum a posteriori, simulated annealing

非フォーカス画像から深さ(DFD=Defocus from depth)を求める課題では、画像中の多 様な点からの深さを算出する必要があるが、そのためには狭い深さの範囲の情景が、 画像に及ぼすカメラの焦点パラメータをモデル化したときの影響を見積もる必要があ る。本論文では、MAP-MRFに基づく考え方によって、2つの非フォーカス画像から、 その情景の深さ情報とフォーカスした(焦点の合った)情景画像を復元する方法を提 案する。空間依存のボケ(blur)パラメータとフォーカスした画像の両方はMRF(Markov random field)によってモデル化され、MAP(Maximum a posteriori)推測値は simulated annealing 法によって得られた。この手法はボケパラメータの空間的変動 に関する平滑化の制約条件や情景画像の強度に順応的である。また、画像の非連続性 (エッジ部分)の保存に必要な線状の場を保存することも可能である。提案手法は合 成画像と実画像の両方に対してその有効性がテストされ、深さの推測値は既存の窓関 数によるDFDよりも良好であることがわかった。空間変動型の復元画像の品質は、ひ どい空間依存型ボケ画像が対象であっても、極めて良好である。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


Kriging指標による画像量子化
Image Thresholding by Indicator Kringing

Wonho Oh and W. Brent Lindquist

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 7, pp.590-602, July 1999

Keywords: Image segmentation, spatial thresholding, indicator kringing

ここで扱う対象は、単変量で表せる分布画像の2値化であり、例えば、複雑な形状の 対象物(個体数がΠ1)が、背景の物質(個体数がΠ0)に埋まっているような状況で ある。より具体的にはX線やレーザーによる2層物質のトモグラフィー画像を想定し てもらえば良い。事前知識から画像のボクセル(voxel)が不完全ながら領域識別可能 であるとする。すなわち、ボクセルのうちのある割合がΠ0に所属し、別の割合がΠ1 に属し、その他は不明であるとしよう。画像中の短距離の空間的共分散から、画像の セグメンテーションを完了するための指標であるkrigingを開発した。Kriging法と は、注目画像n+1以前の、一連の画像特空間座標系列x1 , x2 , x3 , , , xn から作られる確率変数Z(xk )の一次回 帰式によって作られるZ*(xk )で推定するもので、従来の回帰と異なるの は、データが独立ではないことである。本方式による処理結果は、2つの正規分布の 混合、および、エントロピー関数の2方法と比較された結果、2つの正規分布を使う 方法が若干良い結果を示した。しかし、非正規分布ノイズの場合には特に、今後の改 良の可能性が高い。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


折れ曲がったり隠蔽された対象物画像の認識
Recognition of Articulated and Occluded Objects

Grinnell Jones, III, and Bir Bhanu

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 7, pp.603-613, July 1999

Keywords: Articulation invariance, automatic target recognition azimuth variance, empirical performance modeling geometric hashing, synthetic aperture radar images.

対象物の不変特徴量を利用して、合成開口レーダー(SAR)画像中の折れ曲がったり遮 蔽された対象物を認識するための、モデルに基づく自動標的認識(ATR)システムを開 発した。SAR対象画像の散乱中心、方位角偏差、連結不変量の特徴が判った。この新 認識システムの基本的要素について述べるとともに、折れ曲がったり、隠蔽された り、あるいは隠蔽されて折れ曲がったり対象物の認識実行結果が示されている。この 結果から、対象物の、折れ曲がった対象物の不変性や、隠蔽されなかった割合に関連 しているが判った。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


パターンマッチングによる画像圧縮:アルゴリズムおよび実験結果
Pattern Matching Image Compression: Algorithmic and Empirical Results

Mkhail Atallah, Yann Genin, and Wojciech Szpankowski

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 7, pp.614-627, July 1999

Keywords: Lossy Lempel-Ziv scheme, approximate pattern matching, image compression, generalized Shannon entropy, Hamming and square root distortion, algorithms on words, Fast Fourier Transform

近似的1次元パターンマッチングに基づく、変換を使わない画像圧縮法を提案し、こ れをパターンマッチング画像圧縮(PMIC)と呼ぶことにする。この基本的アイデアは、 ジブ-レンペル(Ziv-Lempel)のデータ圧縮法を誤差を許すように、つまり、lossyに変 形して拡張したもので、既圧縮画像中から、非圧縮画像に近似的に合致する最長の信 号列を探索する(換言すれば最小ハミング距離、あるいは、2乗誤差歪みによって判 定)。このアルゴリズムの主要部分はいくつかの新しい特徴によって強化されている ;逆近似マッチング、画像中の余分にシフトした部分記号列の認識、変動可能で適応 的な最大歪レベルDの導入、など。これらの強化がなければ、ここに提案する手法の 効果は疑わしいものであり、効果的な実装化によってアルゴリズムへの興味を呼ん だ。アルゴリズムと実験結果が示されている。この手法は、対象が良品質のグラ フィック画像では、JPEGやwavelet圧縮とも競合することがわかった。これに関連し た理論的結果もレビューする。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


スケール付き直交・遠近法光景から、複数カメラによる構造の復元
Structural Recovery with Multiple Cameras from Scaled Orthographic and Perspective Views

Atsushi Marugame, Jiro Katto, Mutsumi Ohta

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 7, pp.628-633, July 1999

Keywords: Structure recovery, scaled orthographic, perspective, Euclidean and projective geometry

本論文は、スケール付き直交した光景画像と遠近画像の両方を同時に利用して、ユー クリッド構造を方法を抽出するための新規な方法を提案する。スケール付きの直交画 像は、カメラ位置、方位、焦点距離などのカメラパラメータを自動的に得るために利 用する。スケール付き直交特徴はユークリッドによって構造復元が可能になる。ス ケール付き直交画像と遠近画像中の、少なくとも7点によってユークリッド構造が復 元できる。計算画像と自然画像の両方による実験では、十分な精度で構造復元が可能 なことを示しており、潜在的な用途を示している。提案手法は3Dモデル作成や認識、 および、追跡に応用可能であろう。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


面積を有するオブジェクトの相対的位置関係を表現する新規な方法
A New Way to Represent the Relative Position between Areal Objects

Pascal Matsakis, Laurent Wendling

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 7, pp.634-643, July 1999

Keywords: Pattern recognition, parameter extraction, spatial relationships, fuzzy subsets

面積を持った方向性のあるオブジェクトの間の空間的関係を評価するためのファジー な定性的方法(たとえば、「その右側」とか「南の方へ」とか)を使うには、しばし ば角度のヒストグラムを計算する必要があった。この方法によってオブジェクトの間 の相対関係を良好な位置関係を表すことが出来ると考えられてきた。本論文では、力 のヒストグラムという考えを導入する。この考え方は角度のヒストグラムを一般化で きるとともに、それを凌ぐと思われる。(2次元)のオブジェクトは、動径方向の断面 (1次元の属性)で表せ、点(0次元)ではない。そのため、1次元の積分計算の恩恵 を受けることができるため、角度と計測の両方を考慮するときには、ラスターデータ だけでなく、ベクトルデータも高速処理が可能である。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ベイズ誤差推測の下限
Lower Bound for Bayes Error Estimation

Andras Antos, Luc Devroye, Laszlo Grorfi

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 7, pp.643-645, July 1999

Keywords: face detection, fuzzy pattern matching, perceptually uniform color space, skin color similarity, hair color similarity, head shape model

以下のような簡潔な証明を与える。いま、(X, Y)を、N×{0,1}の任意の分布とし、

(X1 , Y1 ), , , (Xn , Yn )を、この分 布から抽出された、独立一定分布(i.i.d.)標本とする。識別において、ベイズ誤差 L*=Infg P{g(X)≠Y}は決定的に重要である。ここで、分布(X, Y)に、さ らなる条件を付けない限り、収束速度についての結論は得られないことを示す。ここ に、

φn (X1 , Y1 ,,, Xn , Yn )をベイズ誤差の推定とし、{φn (.)}を、この推定の系列 とする。

ゼロに収束する任意の正の数列{an }において、

E{|L* - φn (X1 , Y1 ,,, Xn , Yn )|}≧an であるような、ある分布(X, Y)が無限回見つか る。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


平面状オブジェクトのための新規な1パラメータフィルタリング法
A New One-Parametric Fitting Method for Planar Objects

Klaus Voss, Herbert Suesse

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 7, pp.646-651, July 1999

Keywords: Fitting, canonical frame, moments, ellipses, normalization

本論文は、すでに発表されたVossとSuesseの論文の拡張である。その論文において、 我々は正規化の方法を利用した領域に基づくフィルタリング法を開発した。そこで は、線分、3角形、平行図形、円、楕円のための、ゼロ-パラメータのフィッティン グ法を示した。本論文では、円形セグメント、楕円形、超楕円を利用した閉領域の フィッティングの正規化法について議論する。特徴量として、領域に基づく低次元の モーメントを利用する。この場合、1次元の最適問題を解くだけで足りることを示 す。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ハフ変換を利用した楕円の検出と特徴付け手法
A Method of Detect and Characterize Ellipses Using the Hough Transform

Nick Bennett, Robert Burridge, Naoki Saito

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 7, pp.652-657, July 1999

Keywords: Hough Transform, ellipse detection, parameter estimation, projective geometry, feature extraction, computer vision

本論文では、どんな画像からでも自動的に楕円形状を検出し、特徴付けする新手法に ついて述べる。本手法は単パスのアルゴリズムであり、楕円の記述に必要な5つのパ ラメータ全部を検出することなく、任意の楕円パラメータ群や特徴を抽出し、これか ら5つのパラメータを算出することができる。さらに、本手法は、利用者が予め有し ている先験知識と組み合わせることができる。この方法は投影幾何学とハフ変換に基 づいている。本手法は画像から自動的に注目特徴量や幾何学的パラメータのみを抽出 し、先験情報をうまく利用することで、認識と演算の時間を大幅に減少させることが できる。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


画像処理中のオブジェクト間のファジーな相対位置:形態学的プローチ
Fuzzy Relative Position Between Objects in Image Processing: A Morphological Approach

Isabelle Bloch

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 7, pp.657-664, July 1999

Keywords: Fuzzy sets, spatial relative position, directional relations, fuzzy mathematical morphology, structural shape recognition

空間的な相対位置概念の曖昧性を扱うために、ファジー集合の枠組みによって2つの オブジェクトの相対位置に関する新しい定義を提案する(例えば、「その右」とか、 「その上」とか)。この定義は形態学とファジーパターンマッチング法に基づいてお り、さらに、参照オブジェクトに方向性を合致させる満足度合いを表すファジーな標 識物と比較する手法を持っている(たとえば、「ぴったり真上の」のような)。ま た、この定式化の性状は良く、柔軟性があり、直感に合い、厳密でなくても良いよう な構造的なパターンマッチングに利用できる。さらに、画像から抽出される3Dやファ ジーなオブジェクトにも応用できる。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


動きから投影構造を取り出す実験的研究
An Experimental Study of Projective Structure From Motion

John Oliensis, Venu Govindu

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 7, pp.665-671, July 1999

Keywords: Structure form motion, projective geometry, calibration, experimental verification, multiframe structure from motion, optimization, local minima, Levenberg-Marguardt

そもそもカメラのキャリブレーション(更正)はいつでも精度良く可能な訳ではな く、それ故、動きによる投影的な再構造化法(SFM=Structure from Motion)が開発さ れてきた。一方、標準的なユークリッド的SFM法はカメラキャリブレーション既知を 前提として再構成する。しかし、投影的SFMはカメラのキャリブレーションを要しな い。我々は基本的にはアルゴリズムには依存しない、「投影的」対「ユークリッド 的」再構成の実験的比較について述べる。ユークリッド法は、キャリブレーション誤 差が大きくても投影法と同じくらい精度が高い。投影法における最適化問題点では、 ユークリッド法におけるほど、局所最小化の問題を受けない。最適化アルゴリズムの 収束性を強化する方法について述べる。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.21, No.8


視覚縮退(View Degeneracy)の計算モデル
A Computational Model of View Degeneracy

Sven J. Dickinson, Member, IEEE, David Wilkes, and John K. Tsotsos

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 8, August 1999

Kender と Freudenstein の観察に、縮退視(degenerate view)が対象物を取り 囲む視覚圏(viewing sphere)の重要な部分を占める、というものがあるが、 本稿ではその定量化を行った。 今回導入する計算モデルは、遠近法を考慮した(位置等の)幾何情報を対象とし て、多面体をランダムの視点から見た場合に視覚縮退が起きる確率を推測する のに使用できる。 認識モデルの典型的なパラメータでは、20%の確率で視覚縮退が生じ、パラメ ータの取り方によっては50%もの確率となりうる。 物体認識の問題における視覚縮退の影響を論じ、さらに、ある特定の認識フレ ームワークに対して、対象物の明確化にかかるコストと視覚縮退の可能性とを 関連付ける。 このコストを削減するために、今回の視覚縮退モデルをアクティブ焦点距離制御 パラダイムに取り入れた。このパラダイムは、視覚縮退とカメラ視点とのバラ ンスを取るものである。 視覚縮退のモデルをアクティブ焦点距離制御モデルと同じように有効にするため に、実際の認識システム、及び実画像を用いて実験を行ったので報告する。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


陰影からの形状復元:サーベイ
Shape from Shading: A Survey

Ruo Zhang, Ping-Sing Tsai, James Edwin Cryer, and Mubarak Shah

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 8, August 1999

Keywords: Shape from shading, analysis of algorithms, Lambertian model, survey of shape from shading algorithms.

1970年代初頭に、陰影からの形状復元(shape-from-shading:SFS)の技術につい ての最初の開発が Hornによってなされて以来、さまざまなアプローチが提唱 されてきた。 本論文では、6つの有名なSFSのアルゴリズムを実装し、比較している。 各アルゴリズムの性能の解析には、深さ(z)誤差の平均と標準偏差、表面勾配 (p,q)誤差の平均、そしてCPU(占有)時間を用いており、これらによって合成 画像を解析する。 これらのアルゴリズムは、それぞれ特定の画像に対してはよい結果を示すが、 他の画像に対してはうまく働かない。 一般的には、最小化アプローチ(minimization approaches)はロバスト性に優 れ、他のアルゴリズムは速度に優れるといえる。 本論文で用いたC言語のアルゴリズムと実験で用いた画像は、以下のサイトから 入手できる。

 アノニマスFTPサイト:eustis.cs.ucf.edu(132.170.108.42)

 ディレクトリ    :pub/tech_paper/survey

ここには、本論文の電子版も併せて掲載している。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


係数拘束条件を用いる層状化自己較正
Stratified Self-Calibration with the Modulus Constraint

Marc Pollefeys and Luc Van Gool

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 8, August 1999

Keywords: Self-calibration, affine calibration, metric calibration, metric 3D reconstruction, 3D modeling, uncalibrated image sequences.

コンピュータビジョン、特に3次元再構成の問題では、カメラ較正パラメー タの抽出が重要な鍵の一つとなる。 これらのパラメータは、カメラの画像から(そのシーン内の物体配置の)位置情報を 獲得するのに必要とされる。 しかし、これらのパラメータの抽出は、面倒な較正手順を通じてのみ得られる ことが多い。 カメラの明示的な較正を避けて通る道がただ一つある。それが、自己較正 であり、これはいくつかの拘束条件(例えば定較正パラメータ)を満たす ような較正パラメータ・セットを見つけることに基づいている。 このために、いくつもの技法が提案されてきたが、位置情報の較正に一気 に到達することはほとんどできていない。 それゆえ、本論文ではアファイン変換を通じた投射から位置情報抽出までの経 路を層状化するアプローチを提案する。 このためのキーコンセプトは、係数拘束である。 これにより、定数固有パラメータに対するアファイン較正が可能となる。 加えてこれは、シーンに対する知識に結び付けて運用することもできる。 さらに、アファイン較正が既知ならば、焦点距離の変化をもうまく扱うことが 可能となる。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


自動認識のための顔の表現をいかに行うべきか?
How Should We Represent Faces for Automatic Recognition?

Ian Craw, Member, IEEE Computer Society, Nicholas Costen, Takashi Kato, and Shigeru Akamatsu, Member, IEEE Computer Society

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 8, August 1999

Keywords: Automatic face recognition, eigenfaces, face shape, shape-free faces, caricaturing, face manifold.

自動顔認識のための符号化を調べるためになされた試行から得られた結果に ついて述べる。 固有顔(eigenface) 符号化では、特徴点を手動で位置決めして形状を捨象する 方が、形状を正しく合わせる場合よりも有効であった。 配置(符号化)もまた、不正確にマッチするものに与えられるランク付けが、 形状を捨象した顔から得られるランク付けとの相関がないならば、認識に有 効な方法であることが示された。 これらの二者の情報を結びつけることで、両方のシステムのパフォーマンスを 向上させることができる。 形状捨象画像の輝度値の直接の相関をシステムに付加すると、 認識精度は飛躍的に向上したが、これは利用可能な余分な情報が残されていた ことを示唆している。 形状を捨象した顔の認識の優れた点が、形状捨象顔の不連続な集まりを通して、 自然な表情変化の高品質な表現をする場合に見られた。 もちろんその集まりが、顔以外のものを含むならば、形状を捨象することの 不利な点があらわれることになる。 顔の際立った特徴を風刺画的に強調するために、形状捨象符号において 操作をすることは、パフォーマンスのさらなる向上をもたらす。 というのも、この効果は、形状捨象符号化と配置符号化とを独立に 用いる場合にのみ、注目に上るからである。 以上をまとめると、これらの結果が強く支持するのは、顔というものが、 局所的にはこれらの形状とテクスチャによって線形で近似されうる ような高次元の多様性のなかに、おそらくは局所特徴のための独立 システムを伴いながら存在すると見なされるべきだ、ということである。 主成分分析は、この局所近似を行う便利な道具であることがわかる。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


線図形機械図面データベースのインデキシング
Indexing of Technical Line Drawing Databases

Tanveer Syeda-Mahmood, Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 8, August 1999

Keywords: Image databases, technical line drawings, line-labeling, region selection, grouping, recognition, search.

画像インデキシング、すなわち、クエリに答える形で画像内容を検索する問題 は、画像データベースの操作において鍵となる問題である。 本論文では、線図形機械図面(TLD:Technical Line Drawing)と呼ばれる画像 クラスのデータベースにおける3次元物体のクエリに対するインデキシング 方法を示す。 インデキシングは、与えられたクエリに特化した領域の選択と物体認識との 組み合わせとして実現される。 領域選択フェーズでは、関連する画像とその画像内でクエリを受けた対象を 含むと考えられる領域を取り出す。 これは、クエリ中のテキスト情報と、TLD画像クラスに対して単一対象のみ を含む領域を取り出すことが保証されているグループ化機構との両者を用いて 行われる。 このグループ化機構は、解釈線が対象物輪郭と相互作用するような物理的に もっともらしい道程を解析することによって導出された拡張接合セットに、 Waltz の緩和法を適用したものである。 モデルベースの物体認識は、続いて、クエリを受けた3D対象物の幾何的記 述を用いて、選択位置における構成要素の存在を確認する。 クエリ特化選択という方法は、正負判定を誤る機会を少なくしつつ インデキシングにおける探索空間を削減するうえで、きわめて有効である ことを、実験結果は示している。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


オフライン自由手書き単語のモデリングと認識のための隠れマルコフモデル 型アプローチ
An HMM-Based Approach for Off-Line Unconstrained Handwritten Word Modeling and Recognition

A. El-Yacoubi, M. Gilloux, R. Sabourin, Member, IEEE, and C.Y. Suen, Fellow, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 8, August 1999

Keywords: Handwriting modeling, preprocessing, segmentation, featur e extraction, hidden Markov models, word recognition, rejection.

本論文では、広範な語彙を対象とした、オフライン自由手書き単語認識の設計を、 隠れマルコフモデル(HMM)をもとに構築する。 前処理に続いて、単語画像は文字または仮文字へと切り出され、これらは等長 の二つの特徴系列によって表現される。各特徴系列は、形状記号と切り出し記号と が交互に現れる系列であり、ともに明示的にモデル化されている。 単語モデルは、要素HMMからなる文字モデルを適切に連結したものであり、 HMMベースの内挿技法によって、2つの特徴セットを最適に結びつける。 単語画像が辞書にあることが保証されているか否かに応じて、2つの拒否機構 が考案されている。 今回実際の手書き文字を用いた複数の実験により、このモデルが手書き文字認識 に有効に使用できることが示された。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


統合比:手書き画像を対象とした新しい大局的二値化技法
Integral Ratio: A New Class of Global Thresholding Techniques for Handwriting Images

Yan Solihin and C.G. Leedham, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 8, August 1999

Keywords: Document image thresholding, background removal, preprocessing.

本論文では、統合比(Integral Ratio)と呼ばれる、ヒストグラ ムに基づいた大局的二値化技法の新しいクラスを提案する。 これらは、グレイレベルの手書き文字を閾値処理し、背景から切り出す ことを目的としている。 このためには、以下の3つの厳しい要求が満たされる必要がある。

1)全ての手書き文字の細部が保持されること、

2)除去されるべき背景が濃色かつ/もしくはパターンを持ちうること

3)手書き文字は、万年筆、ボールペン、および鉛筆等の様々なペンを用いて 書かれていること。

このような厳しい要請が課される分野として、法廷で用いる文章鑑査がある。 ここでは、手書き文書が法的な証拠であり、いかなる手段を持ってしても 改ざんできないとされる。 今回提案した技法のクラスは、閾値処理を2段階で行うアプローチに基づいて おり、手書き画像の全ての画素が以下の3つのクラスのいずれかに分類される ことを求める。すなわち、前面(絵)、背景(地)、およびこの両者の間でど ちらに属するのかがあいまいな領域である。 純統合比(NIR: Native Integral Ratio)と 正方(二次)統合比(QIR: Quadratic Integral Ratio)の2つのテクニックが このクラスに基づき開発され、よく知られたOtsuの方法、エントロピー二値化 法の2つの技法と対比検証された。 そしてQIRが今回テストした他のいかなる方法よりも優れていることがわかった。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ロバストな回転角度推定方式
Robust Rotation Angle Estimator

Whoi-Yul Kim, Member, IEEE, and Young-Sung Kim

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 8, August 1999

主軸を用いてパターンの回転角を推定する従来方法は、固有値が両方向 で類似するという理由により、回転対称パターンには適さない。 本論文では、新たにロバスト性に優れるZernikeモーメントの位相情報を 用いた回転角度推定方法を示す。 回転対称パターンの回転角度推定において、加えてノイズ混入条件下 でさえも、今回の方法が上で述べたような従来方法よりも正確な推定 を行えることが、実験により示される。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


線形N点カメラ姿勢決定方式
Linear N-Point Camera Pose Determination

Long Quan and Zhongdan Lan

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 8, August 1999

Keywords: Pose estimation, space resection, 2D-3D image orientation, exterior orientation determination, perspective-n-point-problem, four points, five points.

3次元参照点と画像との既知の対応関係から、カメラの位置と方位を決定 する問題は、コンピュータビジョン分野では姿勢推定として、写真測量の 分野では空間上の位置確認(resection)として、知られている。 3つの対応点の組があった場合、最大で4つの代数解が存在することが広 く知られているが、対応点が4つや5つの場合については、ほとんど知ら れていない。 本論文では、4および5組みの一般的な参照点を対象とした姿勢決定方法 の特殊解を線形に導出する方法をいくつか示す。 まず、3点の代数的方法についてレビューした後、4点の2段式、5点で は単段式の線形代数方式を示す。 5点の方法は、さらにそれ以上の点数を扱う方法に拡張可能である。 そして最後に、合成画像と実画像を用いて今回の方法がいかにふるまうか を示す。今回の方法は、共面配置を縮重させることはなく、共面配置に特 殊化された線形代数方式さえ凌ぐパフォーマンスを実際にも持つことを示す。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


定性的推論における相反する振る舞いの情報の有効活用
Making Use of Contradictory Behavior Information in Qualitative Reasoning

A.C. Cem Say

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 8, August 1999

Keywords: Qualitative reasoning, qualitative simulation, QSIM, automated modeling, diagnosis.

定性的シミュレーションから得られた相反する予測の組を、自動的に特定する 技法を示す。 この技法により、シミュレータはより有益な情報を出力するので、 その結果として、診断のような推論タスクや、モデル改良、および 入力状態を含む時系列において無駄と思われる処理を除去するタスクに、 卓越したパフォーマンスがもたらされる。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


Haar変換を用いたディジタルカーブのポリゴンへの高速分解
Fast Decomposition of Digital Curves into Polygons Using the Haar Transform

T.J. Davis

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 8, August 1999

Keywords: Haar transform, Haar functions, digital curves, polygonal decomposition, feature perimeter.

ディジタル画像における周囲長特徴は、Haar 変換を用いると、直線集合に 分解することができる。 Haar 変換の基底関数は、平滑化効果を失うことなく、周囲長に沿った方 向の鋭い変化を保存する。 Haar 変換の係数は、単に、真の周囲長とその多角形分解との間の誤差に関連する。 Haar 変換は、効率的な計算が可能であり、このときの計算オーバーヘッドは、 データ点の数に対して線形である。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


平面曲線のの多重プリミティブ分割——2段節点分類とチューニング からなるアプローチ
Multiprimitive Segmentation of Planar Curves--A Two-Level Breakpoint Classification and Tuning Approach

Hsin-Teng Sheu, Member, IEEE, and Wu-Chih Hu

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 8, August 1999

Keywords: Multiprimitive segmentation, breakpoint classification, tuning, k-curvature, projective height, benchmark.

平面曲線の多重プリミティブ分割のために、節点分類とチューニング からなるアプローチを提案する。 そしてこのアルゴリズムを評価するために、cockhead-likeなグラフ を提案する。 まず、節点は、コーナーと滑らかな接続とに分類される。 そして、節点の両側のセグメントの種類が特定される。 次に、セグメントの統合/分割のために、接続調整手続きが試され、 接続位置の調整がなされる。 線と円弧線分のパラメタの全ての可能な組み合わせを含むように、 cockhead-likeグラフは慎重にデザインされ、それゆえこれはアルゴリズムを テストする際の基準として用いることができる。 今回提案するスキームは非常にシンプルかつ高速であって、閾値を決めね ばならぬ問題もなく、量子化と前処理の誤差に対してロバストであり、その ためマッチングや認識等の様々なアプリケーションで使用することができる。 提案された基準に対するテストと、さらには文献にあるアルゴリズムとの比 較により、今回提案した方式の優越性は確固たるものとなる。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


手話画像系列に対する学習ベースの予測−検証型セグメンテーション・スキーム
A Learning-Based Prediction-and-Verification Segmentation Scheme for Hand Sign Image Sequence

Yuntao Cui and Junyang Weng

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 8, August 1999

Keywords: 2D segmentation, hand sign recognition, visual learning nearest neighbor, feature derivation.

注目画像の複数個を固定する予測−検証型セグメンテーション・ スキームを示す。 このシステムの主な利点は、複雑な背景下にある多数の変形可能物体を 扱うことができる点にある。 また効率も比較的良い。 システムのテストには、濃淡画像系列の手話記号セグメンテーション を用いた。それぞれの画像系列は、America Sign Languageの手話記号 を表している。 実験により、今回のシステムは95%の正答率を3%の却下率で達成してい ることが示された。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


画像の登録とマッチングのための直交重み付けモーメントとアフィン不変量
Cross-Weighted Moments and Affine Invariants for Image Registration and Matching

Zhengwei Yang, Member, IEEE, and Fernand S. Cohen, Senior Member, IEEE

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 8, August 1999

Keywords: Affine invariants, weighted moments, registration, missing data, occlusion, affine transformations, weak perspective.

分数分割比を用いた直交重み付けモーメントという新しいコンセプト に基づく、オブジェクトの照合と位置決めの両方に対するアフィン不 変量の新しいクラスを導出するフレームワークを示す。 分数比の重み付けによって、細部のみが異なる物体を区別する能力と、 ノイズによるわずかな形状変化に対する敏感さとを、より柔軟な範囲 でバランスさせることが可能となる。 さらに、これにより、低次(0次オーダー)のアフィン不変量に到達する ことできる。 この低次のアフィン不変量は、高次の標準モーメントから導出される それよりもロバストである。 アフィン変換のパラメータは、0次及び1次の直交重み付けモーメント から再現可能であり、他のいかなる特徴点の対応情報も必要としない。 アフィン変換のパラメータを決めるための式は、線形代数の範疇である。 実画像における、ノイズ、データ消失、遠近効果のそれぞれに対して、 直交重み付けモーメント不変量の感度が示される。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.21, No.9


画像系列(動画)の超解像再現
Super Resolution Reconstruction of Image Sequences

Michael Elad, Arie Feuer

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 9, pp.817-834, September 1999

Keywords: Image restoration, super resolution, dynamic estimation, Kalman filter, adaptive filters, recursive least squares (RLS), least mean squares (LMS), steepest descent (SD)

以前の研究において、我々は低解像の画像系列から、超解像画像系列を再構築する問題を紹介した。任意の望ましい画像系列を得るための2つの反復アルゴリズム、R-SDとR-LMS、を提案した。これらのアルゴリズムでは、低解像化、連続的動き、計測ノイズ特性、のようなボケについての知識を仮定して、連続的復元処理手順を応用する。計算複雑度の観点からは、これら両方のアルゴリズム共に、実用的に応用可能であることが示されてきた。本論文では、これらのアルゴリズムを、カルマンフィルターの近似として再導出し、その効率を徹底的に解析する。各アルゴリズムそれぞれについて、カルマンフィウターの効率から、その限界値を算出する。R-SDアルゴリズム内部の伝搬情報行列は、時間軸方向に疎のままであることを示し、従って、このアルゴリズムの適用か可能であることを保証する。この解析結果を支持するために、合成系列画像によるコンピュータシミュレーションを実施した結果、このアルゴリズムの演算的には可能性があることを示している。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


単一画像を利用した、部品に基づく複雑なオブジェクトの3D記述
Part Based 3D Descriptions of Complex Objects from a Single Image

M. Zerroug, R, Nevatia

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 9, pp.835-848, September 1999

Keywords: 3D shape descriptions, part-based representations, object segmentation

情景中に存在する複雑なオブジェクトを、立体的な、つまり3Dの、部品によって記述することは、汎用的オブジェクト認識、ナビゲーション、あるいは、物体操作などに極めて有益である。しかし、今までは画像データからこのような記述を導くことは困難であった。距離データや完全な輪郭から、このような記述手段の入手を可能にするための多少の進歩はあったが、現実の強度画像を解析するには多くの困難があった。オブジェクトと部品の境界は、画像の境界と完全に対応する訳ではない。検出された境界はしばしば断片であったり、多くの境界には表面模様とか、影や、あるいは、ノイズが伴っている。更に、2D画像から3Dを推測することは困難である。本論文は単一の画像から、一般化された円筒表現と、円筒間の接続の投影特徴を調べることによって、目的とする3D記述に関する計算方法を紹介する。いくつかの実験例も示す。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


グラフィックス(図面)認識システムの経験的な性能評価
Empirical Performance Evaluation of Graphics Recognition Systems

Ishin T. Phillips, Atul K. Chhabra

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 9, pp.849-870, September 1999

Keywords: Empirical evaluation, benchmark, graphics recognition, engineering-drawing

市場には各種ベクトル化ソフトウエアパッケージがあるが、これらの性能は未知であるか、開発者によって限定的に公開されているだけであった。本論文は、直線、円、円弧、および、文字ブロックを含むグラフィックス(図面)認識システムを評価するための手法を紹介する。これによってベクトル化のソフトウエアパッケージを経験的に比較することが可能になり、完全なベクトル化システムに利用可能な実際的な性能評価手法を利用する。その手法とは、グラフの対象物の組をマッチングさせたデータ、性能評価値データ、グラフィックス認識システム評価の基準データを含んでいる。この評価基準は、3つのシステムについてテストされた。結果は本論文に報告され、分析されている。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


類似度尺度
Similarity Measures

Simone Santini, Ramesh Jain

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 9, pp.871-883, September 1999

Keywords: similarity measures, content-based retrieval, image databases, perceptual similarity, image distances

多くの画像検索システムでは、2つの画像とか、画像とモデルとかを比較することが基本的演算となっている。ほとんどのシステムでは画素レベルのマッチングを実行するのではなく、適当な意味的な差異を評価することが行われている。複雑なマルチメディアデータにおいて、類似度評価を利用した基本演算方式のデータベースシステムが出現し始めている。データベースに関することを議論する前に、演算としての類似度の定義が必要である。本論文ではファジー論理に基づく類似度法を開発する。この類似度には人間に於ける経験的発見法と合致するいくつかの特徴がある。このモデルはファジー特徴コントラスト法(FFC)と呼ばれ、Tverskyによる特徴コントラスト法のより一般的なドメインへの拡張である。このFFCモデルはあいまいな類似度の判断をモデル化することができることを示し、特徴量の間の従属性(dependency)を扱うためにファジー測度の利用を訴える。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ジェスチャー認識のためのパラメータ付き隠れマルコフモデル
Parametric Hidden Markov Models for Gesture Recognition

Andrew D. Wilson, Aaron F. Bobick

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 9, pp.884-900, September 1999

Keywords: Gesture recognition, hidden Markov models, expectation-maximization algorithm, time-series modeling, computer vsion

従来の人間の動き認識は、人体部分のモデルと入力画像のマッチングを取る方法を利用している。ここでは、パラメータ化したジェスチャーの表現、認識、翻訳に関する新しい方法を紹介する。パラメータ化したジェスチャーとは、系統的な空間変動表現のことで、一例を挙げると、指し示すジェスチャーのパラメータは2次元の方向である。我々の手法は、ジェスチャー認識のための標準的手法である隠れマルコフモデル(HMM)を拡張し、隠れマルコフ状態が出力する確率に、大局的にパラメータ化した変動を含ませることである。我々は、線形従属モデルを使って、パラメータ付きHMMを最適化するために、期待値最大化法(EM)を定式化した。テストにおいては、類似のEMアルゴリズムを利用して、与えられた画像系列のPHMM尤度を最大化し、定量化パラメータを推測した。入力データとして、画像から取得されたものと、直接3次元の腕位置を計測した値を利用し、認識結果が標準的なHMMに比べてPHMMの方が優れていること、さらに、入力特徴量にノイズが混入する場合に、パラメータ推測がずっと頑健(ロバスト)であることを示す。最後に、PHMMを任意の(非線形の)平滑さに対応できるように拡張する。この非線形性を定式化するには、汎用期待値最大化(Generalized Expectation Maximization = GEM)アルゴリズムを、訓練時と、ジェスチャー同時認識とパラメータ推測時の、両方に利用することが必要である。我々は、指示ジェスチャー(pointing gesture)に適用した結果を示す。このとき、非線形性を利用したために、指示方向の表現に自然な球座標パラメータの利用が可能になった。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


多次元ハウスドルフ距離を用いた直線に基づく認識
Line-Based Recognition Using A Multidimensional Hausfdorff Distance

Xilin Yi, Octavia I. Camps

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 9, pp.901-916, September 1999

Keywords: Hausdorff distance, line-feature-based recognition, multidimensional distance transform

本論文では、モデルに基づいた認識のために直線を利用した4次元ハウスドルフ距離の利用を提案する。この新手法によって、モデルと画像の間の、回転、スケール変換、平行移動問題は、4次元の2つの点集合間の平行移動によるハウスドルフ距離最小化問題に変換される。提案アルゴリズムの実装化は、高次元に拡張可能であり、そうすることによってn次元パターンの対応関係が見つけられる。この方法をセグメンテーション問題へ利用した場合の効率と感度は、シミュレーションデータを利用して定量的に評価されている。このアルゴリズムの性能は良好で、隠蔽や例外点に対しても頑健であり、セグメンテーション問題が増加するに従って、うまく自然に劣化することが示されている。実画像に対する結果も照会されている。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


誤り訂正機能付きグラフマッチング:基礎となるコスト関数の影響について
Error Correcting Graph Matching: On the Influence of the Underlying Cost Function

H. Bunke

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 9, pp.917-922, September 1999

Keywords: Graph, subgraph, maximum common subgraph, graph isomorphism, subgraph isomorphism, graph matching, error correcting graph matching, cost function, edit operation, graph edit distance

本論文は、2つのグラフ間の最適マッチングに対するコスト関数の影響について研究したものである。グラフ表現を使うことによって、通常の認識問題はグラフのマッチング問題に変換される。このとき、ノードにオブジェクトを対応させ、エッジは関係を表すことができる。あるコスト関数が与えられると、任意のグラフ対に対して、同一の最適誤差修正マッチングに到達する無限のコスト関数が存在することが示される。さらに、このようなグラフ同形性とか部分グラフ同形性、そして、最大共有グラフのような良く知られたグラフ理論のコンセプトは、特定のコスト関数の最適誤差修正グラフマッチングの特別な場合であることが示される。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


スコア(得点)を確率に写像する方法
A Methodology for Mapping Scores to Probabilities

Djamel Bouchaffra, Venu Govindaraju, Sargur Srihari

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 9, pp.923-927, September 1999

Keywords: Recognizer, reestimation methods, feature space, classifier, probability

各種認識器は、それぞれ独自のスコア(得点)を算出するが、これらを比較するには統一的なスケールに変換する必要がある。本論文では、多くの認識器に定義されたスコアの正しさの確率を求める方法について述べている。確率を送出することによって異なる認識器の出力値を同じスケールに載せることが出来るので、容易に認識器同士の比較が可能になる。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


手書き単語認識のためのチェインコード輪郭処理
Chaincode Contour Processing for Handwritten Word Recognition

S. Madhvanath, G. Kim, V. Govindaraju

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 9, pp.928-932, September 1999

Keywords: Image processing, chain code, handwritten recognition, preprocessing, segmentation, feature extraction

多くの認識システムでは、連結成分単位に処理をして、演算量を削減している。手書き単語2値画像の輪郭表現を利用すると、忠実な表現を保持したまま記憶容量を大幅に減少させることが可能になる。他方、1次元情報となった輪郭情報は、単語認識のための画像処理の立場からは、興味ある課題である。我々の実験によると、手書き文字画像の輪郭表現を利用することによって、認識速度と精度の両方に顕著な利点が認められた。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


補間的再分割手法によるスケール・空間の高速実装方式
Fast Implementation of Scale-Space by Interpolatory Subdivision Scheme

Yu-Ping Wang, Rubin Qu

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 9, pp.933-939, September 1999

Keywords: scale-space, interpolatory subdivision scheme, B-spline, edge detection, image representation

最近のピラミッドアルゴリズムを利用したwavelet変換のように、多段解像度の画像を扱う必要から、スケールと空間を扱う手法はコンピュータビジョンに広く使われてくる一方、スケール・空間フィルタリングの高速実装が大きな興味を引いている。本論文では、上記目的のための補間的再分割方式(ISS)を紹介する。スケール・空間表現中から幾何学的特徴量を抽出するために、通常、離散的微分近似が利用されている。そのため、ここに紹介するISSに関して、汎用的数値微分法の正確な導出手続きも紹介する。次に、ISSからスケール・空間フィルタリングの高速近似アルゴリズムが導かれる。さらに、ISSとWhittaker-Shannonサンプリング定理の関係、それに通常利用されているスプライン法の関係が考察されている。ISS応用の1例としてGoekmenとJainによって導入されたλτ空間の高速実装例を示すが、これは各種の有名なエッジ抽出フィルターを包含している。ISS法はスケール・空間フィルタリングや特徴抽出の高速実装において高い効率を示すことが示される。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


画質向上のための非線形な非問等方的拡散法の新しい解釈と改良
A New Interpretation and improvement of the Nonlinear Anisotropic Diffusion for Image Enhancement

Jerome Monteil, Azeddine Beghdadi

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 9, pp.940-946, September 1999

Keywords: Nonlinear anisotropic diffusion, fluid mechanics, homogeneity, image enhancement, noise smoothing, optical flow

輪郭抽出においては、均一領域用のローパスフィルターと、境界部分の先鋭化フィルターを用意する必要があるが、この矛盾する要求を満たすフィルターの設計は容易なことではない。本論文の目的は不均一拡散(AD)の新規な解析を示すことと、伝導関数(CF)やエッジ閾値を巧妙に選ぶことによって適応的非線形フィルターを提案することである。ADが導入された当初、我々がピンホール効果と呼んでいる望ましくない影響が生じた。この問題に関する頑健な解が提案され、実験データによってその効果が評価された。拡散された信号の変遷具合は、オプティカルフロー法を利用した物理モデルによって解析された。全体を通してのこの戦略は、合成画像や実画像に適用した結果によって評価された。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


部分的に隠蔽されたオブジェクト同定におけるハフ空間における教師なしクラスタリング
Unsupervised Clustering in Hough Space for Identification of Partially Occluded Objects

Oscar Yanez-Suarez, Mahmood R. Azimi-Sadjadi

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 9, pp.946‐950, September 1999

Keywords: Image analysis, occluded objects, unsupervised clustering SOM network, Hough space

部分的に隠蔽されたオブジェトを同定するための、テンプレートを使わない自動的手法を示す。解析対象の画像中にある関連オブジェクトの輪郭は、多角形近似によってモデル化され、そのエッジはハフ空間に投影される。構造的適応型自己組織化写像ニューラルネットワークは共線形や平行なエッジのクラスターを生成する。これが各多角形近似内で、部分的に隠蔽されたオブジェクト認識の基底として利用される。様々な条件における多数の場合について触れる。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ハウスドルフ距離による固有空間近似を利用した画像に基づく認識
View Based Recognition Using an Eigenspace Approximation to the Hausdorff Measure

Daniel P. Huttenlocher, Ryan H. Lilien, Clark F. Olson

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 9, pp.951-955, September 1999

Keywords: Model-based recognition, Hausdorff matching, subspace methods, image matching

固有空間手法のような、画像に基づく認識手法は多数の認識課題において成功を収めてきた。しかし、この手法は、オブジェクトが部分的に隠蔽されていたり、乱雑な背景の中にある場合には限界があった。この限界に取り組むために、一般化ハウスドルフ距離を固有空間近似した画像マッチング法を開発した。本方法の主要な長所は、記憶容量が少なく、高速検索可能なことであるが、さらに、部分的隠蔽や乱雑な背景にも耐性がある。本手法は直接画像強度画像に適用するよりも、エッジ強度画像のような2値画像に適している。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.21, No.10


ジェスチャ認識のためのHMMベースの閾値モデル・アプローチ
An HMM-Based Threshold Model Approach for Gesture Recognition

Hyeon-Kyu Lee, Jin H. Kim

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 10, pp.961-973, October 1999

Keywords: Hand gesture, gesture spotting, Hidden Markov Model, segmentation, pattern recognition, relative entropy, state reduction, threshold model

ジェスチャーを自動的に認識することは、予測できない、曖昧な、ジスチャーと無関係な曖昧な動きが存在するため大層困難な課題である。本稿では、隠れマルコフモデル(HMM)に基づく新規な手法を開発したことを報告する。ジェスチャーに無関係なパターンを処理するために、入力パターンの尤もらしさを計算するための閾値モデルという概念を導入する。そして、予め用意したジェスチャーパターンとのマチング具合を確認する機構を提供する。これは、入力パターンの尤度付き閾値を計算して、暫定的にマッチするジェスチャ・パターンを確認するための機構を提供するものである。本方式は、全てのジェスチャー中の特定ジェスチャーについての尤もらしさよりも、この閾値モデルが算出する尤もらしさの方が小さいという、いわゆる弱いモデルである。その結果、この尤度は、多数のジェスチャー候補の中から適当なモデルを抽出するという、適応的閾値として利用することができる。閾値モデルは対象とする全てのジェスチャーモデル状態を集めたものであるため、多くの状態数を持っており、これを減少させる必要がある。この問題を克服するため、相対エントロピーを利用して類似の確率分布を有する状態は併合する。実験結果が示すところでは、手の連続的な動きから学習されたジェスチャから、93.12%の精度で訓練済みジェスチャーをうまく抽出できたことを示している。

Sz

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


顔の表情識別
Classifying Facial Actions

Gianluca Donato, Marian Stewart Bartlette, Joseph C. Hager, Paul Ekman, Terrence J. Sejnowski

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 10, pp.974-989, October 1999

Keywords: Computer vision, facial expression recognition, independent component analysis, principal component analysis, Gabor wavelets, Facial Action Coding System

顔表情符号化システム(FACS)は、顔の構成要素に基づく顔の動きを定量化する客観的手法である。本システムは感情、認識プロセス、あるいは、社会的関係の行動調査のために広く利用されている。コード化は、現在のところ高度に訓練された専門家によってなされている。本稿では画像系列中から顔の動きを自動的に認識する手法を調べ、それらを比較する。これらの手法に含まれるものには以下のようなものがある。オプティカルフローの推測によって顔の動きを解析すること、主成分分析、独立成分解析、局所特徴解析、線形特徴量解析、そして、線形判別解析、のような全空間的解析手法、あるいは、Gabor wavelet表現、局所主成分のような局所フィルター出力に基づく各種手法も含まれている。これらのシステムは、素人の顔表現や、プロの顔表現に対して適用され比較された。最高性能はGabor wavelet表現と、独立要素表現を使ったもので、両者とも顔俳優による12種類の表情変化(顔の上半分のものと下半分のものを含む)画像を96%の精度で識別した。この結果から、表情認識には、局所フィルター、高域空間フィルター、および統計的独立性を用いることの重要性を示す収束しつつある証拠が得られる。

Sz

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


非定性的マルコフモデルを利用した文字列認識結果の後処理
Postprocesing of Recognitized Strings Using Nonstationary Markovian Models

Djamel Bouchaffra, Venu Govindaraju, Sargur N. Sriahari

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 10, pp.990-999, October 1999

Keywords: Nonstationary hidden Markov models, zip code recognition, postprocessing, class conditional probability, Markov random fields

本稿では、非定常的マルコフ・モデルを取り上げ、これをトークン列認識に応用する。従来、音声認識では、音声信号に文脈情報を組み合わせたり、状態遷移モデルを利用する技術が利用されてきた。ここでは手書きの郵便番号認識に、全米郵便番号住所ファイルを利用した。このファイルによって郵便番号に対応する配達地点に関する豊富な情報が得られる。文字画像の認識評点に、これらのデータがn-gramモデルに取り込まれ、数字の認識スコアとシームレスに統合される。特に興味深い点はn-gramの特定の位置を興奮させたり抑制させたり出来ることであり、これからおなじみのマルコフ確率場が導かれる。著者たちは、認識器のスコアから確率値を求める方法について以前報告している。これらのマルコフ測度によって、ベイズ理論に基づく真のマルコフ鎖が構成可能となる。記号列認識の後処理に利用することによってマルコフモデル化が成功したことを経験的に示す。20,000組の郵便番号データに対するいくつかのモデルに基づく認識精度を示す。その結果、文脈情報を無視した数字認識器の認識性能だけに頼る現在のシステムに比べて、優れた効率を示した。

Sz

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


3Dオブジェクト認識における、不変量を使わないインデクス抽出
Indexing without Invariants in 3D Object Recognition

Jeffrey S. Beis, David G. Lowe

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 10, pp.1000-1015, October 1999

Keywords: Model-based object recognition, kd-tree algorithm, nearest neighbors algorithm

1枚の2次元画像から3次元オブジェクトをインデックス化する手法について述べる。この課題を解決する他の方法と異なり、我々の手法は不変特徴量は使わない。従って、認識プロセスにおいて、より豊富な情報を利用することができる。さらに、通常のハッシュテーブルに代わるkd-木(ツリー)をデータ構造として提案する。こうすることで、高次元において仮説の復元がより効率的に可能になり、大きなモデルデータベースに必要な特定化が可能になる。この体制で、探索効率を保つために、最適ビンへの優先探索(Best-Bin First search)を利用した。これは特徴空間に局在する近似的最近傍推定を使い、次に、仮説を実証してランク付けするkd-木探索アルゴリズムの改良である。平均的には、ランク付けプロセスでの検証数が大幅に減少した。この方法はどんな実数値特徴ベクトルにも適用可能な一般性がある。さらに、インデクスに利用した特徴量識別の真の確率分布に基づいて実画像からインデックスを追加するという、直接的手法である。本稿では、合成画像と実画像の両方を利用した実験結果を示す。このシステムの適用分野は遠隔ロボッティックスのドメインである。

Sz

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


自動表面形状取得のための次最適ビュー問題の一解法
A Solution to the Next Best View Problem for Automated Surface Acquisition

Richard Pito

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 10, pp.1016-1030, October 1999

Keywords: Active vision, next best view, sensor planning, range imaging, recerse engineering, automated surface acquisition, model acquisition

表面形状を得るために、次最適画像(NBV = Next Best View)を得る方法について述べる。NBV問題は、未知対象物のすべての可視表面を標本化する上で、次に取り込んだら良いか、そして、どこにスキャナーを持って行くべきかを決める問題である。NBV問題は表面獲得システム中の処理部分や、距離センサー固有の物理的条件によって制約を受けると言うことである。未だ取り込まれていない領域の視野をどのように決定するかについて紹介する。さらに、新規な表現である位置空間(PS)を紹介するが、これは単一データ構造中において、何を撮るべきか、何が撮れるかを表すことでNBV問題への解法を容易にする。対象物がある撮影位置から隠蔽されているかどうかを決定するための計算コストは、NBVで考察される撮影位置の複数候補によって減少する。この自動表面取得システムは、事前知識の無いオブジェクトを任意の方位から撮影するように設計されているが、実物体を対象にした実演が可能である。

Sz

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


局所幾何学的特徴量の分布を利用した位置合わせ
Alignment Using Distributions of Local Geometric Properties

V. Govindu, C. Shekhar

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 10, pp.1031-1043, October 1999

Keywords: Pose estimation, correspondenceless image alignment, geometric properties, statistical distributions

2つの画像を比較する場合には、通常、特徴量間での対応関係を厳密に確立する必要があるが、明示的な特徴量の対応関係なしに画像の位置合わせを行うための枠組みについて述べる。2つの画像はアフィン変換によって十分記述可能であると仮定しよう。その上で、対象画像の輪郭の幾何学的特徴の統計的な分布を用い、これから変換パラメータを推測する枠組みを開発する。提案手法を用いて推定した結果は照明条件や、センサー特徴などに対して頑健であるが、その理由は画像輪郭はこれらの条件に対して比較的不変であることによる。さらに、この方法には分散的な性質異質があるが、輪郭が分断されていたり、隠蔽されたり、乱れていたりする状況に対しても適応可能となっている。本アルゴリズムの精度や頑健性を実験的に確かめた。最後に、本手法を、多種センサー画像対を含む、実画像と合成画像の両方に適用した結果を示す。

Sz

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


RGFF表現モデル:ディジタル画像中の視覚パターンの自動学習分割するシステム
Partitioning of Visual Patterns in Digital Images

Rosa Rodriguez-Sanchesz, J. A. Garcia, J. Fdez-Valdivia, Xose R. Fdez-Vidal

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 10, pp.1044-1073, October 1999

Keywords: Visual patterns, image statistics, Log-Gabor filters, strongly responding units, integral features, invariance across orientations and scales, dynamic clustering

本稿では、2D画像の視覚パターンを自動学習分割するシステムについて述べる。その基本原理は、固定スケールで方位依存性のある、巧妙な帯域通過フィルタリング演算に基づいている。この手法に於ける視覚パターンとは、異なる周波数帯域にまたがって存在する、最も整列度の高い特徴と定義される。解析によって、統計的構造の中での不変量の制約に基づいて画像を再構築する。そのステップは次の3段階から成っている:1)事前注意段階、2)統合段階、3)学習段階。最初の段階では、入力画像を受け取り、一組の対数ガボア・フィルタを適用する。そのフィルタ応答に基づいて、画像のパターンに選択的敏感さをもつフィルタが列挙される。統合段階では、幾つかのセンサー間の共通の土台が探索される。フィルタ応答は、統計量の族を通じて解析がなされる。与えられた任意の二つのフィルタに対して、それらの距離は、統計量の間の距離を通じて導出される。三番目の段階である学習段階では、画像データを分割するのに必要な対数ガボア・フィルタの部分空間を学習するための機構として、クラスター分割がなされる。このクラスタリングは、フィルタ応答のスケール・方位不変量を強調するように作られた相違度に基づいている。この技法は、実および模擬データセットを対象に、示される。最後に、本稿では、計算的な視覚明瞭測度を与える。これは、視覚パターンに基づく画像表現モデルから算出される。この測度を適用して、複雑な自然情景における対象物の視覚的な明瞭度を定量化する。視覚明瞭度に関する、計算的測度と観察者(人間)評価との間の関連を調べるために、幾つかの実験がなされる。

Sz

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ウェーブレットに基づく位置合わせ手法の並進性への影響
The Translation Sensitivity of Wavelet-Based Registration

Harold S. Stone, Jacqueline Le Moigne, Morgan McGire

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 10, pp.1074-1081, October 1999

Keywords: Image registration, image search, wavelet transform, correlation, low-pass filter, high-pass filter, Haar wavelet, Daubechies wavelet, multiresolution search

ウェーブレットに基づく画像の位置合わせ手法が、並進性の影響をどの程度受けるかについて述べる。主な結論として、低域通過Haarフィルターと、Daubechies ウェーブレットサブバンドフィルターの正規化相関係数は、ウェーブレット・ブロックサイズの2倍以上の並進性には基本的に依存しないことがある。3層の低域通過サブバンドによって、0.7および1.0からの相関係数のピークを生成するが、平均で0.9だけ過剰となっている。その並進性への依存度は高域通過のサブバンドに限定されているが、このサブバンドも潜在的には利用価値がある。1,2層の低域通過サブバンドから得られた高域通過サブバンドの相関ピークは0.0から1.0の間にあり、平均でDaubechiesの場合0.5、Haarの場合0.7の過剰となる。これらの結果を得るために数学モデルを作り、そして、実データで確認した。

Sz,Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


色々なポーズに対応可能な、線に基づく顔認識
Line Based Face Recognition under Varying Pose

Olivier de Vel, Stefan Aeberhard

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 10, pp.1081-1088, October 1999

Keywords: Face recognition, line-based algorithm, classification accuracy, varying poses, real-time performance

多数の人間の顔認識システムが研究されているが、その中には正面からの顔画像で、顔の回転は制約付きで、平面内とか平面外で、照明法が決まっていたり、表情に制限があったり、厳しい撮影条件などの条件がある。視野球内での多様な視野を使った顔画像認識は、画像面からはずれた顔の回転は顔の構造が隠蔽される可能性があるためより困難な認識課題である。本論文では、基本的な画像表現として2次元顔画像のランダムな線セグメント画像を利用し、これと一緒に線のマッチング法として最近傍識別器を利用する。1次元線セグメントの組合せを、視野球の複数の2次元顔画像と調和させる。このアルゴリズムは、画像平面の内部においても外部においても、スケール変化に頑健で、計算効率も良く、高い一般化認識率を達成した。このアルゴリズムはベンチマークしたアルゴリズムに比べて識別精度が優れており、準実時間でテスト画像を認識することができた。

Sz,Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


手書き文字認識のための、クラス分離解析とクラス依存特徴量の結合
Analysis of Class Separation and Combination of Class-Dependent Features for Handwriting Recognition

Il-Seok Oh, Jin-Seon Lee, Ching Y. Suen

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 10, pp.1989-1094, October 1999

Keywords: Handwriting recognition, class separation, nonparametric method, class-dependent feature combination, modular neural network

本稿では、手書き文字認識において多数の特徴量を組み合わせる新規な方法を提案する。以下のような2つのアイデアを利用した:特徴量に基づく組合せ、および、クラス依存型特徴。特徴量の評価にはノンパラメトリックな方法が用いられ、本稿の最初の部分ではクラス分けと認識性能に関する特徴量の評価に焦点が当てられている。2番目の部分では、多数の特徴ベクトルが組み合わされ、新たなベクトルが形成される。特徴量は異なるクラス毎に異なる識別能力を発揮する事実を考慮して、新規なクラス依存型特徴量の選択と組合せを提案する。この手法では、クラス毎に自分自身を他から識別するための最適特徴ベクトルを有すると考えられる。識別器としてモジュール化したニューラルネットワークの様式を利用して、制限なし手書き文字の認識実験を実施した。その結果、選択された特徴量はパターンのクラス分けに有効であり、このようなベクトル2個から合成される新特徴ベクトルによって更に認識率が改善されることが分かった。

Sz,Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


手書き漢字のスケルトンにおける分岐点の同定
Identification of Fork Points on the Skeletons of Handwritten Chinese Characters

K. Liu, Y. S. Huang, C. Y. Suen

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 10, pp.1095-1100, October 1999

Keywords: Thinning, selection, segmentation, stroke extraction, character recognition, handwritten Chinese character

本稿では手書き漢字認識に利用されるストローク抽出技術に関して述べる。スケルトン画像の解析に新規な特徴点集合を提案する。幾何学的グラフに基づいて、スケルトン画像中の分岐点を同定するための新規な基準を提案する。実験によって本提案手法が分岐点を正しく検出し、分岐点を統合するのに効果的であることが示された。

Sz

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.21, No.11


同伴グラフを使った階層構造マッチング
Matching Hierarchical Structures Using Association Graphs

Marcello Pelillo, Kaleem Siddiqi, Steven W. Zucker

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 11, pp.1105-1120, November 1999

Keywords: Terms-Maximal subtree isomorphisms, association graphs, maximal cliques, replicator dynamical systems, shock trees, shape recognition

2つの関係構造をマッチングさせる問題は、同伴グラフにおいて最大クリーク(clique)を見つける問題と等価であることはよく知られている。しかし、グラフが階層構造となっている、つまり、木構造となっており、最大クリークは部分オーダーを保存していないようなコンピュータビジョンの問題にどのように応用するかははっきりしていなかった。ここに、グラフ理論の連結性の概念を利用した同伴グラフを構築して、2つの木の間のマッチング問題を解いて見よう。新しい定式化において、最大クリークと、最大部分木の同形の間には1:1の関係があることを証明する。これによって、木のマッチング問題をMotzkin-Strausを利用して無限2次計画問題に変換することが可能となる。これを解くために、我々は理論的生物を想定し(人工生命)動的な複製系(遺伝子)を開発した。このような連続的問題を、離散的問題に置き換えることは、類似の応用を促す意味で魅力的であろう。この手法は、重み付き同伴グラフを使うことで、属性木のマッチングにも拡張可能である。関連付けられ、変形したショック木で表現された形状のマッチングに適用することで、その威力を図解する。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


図表認識改良のための生成ソフトウエア:音楽記号についてのケーススタディ
Generation Software to Improve Diagram Recognition: A Case Study of Music Notation

Dorothea Blostein, Lippold Haken

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 11, pp.1121-1136, November 1999

Keywords: Document image analysis, graphics recognition, diagram recognition, music notation

図表は社会の中で広く利用されており、その実例は、回路設計、音楽、数学公式、建築計画図面、分子構造に見られる。コンピュータは、これら紙の上の記号である画像の図表と、情報としての図表の両方を処理する必要がある。図表認識器は、画像から情報へと翻訳するし、図表発生器は情報から画像へと翻訳する。現在の図表発生技術は、図表認識技術より先行している。図表発生器は表記上の約束事に関する知識がふんだんに利用されており、その中には読み易さや美的趣も含まれている。他方、現状の認識器は記法上の厳しい制約を求められている。レイアウトの情報を抽出できる認識器を作るには、現状の図表発生器に内在されている専門性を再利用するのが当を得た方法であろう。とくに、我々は楽譜の編集・発生器であるLimeを、MIDIScan(市販の楽譜認識器)が出力した生の情報の校正と修正に利用することを論じた。過去数年間に渡り、この組合せのソフトウエアが何千ものユーザーに頒布された。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


パターン認識のための識別アルゴリズムのメタ解析
Meta Analysis of Classification Algorithms for Pattern Recognition

So Young Sohn

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 11, pp.1137-1144, November 1999

Keywords: Data mining, meta analysis, logit model, multivariate statistics

科学検出機器の発達のお陰で、大規模実時間検査システムが可能になってきた。そして、そのような大規模で無意味なデータベースから、意味のある情報を取り出す、データマイニングが経営判断には不可欠に成りつつある。データマイニングや知識発見の分野において、学際分野の研究の発展によって、各種の識別アルゴリズムが利用可能に成ってきている。データの特徴に着目して、いくつかのアルゴリズムの識別効率について比較する統計的メタモデルを開発した。この経験的モデルによって、いくつかのアルゴリズムの中で誤識別を最小化するような、最良の識別ツールを見つけるための決定プロセスを補助することが期待される。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


異なる物理ノイズモデルに適応したスネークに基づく統計的領域セグメンテーション
Statistical Region Snake Based Segmentation Adapted to Different Physical Noise Models

Christophe Chesnaud, Philippe Refregier, Vlady Boulet

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 11, pp.1145-1156, November 1999

Keywords: Image processing, statistical theory of estimation, segmentation, active contour

多くの画像処理応用において、オブジェクトのセグメンテーションアルゴリズムは決定的な重要性をもつ。過去数年、能動的輪郭モデル(スネーク)は、オブジェクトの輪郭を見つけるために広く利用されてきた。このセグメンテーション戦略は、スネークが画像のエッジマップに最大合致するように構成されると言う意味において、エッジに基づく古典的なものである。本論文では、領域スネークに基づく手法を提案し、画像中のオブジェクトを高速にセグメンテーションするアルゴリズムを紹介する。本アルゴリズムは最尤手法によって開発されたもので、(スネークによって定義される)内側と外側の統計計算によって求められる。もし、入力濃淡画像の確率分布関数族が既知であると仮定すれば、その確率場に適応した最適アルゴリズムが開発可能である。この手法は、画像中に輪郭境界が存在しない場合にも有効であることを示す。また、領域内の加算を、領域境界に沿っての加算に変形することで高速アルゴリズムが可能であることを示す。最後に、この手法の有効性を示すために、異なる物理環境に於ける数値シミュレーション結果を示す。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


マルコフ確率場における芯線算出のための確率論的ジャンプ・拡散プロセス
Stochastic Jump-Diffusion Process for Computing Medial Axes in Markov Random Fields

Song-Chun Zhu

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 11, pp.1158-1169, November 1999

Keywords: Medial axis transform, jump-diffusion process, energy minimization, Markov random field

本論文は2D画像の芯線算出のための統計的枠組みを提案する。論文中において、芯線の算出は、数学的な変換ではなく、統計的な推定問題であると見なす。芯線抽出において、本論文は次の3つの面で寄与する。1)芯線や分岐が整合するように、先験知識が採用されていること、2)芯線は多重解釈可能であり、その各々に確率が与えられていること、3)マルコフ確率場における芯線と分岐の両方を推定するために、新規に確率論的ジャンプ・拡散プロセスが提案されていることである。芯線算出のための確率論的アルゴリズムは、領域成長、スネーク、領域競合と言った既存の画像セグメンテーションと共存可能であることを論じる。従って、我々の提案する方法はテクスチャー画像から芯線を算出する新しい方向性を与える。本手法を合成画像と実画像の両方に適用した。その結果、形状学習とサンプリングにうまく適用できた。本論文の次の論文を参照されたい。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


マルコフ確率場に埋め込まれたゲシュタルト法則
Embedding Gestalt Laws in Markov Random Fields

Song-Chun Zhu

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 11, pp.1170-1187, November 1999

Keywords: Gestalt laws, perceptional grouping, shape modeling, Markov random field, maximum entropy, shape synthesis, active contour

本論文の最終目標は2Dオブジェクト形状のモデル化と、画像セグメンテーションや認知の組織化のような中レベルの学習に関する数学の枠組みを研究することである。この目的のために、2Dオブジェクト形状の最も共通性の高い特徴量を性格付ける汎用的形状モデルを追求する。論文中では、形状モデルは、ミニマックス・エントロピー学習理論に基づいて、観察された自然形状から学習する。学習された形状モデルはマルコフ確率場において定義されるGibbs分布である。マルコフ場の近傍構造はゲシュタルトの法則(幼児期、無意味な形状の中から、特定の形状モデルに一致させる性向が強く現れる効果)に対応している。すなわち、共線形性、共円性、近隣性、平行性、対称性。つまり、輪郭に基づく特徴量も、領域に基づく特徴量も両方とも説明が付く。この学習とモデル照合の説明のために、確率論的マルコフ鎖モンテカルロアルゴリズムを提案する。さらに、本論文は、いわゆる非偶然性統計量に定量的尺度を与える結果、ゲシュタルト心理学の経験的観察が情報理論により正当付けられる。実験によれば、局所特徴量の相互作用から全体的形状特徴が成長してくるのが示される。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


更正されてない見かけ上の輪郭画像からの曲面のアフィン再構成
Affine Reconstruction of Curved Surfaces from Uncalibrated Views of Apparent Contours

Jun Sato, Roberto Cipolla

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 11, pp.1188-1198, November 1999

Keywords: Curved surfaces, affine reconstruction, uncalibrated reconstruction, apparent contours, epipolar geometry, time-to-contact

本論文では、更正されてない、見かけの画像輪郭から曲面を再構成することを考察する。見かけ上の輪郭というものは固定した(視点に独立した)特徴量があるわけではないから、固定特徴量を有する未更正画像からの再構成結果を直接利用するわけにはいかない。しかし、未更正カメラ画像の見かけ上の輪郭から、未知の線形変換によってアフィン冗長度の範囲内で曲面が再構成可能であることを示す。さらに、再構成が尺度を持たなくても(非ユークリッド)、輪郭だけから多くのコンピュータビジョン応用に有用な情報を抽出できることを示す。まず、カメラの動きが線形変換(方位は任意)であるならば、最適化プロセスを用いなくとも、見かけ上の輪郭からエピポーラ幾何が抽出可能であることを示す。抽出されたエピポーラ幾何は、次に未更正カメラ画像の見かけ上の輪郭の変形量から曲面の再構成に利用される。この結果は、画像中の固定特徴量から曲面を区別するために応用される。また、曲面に接触するまでの時間(time-to-contact)が見かけ輪郭の簡単な計測から計算されることが示される。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


スケール・空間・エントロピー条件による画像構造の表現について
On the Representation of Image Structures via Scale Space Entropy Conditions

Mario Ferraro, Giuseppe Boccignone, Terry Caelli

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 11, pp.1199-1203, November 1999

Keywords: Scale space, entropy production, features encoding

画像を異なるスケールで解析することは、符号化、圧縮、特徴抽出などに多くの洞察を与える。本論文はスケール・空間の異なった領域内に閉じこめられた画像特徴を表現し、演算するための新規な方法を示す。スケールと空間の生成モデルとして熱力学モデルを採用することによって、いわゆるエントロピーに富む画像領域に対応する特徴量が求まる。ここでは、あるスケールの範囲内でエントロピー勾配が一定となる。情報内容が異なる領域である、異質な画像特徴が、このような領域内の異なる空間スケール帯内に符号化される。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ファジー推論による平面曲線上のコーナー検出と解釈
Corner Detection and Interpretation on Planar Curves Using Fuzzy Reasoning

Liyuan Li, Weinan Chen

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 11, pp.1204-1210, November 1999

Keywords: Corner detection, dominant point detection, digital curves, curve description, feature extraction, shape analysis, fuzzy reasoning, fuzzy pattern recognition

平面曲線のコーナー検出は、局所図形特徴をヒトがどう知覚するかによって調べられている。最初に、輪郭点列による曖昧なパターン集合が用意された。次に、コーナー検出がファジ識別問題として特徴づけられた。その中には、評価、識別、場所という3段階がある。在来手法の単なるラベル付け法と比較して、本手法は曲線について説明機能を有する点と、ヒトの知覚に基づいて実行することで優れている。多様な複雑度の形状に適用した実験結果が示されている。ノイズに対する出来映えも紹介されている。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


カラーと照度の投票
Color and Illuminant Voting

Guillermo Sapiro

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 11, pp.1210-1215, November 1999

Keywords: Physics-based vision, color constancy, illuminant estimation, Hough transform, physical constraints, bilinear models

カラーの安定化と照度推定に対する幾何学的ビジョン法による解法が本論文中に紹介されている。その一般的枠組みを示すが、その基になったアイデアは一般化確率的ハフ変換であり、これによって自然画像の照度と反射度合いを推定する。各画素は、照度推定値を投票するが、この累積投票数に基づいて推定がなされる。この枠組みは、色一定性問題という物理的制約条件を導入するのに自然である。カラー一定性の以前のアルゴリズムと、本手法との関連を示す。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


モーメント法によるノイズ画像中のロバストな線分フィッティング法
Robust Line Fitting in a Noisy Image by the Method of Moments

H. Qjidaa, L. Radouane

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 11, pp.1216-1223, November 1999

Keywords: Line fitting, outliers, inliers, underlying p.d.f., Legendre moments, maximum entropy principle, clustering

入力系に顕著なランダムノイズが存在する場合には、直線フィッティング法を点データ集合に適用するに際し、標準的な最小2乗距離法は、直線と相関があるデータに比べて、信頼性が低くなることが知られている。ここに、ルジャンドルモーメント理論と最大エントロピー原理に基づく、ノイズ画像への直線フィッティングに関する新しい統計的クラスタリング法を紹介する。隠された真の確率分布関数を推定するための新しい方法を提案する。この確率分布関数は、ルジャンドルモーメントを使ったルジャンドル多項式によって展開される。展開のオーダーは最大エントロピー原理によって選択される。確率分布関数の最大値に対応する点を直線の真の点として、連鎖アルゴリズムによって抽出される。この手法は直接多次元データに一般化される。この手法を、ノイズの多い実画像とシムレーション画像へ適用した結果は他の既知の方法と比較しても上々であった。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


TextFinder:画像中のテキストを自動的に検出、認識するシステム
TextFinder: An Automatic System to Detect and Recognize Text in Images

Victor Wu, Raghavan Manmatha, Edward M. Riseman

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 11, pp.1224-1229, November 1999

Keywords: Text reading, character recognition, multimedia indexing, text detection, texture segmentation, filters, hierarchical processing, binarization, connected-components

ビデオ画像、新聞、広告、株式証券、写真、小切手など、異なる画像中から自動的にテキストを検出・認識する頑健なシステムを提案する。テキストの検出には、まず多段スケールのテクスチャーセグメンテーションと領域凝集化による制約によって検出され、更に、ヒストグラムに基づく2値化アルゴリズムによって、整理抽出される。システム性能評価の自動化手法も提案した。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


RANSACに基づくDARCES:部分的に重なった距離画像の高速自動位置合わせの新手法
RANSAC-Based DARCES: A New Approach to Fast Automatic Registration of Partially Overlapping Range Images

Chu-Song Chen, Yi-Ping Hung, Jen-Bo Cheng

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 11, pp.1229-1234, November 1999

Keywords: Computer vision, image data, range image, registration, 3D imaging

本論文では、新しい手法であるRANSAC(Random Sample Consensus)に基づくDARCES(Data Aligned Rigidity-Constrained Exhaustive Search)を提案する。これは初期推定を用いないで、部分的に重なり合った3Dの位置合わせ問題である。ノイズのない場合、我々の基本的アルゴリズムの見つける解は真であることが保証されるだけでなく、それに要する計算時間複雑度も比較的小さいことが示される。更なる特徴として、本手法は、3Dデータ中に局所的特徴が存在しないときでも利用可能であることがあげられる。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


仮説検定による直線特徴からのオブジェクト姿勢の高信頼性決定法
Reliable Determination of Object Pose from Line Features by Hypothesis Testing

Chin-Cheng, Wen-Hsiang Tsai

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 11, pp.1235-1241, November 1999

Keywords: 3D-to-2D, line features, object poses, hypothesis testing, reject option, reliable estimated poses

信頼性の高いコンピュータビジョンシステムを開発するためには、採用されたアルゴリズムの出力品質が保証されなくてはならない。本研究において、直線特徴から推定される姿勢の質を保証するために、統計的仮説検定に基づく簡便な2つの検定関数が定義される。第1に、直線特徴量間の関係に基づく誤差関数や、品質閾値が定義された。姿勢推定のあと、推定結果が十分正確であるかどうかについて第2の検定関数が導入される。実験結果によると、最初の検定関数による検出結果は、低品質であったり、誤差を含む直線対応を検出するが、提案手法全体としての推定結果は高い信頼性を示す。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


分散カメラ系による構造的環境中のヒトの追跡
Tracking Human Motion in Structured Environments Using a Distributed-Camera System

Q. Cai, J. K. Aggarwal

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 11, pp.1241-1247, November 1999

Keywords: Tracking, human modeling, motion estimation, multiple perspectives, Bayesian classification, end-to-end vision systems

本論文は、多視点カメラによる同期単眼モノクロ動画中から、大まかにヒトのモデルを追跡するための概念的枠組みを紹介する。異なるカメラ座標系における3D幾何の動き解析とか、動き検出、セグメンテーション、パターン認識のユニークな組合せによって一連のヒト追跡システムの可能性を示す。このシステムは1つのカメラ画像から追跡を開始する。可動カメラが対象物をこれ以上捉えられないと予測されたとき、別のカメラにスイッチされ、よりよい画像で連続追跡可能となる。ヒトの体の柔軟性に対処するため、空間的にも時間的にも、ヒト画像の中心線の点がマッチングに利用される。このとき、ベイズ識別法が利用される。位置、強度、幾何学的特徴などの追跡特徴量のクラス条件付き確率密度モデルとして、多変量正規分布が利用された。本システムにおいて、ある程度の隠蔽は許容した。プロトタイプを使った実験結果から、そのアルゴリズムの実時間応用の可能性が実証評価された。

Ej

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.21, No.12


データの近接性に関する新しい制約と、陰影から形状復元(Shape-from-Shading)した針状マップの整合性
New Constraints on Data-Closeness and Needle Map Consistency for Shape-from-Shading

Philip L. Worthington, Edwin R. Hancock

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 12, pp.1250-1267, December 1999

Keywords: Shape-from-shading, hard constraints, curvature consistency, gradient consistency, robust statistics

陰影からの形状復元(shape-from-shading)を用いる針状マップ(多数の微小ベクトルによる画像表現)再現問題に対して、本研究は二つの貢献をする。 第一に、幾何学的な更新手続きを与える。これは、画像の照射方程式が、強い拘束条件として満たされることを許容するものである。これは、再現される針状マップ情報と元情報との近似性を向上させるのみならず、面倒なパラメータの調整を不要とする。第二に、この新しい陰影からの形状復元プロセスによって、その制御が容易になり、多様な形式の針状マップの整合性の要件を調べることが出来る。第一の拘束条件の組は、針状マップの滑らかさを基にしている。第二の調査手段は、地形的な拘束条件を課すために曲率情報を用いるという方法である。第三には、(原)画像の勾配場と矛盾しないように針状マップを再現する方法を探索する。それぞれのケースで、多様なロバストな誤差測度と一貫性のある重み付けスキームとを探索する。このスキームによって、再現される針状マップに所望の拘束条件を課すことができる。本論文では、既知の正解法線を伴う実画像と合成画像との両方を対象に、新しいshape-from-shadingのフレームワークの実験的評価を示す。今回の解析から導かれる主な結論は、データ近似性の拘束条件がshape-from-shading の効率を向上させることと、地形的・勾配的な意味での一貫性の拘束条件が、再現される針状マップの忠実度を向上させることである。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


スケールに敏感なゲート付きエキスパートを利用した特徴データの発掘
Data Mining for Features Using Scale-Sensitive Gated Experts

Ashok N. Srivastava, Renjeng Su, Andreas S. Weigend

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 12, pp.1268-1279, December 1999

Keywords: Mixture of experts, mixture model, classification and regression, time series segmentation, neural networks

本稿は、スケールに敏感なゲート付きエキスパート(Scale-Sensitive Gated Experts (SSGE))と呼ばれる複雑で非線形回帰表面を、より単純な表面(これを特徴量と呼ぶ)に分割する新しいツールについて述べる。この単純な表面集合は、各要素が1つのフィードフォワード型ニューラルネットワークによって効率的にモデル化される。回帰表面が分割される度合いは外的に与えられるスケールパラメータによって制御される。SSGEは非線形ゲート付きネットワークといくつかの競合する非線形エキスパートから成っている。このSSGEはJacobたちの各種エキスパートの系に似ているが、後者は入力・出力空間を1回分割するだけであり、従って、1種類の特徴量集合が得られるのに対し、SSGEは、特徴量の族を発見することが可能である。スケールパラメータを設定する毎に、新たな特徴量集合が得られる。本稿では、スケール依存性ゲート付きエキスパートを導出し、この効率を時系列セグメンテーション問題に適用して示す。主要な結論は、1)スケールパラメータによって回帰表面の特徴量の粒度が制御される。2)類似特徴量は同じエキスパートによってモデル化され、異なる種類の特徴量は異なるエキスパートによってモデル化される。3)時系列問題には、SSGEは課題毎に異なった興味ある振る舞いを示す。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


プロトタイプの抽出と適応的OCR
Prototype Extraction and Adaptive OCR

Yihong Xu, George Nagy

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 12, pp.1280-1296, December 1999

Keywords: Optical character recognition, adaptive classification, template matching, segmentation, document image analysis, text reader

ページ画像の構成、生成、量子化の品質が低下してもOCRの精度を維持するためには、システムの文書に合わせて調整することが不可避である。我々は文書用OCRのためのプロトタイプ(手本文字)抽出法を提案する。これはセグメント化されてないテキスト画像と、それに対応する文字画像の連鎖から自動的に訓練用サンプルを生成し、それに対応する翻訳(認識結果)を作る。文字連鎖の誤りを、システムは許容するため、不完全なオムニフォントOCRをこの目的に利用することができる。本手法はセグメント化されてないテキストから、文字幅、単語中の文字位置、合致/非合致確率を推定する新しいアルゴリズムに基づいている。このプロトタイプ抽出アルゴリズムとセグメンテーション無しの単語認識を結びつけて、実験的に単語認識システムが設計構築された。その結果、システムは異なるページ画像に適応し、ひどく汚れた印刷物に対しても高い認識精度を示した。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


分類と回帰のための大域最適化ファジー決定木
Globally Optimal Fuzzy Decision Trees for Classification and Regression

Alberto Suarez, James F. Lutsko

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 12, pp.1297-1311, December 1999

Keywords: Automatic learning, decision trees, fuzzy set theory, global optimization, backpropagation, nonparametric regression, classification

ファジー決定木は、木を構成するノード中の節点の部分的メンバシップの可能性を許す事により、構築される。この表現能力の拡張により、決定木は強力な機能的approximant(類似物)に変換される。このapproximantは、解釈容易さを残したままで、コネクショニスト的手法の特徴を取り入れるものである。 CART(Classification And Regression Trees)決定木のスケルトンにファジー構造を重畳することにより、ファジー化がなされる。ファジー木のトレーニングルールは、ニューラルネットのバックプロパゲーションに類似した形でデザインされている。このルールは、ファジー分岐のパラメータを特定する大域最適化アルゴリズムと同じものである。ファジー決定木の自動生成のために開発されたこの方法を、分類問題と回帰問題の両方に対して適用する。回帰問題では、ファジー木の表現関数により課される連続性拘束条件が、回帰品質の実質的な向上をもたらし、過剰適応を制限することが観測される。分類問題におけるファジー化は、属性空間における分類誤差の確率分布構造を明らかにする方法をもたらす。この方法により、決定木の誤り率を平均誤差率よりも有為に低く、時にはベイズ法の誤分類率よりも低くなるように領域同定を行うことができる。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


曲線の柔軟な構文的マッチングと、シルエットの階層的自動識別への応用
Flexible Syntactic Matching of Curves and Its Application to Automatic Hierarchical Classification of Silhouettes

Yoram Gdalyahu, Daphna Weinshall

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 12, pp.1312-1328, December 1999

Keywords: Curve matching, syntactic matching, image database, silhouettes

曲線マッチングは、基本的な対応付け問題の一例である。ここで示す柔軟なアルゴリズムは、重度の変形や任意の大規模変倍、そして剛体変換等の条件下で曲線のマッチングができるようにデザインされている。両曲線に対して構文的表現が構成され、一方の曲線を他方へと写像するエディット変換が、ダイナミック・プログラミングにより検出される。上記のアルゴリズムを、シルエット・マッチングに適用した大規模な実験を示す。今回の実験では、部分的な隠蔽、様々な視点、分節、およびクラスマッチング(類似する物体のシルエットがマッチングされること)について検証する。今回、定性的な構文的マッチングを基にして相違度を定義し、データベース上の121の画像の全ての組に付いてそれを計算した。この実験により、今回のアルゴリズムを客観的に評価する:第一に、今回の結果を他の報告と比較する。第二に、データベースを形状カテゴリに分類・組織化するために相違度を用いる。実際にデータベースが階層組織化されることは、今回のマッチング及び類似性推定の良さの根拠となる。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


逆ハフ変換について
On the Inverse Hough Transform

Anastasios L. Kesidis, Nikos Papamarkos

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 12, pp.1329-1343, December 1999

Keywords: GHough Transform, edge extraction, line detection, nonlinear filtering

本稿では、逆ハフ変換アルゴリズムを示す。本アルゴリズムは、ハフ空間の情報のみを用いて原画像を正確に再現する。これはあらゆる二値画像に適用可能である。最初のアプリケーションとして、直線検出及びフィルタリングに、このアルゴリズムを用いる。標準的なハフ変換の場合、線は、連続な直線としてではなく、原画像にあるがままの姿で(つまり画素毎に)検出される。ハフ空間での量子化誤差の影響を回避するため、原画像の大きさにのみ関連する逆変換条件を定義する。今回の実験結果により、本アルゴリズムはロバストかつ正確であることが示される。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


手書きフレーズのholisticな検証
Holistic Verification of Handwritten Phrases

Sriganesh Madhvanath, Evelyn Kleinberg, Venu Govindaraju

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 12, pp.1344-1356, December 1999

Keywords: Word verification, holistic approaches, word shape matching, handwritten word recognition, address interpretation

本稿では、手書きフレーズ画像の知覚的holistic(総体的)特徴を用いた制限なしオフライン手書きフレーズの高速検証のためのシステムを示す。本システムは、現行のアメリカの郵便物から自動抽出された手書きの通り名称を対象とし、解析的識別器の認識結果に対する検証に用いられる。通り名の二値画像とASCIIコードとが与えられると、通り名称候補の holistic 特徴(基準線、大きな間隙と局所輪郭の極値)は、構成文字の期待される特徴から、ヒューリスティックなルールを用いて「予測」される。ダイナミックプログラミングアルゴリズムを用いて、予測された特徴と画像から抽出された特徴のマッチングを行う。 holistic 特徴のクラスは、宛先の受容/拒否の決定を許容しつつ、時間効率のよい方法で、コスト増加順に逐次的にマッチングされる。本システムは、30%の受容レベルで98%のエラーを拒否する。1画像あたり平均およそ20/msec(SPARC10,150MHz)である。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


単一の顔画像の自動識別
Automatic Classification of Single Facial Images

Michael J. Lyons, Julien Budynek, Shigeru Akamatsu

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 12, pp.1357-1362, December 1999

Keywords: Computer vision, face recognition, facial expression recognition, Gabor wavelets, principal component analysis, discriminant analysis

ラベル付けされた伸縮性グラフマッチング、二次元のガボール・ウェーブレット表現、および線形判別解析を基にした顔画像の自動分類方法を示す。性別、「人種」、そして表情を分類して表わすようにテスト結果をツリー状に示す。そして判別ベクトルの視覚的解釈を与える。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


リレーショナルヒストグラムによる線パターンの検索
Line Pattern Retrieval Using Relational Histograms

Benoit Huet, Edwin R. Hancock

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 12, pp.1363-1370, December 1999

Keywords: Image database, line patterns, content-based retrieval, relational representation, geometric features, histogram comparison

形状表現と認識には線パターンが極めて有効であることが分かっている。大規模データベースからの線パターンの検索のために、新しいコンパクトな形状表現法を示す。基礎となる考えは、形状ヒストグラムを作成するのに幾何的な特徴と構造情報の両方用いる、というものである。線分の各パターンに対して、N個の最近傍グラフを計算することにより上記の目的を実現する。近傍グラフの枝は、二次元ペア毎の幾何ヒストグラムに対する寄与を制御するのに用いられる。つまり、2つの線分の相対角度と、線分長の比、のヒストグラムを利用する。正規化されたヒストグラム各項の相互相関を最大にする線パターンを探し出すことにより、形状がインデキシングされる。それぞれが数百本の線分からなる線パターン画像を2,500以上含むデータベースを対象として、今回の方法を評価する。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


波形のマッチングによる追跡と連続的隠れマルコフモデルによる、多重アスペクト的な標的の同定
Multiaspect Target Identification with Wave-Based Matched Pursuits and Continuous Hidden Markov Models

Paul Runkle, Lawrence Carin, Luise Couchman, Timothy J. Yoder, Joseph A. Bucaro

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 21, No. 12, pp.1371-1378, December 1999

Keywords: Hidden Markov model, matched pursuits, classification

本稿の目的は、遠方にある未知の標的を多数の異なるセンサーで検出し、その位置を確定した後、それが何であるかを同定することである。このような多面的標的の同定は、複数の散乱した波の形状から抽出された特徴量を融合することで達成される。これらの波の形状は、標的の方位が刻々変化する特徴を表している。まず、最尤法による識別が実行されるが、これは合理的な仮定のもとで、隠れマルコフモデルを用いて実現されうるのであり、本稿ではそのことを示す。我々は連続隠れマルコフモデルを利用し、これと離散的な隠れマルコフと比較した。特徴量に解釈は波に基づくマッチング法を採用した。5つの隠れた伸縮性標的から散乱された音響分散データ(増幅されていない分散データ)を測定し、このアルゴリズムの評価がなされた。

SUZUKI,Takeshi

Copyright (c) 1999 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


[インデックス] [前の年] [次の年]