AbstractClub - 英文技術専門誌の論文・記事の和文要約


[インデックス] [前の年] [次の年]


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.22, No.1


統計的パターン認識:レビュー
Statistical Pattern Recognition: A Review

Anil K. Jain, Robert P. W. Duin, Jianchang Mao

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 1, pp.4-37, January 2000

Keywords: Statistical pattern recognition, classification, clustering, feature extraction, feature selection, error estimation, classifier combination, neural networks

パターン認識の主要な最終目的は、教師つき、あるいは、教師なしの識別であろう。伝統的にパターン認識が定式化を行ってきたその構想の中で、統計的手法は最も熱心に研究され、実際に使われてきた。最近では統計的学習理論から導入されたニューラルネットワーク手法がますます注目を集めている。認識システムの設計には以下のような注意深い配慮が要求される;パターンクラスの定義、情報検知環境、パターン表現、特徴量抽出と選択、クラスター分析、識別器の設計と学習、訓練および検定サンプルの選択、効率の評価。この分野に於ける約50年の研究開発にもかかわらず、複雑なパターンを方位、位置およびスケールによらず認識するという一般的な課題は未解決のままである。データマイニング、ウェブ探索、マルチメディア検索、顔認識、手書き認識のような新しくて育ちつつある応用分野には頑健で効率的なパターン認識手法が要求される。このレビューの目的は、パターン認識システムの色々な段階で利用されている、有名な手法のいくつかをまとめて比較し、この刺激的で挑戦のしがいのある分野の最前線にある研究トピックスや応用分野を認定することである。!

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


PAMIにおける文書画像解析の20年
Twenty Years of Document Image Analysis in PAMI

George Nagy

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 1, pp.38-62, January 2000

Keywords: Document image analysis, image processing , OCR, character recognition, forms processing, graphics recognition

PAMIに寄稿された99の論文を分類し、まとめ、補完し、解釈し、差し障り無く評価した。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


オンライン、および、オフラインの手書き認識:包括的概説
On-Line and Off-Line Handwriting Recognition: A Comprehensive Survey

Rejean Plamondon, Sargur N. Srihari

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 1, pp.63-84, January 2000

Keywords: Handwriting recognition, on-line, off-line, written language, signature verification, cursive script, handwriting learning tools, writer authentification

手書きは日常生活の中でのコミュニケーションや記録の手段として依然として利用され続けている。人に関わる処理において、手書き文書の機械による認識は、PDAへの記録、郵便封筒の宛先、銀行小切手の金額、所定様式の手書き領域の読み取りなど、実用的な重要性を持っている。ここでは、手書き言語の性質、その電子化方法、そして、手書き言語認識アルゴリズムの背景をなす基礎的考え方について概観する。オンラインの場合(記録中に筆跡を得ることができる)、及びオフライン(画像を走査して得られる)の両方について考察する。文字や単語の認識に於ける前処理アルゴリズムや実用的システムに於ける効率についても触れる。その他、署名照合、著者の真偽確認、手書きの学習ツールについても考察する。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


医療画像解析:20年間の進歩と将来の挑戦
Medical Image Analysis: Progress over Two Decades and the Challenges Ahead

James S. Duncan, Nicholas Ayache

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 1, pp.85-106, January 2000

Keywords: Medical imaging, medical image analysis, computer vision, image segmentation, image registration, nonrigid motion, deformable contours, image-guided surgery

医療画像解析は、PAMIのコミュニティにおいて雑誌の創刊のころから関わってきた。当初は、パターン解析やコンピュータビジョンの技術を別の分野に応用することに努力が払われていた。しかし、過去20年、30年の間にこの分野のユニークな問題の特性から、医療分野独特の発展を促してきた。これらの例としては、取得する画像情報のタイプ、データの3次元性、対象物の動きや変形が非剛体的であること、対応する実測データが潜在的に正常であろうと異常であろうと統計的分散に対する配慮があげられる。本論文では、過去20年以上にわたる発展を観察し、今後に向けて挑戦すべき課題のいくつかを示唆する。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


人々を見る:どこにでも存在し、そして、身につけたコンピュータが処理するための検知技術
Looking at People: Sensing for Ubiquitous and Wearable Computing

Alex Pentland

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 1, pp.107-119, January 2000

Keywords: Looking at people, face recognition, gesture recognition, visual interface, appearance-based vision, wearable computing, ubiquitous

人々を見る、つまり、人々を検知し、追跡し、同定するということ、すなわち、人の行動を解釈すると言うことは、マシンビジョンにおける中心課題となってきた。当初、あまりにも難しすぎて研究テーマだと思われたことも、十分取り組みが可能であることが分かり、そのいくつかは商品化企業を誕生させた。本技術の主要な応用として上げられるものに、埋め込み型第4世代コンピュータ、よく整備された環境、携帯あるいは着衣デバイスなどがある。鍵となる牽引技術の目標は、関連する人に関係した(すなわち、誰が、何を、いつ、どこで、なぜ)内容が何であるかを決定することである。本論文は、強力であることが判明している数学的ツールを調べ、問題領域における分類体系を作ることであり、それから最新の技術を調べることである。とくに以下の4分野に注目する:人の同定、監視/モニター、3D手法、利口な室内/知覚インターフェース。最後に、今後に残された主要課題と、新たな機会について述べる。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ボロノイ(Voronoi)ダイアグラムを簡略化した角二分割ネットワーク:その生医学画像における複雑な交差の処理への応用
Angular Bisector Network, a Simplified Generalized Voronoi Diagram: Application to Processing Complex Intersections in Biomedical Images

Florence Cloppet, Jean-Michel Oliva, George Stamon

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 1, pp.120-128, January 2000

Keywords: shape descriptors, skeleton, generalized Voronoi diagram, graph theory

コンピュータビジョンの主要目標の1つは、形状記述のための柔軟な方法の研究と開発である。発見的方法によって形状を記述する方法が多数知られており、これによって簡単な形状や領域は、受容できるレベルの結果が得られている。この場合、オブジェクトは、ノードが部分領域(領域を分割したもの)を表す平面グラフで表現され、領域の形状はグラフの性質として表される。本論文では多角形形状の記述子である角二分割ネットワーク(Angular Bisector Networks (ABN))によって自動的にセル構造のニューロン突起間の分割を検出する。線形代数複雑度のようなABNの性質とか、特徴点の抽出のしやすさなどは極めて有用であり、実験結果は確実に得られる。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.22, No.2


ソナー画像の陰影形状識別のためのハイブリッド遺伝法の最適化とモデルに基づく統計的手法
Hybrid Genetic Optimization and Statistical Model-Based Approach for the Classification of Shadow Shapes in Sonar Imagery

Max Mignotte, Christophe Collet, Patrick Perez, Patrick Bouthemy

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 2, pp.129-141, February 2000

Keywords: Deformable template, objective function, simulated annealing, gradient-based algorithm, genetic optimization, shape recognition, sonar imagery

高解像度のソナー画像中の人工物から変形可能なテンプレートモデルを用いて自然物を分離する、独自な統計的識別法を紹介する。許容される線形変換法といっしょに、プロトタイプのテンプレートとして人造物の陰影形状が事前知識として与えられる結果、形状の変動幅が考慮されることになる。用意された線形変換とは、スケール変換、一方向への伸縮変換、回転変換、ねじれ変換の4つである。次に、識別問題が二段階プロセスとして定義される。第一に、入力画像中の対象領域の検出は、コスト関数最小化問題として定義される。第二に、収束点におけるこの関数値によって、目的オブジェクトがソナー画像中に存在するか否かが判定される。エネルギー最小化問題は緩和法(降下法)と、次の2つの確率的緩和法を使って取り組むことができる:すなわち、シミュレーテッド・アニーリング法やハイブリッド・遺伝子アルゴリズムである。後者は人造データとソナー画像の両方でテストされ、有望な結果が得られた。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


カラーテクスチャーのセグメンテーション
Segmentation of Color Textures

Majid Mimehdi, Maria Petrou

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 2, pp.142-159, February 2000

Keywords: Color segmentation, probabilistic relaxation, perceptual smoothing

本論文は、カラー画像のテクスチャーの知覚的セグメンテーションについて述べる。テクスチャー画像の多段スケール画像をマルチバンドの平滑化アルゴリズムによって生成するが、このとき入力されるカラーの知覚量はヒトの心理物理測定に基づいてなされる。初期セグメンテーションは、平滑化の最も粗い画像にクラスタリングアルゴリズムを適用した。次に分割されたクラスターは、核クラスターが孤立化するように再構成された。つまり、確実に同一領域と判断される画素の集合である。核を構成する画素は、解像度別の二次元カラーヒストグラム、すなわち、全体として3次元のカラーヒストグラムを構成し、その他の画素が所属する核クラスターやカテゴリーを、標準偏差値を利用した確率に従って分類した。解像度を順次上げながら、この処理を繰り返し、最高の解像度に達するまで実行した。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ベイズ推定法の基本的な限界:道路追跡のためのオーダーパラメータと相遷移
Fundamental Limits of Bayesian Inference: Order Parameters and Phase Transitions for Road Tracking

Alan L. Yuille, James M. Coughlan

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 2, pp.160-173, February 2000

Keywords: Bayesian inference, phase transitions, curve tracking

ベイズ推測に基づく画像問題の定式化である、最大事後推定(MAP)がますます注目を集めている。この手法では、まず、推定すべき、変数Xに関する事前確率分布P(X)が定義され、条件付き分布P(X|Y)がYについて測定される。例えば、Xは航空写真中の道路位置と形状を表し、Yは航空写真そのものか、あるいは、これをフィルター処理したものである。これらの分布は、問題事象集合の上での確率分布P(X,Y)を定義する。本論文では、航空写真画像からの道路検出という特別な場合を考察し、これかの結果を総合して、(採用された推定アルゴリズムとは独立した)MAP推定の効率に関する基本的な限界値を決定する。推定精度とか道路が検出されたかどうか、と言った効率尺度が、オーダーパラメータKによって確率P(Y|X), P(X)に依存することを示す。直感的にはKは局所的効果(局所エッジフィルターによって導かれた)の強さを総合化したものと、事前情報を加味したものである。このパラメータKによる臨界値で決まる相遷移が存在することを示そう。この相遷移以下では、どのようなアルゴリズムを利用しても道路の検出が可能である。これに関連する研究において、我々は、非常に類似したオーダーパラメータを導き、これによって、A*探索アルゴリズムによって、解の探索と精度の時間複雑度とメモリー複雑度が求まることを示した。この手法は、他の視覚画像問題にも応用可能であり、「悪い事前確率」を用いるモデルの結果について簡単にまとめる。視覚探索の複雑度や、NP完全問題の演算コストに関する相遷移のような臨界現象に我々の研究がどのように関わっているかについてコメントする。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


サポートコーン:境界を解析するための表現ツールとその相互作用
The Support Cone: A Representational Tool for the Analysis of Boundaries and Their Interactions

Leo Dorst, Rein van den Boomgaard

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 2, pp.174-178, February 2000

Keywords: Boundary representation, orientation-based representation, Gauss map, slope transform, Legendre transform, support function, Huygens wave propagation, collision detection, mathematical morphology

オブジェクトに関する応用において、境界との相互作用のみに着目すればよい場合は多い。境界を局所的に表現できるとともに、かつ、境界の内側を矛盾無く表現できる有向境界表現法を紹介する。衝突問題や、伝播問題は、方向スペクトルの加算にまとめて表現することが可能であり、有向曲率のような微分幾何学の変換法則を導く。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


勾配共分散からの、画像場のカテゴリー化とエッジ・コーナー検出
Image Field Categorization and Edge/Corner Detection from Gradient Covariance

Shigeru Ando

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 2, pp.179-190, February 2000

Keywords: Image feature extraction, edge, corner, vertex, gradient, invariance

画像中のエッジやコーナー、および、頂点は、基本となる画像の強度表面の1D(一次元)や、2Dの不連続点に対応している。尾根やピークは1D, 2Dの極値に対応している。これらすべては、勾配の分布、特に、その次元の問題として特徴付けられる。画像場のカテゴリー化の問題と見るなら、これは各々の小ウィンドー毎に勾配ベクトルの共分散行列を構成する問題であり、これに正準相関分析を適用することである。シュワルツの不等式を行列式に適用し微分方程式を解くことが解析の鍵となる。そのために画像場を単一方向変化領域(UNIVAR)、任意の方向に変化する領域、および、変化しない領域にカテゴリー化する2つの演算子PEG と QEG が得られる。これらの応答の絶対値が最大となる条件、すなわち、PEG =1 と QEG =1が小ウィンドーに起きる場合について調べ、これが目的とする1次元、2次元の不連続・極値とOMNIVARであり、多くの場合、極座標系での1Dパターンである。このことから、更に詳しく有益な軸を分析することによって、エッジ、尾根、ピークコーナー、頂点へと識別するアルゴリズムが導ける。多様な画像の多様なノイズレベルの画像について局在化アルゴリズムの演算子の効率を調べ、比較した。その結果、提案する手法は、安定性、局在性、解像度の点から優れていることが推察できた。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


陰多項式、直交距離回帰、そして、曲面上の最近接距離
Implicit Polynomials, Orthogonal Distance Regression, and the Closest Point on a Curve

Nicholas J. Redding

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 2, pp.191-199, February 2000

Keywords: Fitting, orthogonal distance regression, implicit polynomials, algebraic curve, successive circular approximation, resultants, ionograms

陰形式の多項式には、コンピュータビジョンにおける曲線表現や表面表現において多くの魅力的性質がある。本論文では、直交距離測度を利用して、平面上の多数の点に陰形式の多項式をフィッティングさせる問題について考える。直交距離回帰法の近似方法は、解の中のカスプ(尖点)問題の影響を受けやすいことが他の研究者によって指摘されているが、本研究中でも確認された。本研究は厳密な直交距離回帰法に焦点を絞っている。厳密法の最も困難で手間のかかる部分は平面状の任意の点から、代数曲線上の最近接点を計算することである。ここではこれを実現するための3種類の方法について詳細に考察している。最初の方法は標準的なニュートン法であり、第2の方法はコンピュータグラフィックスで最近復活した方法によっており、第3の方法は、曲線を継続的円弧により近似する新規な方法である。この中で、ニュートン法が最速であることが示されるが、時として、初期の推定値はいいのに失敗することがあることが示される。継続的円弧近似法は計算は速くないが、頑健である。本研究はイオン飛跡抽出アプリケーションのために、斜め方向細線化投影画像に、2変数の陰行列の当てはめを行う。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


一次元隠蔽画像信号の周波数構造
The Frequency Structure of One-Dimensional Occluding Image Signals

Steven S. Beauchemin, John L. Barron

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 2, pp.200-206, February 2000

Keywords: Occlusion, Fourier transforms, optical flow, non-Fourier motion

1次元の隠蔽画像信号の周波数構造について理論的研究を紹介する。画像信号の隠蔽は周波数領域において、最も容易に抽出できる情報を含んでいることを示す。例えば、隠蔽していたり隠蔽されている信号の速度(画像の並進速度)や、透明性現象は、この理論的研究によって理解されるであろう。さらに、隠蔽された1D信号速度は線形モデルの元では不変である。この理論的枠組みの中で、非フーリエ的動き(隠蔽透明性や隠蔽効果)の周期構造を厳密に記述したり、このような視覚的現象間の橋渡しや、周波数空間における理解に利用できる。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


識別効率の改善のためのニューラルネットワークの最適組み合わせ
Optimal Linear Combination of Neural Networks for Improving Classification Performance

Naonori Ueda

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 2, pp.207-215, February 2000

Keywords: Pattern classification, ensemble learning, linear combination, minimum classification error discriminant, neural network

識別問題に焦点をあてて、統計的パターン認識理論に基づいて、多数のニューラルネットワーク識別器を線形に結合する方法について紹介する。我々の手法では、誤りを最小化するという意味において、どのニューラルネットワークが個々のクラスに最も良いか、が選択される。次に、個々のニューラルネットワークの強みを生かすように、これらが線形結合される。この手法では、最小識別誤り(MCE)基準によって最適な線形重みが推定される。定式化において、識別の決定ルールにはコスト関数が組み込まれているから、識別により適した重みの組み合わせが得られるかも知れない。人工的データや実データによる実験結果によると、テストデータの評価では、一個の識別器に比べ、結合識別器は全体的識別誤りで評価する限り圧倒的な性能を示す。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ステレオと動きを補償し合っての立体的動き
Stereo-Motion with Stereo and Motion in Complement

Pui-Kuen Ho, Ronald Chung

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 2, pp.215-220, February 2000

Keywords: Stereo-motion, 3D reconstruction, affine cameras

本論文は、ステレオ視と動的視野を結合した新しい手法を紹介する。このとき、個々の特長は保持し、欠点は排除する。アフィンカメラを想定して、ステレオ対応と動きの対応は、行列の形にまとめて構成されると、情景画像は3D構造に分解でき、カメラパラメータ、動きパラメータ、そして、ステレオ幾何情報が得られる。こうして、ステレオ対応は、動き対応に変換できる結果、画像データサイズに比例した時間で処理できることになる。この手法は、画像系列が少なくても、ステレオ画像のように、動画像や、正確な再構成における簡単な対応関係で済ませられる。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.22, No.3


可逆的な形状輪郭表現
Morphological Reversible Contour Representation

Yassin M.Y. Hasan, Lina J. Karam

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 3, pp.227-240, March 2000

Keywords: Shape analysis, binary images, mathematical morphology, shape representation, homotopy, topology, contour coding, contour filling

本論文では離散的2値画像の可逆的な輪郭表現法について述べる。2値画像は、非重複の多レベル輪郭と、残差画像の組によって表現できる。ここで提案する表現法では、従来のスケルトンによるロスレス表現であるシードに基づくモルフォロジー輪郭より、必要な画素数は遙かに少なくてすむ。提案する輪郭表現法は単純でユニークであり、2値画像の制約のない一般的方法である。さらに、この方法は他のロスレスの方法に比べ、演算回数が少なくて済む。出来た多重輪郭画像成分はノイズに対して頑健でもある。更に画像を圧縮するため、効果的な差分チェイン輪郭符号化法が利用された。この方法は従来のモルフォロジカルな手法に比べて非常にビット数が少ない。原画像を正確に再構築するための、出発点(シード点)を必要としない多重輪郭画像の自動的充填手法を提案する。この、モルフォロジカルにユニークな輪郭表現方法と、そのロスレスな再構成法は、多様な複雑さや、多様な大きさをもつ画像に対してテストされた。そのいくつかのを示す。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


非剛体的対応法を使った新規な自動標識認識のための枠組み
A Framework for Automatic Landmark Identification Using a New Method of Nonrigid Correspondence

Andrew Hill, Chris J. Taylor, Alan D. Brett

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 3, pp.241-251, March 2000

Keywords: Terms--Correspondence, critical points, polygonal approximation, automatic landmarks, flexible templates, point distribution

2つの輪郭形状を対応させるためのアルゴリズムに基づく自動的標識認識法についての枠組みを紹介する。この自動的標識認識法では、対応する一対の形状を、ルートに両者の平均形状を有する2分木で表現し、木の先端に行くに従って、形状の違いが明瞭になる。これによって手本となる形状が自動的に生成される。標識は統計的形状モデルを点分布として訓練するために利用される。対応化アルゴリズムは、貪欲なアルゴリズム(greedy algorithm)によって対となる境界毎にそのコスト関数を最小化するような、大まかな多角形近似によるマッチング対を見つける。このコスト関数は、大まかな多角形近似の(定義された境界に対する)形状誤りと表現誤りの両方を表現する。多様な非剛体変形を表している3種の形状に対してこの適用結果が示されている。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


整合的な勾配演算子
Consistent Gradient Operators

Shigeru Ando

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 3, pp.252-265, March 2000

Keywords: Terms--Image processing, feature extraction, gradient, edge, corner, orientation

差分幾何学的手法や方位解析、統合化ビジョンセンサーなど、多くの画像処理アルゴリズムやシステムにおいて、精密で正確な勾配情報が必要とされている。本論文では新たに導かれた整合性基準に基づいて最適な勾配演算子を提案する。この基準は、連続的勾配と離散的勾配の差分を、演算子に内含されている平滑効果と自己非整合性に直交分解する方法である。この整合性によって、パターンの配置、スペクトル成分、画素以下の並進などとは無関係に、局所的1次元パターンの勾配方向の正確さが保証される。非整合性を減少させることが第1目的として、任意サイズの正確な勾配演算子が究極的に得られる反復アルゴリズムを導く。我々は3×3, 4×4, 5×5の最適演算子を求め、これを従来の演算子を比較し、合成画像や実画像に適応し比較した。その結果、精度、バンド幅、一様性の観点から、本方式が従来方式よりも優れていることが示される。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


動きのあるオブジェクトの検出と追跡のための測地的動的輪郭と輝度レベル集合
Geodesic Active Contours and Level Sets for the Detection and Tracking of Moving Objects

Nikos Paragios, Rachid Deriche

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 3, pp.266-280, March 2000

Keywords: Terms--Front propagation, geodesic active contours, level set theory, motion detection, tracking

本論文は動画中の複数の動きのあるアブジェクトを検出・追跡する多様な方式を紹介する。動き検出は、観測されたフレーム間差分分布関数(interframe difference density function)を混合モデルで近似した統計的手法によってなされる。このモデルは、静的(背景)と動的(オブジェクト)な2つの成分からなっている。両成分とも平均値は0で、ラプラシアンやガウス則に従う。この統計的枠組みは、動き検出の境界抽出に利用される。更に、原画を利用して、動きのあるオブジェクトの境界が抽出される。次に、測地線による動的輪郭を目的関数として利用した一般的枠組みの中で、検出と追跡の問題が扱われる。この関数は降下法によって最小化され、内部・外部の画像に依存した力によって、当初の大まかな境界曲線が、オブジェクトを特定する目的関数へと順次変形していく。輝度レベルによる定式化手法を使って、トポロジー的変化の最中でも複雑な曲線が検出・追跡され、自然に処理されることを示す。輝度レベルによる直接的定式化手法に要する演算コストを削減するため、Hermesと呼ばれる新たな手法を提案する。Hermesはよく知られた(狭帯域、高速前進)前線伝搬アルゴリズム(front propagation algorithm)の性質を活用し、その有効性が確かめられた。実ビデオ画像に適用し、有望な結果が得られた。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


主成分曲線の学習と設計
Learning and Design of Principal Curves

Balazs Kegl, Adam Krzyzak, Tamas Linder, Kenneth Zeger

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 3, pp.281-297, March 2000

Keywords: Learning systems, unsupervised learning, feature extraction, vector quantization, curve fitting, piecewise linear approximation

d次元確率分布やデータの雲の「真ん中」を通過する「自己整合的」な滑らかな曲線が主成分曲線として定義されてきた。この曲線はデータを統合し、同時に、特徴抽出の道具として有効である。ここで、ある与えられた長さの連続曲線としての主成分曲線を定義する新しい方法を提案する。この曲線は、曲線とある与えられた分布に基づくランダムに抽出された空間点間の距離の期待値を最小化する。この新しい定義によって、与えられた訓練データから主成分曲線を学習する過程の理論的な解析が可能になり、新たな実用的構築も可能になる。我々の理論的学習法は、k個のセグメントからなる多角形線分のクラスから、ある与えられた総線分長で、n個の独立な訓練点において平均2乗距離を最小化するように選択するという方法である。この学習法の収束性の性質について解析がなされ、理論的結果に実用性を加味したアルゴリズムが実装された。このアルゴリズムを繰り返すたびに、2乗距離基準に従ってこれを最小化するよう、多角形線分に新たに頂点が追加され、頂点位置が更新された。シミュレーションによって、このアルゴリズムを従来法と比べた結果、効率の点でも、計算複雑度の点でも優れていただけでなく、変化しているモデルに対しても頑健であった。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


陰関数表現の多項式曲線や表面をデータにフィッティングさせるための3Lアルゴリズム
The 3L Algorithm for Fitting Implicit Polynomial Curves and Surfaces to Data

Michael M. Blane, Zhibin Lei, Hakan Civi, David B. Cooper

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 3, pp.298-313, March 2000

Keywords: Least-squares fitting, implicit polynomial representations, curve and surface fitting, fitting with constraints, algebraic curves and surfaces

本論文では、陰関数表現された幾何学的形状モデルをデータにフィッティングさせ、これら多項式を研究するための、全く新しい手法を紹介する。このモデルの能力によって、2次元、3次元の複雑な一般形状を表現することができ、標本化が均一でなかったり、ギャップを含むような未組織化データに対して高速な反復フィッティングが可能となり、ユークリッド距離やアフィン変換に対して不変な新しい完全集合に基づく場所に依存しない形状認識が可能であり、一回の計算によって高速で安定なポーズ推定が可能である。このアルゴリズムは4つの大きな理由によって陰関数表現の多項式手法が優れていることを示している。まず第1に、陰関数多項式による2次元曲線と3次元表面のフィッティング問題では既存の方法に比べ何桁も高速である。第2に、ノイズがあったり、変形したり、欠損データのある問題に対して、再現性や、数値的安定性、頑健性が既存の方法に比べ、顕著に良好である。第3に、14次とか、16次とかの高次の多項式に対しても容易に適用できる。第4に、フィッティングに加えて新たな線形の制約条件を付加することが容易であり、線形ベクトル空間の考え方が適用できる。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ノイズ適応的判別関数と、不明瞭な漢字活字文字の認識への応用
A Noise-Adaptive Discriminant Function and Its Application to Blurred Machine-Printed Kanji Recognition

Shin'ichiro Omachi, Fang Sun, Hirotomo Aso

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 3, pp.314-319, March 2000

Keywords: Discriminant function, Mahalanobis distance, Bayes classifier, distribution of feature vectors, noise, blurred character recognition

不明瞭な画像を正確に認識することは実用的であるが、以前は多くの場合見過ごされてきた。不明瞭な画像のノイズレベルを定量化し、ノイズレベルに適合するような判別関数の変形法を提案する。実験によって、この提案手法は既存の統計的手法を補強することが示され、不明瞭なパターンを見事に認識することを示した。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.22, No.4


可変照明下における高速、高信頼性頭部追跡法:テクスチャーを貼り付けた3Dモデルの位置合わせにもとづく手法
Fast, Reliable Head Tracking under Varying Illumination: An Approach Based on Registration of Texture-Mapped 3D Models

Marco La Cascia, Stan Sclaroff and Vassilis Athitsos

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 4, pp.322-336, April 2000

Keywords: Visual tracking, real-time vision, illumination, motion estimation, computer human interfaces

可変照明下における3D頭部追跡の改良手法について述べる。頭部はテクスチャーを貼り付けた円筒形画像の位置合わせ問題として定式化される。その結果出来る動的テクスチャーマップは安定な顔画像と見なされる一方、多くの既存の2D顔認識法、表情解析、読唇法、視線追跡などの入力画像として利用できる。照明が変化したり頭部が動いたりする条件下で位置合わせ問題を解くために、位置合わせ残差を、テクスチャー変形可能テンプレート(warping template)と、直交照明テンプレート(orthogonal illumination template)の線形結合としてモデル化する。正規化された位置合わせ誤差の重み付き最小2乗法を利用して、高速で安定なオンライン追跡が達成された。導入した調整項は、テンプレートの変形可能性と照明に起因する曖昧性を限定する方向に働く。その結果、長期間にわたって、安定な頭部追跡が可能になる。追跡には、初期においてきちんとモデルに合致している必要はない。系は、単純な2D顔画像検出器を使って自動的に初期化される。唯一の仮定は、最初のフレームにおいて、顔がカメラに向いていることである。この定式化においては、多くのワークステーション、PC、ゲーム機において利用可能なテクスチャーマッピングハードウエアの機能を活用した。SGI-O2ワークステーションにおいて、非最適化での実装をしたところ、15フレーム/秒で作動した。この定式化の有効性に関する詳細な評価が報告されている。この手法が、照明、正規化パラメータ、初期位置の誤差、カメラパラメータに対する影響の受け易さが解析された。追跡の適用例と応用についても報告する。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


漸近的分配関数列によるベイズセグメンテーション
Bayesian Segmentation via Asymptotic Partition Functions

Aaron D. Lanterman, Ulf Grenander, Michael I. Miller

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 4, pp.337-347, April 2000

Keywords: Gaussian Markov random fields, texture segmentation, stochastic difference equations

ガウス確率場の分配関数を漸近的近似によって導出する方法について述べる。テクスチャーは、確率的差分方程式によって誘導されるガウス確率場によって特徴付けすることが出来る。この差分方程式は、有限個の、停留的、線形差分演算子によってサポートされており、境界において非定常状態にも適応するよう調整されている。隠されている真の形状のサイズが大きくなると、対数正規化項は、確率場を誘導する演算子の周波数分布(スペクトル)の対数の積分に収束することが示される。確率場の共分散にフィットさせるということは、差分演算子が誘導する確率場モデルの周波数分布のパラメータをフィッティングさせることに等しい。方位の異なるテクスチャーを扱うために行列解析手法を提案する。漸近的最尤法による訓練データによって推定されたテクスチャーパラメータの例を示す。ラプラシアンの強度を使った等方的モデルと、偏微分の混合を使った方向性モデルが探索された。電子顕微鏡によるミトコンドリアとアクチンーミオシン複合体、および、赤外線による市街の遠景画像に対するパラメータ推定が行われた。電子顕微鏡ミトコンドリア画像には変形可能テンプレートモデルが使われて形状を推定したが、推定が進むに連れて、この漸近近似法による推定では計算が容易になった。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


軌跡の三角測量:単眼画像系列からの動く点の3D復元
Trajectory Triangulation: 3D Reconstruction of Moving Points from a Monocular Image Sequence

Shai Avidan, Amnon Shashua

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 4, pp.348-357, April 2000

Keywords: Structure from motion, multiple-view geometry, dynamic scenes

単眼動画カメラからの動点を使って3D座標を再生する問題---すなわち、視野の中の線分の計測のみからの3D再構成---を考える。この課題は、動く物体の軌跡の形状にある制約が課せられたときのみ解くことができる。このような課題群を、"軌跡三角測量"と呼ぶことにする。対象点の軌跡が直線に沿って、あるいは、円錐曲線に沿っている場合の解を調べる。もし、点が直線に沿って動くなら、少なくとも5点から線形法によって、その線分(各時間に於ける3D位置)が一意に復元できることを示す。軌跡が円錐曲線の場合は、動点の復元には一般的に9視野で充分であることを示す。また、円錐曲線の型が既知の場合は、もっと少ない画像で充分である(例えば3Dユークリッド空間では、7画像で十分)。一般的に、軌跡三角測量法によって、動的情景処理の守備範囲が前進する。従って、静止画像は、多数の動物体からなる画像から情景を再構成する課題の特別な場合と見なされる。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


エピポーラ幾何を利用した輪郭マッチング法
Contour Matching Using Epipolar Geometry

Joon Hee Han, Jong Seung Park

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 4, pp.358-370, April 2000

Keywords: Contour matching, epipolar geometry, contour motion

画像中において特徴をマッチングさせる計算は、多数画像解析においては重要なプロセスである。2つの画像間の動きが大きい場合、マッチング問題は非常に困難になる。本論文では幾何学的制約に基づく輪郭マッチングアルゴリズムを提案する。動画カメラから撮影された静止画像から輪郭が得られると仮定すると、2組の輪郭集合間にエピポーラの制約を課し、輪郭上で対応点を計算することを試みる。最初にコーナー点のマッチングをさせることによって得られるエピポーラ条件から、エピポーラ幾何、輪郭端点、輪郭距離によって候補輪郭が選択される。間違ったマッチングを減少させるため、輪郭上の多数のマッチング点を使って候補点は選択される。初期のエピポーラ制約条件は、マッチングされた輪郭を使って改良される。このアルゴリズムは1組の画像や、2組の画像に応用できる。全プロセスは自動化されており、多様な実画像に対してもテストされた。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


隠れマルコフモデルを複数観測によって訓練する---コンビナトリアル法
Training Hidden Markov Models with Multiple Observations---A Combinatorial Method

Xiaolin Li, Marc Parizeau, Rejean Plamondon

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 4, pp.371-377, April 2000

Keywords: Hidden Markov model, forward-backward procedure, Baum-Welch algorithm, multiple observation training

隠れマルコフモデルモデル(HMM)は確率的モデルであり、統計的な学習や識別が可能である。この方法は、系列信号を扱う適用性の広さ、多面性から、音声認識、手書き文字認識に利用されてきた。他方、この手法は複雑な構造を持ち、利用されるデータに不確実性があるため、ある種の仮定のもとに多数観測訓練問題を解析させざるを得なかった。多年にわたり研究者は音声や手書きの応用にはLevinson訓練法を用いてきたが、そのとき、観測は互いに独立であるとの仮定があった。本論文では、上記仮定をしないで、HMMによる多数観測訓練を正統的に扱ってみよう。その中で、多数観測による訓練は、一般性を失うことなく、個々の観測確率の組合せとして表現される。この組合せ的手法によって、従属-独立仮定にもう1つの自由度が与えられる。Baumの補助関数を一般化してこの枠組みに取り入れ、ラグランジェ乗数法を使って関連目的関数を構築することによって、求められた訓練方程式が目的関数の最大を保証することが証明される。さらに、Levinsonの訓練方程式は、本手法の特殊例に過ぎないことを示そう。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


SAR画像中の航空機を検出するためのインテリジェント・エージェントの融合
Fusion of Intelligent Agents for the Detection of Aircraft in SAR Images

Arthur Filippidis, L.C. Jain, N. Martin

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 4, pp.378-384, April 2000

Keywords: Fusion, Automatic Target Recognition

新規な自動標的認識(ATR)融合システムを利用して、ROC(Receiver Operating Curves)法が20枚の画像解析に用いられた。合成開口レーダー(SAR)画像中の航空機自動検出の精度を向上させるため、カラー航空写真から得られる事前知識を利用して、ファジー推論が利用された。異なった2つのセンサーから撮影された画像は異なる時間に撮影された。我々の実験を総括するため、実画像と、合成画像にノイズを加えたものに対して行われた検出では、ATR融合手法によって、91.5%の確率で正しく検出された。この手法の誤報率は、テクスチャー識別手法を使うことで17%減少した。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ノイズ適応的判別関数と、不明瞭な漢字活字文字の認識への応用
Automatic Caption Localization in Compressed Video

Yu Zhong, Hongjiang Zhang, Anil K, Jain

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 4, pp.385-392, April 2000

Keywords: Caption extraction, text location, texture, compressed video, segmentation, multimedia

我々はJPEG圧縮された画像中や、MPEG圧縮されたビデオ画像のI-フレーム中のキャプション(画像中のテキスト)の位置を自動的に特定する手法を紹介する。キャプションテキスト領域は、特異的なテクスチャーの特徴を利用して背景からセグメント化される。以前発表した方法はビデオ画像を完全に復元してから行うものであったが、ここでの方法はDCT圧縮領域の強度の変動情報を利用して直接に候補領域を直接特定する。従って、復元処理はほんの少し必要なだけである。提案手法は、240×350画素を処理するのにたった0.006秒しか要しない。その時の読み出し正解率は99.17%であり、MPEGビデオが持つ2300以上のI-フレーム中から非テキストDCT領域を誤って抽出した率は1.87%であった。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


剛体オブジェクトの正射投影からの3D形状と動きの最小二乗推定法
Least Squares Estimation of 3D Shape and Motion of Rigid Objects from Their Orthographic Projections

Yiannis Xirouhakis, Anastasios Delopoulos

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 4, pp.393-399, April 2000

Keywords: 3D motion, 3D structure, structure from motion, orthography

3次元オブジェクトを2次元投影から動きを形状を復元することは、コンピュータビジョン、生体医学工学、ビデオ符号化、そして、MPEG-4とかMPEG-7のようなMPEG標準化に絡んで興味ある問題である。本研究は、正射影画像と関連する動き場に基づいて、3次元剛体オブジェクトの動きと形状を抽出する新規な方法を確立する。理論的解析を評価するための実験的結果も示されている。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


階層的特徴空間におけるOCR
OCR in a Hierarchical Feature Space

Jaehwa Park, Venu Govindaraju, Sargur N. Srihari

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 4, pp.400-407, April 2000

Keywords: Pattern recognition, characteddigit recognition, multiresolution, feature space, hierarchical classification, recursion

本論文は、多解像度と階層的特徴空間を利用した高速・高精度の文字認識手法(すなわち、階層的OCR)について述べる。疎から密へと異なる解像度における特徴量に対応する認識手法は、回帰識別手法によって実装化された。典型的な例でいうと、認識器は、記憶容量と計算時間の計算資源の負荷において、多くの解像度の中のどの特徴量を使うか、そのバランスを保っている必要がある(その結果高精度となる)。本論文において、入力パターンを識別するために必要となる解像度の度合いを適応的に決定する方法を紹介する。これによって計算資源の最適な利用が可能となる。階層的OCRは、入力パターンの質や、その固有の類似性や、それが対比しようとしている他のクラスパターンとの相違、そして、利用可能な処理時間といった要因に動的に適応する。さらに、与えられた認識されようとしているパターンのクラス(文字)に応じて、そのパターンの重要度の高い部分が集中的に高解像度が割り当てられる。実験によってこの手法の正しさが証明された。標準NISTデータに対して、階層的OCRは従来のk最近傍法によるOCRより300倍も高速であり、ニューラルネットによる方法より10倍高速であった。この比較においては、同一特徴量を使用した。本手法による認識率は96%であり、他の方法と同等であった。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


離散的モーメントによる楕円形状の特徴付け
Efficiency of Characterizing Ellipses and Ellipsoids by Discrete Moments

Jovisa Zunic and Natasa Sladoje

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 4, pp.407-414, April 2000

Keywords: Pattern analysis, computer vision, digital shapes, coding, parameter estimation

本論文では楕円に焦点をあて、その表現と、デジタイズした情報からの復元問題を扱う。本論文の主要な結論は、デジタルの楕円形に1:1対応する有限個の離散的モーメントによって、最適なメモリー量で漸近的にデジタル楕円を符号化できることである。さらに、同じパラメータを使って、楕円の再構成問題を考察する。現実の形状のデジタル化によって、情報の損失は避けられないから、デジタル情報による元のデータの形状推定精度には限度がある。中心位置と楕円の半軸の再構成の精度の明瞭な上限値を、与えられた画像の階層土の関数として導く。この結果は3Dにも適用可能であり、実例とともに示す。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.22, No.5


多方向直線セグメンテーションのための方位空間フィタリング
Orientation Space Filtering for Multiple Orientation Line Segmentation

Marco La Cascia, Stan Sclaroff and Vassilis Athitsos

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 5, pp.417-429, May 2000

Keywords: Line segmentation, multiple orientation lines, orientation bandwidth, orientation space Visual tracking, real-time vision, illumination, motion estimation, computer human interfaces

本論文の最終目的は、交差点(X交点)や枝点(T交点)における複数の直線をセグメンテーションするための適当な方法を提供することである。この交点は、多方向の直線が局在している領域と見なすことができる。ここで、新規な"方向空間"という表現法を提案する。これは画像の縦横座標軸に方位軸を加えることによって導くことができる。方位空間表現は、Gaborフィルターを作用させて連続化した方位パラメータを扱うことで構築できる。多方位の直線をセグメンテーションする問題は、3D画像を方位空間において閾値処理し、その中の連結成分を抽出することによって扱うことができる。このようにして、X 交点やY交点が効率的に分離される。曲線の分離も行うことができる。X, T, L交点について、数学モデル上で実証し解析された。この方式の感度についても考察した。合成画像と実画像の両方による実験では、本方式は式交点のセグメンテーションや曲線の分類に有効であることが示された。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


MIR:頑健なクラスタリングに向けて---距離画像のセグメンテーションへの応用
MIR: An Approach to Robust Clustering--Application to Range Image Segmentation

Klaus Koester, Michael Spann

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 5, pp.430-444, May 2000

Keywords: Segmentation, robust statistics, region merging, range images, clustering, least-median-of-squares, segmentationGaussian Markov random fields, texture segmentation

本論文は、新規で頑健な統計的検定に基づく教師無し領域併合処理について述べる。併合するかどうかの決定は、隣り合う領域間で、相互内層比(統計的分散値で判定して,ある領域Aの内側に存在するか、あるいは、領域Bの内側に存在するかの比=MIR)によって判定される。この比は、頑健な回帰手法と、頑健で新規なガウス分布スケール(つまり標準偏差値)によってなされる。MIRによって同一のガウス分布かどうかの同定は、対比する集合の大きさの関数として理論的に導くことができる。ここに紹介する分布検定法は、すでに確立されているコルモゴロフ・スミルノフ検定と比較され,平面からなる距離画像のセグメンテーションアルゴリズムに実装された。実画像を含む60画像のセグメンテーション実験によって、この反復領域成長法が評価された。この評価には、最新の4つのセグメンテーションアルゴリズムが使われたが、実用的であるためにはノイズの多い画像に適応可能な、頑健な手法の必要性が示された。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


スネークペダル:物理学に基づく制御を利用したコンパクトで融通性のある幾何学モデル
Snake Pedals: Compact and Versatile Geometric Models with Physics-Based Control

Baba C. Vemuri, Yanlin Guo

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 5, pp.445-459, May 2000

Keywords: Geometric models, snakes, pedal curves, surfaces, alternating direction implicit method, Levenberg-Marquardt method

本論文では、全体的でかつ局所的なオブジェクトの形状特長を表現する新規な幾何学的形状モデルを紹介する。従来、幾何学モデルは、局所的に細かな形状が存在しない全体形状の記述に適していた。我々は、局所的な細かい表現を含んだ全体形状の記述が可能な強力な幾何学的形状モデル化法を提案するが、これは物理的制約下の位相変化も記述可能である。提案モデル化法では、形状をペダル曲線と曲面によって表現する方法である。ここで、ペダル曲線や曲面とは、ペダル点と呼ばれる固定点によって描かれた固定曲線・曲面の接線に、ペダル点から下ろされた垂線の足の軌跡である。ペダル点の位置を変化させ、局所的にも全体的にも変形した形状群を合成することができる。このペダル点を変化させることで幾何形状モデルを形成し、この変化するペダル点の位置をスネークで表現する物理的形状制御法を紹介する。このモデルは"スネークペダル"と称することにするが、スネークに加えられる力によって反復操作が可能である。我々は画像データから形状を復元する高速反復数値計算法を開発した。このアルゴリズムは全体的パラメータを解く外側のループではLevenberg‾Marquardt (LM)法を使い、局所的形状フィッティングを解く為の内側のループではAlternating Direction Implicit (ADI)法を利用する。このようにして、全体的、かつ、局所的手法の組み合わせによって、モデルへのフィッティング問題の効率的数値的解法が得られる。この手法を合成画像と実画像に適用し、その有用性を実証した。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


画像識別と復元のための変分モデル
A Variational Model for Image Classification and Restoration

Joon Hee Han, Jong Seung Park

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 5, pp.460-472, May 2000

Keywords: Variational model, classification, labeling, phase transition theory, edge-preserving regularization, minimization, satellite images

エッジを保存する正規化法と組み合わせた、画像識別のための変分モデルを紹介する。識別とは各画素に属性をつけることであるが、その離散的性質のため多くの確率的な手法が開発されてきた。しかし、変分法を使った方法はほとんど無かった。過去10年間、変分法はエッジの保存復元に有効であることが証明されている。本論文では、規則的な境界を有する均一領域からなる画像の識別に変分法が有効であることを示す。このモデルは力学における相変化理論によって開発された研究に基づいている。提案アルゴリズムは高速で、実装化容易で、効率的である。この手法は合成画像と衛星画像の両方に適用比較され、Pottの正規化法と比較された。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


確率的判別のアルゴリズム実装について
On the Algorithmic Implementation of Stochastic Discrimination

Eugene M. Kleinberg

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 5, pp.473-490, May 2000

Keywords: Pattern recognition, classification algorithms, stochastic discrimination, SD

パターン認識に於ける適当な識別器を構成するために確率的な判別を利用するのは一般的な手法である。そのために、疑似確率プロセスによって生成される非常に弱い成分を任意の数だけ結合して作るが、このようにして構成される一般化された非常に複雑で正確な識別器は、元の弱い要素の能力と特性を保持している。事実上、しばしば観察されることであるが、訓練集合に対して最大効率を示すようになった後でも、この弱い成分が加味されるほど、テスト集合に対する識別器の効率はどんどん向上する。このことは根源的な理論から予測されていたことであり、誤り確率が訓練集合に対して最小になっても、その手法の本質的で優れた計測によって、訓練集合とテスト集合の両方に対する識別効率は、複雑度の増加とともに向上する。本論文では、この手法をパータン認識に適用した確率的識別法のレビューから始める。色々な理論的事柄を考慮した例題を進めながら、アルゴリズムの実装に含まれる考察事項を議論する。その後で、このアルゴリズムを実装し、University of California Irvine,および Statlogのデータベースに対するその他の多くのアルゴリズムと、その効率を比較した。比較すべきアルゴリズムにはboosting and baggingアルゴリズムも含まれる。この研究過程において、我々の結果と、多くの研究報告に書かれている手法とを、同じデータに適用して調べた。本論文では確率的識別法の基本的理論の概要、および、boosting法の一般化能力や、アルゴリズムについての所見を述べる。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


3次元の実世界テクスチャーの解析と認識
The Analysis and Recognition of Real-World Textures in Three Dimensions

Pei-hsiu Suen, Glenn Healey

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 5, pp.491-503, May 2000

Keywords: 3D texture, tecture, color recognition, classification, computer vision, bidirectional reflectance distribution function (DRDF), invariant, bidirectional texture function (BTF)

粗い表面の観測テクスチャーは、奥行き短縮、局所陰影、内部反射、表面成分による陰影や隠蔽によって、照明条件、視野角度の複雑な影響を受ける。提示標本の視覚複雑度を表現するために表面の次元性の考えを導入する。この次元表現は、観測テクスチャーを照明範囲や視野角の関数として表現するため、基底となる複数のテクスチャーを定義する必要がある。基底テクスチャーはカラーバンド内およびカラーバンド間相関を考慮してマルチバンド相関係数を利用して表現される。我々は、Columbia Utrecht Reflectance and Texture (CUReT)データベースを利用して実体物の次元表面の性質を調べた。その解析の結果、次元表面の照明角度範囲や視野角度範囲への依存度合いは、おおよそ対象物の表面複雑度に依存する傾斜に比例していることが分かった。未知の照明や視野幾何条件の下で得られる画像のカラー画像の粗い表面の認識問題にこの解析法を拡張した。61個の物質標本を使った12,505枚の画像を使って、マルチバンド相関モデルによって捉えられた情報で、色々な条件下の表面が認識出来ることを示す。また、カラー情報の利用によって、3次元画像認識が非常に有利になることを示す。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


大きな知覚構造体の教師木付き学習:グラフスペクトルによる分割と学習
Supervised Learning of Large Perceptual Organization: Graph Spectral Partitioning and Learning Automata

Sudeep Sarkar, Padmanabhan Soundararajan

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 5, pp.504-525, May 2000

Keywords: Perceptual organization, leaning in vision, learning automata, Bayesian networks, feature grouping, object recognition

認知情報の整理によって、同一対象物から得られたと思われる低レベルの特徴量をグループ化するための美しい枠組みが出来る。いま、ある対象物の画像が訓練情報として与えられているとする。これに関連する学習プロセスによって、近傍性、平行性、連続性、分岐、および、背景から、対象物を分離するための共通領域などの基本的顕著性などについて、全体としてどの程度の重みを配分すべきかが判定される。グループ化プロセスのパラメータは、学習すべきベイズネットワークの確率を規定するものとして認識される。この学習を完成させるために、N人の確率的オートマトン・プレーヤーのチームによる協力的ゲームの枠組みを使った。グラフ分割法によるグループ化プロセスを使うと、小さなプリミティブ集合に対して定義された関係から、大きなグループが形成可能であるし、しかも処理は高速である。このグループ化プロセスや学習の枠組が多様な実画像に対して頑健であることを統計的に示す。また、グループには、測光的属性が重要であること、小さなプリミティブ間の局所的関係から、大きくて顕著なグループが形成されることも示される。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


有限要素モデルの動的高精度化における非剛体運動の解析
Nonrigid Motion Analysis Based on Dynamic Refinement of Finite Element Models

Leonid V. Tsap, Dmitry B. Goldgof, Sudeep Sarkar

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 5, pp.526-543, May 2000

Keywords: Physically-based vision, deformable models, nonrigid motion analysis, biomedical applications, finite element analysis

本論文では正確な運動追跡アルゴリズムを提案する。オブジェクトの初期モデル表現の一般的知識が与えられた場合、対象物の形状や物性の対応関係が大まかであったり、不完全であったり、あるいは欠損していても、有限要素モデルを使って緻密な動きベクトルを復元することができる。この手法は実物体と予想された動きの差を反復解析する手法に基づいている。もし、差が大きければモデルによる対象物の特性把握が不十分であることを示唆している。対象物が動いている間のフィードバックによって、実位置と予測位置の誤差を最小化すればモデルの精密化が可能である。これらの誤差は、形状とか物性とかのモデルパラメータ予測の欠陥に起因するものである。未知のパラメータは、対象物の非剛体運動を近似する最良非線形有限要素モデルの反復降下探索法によって、復元される。この探索を通じて、対称物体の物性推測そ行うだけでなく、初期の疎な対応関係から密な点対応関係を推測する。このように、追跡中にモデルが精密化され、更に、追跡が正確になる。その結果、非剛体の運動についてより詳細な記述が可能になる。この提案手法の優秀性は実験結果によって実証された。この手法を応用して、人工弾性体やヒトの皮膚の未知の弾性率復元がなされ、複雑な3Dオブジェクトの詳細形状がわかり、手の動き解析に使われた。我々の研究は、複数の物質や3Dを含むオブジェクトの連続距離画像から非剛体の正確な定量的動き解析の可能性を示している。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


変形可能なテンプレートを使ったオブジェクト追跡
Object Tracking Using Deformable Templates

Yu Zhong, Anil K. Jain, M.-P. Dubuisson-Jolly

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 5, pp.544-549, May 2000

Keywords: Trackingi image sequence deformable template, shape, texture, motion

手書きによるプロトタイプモデルを逐次変形しながらオブジェクトを追跡する新規な方法を提案する。連続画像中のオブジェクト追跡に、2つの事柄を結合した次のような基準を利用した:フレームから次のフレームへのオブジェクト形状の変化と、モデル形状の入力画像への忠実性。この変形可能なテンプレートはモデルでは、新フレームのオブジェクト形状をモデル化するための系統的形状変形手法とともに、それ以前のフレームから抽出された事前形状情報を利用する。追跡プロセスには以下のような画像情報が利用される:1)エッジと勾配情報、すなわち、勾配値の大きい画素から成るオブジェクトの境界:2)領域整合性、すなわち、同一オブジェクトは統一的な色とテクスチャーを連続フレーム中で保持している:3)フレーム間動き、すなわち、移動するオブジェクトの境界はフレーム間の動きで特徴付けられる。形状変形と、モデル形状が注目画像にどれほど忠実であるか、を最適化することによってオブジェクト追跡は進行していく。変形可能なテンプレート中の潜在的な真の構造と、領域や、動きや、画像勾配の手がかりを利用することによって、弱い画像特徴による不都合な影響や、それほど大きくない隠蔽の影響を軽減させている。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.22, No.6


効率的なマルコフ鎖モンテカルロ法によるテクスチャー集合の探索---テクスチャーの"3色"理論へ
Exploring Texture Ensembles by Efficient Markov Chain Monte Carlo---Toward a "Trichromacy" Theory of Texture

Song Chun Zhu, Xiu Wen Liu, and Ying Nian Wu

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 06, pp.554-569, June 2000

Keywords: Gibbs ensemble, Julesz ensemble, texture modeling, texture synthesis, Markov chain Monte Carlo

本論文はテクスチャーの数学的定義、つまり、Julesz集合Ω(h)について述べる。Ω(h)はz2 上で定義される、同一統計量hを共有する全画像の集合である。これからテクスチャーモデルに関する逆問題が派生する:未知のJulesz集合Ω(h)から抽出された画像集合があるとき、その集合を定義する統計量hをどのようにして探索するか。Julesz集合Ω(h)は、その集合内画像で一様であるが外側ではゼロとなる同伴確率分布q(I;h)を有する。関連論文[Y.N. Wu, et al, Proc. Inte. Conf. Computer Vision, Sept. 1999]において、q(I;h)は、画像の格子Λ→Z2 であるとき、FRAME (Filter, Random Field, And Minimax Entropy)モデルの有限分布であることが示されている。この結論から、Z2 上でのテクスチャーの科学的定義と、有限格子上での数学的テクスチャーモデル間の潜在的な真の関連性が確立される。この方法には、コンピュータビジョンにとって2つの利点がある;1)合成テクスチャー画像間の統計量マッチングというこれまでの行為に対して数学的な基礎が与えられ、2)特徴量を探し出し、モデルを選択し、テクスチャーを合成してFRAMEモデルを学習するという高価な演算負荷から解放される。本論文では、Julesz集合の標本化のための、効率的なマルコフ鎖モンテカルロアルゴリズムが提案される。このアルゴリズムによって、フィルター係数の方向に動きながらランダムなテクスチャー画像が生成される結果、従来の単一サイトGibbs samplerが拡張される。また、従来よく使われている4つの統計量である、モーメント、展直関数(rectified function)、周辺分布ヒストグラム、線形フィルター応答の結合ヒストグラムについてその表現能力を比較してみる。我々の実験によると、周辺分布ヒストグラムによる少数のサンプル窓で、充分多様なテクスチャーを捕まえられることが示唆される。我々の理論とアルゴリズムを図示し、これによって多くの自然のテクスチャーがうまく合成できたことを示す。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


進化論的追跡手法と顔認識への応用
Evolutionary Pursuit and Its Application to Face Recognition

Chengjun Liu, Harry Wechsler

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 06, pp.570-582, June 2000

Keywords: Evolutionary pursuit, face recognition, genetic algorithms, optimal basis, Principal Component Analysis (PCA), Fisher Linear Discriminant (FLD)

本論文では画像の符号化および識別法として、新規で適応的である進化論的追跡(EP)法を紹介する。投影追跡手法との類推によって、EP法はデータ圧縮とパターン識別の双方の最適基底を追跡学習法によって探索する。EPの課題は、未知の画像に対して、訓練中に出くわす経験的リスクを減少させることと、保証付きリスクの確信範囲を狭めることに伴う経験的リスクを減少させることのバランスを取りながら、学習機械としての汎化能力を向上させることである。この目的のためにEPは、最適基底を決定するための解を探索する、遺伝的アルゴリズム(GA)に特徴的な戦略を実装した。EPは、まず元のデータを、低次元で白色化した(ランダム回転した)主成分分析空間に投影することから始める。ランダムに回転された有向基底ベクトルがGAによって探索される。このとき、進化の駆動力は効率精度(経験的リスク)とクラス分離(確信区間)である。精度は学習の成功率を示し、分離は未知のテストにおける期待適合度を示す。通常では、貪欲探索(greedy search)アルゴリズムが必要な多くの基底をもつ顔画像認識に、この新しい方法が適用された結果、好ましい結果が得られた。369個の項目に対応する1107個のFERET前面顔画像の認識が行われた。認識精度と、汎化能力を評価するために、各課題に対して異なる時期や異なる照明条件下で得られた画像にも適用した。その結果、EP法は、主成分分析法(固有顔画像法)に比較して認識能力が優れ、汎化能力はフィッシャー線形識別法に比べて優れていた。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


非計量的距離による識別:画像検索とクラス表現
Classification with Nonmetric Distances: Image Retrieval and Class Representation

David W. Jacobs, Daphna Weinshail, Yoram Gdalyahu

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 06, pp.583-600, June 2000

Keywords: Nonmetric, image retrieval, classification, supervised learning, median, condensing, nearest-neighbor, triangle inequality, robust distance, representation

見かけ画像を利用したビジョン研究の重要問題の1つに、未知の画像を識別するためには、過去のラベル付き画像をどのように利用すれば良いかが分からないことにある。ヒトのやり方をモデル化したシステムや、ロバストな画像マッチング法では、しばしば尺度の無い類似度を使うことがある。しかし、三角不等式が成り立たない場合には、ほとんどの既存のパターン認識手法が使えない。我々は、広範囲の非計量的類似度関数を使う場合には、事例に基づく(最近傍)手法は無理なく適用できることを示す。しかし、肝心なことは、正確にクラスを特徴付けできる表現方法を見つけることである。既存のクラス表現のための短絡的発見法は非計量的データ空間を扱うには不的確であることを示す。この問題点を扱うために、以下の2点に着目した手法を開発する:まず第1に、2画像間の距離表現は、非計量空間での相違を表現するのには適してないことを示す。これに代わり、2画像と他の多数の既存画像からの距離ベクトルの相関を利用する。第2に、非計量空間における境界面上の点は、ユークリッド空間に比べ、クラスの構造把握にはそれほど重要ではないことを示す。クラスを記述するには、非典型的な点の方が、より重要であることを示唆する。経験から一般化するというアイデアが学習にとって重要であることを、合成画像と実画像を使って示す。さらに、パラメータを利用した教師付き学習問題に応用する方法を示唆する。これには、特定の非計量的距離関数への応用が含まれ、非計量空間において威力を発揮する線形判別関数の一般化について、特に述べてある。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


空間の中の点パターンへの曲線特徴抽出:ノイズのある点への主曲線クラスタリング
Finding Curvilinear Features in Spatial Point Patterns: Principal Curve Clustering with Noise

Derek C. Stanford, Adrian E. Raftery

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 06, pp.601-609, June 2000

Keywords: Bayes factor, BIC, CEM algorithm, earthquake, EM algorithm, Hough transform, model-based clustering, smoothing, spatial point process, visual defect metrology

主曲線とは、主成分直線を一般化して曲線に拡張した概念である。この主曲線に関するクラスタリングによって、特徴形状のノイズのパラメトリックモデルを非パラメトリックなモデル化によって結びつけることが可能となる。この方法は、空間の点パターンによる曲線特徴を見つけるのに便利であり、ノイズの存否にかかわらない。この手法の応用例としては、探知画像から、いくつかは誤探地を含む湾曲した地雷原の領域を見つけることができるし、あるいは、地震目録データから地震断層を見つけることがある。我々の主曲線クラスタリング法は次の2ステップから構成されている:第1は階層的で集積的方法(HPCC)であり、第2は有名なEM法の1つと確率モデルによる識別EM法(CEM-PCC)である。HPCCは潜在的な特徴量クラスターを結合するのに利用され、CEM-PCCはその結果を精密化し、背景ノイズの処理に利用される。このアルゴリズムは開始点をうまく選ぶことが重要である。開始点を見つけるには、例えば最近傍の散在点除去を利用しても、モデルによるクラスタリングを利用するにしても、手動でも自動でも見つけることができる。我々は近似的ベイズ因子を利用して、複数の特徴量と平滑化の大きさの両方を選択した。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ビデオ画像からの、高速でグローバルな姿勢推定法
Fast and Globally Convergent Pose Estimation from Video Images

Chien-Ping Lu, Gregory D. Hager, Eric Mjolsness

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 06, pp.610-622, June 2000

Keywords: Pose estimation, absolute orientation, optimization,weak-perspective camera models, numerical optimization

関連する2D画像を剛体変形して既知の3D形状に関連づける課題は写真計測やコンピュータビジョンの古典的問題である。今まで、この問題に対する最良解は反復最適化法であったが、これは集束性の保証がなかったし、回転行列の正規直交系を効果的に説明できなかった。姿勢推定問題は、オブジェクト空間(画像空間ではなく)での共線性に基づく誤差尺度を最小化する問題として定式化できることを示す。オブジェクト空間の共線性誤差を利用して、直接、直交回転行列を算出し、かつ、グローバルに集束する反復アルゴリズムを求める。実験によってこの方法は計算効率が良いこと、つまり、従来の最良の最適化手法より精度が劣ってないこと、また、例外データに対する頑健さでも、従来のどの方法よりはるかに優れていることを示す。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


部分的ステップによる次元削減
Fractional-Step Dimensionality Reduction

Rohit Lotlikar, Ravi Kothari

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 06, pp.623-627, June 2000

Keywords: Dimensionality reduction, classification, Fisher's Linear Discriminant

次元数を削減するための線形投影は線形判別分析(LDA)を利用して計算されるが、出力空間におけるある種の分離可能性基準に基づいていることが多い。その結果得られる最適化問題は線形であるが、これらの分離可能性判別は、出力空間の識別精度に直接関係はしてない。その結果、試行錯誤的手続きによって、重み関数の異なる違った分離判別で実験し、訓練集合による結果の中の最良のものを採用する。しばしば、訓練集合で最高性能を示しても、部分空間のデータではお粗末な識別結果となることがある。本小論文では部分次元のコンセプトを紹介し、部分的ステップLDA(F-LDA)と呼ばれる部分ステップによる逐次的次元削減手法を開発する。F-LDAアルゴリズムは重み関数の選択に関しては、より頑健であり、どんな重み関数に対しても、LDA法で得られた精度より高い識別精度の部分空間が見つかる。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ベイズグラフの編集距離
Bayesian Graph Edit Distance

Richard Myers, Richard C. Wilson, Edwin R. Hancock

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 06, pp.628-635, June 2000

Keywords: Graph matching, edit-distance, Bayesian, MAP estimation, stereo images

本論文ではくずれた関係グラフの比較と、マッチングのための新規な枠組みについて述べる。ここでは、Sanfeliu and Fuによって紹介された編集距離の考え方を発展させる。我々は、Levenshtein距離によって、グラフマッチング問題において構造が壊れているときに、グラフのマッチング誤差の確率分布をモデル化のために利用できることを示す。この確率分布は Wilson and Hancock によって導入されたMAPラベルの更新に際して、マッチングの位置決めに利用できる。このグラフマッチングアルゴリズムの結果と、Wilson and Hancockによる最近の結果とを比較する。この問題に編集距離を利用することは、従来のラベル辞書の総当たりコンパイルに比べると、優れた代替え法とみなすことができる。さらに、本方法は、最悪の複雑度を有する場合に対しても、指数関数的ではなく、多項式的複雑度になるに過ぎない。このことは人工的データに対する実験でも支持されており、これが効果的であることは非更正ステレオ画像対応問題でも示されている。このことから、計算効率の良さは、マッチングの品質を犠牲にしたものではないことを示している。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


信頼度評価による、認識用大規模文字集合の詳細候補選択
Precise Candidate Selection for Large Character Set Recognition by Confidence Evaluation

Cheng-Lin Liu, Masaki Nakagawa

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 06, pp.636-642, June 2000

Keywords: Handwritten character recognition, large character set, candidate selection, confidence evaluation, Bayesian inference

本論文では、距離に基づく識別器の確信度評価を利用した、大規模文字集合の精密な認識候補選択手法を提案する。提案手法は、多様な距離尺度に応用可能であり、ユークリッド距離、市街地距離による実験では有望な結果が得られた。確信度を評価することによって、距離の分布が解析され、クラス確率が次の2段階で求まる:出力確率評価と、入力確率推論。入力確率を確信度として利用することによって、いくつかの選択則がテストされ、高い確信度を示すクラスを第1位に選択するルールが最良の結果をもたらした。ETL9Bのデータベースによる実験では、現状の一定候補数を選ぶ方法に比べ、精度を保ったまま候補データ数が1/4になった。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


Bスプライン曲面近似するための散らばった3Dデータの整列化とパラメータ化
Ordering and Parameterizing Scattered 3D Data for B-Spline Surface Approximation

Fernand S. Cohen, Walid Ibrahim, Chuchart Pintacirooj

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 06, pp.642-648, June 2000

Keywords: Surface fitting, B-Spline, Gaussian map, geodesics, NURBS

医用画像形成、コンピュータビジョン、コンピュータグラフィックなどの多くの応用分野にとって、表面表現法は本質的に重要である。我々はBスプラインによる表面モデル化法を提案する。構造を持った照明光(レンジファインダー)によるか、あるいは、時系列冠状脳断面のような表面断面の画像列による外接輪郭点座標のような、散らばった非整列データ点列に最もフィットする滑らかな表面を形成するにはBスプラインが適している。Bスプラインは最も効率的な表面表現法として知られている。Bスプラインは、閉包性、連続性、局所形状の制御可能性、アフィン変換に対する不変性など、表面表現に非常に適した、魅力的な性質を持っている。このような魅力的性質にも関わらず、Bスプラインは、散らばった非整列3D点データ表現にはあまり利用されてない。その理由の1つは、散らばったデータ集合から物理的に意味のある表面表現ができるように点を整列させる課題を解く方法が見つからないことによるのかも知れない。Bスプライン表面表現が可能なパラメータや、そのためにデータ点を整列させる方法を見つける問題は拡張ガウス関数写像(extended Gaussian map)の測地線によって達成された。コントロール点は、表面への最適フィッティングを誤差2乗最小問題を解析的に解くことで達成された。ノイズのないモデル化ではBスプライン補間法の代わりに近似法を利用した。また、局所的変形やノイズに頑健なBスプラインフィッティング法についても調査した。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.22, No.7


優占部分空間不変量
Dominant-Subspace Invariants

D. Gregory Arnold, Kirk Sturtz, Vince Velten, N. Nandhakumar

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 7, pp.649-662, July 2000

Keywords: Dominant-subspace invariants, Lie group analysis, principal basis, quasi-invariants, thermophysical invariance, thermophysical model

オブジェクト認識のためには、特徴量空間においてユニークであって頑健で安定した特徴量が求められる。Lie群の解析によって、不変特徴量と呼ばれる、このような特徴量を決定するための建設的な手続きが得られる。絶対不変量が見つかることは一般的には希であるが、いわゆる準不変性を利用することによって、絶対不変性に要求される条件を緩和することができ、潜在的に実世界応用において有用となりうる特徴量を探すことができる。本論文では、Lie群の理論を利用して準不変な特定の優占部分群不変量の概念を作った。これを構成するアルゴリズムを以下に示すが、これは基本的には、Lie群における作用軌道のよい近似となる積分部分多様体を探索し、決定するものである。この考え方を長波長赤外線問題に応用した結果は有効なものであった。他の応用分野についても述べられている。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


代数曲線の複素表現と、および、これのポーズ推定と不変認識への利用
The Complex Representation of Algebraic Curves and Its Simple Exploitation for Pose Estimation and Invariant Recognition

Jean-Philippe Tarel, David B. Cooper

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 7, pp.663-674, July 2000

Keywords: Complex polynomials, pose estimation, pose-independent curve recognition, Euclidean invariants, complete-sets of rotation invariants, curve centers, implicit polynomial curves, algebraic curves, shape representation, shape recognition.

任意次数の2次元代数曲線(陰関数多項式曲線)のコンピュータビジョンへの応用を目指した新たな表現法を紹介する。これらの表現法によって、高速で正確なポーズに依存しないユークリッド変換を受けた形状認識が可能になる。この変換において、不変量は完全であり、高速で正確なポーズ推定は多項式の全係数が既知であるとする。この全係数を既知にするために、係数に基づいた新規なセンタリングを実行し、続いて、多項式係数空間を一群の直交部分空間に分解することによって回転推定を行う。現実の測定データ空間内での回転が、これら2次元部分空間内の回転や、1次元部分空間内の同値変換に変換できる。これら2次元係数部分空間での回転角同士は比例関係にあり、また、x, yデータ空間での回転角の整数倍である。この方法を複素変数、x + iy = z,や、複素多項式係数に適用してみると、より理解や計算が単純化する。形状に基づく索引をデータベースに利用する場合の有用性を示すために、代数曲線の複素表現し、その有用性や頑健性を示した。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ステレオマッチングと隠蔽検出のための協調アルゴリズム
A Cooperative Algorithm for Stereo Matching and Occlusion Detection

C. Lawrence Zitnick, Takeo Kanade

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 7, pp.675-684, July 2000

Keywords: Stereo vision, occlusion detection, 3D vision

本論文では明示的に検出された隠蔽による視差マップを求める立体視アルゴリズムを 紹介する。滑らで精密な視差マップを得るために、最初、MarrとPoggioによって提案 された、ユニーク性と連続性の2つの仮定を採用する。すなわち、視差マップは画素 毎にユニークな値を持っており、いたるところ連続である。この仮定は視差空間にお けるマッチング値の3次元配列において成り立つものとする。各マッチング値は、片 眼画像中のある画素と、もう片方の画像中の対応する画素との間の、相対的な位置の 差に相当する。繰り返し法により、隣接画素に信頼度を拡散させ、視野の相似線に沿 う画素の信頼度を抑制し、これによってマッチング値を更新する。ユニーク性の仮定 を適用することで隠蔽領域は明示的に同定できる。この手法の効果を実証するために 人工画像と実画像の両方の処理結果を示した。その中には、他の方法によって得られ た真値との定量的比較も含まれている。

Ej,TS

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


動きから構造を推定する方法に潜む曖昧さ
A New Structure-from-Motion Ambiguity

John Oliensis

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 7, pp.685-700, July 2000

Keywords: Structure-from-motion, error sensitivity, ambiguity, bas-relief ambiguity, projective geometry, least-squares error, local minima.

本論文は、動きからの構造推定法(SFM)で得られるユークリッド構造中の、新規で近似的で、かつ、本質的な曖昧さの存在について示す。この曖昧さはバス・レリーフの曖昧さと同様に一般的に生じるものであるが、これと異なり、深さ方向に変動を有する情景画像に対して強調される。この曖昧さは投影SFMには生じないが、同じ理由によって、投影再構成法では誤差が大きくなりやすい。我々の解析によって、Jepson, Heegerおよび Maybankによる解析を補完する領域に対する最小2乗誤差曲面の準定量的な特徴付けが可能になる。我々の解析の1部として、無限小動き誤差---オプティカルフロー誤差---は、穏やかな有限動きの良い近似となることを示す。また、画像中や画像近辺で、エピポールの大きな誤差の極小値が存在することを示す。また、並進方向が与えられたとき、回転に伴う誤差を最小化する場合の、新規な極小値の存在が示される。。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


遺伝的アルゴリズムを利用した、最適逐次線形関数のフィッティング
Fitting Optimal Piecewise Linear Functions Using Genetic Algorithms

Jennifer Pittman and C.A. Murthy

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 7, pp.701-718, July 2000

Keywords: Genetic algorithms, optimization, statistical data analysis, splines

あるデータのモデル構築課題は、パターン認識,コンピュータビジョン、応用数学などの多くの科学分野に共通する問題である。多くの場合、データが生成されるプロセスとか、その統計的性質については分かってない。例えば,線形モデルを逐次当てはめる場合において、どのくらいの数の線素片を、そして、どこに結び目を置けば良いか、については知られてない。そのため、構築すべき統計モデルには、ほとんど仮定は入ってないが、それでもある意味で最適なモデルを利用している。このような方法を設計するために遺伝的アルゴリズムを利用した。本論文では、線形関数を逐次当てはめに、遺伝的アルゴリズムを利用することを検討した。線素の数,結び目の位置,そして、根底にある真のデータ分布は未知であると仮定した。この問題を解く為の、既存の手法を論議し、線素の数や、その位置を最適化するために、遺伝的アルゴリズムを使った新しい手法を紹介する。我々の手法と、いくつかの既存手法の効率を比較した実験結果を示す。結論として、我々の手法は、ロバストであっても、あるいは、非ロバストであっても、両方とも逐次フィッティングには価値あるツールであると言える。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


統合化され完備された尤度による、クラスタリングのための混合モデル評価
Assessing a Mixture Model for Clustering with the Integrated Completed Likelihood

Christophe Biernacki, Gilles Celeux, Gerard Govaert

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 7, pp.719-725, July 2000

Keywords: Mixture model, clustering, integrated likelihood, BIC, integrated completed likelihood, ICL criterion

我々は統合化され完備された尤度モデルによる、クラスター分析の道具立てとして、混合モデルの評価を提案する。この目的のために、観測データは最大事後演算子によって既知クラスターに割り当てられる。次に、統合化された完全尤度(ICL)はベイズ情報基準(BIC)によって近似される。シミュレーション、および、実データによるICLを使った数値実験の結果、混合モデルの選択でも、関連クラスター数を選択する場合でも、両方とも良い効率を示すことが分かった。殊に,ICLはBICよりも、混合モデル仮定に違反する場合や、データの分割に鋭敏であるようなクラスターを選定するのに、より頑健であるように見える。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


超楕円をフィッティングさせる
Fitting Superellipses

Paul L. Rosin

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 7, pp.726-732, July 2000

Keywords: Curve, superellipse, fitting, error measure

従来の論文で紹介される超楕円によるデータフィッティング手法は、問題が非線形であることによって演算コストが高い。本論文は、フィッティング効率と精度の間のトレードオフに基づくいくつかのフィッティング技術について、その手法とテスト結果について紹介する。さらに、ほとんどの超楕円フィッティング手法に適用可能である、これに代わる多様なフィッティングエラー測度(EOF)について述べる。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


動的な輪郭モーフィング
Morphing Active Contours

Marcelo Bertalmi'o, Guillermo Sapiro, Gregory Randall

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 7, pp.733-737, July 2000

Keywords: Partial differential equations, curve evolution, morphing, segmentation, tracking, topology

本論文は、与えられた画像において曲線をモーフィングさせて、第2の画像の任意の位置に描かせる方法について述べる。このアルゴリズムは、対になった偏微分によって第1の画像の曲線の変形を追跡しながら、第1の画像の偏微分(PDE)値を、第2の画像に変形させる手法に基づいている。第1の方程式の速度(velocity)を第2の画像に投影することによって追跡が実行される。既知のPDEに基づく手法に比べて、フレーム画像も曲線も両方とも追跡に使われる。この手法はオブジェクト追跡や連続画像のセグメンテーションに応用可能である。変形曲線のトポロジーは、新たにトポロジーのための道具を追加することなく、変更可能である。これによって、例えば,フレームからフレームへと対象オブジェクトのトポロジーが隠蔽によって変化するような場合でも、追跡が可能である。さらに、本研究は画像解析の応用に、PDE対による投影速度のコンセプトを始めて紹介している。これを電子顕微鏡画像の追跡とセグメンテーションに利用した例を示す。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


事前形状や滑らかさによる境界検出
Boundary Finding with Prior Shape and Smoothness Models

Yongmei Wang, Lawrence H. Staib

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 7, pp.738-743, July 2000

Keywords: Boundary finding, correspondence, statistical shape models, smoothness models, deformable models, prior knowledge, Bayesian formulation

入力画像の事前知識とエッジ情報に基づいて、ベイズ手法による境界検出のための統一的な枠組みを提案する。我々の事前知識の枠組みは、独立性、滑らかさ、統計的形状、および結合モデルの4つの異なる共分散行列に対応する主成分分析に基づいている。実際、スネーク、モーダル解析、フーリエ記述子、点分布モデルは、異なる事前モデルから導かれ、あるいは、関連している。真の訓練集合が変形範囲をカバーするような充分な変動を持ってない場合、混合共分散行列として滑らかさと統計的変動モデルの混合した事前情報を利用する。そしてより大きなデータ集合が得られるに従って徐々に、変動の統計モデルをより多く利用する。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.22, No.8


実時間追跡を利用した行動パターンの学習
Learning Patterns of Activity Using Real-Time Tracking

Chris Stauffer, W. Eric L. Grimson

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 8, pp.747-757, August 2000

Keywords: Real-time visual tracking, adaptive background estimation, activity modeling, co-occurrence clustering, object recognition, video surveillance and monitoring (VSAM)

ある現場にある運動物体を受動的に観察するための視覚的モニタリングシステムを開発し、これらの観察に基づく行動パターンを学習することが我々の最終目標である。観察場所の拡大に従い、複数カメラが使われた。このシステムのキーとなる要素は動きの追跡、カメラ座標系、行動識別、および、事象検出である。本論文では、動きを検出し、現場における行動のパターンを学習をするために、観察された動きをどのように利用することができるかを示すことに焦点を合わせる。動きのセグメンテーションは、各画素を多様なガウス分布の混合と見なし、モデル更新にはオンライン近似を利用するような、適応的背景除去法に立脚している。その後、複数のガウス分布が評価され、背景処理から、その中のどれが最も可能性が高いかが決定される。これによって戸外の照射量変化、ごたごたした状態から生じる繰り返し動作、長期的情景変化などを高い信頼性で処理できる、安定な実時間追跡システムとなる。この追跡システムは、追跡オブジェクトが何であるかの同定はしないまま、全部の追跡が終了し、後で同一の同定処理に任せる。このシステムでは、同一画像系列内で共起画像を蓄積して後に備える。これら共起統計は、その後、階層的2値の木による識別に使われる。この手法は、その場所の個々の行動事象の識別に有効なだけではなく、系列画像の識別にも役立つ。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


複数ビデオ画像系列からの行動監視:共通座標の枠組みの確立
Monitoring Activities from Multiple Video Streams: Establishing a Common Coordinate Frame

Tily Lee, Raquel Romano, Gideon Stein

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 8, pp.758-767, August 2000

Keywords: Vide survellance, multiple views, external camera calibration, planar motion, tracking

広い領域を監視するためには、複数のカメラ間の連携が必要であり、そのためには、分散ラ間での事象の関連づけが必要となる。本論文では、広域の情景における複数カメラの自動外部キャリブレーション課題に取り組んだ、すなわち、個々の3D相対位置と方位の完全復元に挑んだ。カメラは互いに遠く離れているため、統計的特徴量の整合性のために、明るさが同じであるとか、近くにある場合の特徴などは、利用できない。その代わり、画像系列全体を通しての、追跡したオブジェクト平面幾何学的制約条件を利用した。ロバストに追跡オブジェクトを平面モデルにマッチング・フィッティングさせことによって、複数情景にまたがる地表平面情景を組み立て、平面上の配置行列を分解して、3Dの相対カメラ位置と地表面位置を復元した。この手法を、よく制御された実験室でテストしカメラパラメータが内蔵する誤差の影響を見積もり、そして、未制御の戸外で実証した。戸外では、カメラの同期は必要なく、幾何学的制約によって追跡データの整合が実時間で可能であることを示す。真のカメラパラメータに伴うノイズにも関わらず、このシステムは地表面の複数の情景画像をうまく鳥瞰情景に変換でき、相対的な3Dのカメラ位置と地表面を復元できた。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


独立な動きの検出:時間的連続性の統計
Detecting Independent Motion: The Statistics of Temporal Continuity

Robert Pless, Tomas Brodsky, Yiannis Aloimonos

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 8, pp.768-773, August 2000

Keywords: Independent motion, normal flow, tracking, video mosaic, stable feature frame, airborne visual surveillance

空中撮影への応用に特化した課題に、すなわち、ノイズのある長時間ビデオ画像中の、独立に動き回る小さなオブジェクトの追跡について考察する。正確な背景の動きモデルを計算するためには、直接時空間画像の強度勾配計測値を利用する。これによって沢山のフレームに渡る正確なモザイク化(張り合わせ)や、独立した動きの指標の働きをする制約違反関数(constraint violation function)の定義が可能になる。新規な、時間統合法によって、オプティカルフローを計算せず、オブジェクトモデルやカルマンフィルターを使わないで、長時間の画像系列に渡って確信度を維持することができる。モザイク化によって安定な特徴フレームが得られ、独立に動くオブジェクトの詳細な局在化が可能になる。制約違反尺度における画像ノイズの効果を統計的に解析し、試験された画像系列において、確率分布による推定と測定された標本の頻度が、良い一致を示すことを紹介する。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


方向性が制御された流れの蓄積から顕著な動きの検出
Detecting Salient Motion by Accumulating Directionally-Consistent Flow

L. Wixson

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 8, pp.774-780, August 2000

Keywords: Motion detection, optical flow, vegetation, motion salience

多くの視覚課題において、動きの検出は重要な役割を持っている。しかし、画像の動きは興味ある事象からも生じるが、そうでない事から生じることもある。本論文では、人や車が方向性を持って移動するような、典型的監視対象から得られるような動きとして、顕著な動きが定義される。そうでない動きには、水の反射によるきらめきや、風による植物の揺らぎのような、何でもない動きがある。我々は、中間段階のオプティカルフロー統合化に基づく顕著な動きを検出するアルゴリズムを提案する。この提案手法が実ビデオ画像に応用可能であることを示す実験結果を示す。他の多くの動き検出法と異なり、本手法では感心のない動きを除去するために、オブジェクトの大きさや、形状に関する知識を予め与える必要はない。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


頑健な実時間周期運動の検出・解析と応用
Robust Real-Time Periodic Motion Detection, Analysis, and Applications

Ross Cutler, Larry.S. Davis

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 8, pp.781-796, August 2000

Keywords: Periodic motion, motion segmentation, object classification, person detection, motion symmetries, motion-based recognition

静止画像カメラにもビデオ画像カメラにも適応可能な周期的動きを検出し解析する新規な手法について述べる。興味ある被写体を追跡することによって被写体の時間と共に変化する自己相似性を計算する。周期的運動に対して自己相似性尺度も周期性を持つので、この周期性検出のために時間-周波数解析を適用する。また、周期性については、相似性行列に内在する2D格子構造を利用してロバストな解析も行う。これを使った実時間システムが実装され、周期性を使ったオブジェクトの追跡と識別が行われた。ヒト、走るイヌ、クルマのようなオブジェクト識別と、ヒトの数え上げ、非定常的周期性が得られた。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


W4:人々とその活動の実時間監視
W4: Real-Time Surveillance of People and Their Activities

Ismail Haritaoglu, David Harwood, Larry S. Davis

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 8, pp.809-830, August 2000

Keywords: Surveillance, people tracking, activity detection, real-time vision, body part analysis

W4 は、大勢の人を見つけて追跡し、彼らの屋外での行動を実時間で監視するシステムである。これは単眼の中間調を有するビデオ映像か、あるいは、赤外線カメラからのビデオ映像に対して作動する。W4 は、形状解析と追跡の組合せを使ってヒトの位置と体の部分(頭、手、足、胴)を定め、ヒトの見かけのモデルを形成するため、隠蔽のような相互作用があっても追跡できる。このシステムは、前面に複数のヒトがいるかどうかを決定でき、従って、その領域を構成するヒトをセグメント化できて、追跡できる。W4 は、人々が物を運んでいるかどうかを決定できるし、シルエットから、そのオブジェクトをセグメント化でき、シルエット画像からその見かけ上のモデルを構築できる。W4 は、ヒトと物の間の出来事、例えば、物を置くとか、カバンを交換するとか、物を片づけるとかを認識できる。このシステムは320×240の解像度の25Hzの画像に対して、400MHz, dual-Pendium II のPCで作動する。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ヒトの関わりをモデル化するためのベイズコンピュータシステム
A Bayesian Computer Vision System for Modeling Human Interactions

Nuria M. Oliver, Barbara Rosario, Alex P. Pentland

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 8, pp.831-843, August 2000

Keywords: Visual surveillance, people detection, tracking, human behavior recognition, Hidden Markov Models

画像による監視システムにおいてヒトの行動をモデル化し認識するための実時間コンピュータビジョン・機械学習システムについて述べる。このシステムは、ヒト同士の相互作用がある場合や相互作用の種類を同定することをとくに考慮してある。その例としては、あるヒトを追跡する場合、あるヒトに会うために経路を変更する場合などである。このシステムは、閉じたフィードバックループによって、トップダウンをボトムアップ情報と組み合わせるが、そのどちらの情報とも統計的ベイズ法を採用している。我々は、2つの異なる状態に基づく学習アーキテクチャーを提案し比較している。特に、モデル化と相互作用には、HMMとCHMMを利用している。このCHMMモデルは、より効率的にかつ精度良く働くことが示される。最後に、限られた訓練データで問題を処理するために、人工生命型の訓練システムが採用されて、ヒトの相互作用を認識するために柔軟な事前モデルが開発された。これら先験モデルによって、追加調整や訓練なしに、ヒトの行動や相互作用が正確に識別できることを実証する。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ビデオ画像中の活動の発見とセグメンテーション
Discovery and Segmentation of Activities in Video

Matthew Brand, Vera Kettnaker

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 8, pp.844-851, August 2000

Keywords: Video activity monitbrincj, hidden Markov models, hidden state, parameter estimation, entropy minimization

隠れマルコフモデル(HMM)は、監視や、事象認識に関する論文における標準装備になってきたが、その理由は、経時的分析に確率分布推定や、動的時間のワープを可能とする利便性にある。一旦訓練すれば、このモデルの内部は透明なものと見なすことができ、隠れ状態を解釈する必要はない。この結合分布エントロピーを最小化することによって、HMMの内部の状態マシーンを、観察される活動を意味ある状態に整理させることができる。これをビデオの監視や注釈付けに利用したり、ビデオ画像中の活動を低ビットで符号化したり、不自然な行動の検出に用いることもできる。オフィスに於ける行動や戸外の交通に適用して、本枠組みが行動の主要なモードを学習したり、活動の変化を学習するかを実証する。次に、この枠組みによって、極端に曖昧な画像から隠れ状態を推測することができるか、特に、低解像度のシルエット系列から3Dの体の方位を推測できるかを示す。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


確率的構文解析による視覚活動と相互作用の認識
Recognition of Visual Activities and Interactions by Stochastic Parsing

Yuri A. Ivanov, Aaron F. Bobick

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 8, pp.852-872, August 2000

Keywords: Syntactic pattern recognition, action recognition, high level vision, video surveillance, gesture recognition, video monitoring

本論文は確率的構文手法を利用した、経時的活動や、多数のエージェントとのやり取りの検出と認識について述べる。この基本的アイデアは、認識課題を2段階に分ける。下位ののレベルの検出においては、標準的な独立な確率的事象検出器を利用して下位の特徴量の候補検出を提案する。これら検出器の出力は、確率的自由文脈文法の構文解析機構への入力信号列となる。文法と構文解析器によって長期の時間的制約や、曖昧さが除かれた不確定な低位の検出が与えられるが、与えられたドメインにおける事象の時間的構造に対する先験知識を利用することもできる。そのようなシステムを完成させるために、まず、1)連続的な下位の検出器から離散的記号列を生成する技術を作り、2)入力される記号列中の曖昧さを扱うための確率的自由文脈構文解析を拡張し、3)プリミティブ間の時間的整合性のような、記号間に制約を課すためのオンライン的構文解析アルゴリズムが強化される。そして、4)多数のオブジェクトの相互作用に整合性を保たせるために、整合性フィルターを拡張する。この実時間システムを開発し、ジスチャー認識や、ビデオ監視に応用して見た。監視への応用では、多数の、相互に関わり合ったオブジェクトをどの程度正しく解釈できたかを示す。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


イベントドリブンの選択的注視法による多数オブジェクトの行動認識
Multiobject Behavior Recognition by Event Driven Selective Attention Method

Toshikazu Wada, Takashi Matsuyama

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 8, pp.873-887, August 2000

Keywords: Behavior recognition, HMM, nondeterministic finite automata, selective attention mechanism, toke propagation, multiviewpoint image

セグメント化してない画像系列から、多数オブジェクトの振る舞いを認識することは困難な課題である。なぜなら、今まで提案されたほとんどの動き認識手法は、単一オブジェクトの仮定がなされているから。既存の手法に基づき、この課題をボトムアップによる画像セグメンテーションと、画像系列識別のみによって解くことができる。この直接的な手法は、全面的にボトムアップセグメンテーションに依存しているが、このセグメンテーション法は、隠蔽や例外に弱いことが知られている。本論文は、この課題のために、ボトムアップセグメンテーションを使わない全く新規な方法を提案する。我々の手法は仮説生成と検証に基づいている。すなわち、入力画像と振る舞いモデルが動的に生成され、画像中から、これを支持する証拠を見つけて検証するという、尤もらしさの仮説に基づいている。これを実現するために、選択的注視モデルと呼ばれるアーキテクチャーを利用した。これは、状態依存性イベント検出器とイベント系列分析器から構成されている。前者は画像の制限領域内(注視領域)の変化(イベント)を検出するが、隠蔽や例外には影響されない。後者は検出されたイベントを解析し、多数オブジェクトの挙動として可能性のある全ての状態を駆動する。このアーキテクチャーにおいて、各注視領域は対応する仮説によって決定されるため、イベント検出は生成された仮説の検証プロセスと見なすことができる。このアーキテクチャーは全ての可能な仮定が生成されるため、健全である。しかし、これらの冗長な仮定は、認識結果に曖昧性が存在することを意味する。従って、更にシステムを拡張し、1)状態空間において異なるオブジェクトを識別するため色つきトークンを伝播させ、2)単一視野の画像認識結果の曖昧さを解消するため、多視点画像系列の統合化を行う。人間の行動の認識のために、実画像による徹底的な実験が行われた結果、このアーキテクチャーの健全性とロバスト性が実証された。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


正規化分割と画像のセグメンテーション
Normalized Cuts and Image Segmentation

Jianbo Shi, Jitendra Malik

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 8, pp.888-905, August 2000

Keywords: Grouping, image segmentation, graph partitioning

視覚における知覚的グループ化の問題を解く新規な手法を提案する。局所的な特徴量に着目し、画像中での整合性に注目するのではなく、我々の手法は画像全体の印象を抽出することを目標とする。画像セグメンテーション問題をグラフの分離問題と見なし、このグラフをセグメント化するための新規なグローバル基準である、正規化分割を提案する。この正規化分割基準の尺度は、異なるグループ間の全体的相違度と、グループ内全体的相違度の両方を利用する。この基準を最適化するための、一般化固有値問題に基づいた効率的計算手法を示す。この手法を静止画像や動画の系列に応用した結果は非常に勇気づけられるものであった。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


統計的、および、幾何学的情報を利用した、適応的焦点可変モデル
An Adaptive Focus Deformable Model Using Statistical and Geometric Information

Dinggang Shen, Christos Davatzikos

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 8, pp.906-913, August 2000

Keywords: Active contour, snake, statistical shape models, adaptive focus deformable model

医用画像用途を強調した能動的輪郭(スネーク)モデルを紹介する。このモデルには3つの新規な点がある。まず第1に、スネークモデルの各点の周囲の幾何学的構造を特徴付けるのに属性ベクトルが使われる;この変形可能モデルは類似の属性ベクトルを探して変形する。これは、通常、幾何学的構造を考慮しないで、近隣エッジの方向へ変形するモデルとは異なっている。このような手法を採用した理由は解剖学的意味で対応点を確立する必要性からの要請である。第2に、適応的に、着目すべき統計的モデルを示唆することにより、尤も信頼性の高いと思われる輪郭を、最尤マッチングによって能動的に変形していく。第3に、スネークによるセグメントと同時に、スネークエネルギー関数の評価によって局所的最小値にロバストな変形メカニズムが提案されていることであり、従来の各点での評価とは異なる。色々な実験結果から、この提案モデルの効果が実証された。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


環状光源による照明下の光沢面の動きから完全な3Dモデルを獲得する
Acquiring a Complete 3D Model from Specular Motion under the Illumination of Circular-Shaped Light Sources

Jiang Yu Zheng, Akio Murata

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 8, pp.913-920, August 2000

Keywords: Shape from highlight, 3D model reconstruction, specular motion, epipolar-plane images, surface geometry, specular-motion stereo

本研究では、光沢のある表面の3Dモデル復元をする。オブジェクトが回転し、その連続画像が撮影される。環状の光源が円錐状の光線を作り、これが回転オブジェクトを照明すると、ハイライトのストライプがほとんどの光沢面上に観察される。表面形状は連続画像中のハイライト部の動きから計算される;すなわち、光沢の動きのステレオか、あるいは、1つの光沢の軌跡が利用される。もし照明光が適当に設置されると、回転中にオブジェクト表面のすべてがハイライトを示す。回転平面の形状は、対応するエピポーラ面画像を利用して別途計測される。3D形状はこうして異なる回転面で得られる形状を結合して再構成される。形状の計算は単純であり、各回転平面上でハイライト部の動きが必要なだけである。本論文の新規性は一般的な光沢のあるオブジェクトの完全モデル化であり、これは以前なされてなかったことである。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.22, No.9


トレラントラフセットを使った手書き数字識別
A Handwritten Numeral Character Classification Using Tolerant Rough Set

Daijin Kim, Sung-Yang Bang

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 09, pp.923-937, September 2000

Keywords: Tolerant rough set, lower and upper approximation, similarity measure, genetic algorithms, handwritten numeral character classification

本論文は既存のラフセットと等価である拡張トレラントラフセットに基づく新規なデータ識別手法を提案する。2つのデータ間の類似尺度は、全ての構成属性の距離関数によって記述される。それらがトレラントであるとの定義は、類似尺度が、ある類似閾値を越えた場合についてである。正確な識別のためには最適類似閾値の定義が重要である。従って、我々は遺伝的アルゴリズム(GA)によって最適に定義する。この場合、進化の最終目標は、1)多数のトレラントなオブジェクトが同じクラスにできるだけ多く包含されていること、そして、2)同じクラスのあるオブジェクトは、できるだけトレラント(許容される)であること、という2つの条件のバランスが取れている必要がある。最適類似閾値が見つかった後は、各々のオブジェクトのトレラント集合が得られ、データ集合は、共起クラスに依存して、lower approximationおよびupper approximation集合にグループ化される。我々は、第1段階にlower approximationを使い、次に、第1段階で識別できなかったデータに対してupper approximation集合から得られたラフ・メンバーシップ関数によって識別する2段階の識別法を提案する。この識別法を手書数字の識別に利用し、この識別効率と学習時間を、フィードフォワード型ニューラルネットワークのバックプロパゲーションアルゴリズムの識別効率・学習時間と比較した。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


一筆書きの画像から書き順を復元する
Recovery of Drawing Order from Single-Stroke Handwriting Images

Yoshiharu Kato, Makoto Yasuhara

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 09, pp.938-949, September 2000

Keywords: Handwriting, cursive script, character recognition, stroke recovery, temporal information, image processing, OCR

一筆書き(単一ストローク)の手書き文字の静止2D画像から、書き順を復元する新規な方法について述べる。ここで、文字はひとつのストロークでできていなければならないが、筆跡が二回分重なることは許される、とする。手書き文字がスキャンされ、前処理された後、2つのステップからなる復元法を応用した。最初に、スケルトン画像全体から構成されたグラフを解析し、各エッジの型を決定し、グラフをラベル付けした。第2に、このラベル情報を利用して、始頂点から終頂点まで追跡した。この方法は、セールスマン問題のような多数の経路探索を要求しないため、文字が複雑であっても組み合わせ爆発を生じる心配はない。手書き文字の筆順が復元されることによって、静止2D画像から時間情報が得られることになる。従って,この手法によって、オフラインの文字認識と、オンラインの文字認識の橋渡しが可能となる。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ロバストな線形性とサポートベクトル回帰
Robust Linear and Support Vector Regression

Olvi L. Mangasarian and David R. Musicant

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 09, pp.950-955, September 2000

Keywords: Support vector machines, regression, Huber M-estimator, kernel methods

ロバストなHuberのM推定とは、小さな誤りに対して2次であり、そうでない誤りには線形である微分可能コスト関数であるが、これはもとの課題の主要空間中で正確にモデル 化できる。このために、線形で非線形サポートベクトルである推定器のための簡単な課題である凸2次プログラムを利用する。以前のモデルはずっと複雑であるか、あるいは、双対空間で定式化されている。ロバストなHuber線形推定器を解くためには、特殊化した数値アルゴリズムを考える必要がある。これらのアルゴリズムとの数値テスト比較によって、線形・非線形両方のサポートベクトル問題に対して2次形式プログラミングモデルが有効であること示唆される。20,000以上のデータを有する大規模問題に対して、これが極めて高速であることが示されている。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


オブジェクト認識の効率を予測する
Predicting Performance of Object Recognition

Michael Boshra, Bir Bhanu

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 09, pp.956-969, September 2000

Keywords: Bounds on recognition performance, model-based real-world object recognition, modeling data distortion, performance

我々はオブジェクト認識の基本的な効率を予測するため方法を紹介する。情景データとモデルオブジェクトのデータが2Dの点群特徴として与えられたとき、ボーティング(voting)に基づく判定によってデータ/モデルが評価される。ここで提案される手法は、不確定性、隠蔽、モデルの類似性に加えて更に乱雑性などのデータ変形因子も考慮する。従来はこれらの部分的な要因しか考慮しなかったのと異なり、この手法は全部を考慮する。効率は2段階で予測される。第1段階では、モデルオブジェクトの全ての組合せについてその相対的変形の関数としての構造比較によって類似度が計測される。第2段階では、認識誤り確率の上限を決定するために、データ変形因子の統計モデルとともに類似度情報が利用される。この限界は認識精度確率の下限を決定するために直接利用される。実際の合成開口レーダー(SAR)データを利用した実験によってこの手法の正当性が実証された。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


興味視野領域を定義するためのアルゴリズム:注視との比較
Algorithms for Defining Visual Regions-of-Interest: Comparison with Eye Fixations

Claudio M. Privitera, Lawrence W. Stark

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 09, pp.970-982, September 2000

Keywords: Eye movements, scanpath theory, regions of interest identification and comparison

圧縮、画像データベース検索、画像理解などの多くのマシンビジョン応用において、しばしば興味領域と呼ばれる画像の代表的部分系列箇所のみを詳細に解析すれば良い場合が多く存在する。この興味領域をROIと呼ぶことにする。このようにアルゴリズムで検出されたROIをaROIと呼び、異なる複数の画像処理アルゴリズムを使い、適当なクラスタリング手続きによってこれを自動的に見つける手法を研究・開発した。人間の知覚では、内部表現はトップダウンで、文脈依存的に視覚運動列を制御し、人によって見つけたROI、すなわちhROIが注視される。本論文では、ボトムアップで自由文脈アルゴリズムを評価するための基準として、我々のaROIと、hROIを比較する。最後に応用について考察した。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


適応的スケールフィルターとレンジデータを使った特徴抽出
Adaptive-Scale Filtering and Feature Detection Using Range Data

Clark F. Olson

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 09, pp.983-991, September 2000

Keywords: Filtering, edge detection, feature detection, stereo, smoothing, scale-space

エッジやコーナー検出において、画像中の場所を同定するための適当な縮尺率を知らずにスケールを固定したまま検出を試みることが多い。しかし、多くの画像には、1つの画像中には多様な距離が含まれており、実際には同じ大きさの特徴であっても、画像中では異なった大きさになる。フィルタリングや特徴検出のスケールが注目画素の存在する情景の距離に応じて局所的に変化する手法を紹介する。このスケールはステレオ視で推定する。従って検出された特徴は、画像中ではなく、実世界において同じ大きさである。この手法は離散的に複数のスケール画像のフィルタリング処理と、各画素での内挿処理によって正しいスケールを求め、効率的に実装化された。この方法を砲弾認識認識問題に応用した結果は、著しい効率改善が見られた。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


モデルに基づく輝度条件:構造と動きの直接推定
Model-Based Brightness Constraints: On Direct Estimation of Structure and Motion

Gideon P. Stein, Amnon Shashua

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 09, pp.992-1015, September 2000

Keywords: Shape representation and recovery, 3D recovery from 2D, shape from motion, image sequence analysis, algebraic and projective geometry

我々は複数視野画像の輝度から構造と動きを直接推定する方法を述べる。我々はHornとWeldonの直接法を3視野像に拡張した。3番目の画像を加えることによって動きの解が得られ、視野の深さ方向のマップ密度が向上する。これには、従来必要であったオプティカルフロー算出のための対応点を最初に見つける必要がなく、時空間微分を直接線形計算を実施して求めることができる。この方法の利点と限界について述べ、実画像による実験で検証した。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


複雑な運動の学習と識別
Learning and Classification of Complex Dynamics

Ben North, Andrew Blake, Michael Isard, Jens Rittscher

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 09, pp.1016-1034, September 2000

Keywords: Computer vision, learning dynamics, Auto-Regressive Process, Expectation Maximization

動的なプロセスの学習は最尤法に基づく、標準的で誤差を含まない自己回帰プロセスによって求められる。実際のセンサーの観測値に伴う不確定性から、運動は近似値しか観測できない。それでもカルマンフィルターに基づく"EM-K"--Expectation-Maximization (EM)法によって学習は可能である。しかし、これでは、多数の動きクラスのようなもっと複雑なものは扱えない。また、視覚によって観察される動的プロセスでも問題となる:カモフラージュのような背景の雑景から非ガウス的観察ノイズが生じる。動的クラスが1つだけであるような場合でも、非ガウス的観察の場合はEM-Kの守備範囲を越える問題を含む。このような場合には、ランダムな「粒子集合」が伝搬して凝縮(CONDENSATION)するアルゴリズムに基づく"EM-C"によって解けることを示す。雑景中の学習は机上での手の動きを観察することによって実験的に研究された。その結果、ここに示す学習済み動的モデルは優れた予測値を持つことが示される。事前動き予測に利用される場合、視覚観察における演算負荷は著しく軽減される。マルチクラスの動力学をジャッグリング画像に応用してみたところ、尤もらしい動的モデルが学習プロセスから見つかった。そして正確な動き識別が得られた。実際、EM-C学習は演算負荷が大きく、本論文の結論では演算複雑度について触れている。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


反響測定の制約による移動ロボットの定位法
Mobile Robot Relocation from Echolocation Constraints

Jong Hwan Lira, John J, Leonard

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 09, pp.1035-1041, September 2000

Keywords: Localization, mobile robots, navigation, sonar

本論文はソナーデータを利用した可動ロボットの移動法を紹介する。ロボットをどう配置するかの事前推定が得られない状況で、全体的な参照フレームに対応して移動ロボットの姿勢を決定するプロセスは、測定結果と、事前に用意された環境マップとの対応付けのための探索問題と見なせる。色々なオブジェクトに対する反響測定によって、コーナー、エッジ、円筒、壁の4つの幾何学的特徴がソナーセンサーモデルとして与えられた。ロボット位置決定には各々の距離測定値を制約下探索し、これをデータ特徴として利用した。2方向からの距離データの可能な組合せの全数探索から、仮説・検証法によってロボット位置が決定された。このアルゴリズムは距離データと環境モデルとの最良合致によって位置を決定する。この手法の効率を実証するために、単一のポラロイドカメラの超音波センサーを走査して得られるデータと、ポラロイドセンサーをリング状に配したデータの両方について実験した。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


固有空間モデルの併合・分離
Merging and Splitting Eigenspace Models

Peter Hall, David Marshall, Ralph Martin

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 09, pp.1042-1049, September 2000

Keywords: Eigenspace models, principal component analysis, model merging, model splitting, Gaussian mixture models

各々がn次元観測集合を表す2つの固有空間モデルが与えられたとき、1)2つの集合を統合した表現モデルに併合するか, 2)1つのモデルを2つの異なる表現の集合に分離するか、を決定論的に与える新規な手法を紹介する。これが実行された後、正確にその手順を保存する。ここでは、その手法を理論的に導き、その効率と精度に関する実験的結果、および、動的に更新されるガウス混合モデルの構成を含む、3つの一般的応用について述べる。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


スケール・空間フィルタリングのための、空間・周波数トレードオフ
A Spatio-Frequency Trade-Off Scale for Scale-Space Filtering

Luc Fiorack

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 09, pp.1050-1055, September 2000

Keywords: Scale-space filtering, temporal versus frequency aliasing, time-frequency trade-off scale

ここでは空間コンボリューションフィルターのための実装化と、フィルター出力精度を最適化するためのフーリエ変換の問題について考察する。我々はガウス型スケール・空間フィルターに着目し、可能なスケール範囲を2つの等長の部分間隔に分割すべきかどうかのトレードオフが存在することを示す。このトレードオフ・スケール以下では、フーリエフィルタリングによって、空間フィルタリングより高精度の結果が得られるが、これより上ではそうはならない。もちろん、逆の信条である計算速度と対比させるべきであろう。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


等厚輪郭からの形状復元
Shape Recovery from Equal Thickness Contours

Ge Cong, Bahram Parvin

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 09, pp.1055-1061, September 2000

Keywords: Shape-from-X, 3D construction, shape from multiple views

等厚輪郭(Equal Thickness Contours =ETC)に基づくユニークな画像様式によって、多数の視野から3D形状を復元するための新規な可能性を紹介する。これらETCは、透過ビームや回折ビームの干渉によって生成される可能性がある。オブジェクトの多方位画像を表現するためのコンピュータによるフレームワークを示し、次に、これら表現を統合し、代数的に3D表面を構成する。本フレームワークでは、オブジェクトの厚さは、まず理想的輪郭から得られ、これを実データに拡張する。実データに対しては、オブジェクト厚さは2次微分の最大値を示す点に対応する曲線セグメントをグループ化することで推測できる。プロセスの各ステップにおいて、もとの特徴に近いことを保証するためのある種の規格化を利用する。この手法はホログラフ処理によって得られたサブミクロンの結晶構造の画像に応用された。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.22, No.10


円形の制御点列を利用したカメラの幾何学な補正
Geometric Camera Calibration Using Circular Control Points

Janne Heikkil

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 10, pp.1066-1077, October 2000

Keywords: Camera model, lens distortion, reverse distortion model, calibration procedure, bias correction, calibration accuracy

現代のCCDカメラは、その画素サイズの1/50以上の空間精度が出せる。しかし、色々 な誤差要因による画像形成プロセスへの影響によって、このような精度達成は容易で ない。現在の典型的キャリブレーション(更正)手法は、以下の仮定の上に成り立っ ている:観測値には歪みが無く、誤差として考慮するのは平均値がゼロで、独立等分 布のランダムノイズが観測画像座標中に存在するだけであり、カメラモデルによって 完全に3D座標系と画像座標系の写像が記述されている。一般的にはこの条件は成り立 たたず、キャリブレーション結果は予想した程の精度に達しない。本論文では、精密 な3Dコンピュータアプリケーションのためのキャリブレーション手続きについて述べ る。このとき、円状の制御点列に対する偏り訂正や、歪んだモデルを逆変換するため の非回帰的手法について述べる。精度解析を実施し、理論的精度を低下させている誤 差原因について考察した。合成画像に対するテストから、制限付き誤差条件下におけ るキャリブレーション結果の改善が示唆されている。なお、実画像における外部誤差 源の抑圧は必須である。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


非ガウス分布の教師無し識別のための独立成分解析(ICA)混合モデルと、目隠し信号 分離における自動的コンテキストスイッチング
ICA Mixture Models for Unsupervised Classification of Non-Gaussian Classes and Automatic Context Switching in Blind Signal Separation

Te-Won Lee, Michael S. Lewicki, Terrence J. Sejnowski

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 10, pp.1078-1089, October 2000

Keywords: Unsupervised classification, Gaussian mixture model, independent component analysis, blind source separation, image coding, automatic context switching, maximum likelihood

教師無し識別アルゴリズムは、各々が独立で、非ガウス分布密度の相互に排他的なク ラスの混合として、観測データをモデル化することによって導くことができる。この アルゴリズムは各クラスの密度を推定し、非ガウス構造のクラス分布をモデル化する ことができる。この新規なアルゴリズムは、標準的ガウス混合モデルと比較して識別 精度を改善することができる。これを信号源位置不定の非定常環境における信号源分 離に応用した場合、これは自動的に異なる混合性質を有するコンテクストに対応する クラス間をスイッチすることができる。このアルゴリズムは、自然画像とテキストの 両方を含む画像でも効果的に符号を学習することができる。この手法は高次元データ の非ガウス構造のモデル化に有力であり、多くの応用の可能性を秘めている。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


顔認識アルゴリズムのためのFERET(顔認識技術)評価手法
The FERET Evaluation Methodology for Face-Recognition Algorithms

P. Jonathon Phillips, Hyeonjoon Moon, Syed A. Rizvi, Patrick J. Rauss

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 10, pp.1090-1104, October 2000

Keywords: Face recognition, algorithm evaluation, FERET database

顔の認識を高い信頼性で行うための最も重要な2つの要件は顔画像の大きなデータ ベースと、システム評価のための検定手続きである。Face Recognition Technology (FERET)プログラムは、この両者共に考慮されており、前者はFERETデータベースに よって、後者はFERET検定手法を確立することによって。今日まで1,199人からなる 14,126個の顔画像がFERETデータベースに含まれており,これは開発用と、テスト用 保存データとに分かれている。1996年9月、FERETプログラムは、第3回のFERET顔認識 テストを実行した。このテストの主要目的は1)最新技術の評価、2)将来の研究分野を 見つけ、3)アルゴリズムの効率を測定することである。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


多数フレームによる平面的動きの予測
Multi-Frame Estimation of Planar Motion

Lihi Zelnik-Manor, Michal Irani

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 10, pp.1105-1116, October 2000

Keywords: Motion estimation, plane alignment, multi-frame analysis, gradient-based methods

従来の平面的位置合わせ手法にはフレーム間の位置合わせ技術が利用されていた。本 論文では既知の2フレームによる動き推定法を、多数フレームの平面状部分空間内に おける同時多数フレーム推定に拡張する。本論文は以下の3点が重要である;1)カメ ラキャリブレーションが一定のとき、平面状表面のパラメトリックな画像動きは低次 元線形部分空間中に埋め込まれている、2)多数フレームにまたがる多数の平面状表面 は相対的動きが、カメラキャリブレーションが変化していても低次元線形部分空間中 に埋め込まれていることを示し、3)3D情報復元や、カメラキャリブレーションを行 わなくても多数フレーム条件によって平面状動きを多数フレームから推定することが 可能であることを示す。得られた多数フレーム推定プロセスは、個別の2フレーム推 定よりも条件が厳しく、その結果、小領域であっても位置推定制度が向上する。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


完結エネルギーとスケール
Completion Energies and Scale

Eitan Sharon, Achi Brandt, Ronen Basri

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 10, pp.1117-1131, October 2000

Keywords: Curve completion, curve saliency, least-energy curve, perceptual grouping, elastica curve, scale , induction field, completion field, fast summation, multiscale

画像中のなめらかな曲線を検出し、ギャップ間を連結させることは、知覚識別におけ る2大重要課題である。本研究では、曲線要素を連結して完全な曲線にするための完 全化エネルギーについて調べるが、曲線要素が内在的に依存している長さや幅のス ケールを活用する。我々は、2つの曲線要素間の最尤完全化のための高速計算法を紹 介するが、このために、最小エネルギー曲線を計算するための新規な解析的近似法と 高速数値計算手法を開発した。これはマルチスケール手続きを利用してなされる、す なわち、異なるスケールにおいて、独立処理を実行しながら、スケール間の調整もあ る程度行う。このような手法によって、線素が形成する全誘導場(induction field) でO(N log N)オーダーの加算をすればよい。ここでNは画像中の画素数とする。さら に大切なことは、このような手続きが現実的には誘導場の長さやスケールに依存して いることである。長い線素が作る場は、その構成要素である短い線素の集合が作る場 とは異なっている。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ランク付けの改良に向けて
Toward Improved Ranking Metrics

Nicu Sebe, Michael S. Lew, Dionysius P. Huijsmans

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 10, pp.1132-1143, October 2000

Keywords: Maximum likelihood, ranking metrics, content-based retrieval, color indexing, stereo matching, motion tracking

多くのコンピュータビジョンアルゴリズムにおいて、2つの特徴量の距離を決定する ために尺度とか類似度が利用されている。ユークリッド距離とか、あるいは、 SSD(Sum of the Squared Differences;差の2乗和)が一般的に利用されているが、 ノイズがガウス分布型加算ノイズである場合には最尤という観点からも、これは妥当 である。国際的なテスト用データ集合である実画像のノイズ分布は、この仮説が必ず しも成り立たないことを示している。すなわち、実画像には、実際のノイズ分布に近 い、他の分布が使われるべきであり、本論文ではこれを使って3つの異なる応用考察 を行った:画像データベースの内容に基づく検索、ステレオマッチング、動き追跡。 その各々において、それぞれ異なるノイズ分布モデル化関数で実験し、それぞれに対 応する距離尺度によってその精度を計算した。我々の実験では、SSD距離、SAD(sum of the absolute differences)距離、コーシー距離、および、カルバック相対情報量 を比較した。これらSSDあるいはSADを使った過去の研究論文のいくつかのアルゴリズ ムから、我々はコーシー距離が高い精度を示すことを示した。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


適応的多様体上へのモザイク化
Mosaicing on Adaptive Manifolds

Shmuel Peleg, Benny Rousso, Alex Rav-Acha, Assaf Zomet

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 10, pp.1144-1154, October 2000

Keywords: Mosaicing, motion analysis, image alignment

画像のモザイク(貼合わせ)処理は、通常、多数の画像やビデオフレームを貼合わせ て視野を拡大するために使われている。既存のモザイク化法は、ある決まった画面に 全ての画像を投影して作られる。カメラが平行移動する場合は、通常、平面が利用さ れ、カメラをパニングするときには円筒面が、パニングとティルティング両方のとき は球面が利用される。カメラの動きに合わせてモザイク化法は異なるが、カメラの前 進などの、より一般的動きは従来モザイク化不可能であった。ここでは、より一般的 なカメラ動きが可能な画像モザイク化法を紹介する。この新規なモザイク化法は、画 像から幅の狭いストライプが切り出され、カメラの動きに適応した画面上に投影され る。従来のモザイク化では、予め決められた画面を利用していたが、より一般的画面 を使うことで、これらの限界を克服した。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


学習曲線の最悪値
How Bad May Learning Curves Be?

Hanzhong Gu, Haruhisa Takahashi

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 10, pp.1155-1167, October 2000

Keywords: Generalization, concept learning, generalization error, learning curves, sample complexity, PAC learning, worst-case learning, interpolation dimension

本論文では平均的学習アルゴリズムを訓練サンプルに対して実施したとき、学習効率 が最悪であった場合に,学習曲線の限界値を推測する必要性があった。次に我々は学 習問題を仮説検定問題に既約化し、系の複雑さやブール代数内挿次元(Boolean Interpolation Dimension)に関して,いわゆる性質の悪い学習アルゴリズムの学習曲 線を調べた。性質の悪いアルゴリズムは通常のアルゴリズムよりは振る舞いが良くな いし、ブール内挿次元は、一般的には多数のシステム重みによって限定されているか ら、学習結果は現実の学習状況においての解釈や、最悪のケース学習曲線に当てはま るであろう。この研究によって、実際の学習状況に置ける最悪汎化ケースについて新 たな解釈が可能であることを示している。これは、今までの均一学習集合による、 Vapnik-Chervonenkis (VC)次元解析方法とは大きく異なる。このとき利用した。シ ミュレーションに使った数値とともに結果を示す。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


手形状の測定による生物統計学的同定
Biometric Identification through Hand Geometry Measurements

Raul Sanchez-Reillo, Carmen Sanchez-Avila, Ana Gonzalez-Marcos

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 10, pp.1168-1171, October 2000

Keywords: Hand geometry, classification, verification, biometric systems, Euclidean distance, Hamming distance, Gaussian mixture models, radial basis functions

手形状を同定し、これに生物統計学的を考慮し、手の識別を行うシステムの定義と実 装を紹介する。手の特徴量は、手を置くために設計された台に置かれた手をカラー写 真化し、これから抽出される。識別や照合のために、ユークリッド距離を利用した方 法から、ニューラルネットワークに至るまで、異なるパターン認識手法がテストされ た。この実験によって、最大97%までの識別成功率が達成されたことから、どんな ユーザーであっても、中〜高度のセキュリティ環境が本システムによって構成可能で あることを示している。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


広角レンズとポリカメラの、非尺度的キャリブレーション
Nonmetric Calibration of Wide-Angle Lenses and Polycameras

Rahul Swaminathan, Shree K. Nayar

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 10, pp.1172-1178, October 2000

Keywords: Camera calibration, wide-angle lens, radial distortion, decentering distortion, camera clusters, polycamera, nonsingle viewpoint, minimum working distance, real-time panoramic sensor

広角レンズカメラで撮影された画像は、画素点を光軸方向に変形させる強い歪が生じ やすい。本論文は、キャリブレーションのための測定用被写体を利用することなく、 この歪を除く簡単な方法を提案する。歪によって情景の中の直線は、画像中では曲 がって見えるから、我々のアルゴリズムでは、曲線を直線に直すようなパラメータを 探す。画像中の曲線に沿って、ユーザは数点を選択する。選択された画像中の点列が ノイズを明示的に表すように設計された目的関数を最小化することで、歪パラメータ が見つかり、これによって曲線が直線に復元される。合成画像のみならず、実画像に おいても、実験結果を示した。また、複数のカメラを稠密に組合せたポリカメラのア イデアも示し、非常に広い視野を撮影するための構成方法を提案する。このようなカ メラクラスターは、理想的には1つの視点を持たせるべきであるが、撮像センサーが 有限の大きさであるため、視点を1点にすることはできない。従って我々はこのよう な場合に、視点をできるだけ近づけるような最小有効距離(minimum working distance:レンズからの距離がこの距離以上であれば事実上同一視点と見なせる距 離)を求めるための解析方法を示す。最後に、4つの広角センサーによって構成され る、その有効距離が4mのポリカメラを示す。我々の提案する手法によって歪の無い画 像が得られ,実時間で高解像度のパノラマ画像を合成した。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


視覚部品の対応による形状類似尺度
Shape Similarity Measure Based on Correspondence of Visual Parts

Longin Jan Latecki, Rolf Lakamper

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 10, pp.1185-1190, October 2000

Keywords: Shape representation, shape similarity measure, visual pads, discrete curve evolution

視覚認知に基づく類似尺度を示し,2Dオブジェクトのシルエットからなる画像データ ベース中の類似オブジェクトの検索に関して、その特性を解析した。量子化ノイズの 影響を削減し、セグメンテーション誤りを減少させるため、ディジタル曲線の進化と いう新規な形状処理によって、計算は単純化される。我々の類似尺度を計算するた め、まず最初に視覚部品中の最適な対応をとる(ここでは視覚部品の演算は行わな い)。次に、対応部品同士の類似度が計算され、集積される。我々の類似尺度は多様 な画像データベース中のオブジェクトの輪郭形状を使ったマッチングに利用され,論 文で良く知られている既知手法と比較した。実験によれば、我々の形状マッチング手 法は直感的形状対応に一致し、ノイズによる歪にも頑健である。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


3D情景中の独立的動き検出
Independent Motion Detection in 3D Scenes

Harpreet S. Sawhney, Yanlin Guo, Rakesh Kumar

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 10, pp.1191-1199, October 2000

Keywords: Motion analysis, 3D scene analysis, moving object detection, dynamic 3D analysis.

本論文は、、カメラを動かしながら撮影した3D情景中の、独立に動いているオブジェ クトを検出するアルゴリズムを提案する。この課題において,2つの基本的制約条件 がある:1)複数視野に関するカメラの動きの制約(例えば、エピポーラ条件とか3 線線形(trilinear)条件)や、2)形状一定条件、など。この課題に対する従来の解 決法は、部分的拘束条件のみを用いるか,あるいは、オプティカルフローの密な対応 関係に頼るかのどちらかであった。我々は、事前の対応関係やフローを必要せず、両 方の制約条件を採用した。我々の手法では,2つの制約条件を成り立たせるため、 「平面+視差」分解を利用する。また、真の視差や独立な動きが混在するような、疎 な3D画像と呼ばれる情景画像のクラスに対して、平面+視差分解によって徐々に進行 することができるかどうか、基本的制約条件が正しいかどうかが実証される。このア ルゴリズムを、ある困難な疎な3D情景に当てはめた結果からは、有望であることが示 された。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


Kruppaの方程式に従わない場合のカメラ自己キャリブレーション
A Case Against Kruppa's Equations for Camera Self-Calibration

Peter Sturm

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 10, pp.1199-1204, October 2000

Keywords: Self-calibration, calibration, euclidean reconstruction, Kruppa equations, critical motions, degeneracy, absolute conic

透視カメラ(通常の光学カメラ)の自己キャリブレーション法について、特に、古典 的なKruppaの方程式に基づく問題を考察する。一般的な数種のカメラの動きについ て、自己キャリブレーション法は、解の存在が不明確な、退化した課題であることが 知られている。以前の論文において、我々はカメラの動きが、解の存在性を左右する 際どい系列画像について研究し、この応用の重要性を明らかにした。ここでは、一般 的自己キャリブレーションにおいて、それほど際どくないが、Kruppa方程式では対処 できないようなカメラの動きについて明らかにする。この対処できない場合とは,全 てのカメラの光軸中心が球の表面上に存在し、光軸が球の中心を通過する場合であ る。画像から3Dを構成するような課題では、このようなことは極めて自然な状況であ る。シミュレーション結果によると、数値的自己キャリブレーションアルゴリズム は、退化の近傍点で不安定になる。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


反復最近傍点アルゴリズムのための方位信頼性
An Orientation Reliability Matrix for the Iterative Closest Point Algorithm

Byung-Uk Lee, ChuI-Min Kim, Rae-Hong Park

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 10, pp.1205-1208, October 2000

Keywords: ICP algorithm, 3D registration, range data, volumetric modeling, pose estimation

本論文は、距離画像の位置合わせのための反復最近傍点アルゴリズムにおいて、回転 成分の信頼性を表現する行列を提案する。反復最近傍点アルゴリズムの信頼性は、オ ブジェクトの表面垂直ベクトルに依存することを示す。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.22, No.11


文書画像の劣化モデル有効性確認のための、統計的で非パラメトリックな手法
A Statistical, Nonparametric Methodology for Document Degradation Model Validation

Tapas Kanungo, Robert M. Haralick, Henry S. Baird, Werner Stuezle, David Madigan

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 11, pp.1209-1223, November 2000

Keywords: Model validation, nonparametric statistical tests, permutation tests, document degradation models, simulation models, OCR

印刷したり、複写したり、あるいは、スキャニングすることによって文書画像の品質が劣化する。文書画像理解の研究において、これらの劣化プロセスを理解することは、極めて重要である。この劣化モデルが得られることによって、システムの効率を予想したり、システムが破局する点を制御しながら実験することができたり、大量の多国語データ集合を識別訓練用や、最適なノイズ除去用や、アルゴリズムの自由パラメータ値を選定するためなどのグラウンドトゥルース(groundtruth)と共に構成することができる。文書理解の研究は何十年も前に始まってはいるが、今まではたった2つの画像劣化モデルが提案されているに過ぎない。また、これらのモデルの正当性を確認する統計的モデルは試みられていない。本論文では、局所劣化モデルの有効性を確認するための統計的手法を提示する。ここで提示するモデルは非パラメトリックで、2標本置換検定法に基づいている。もう1つの標準的道具として、距離関数のようなアルゴリズム間の妥当性評価のために検出力関数(power function)を利用することである。妥当性評価や検出力関数法はモデルとは独立であるからどんな劣化モデルであっても妥当に利用できる。任意の2つのモデル比較法も述べてある。これには、実世界に最も近いモデルを選択するための推定モデルに伴うp-値を利用する。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


文書画像の幾何学的構造解析:知識に基づく手法
Geometric Structure Analysis of Document Images: A Knowledge-Based Approach

Kyong-Ho Lee, Yoon-Chul Choy, Sung-Bae Cho

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 11, pp.1224-1240, November 2000

Keywords: Document image analysis, geometric structure analysis, region segmentation, region identification, knowledge-based approach

幾何学的構造解析は、文書画像から抽出された論理的成分から電子的文書を構成するために必要不可欠である。本論文では、技術論文を対象として、巧妙な幾何学的構造解析を知識に基づいて行う手法を紹介する。ここに提案する知識ベースは、技術論文雑誌に共通の幾何学的特徴を符号化するだけでなく、出版物に特異的な特徴をルールの形で符号化する。この方法は、トップダウンとボトムアップのハイブリッド手法を採用しており,セグメンテーションと、同定の2つのフェーズから成っている。一般的には,セグメンテーションの結果は構成要素のレイアウトと1対1の対応関係をもってはいない。従って、ここで提案する方法は、セグメント化された領域を分割したりグループ化して、複合化レイアウト成分にすることによって、文章行や数式のようなテキストだけでなく、画像とか描画や表のような非テキストオブジェクトをも見つける。IEEE PAMIをスキャニングして得られた372枚の画像に本提案手法を適用した結果は、テキスト画像の99%以上をうまくセグメント化し、以前の方法に比べて極めて良好な結果を得ている。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


一般化ポテンシャル場を利用した、3次元オブジェクトのスケルトン化
Skeletonization of Three-Dimensional Object Using Generalized Potential Field

Jen-Hui Chuang, Chi-Hao Tsai, Min-Chi Ko

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 11, pp.1241-1251, November 2000

Keywords: 3D skeletonization, roedial axis transform, potential field, distance function, 3D thinning

中心軸変換(medial axis transform :MAT)は、質問とか、アニメーションとか、有限要素法のメッシュ生成とか、経路探索、特徴認識などに有用な、骨格(スケルトン)表現法である。本論文では2D MATを、ポテンシャルに基づくスケルトン化法によって、従来の距離関数に代わってニュートンポテンシャルモデルのポテンシャルの谷をスケルトンとして抽出するが、これを3次元に一般化した。Chuangの文献に与えられた一般化ポテンシャル関数はニュートンポテンシャルに比べて、距離に対する減衰率が大きいが、これを3Dの場合に利用した。この提案手法の効率は、これらの関数とその勾配が多面体表面の閉形式で得られる事実から求められた結果である。シミュレーションによれば、提案手法によって得られたスケルトンは、対応するMATスケルトンに密接に関連している。3Dオブジェクトの中心軸(表面)は一般的に2Dであるが、ポテンシャルの谷は、1次元であり、より現実的なスケルトンを形成する。このアルゴリズムの他の好ましい属性は、オブジェクト境界の摂動に対する安定性、部分スケルトンを得られる柔軟性、計算時間の短さなどがある。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


適応的輪郭閉鎖アルゴリズムとその実験的評価
An Adaptive Contour Closure Algorithm and Its Experimental Evaluation

Xiaoyi Jiang

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 11, pp.1252-1265, November 2000

Keywords: Contour closure, adaptive grouping, directional morphology, image segmentation, performance evaluation

エッジに基づいて画像をもとに、完全に領域分けする方法は今までは注目されていなかった。本論文は、エッジに基づく完全な画像セグメンテーションを成功させるための鍵となる輪郭閉鎖問題を解くことによって適応的グループ化アルゴリズムを提案し、この潜在能力を確かめるのが目的である。ここで提案する方法の有効性は、距離画像の範疇で広範にテストされ、いくつかの領域に基づくセグメンテーション法と厳密に比較された。異なるレンジスキャナーによって得られた、品質の異なる3種類の距離画像データベースについて、本提案方式は、セグメンテーションの品質からも計算速度からも非常に魅力的な性能を示した。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


三角形マッチングと動的時間ワーピングに基づく指紋照合システム
A Fingerprint Verification System Based on Triangular Matching and Dynamic Time Warping

Zsolt Miklos Kovacs-Vajna

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 11, pp.1266-1276, November 2000

Keywords: Fingerprint, fingerprint verification, dynamic time warping, triangular matching, NIST sdb 4

効果的指紋照合システムを紹介する。これは現存する参照用指紋画像が、オンラインで、あるいは実時間で得られたテスト用指紋画像と同一であるかどうかを詳細マッチングによって検証する。このマッチングシステムは2つの主要なブロックから構成されている。第1ブロックは参照画像からオフラインで基本的情報を抽出する。第2ブロックはマッチングをオンラインで行う。参照画像からの情報はフィルタリング処理と、注意深い詳細抽出手続きによって得られる。指紋の同定処理は、指紋が静摩擦や指の回転によって大きく変形することに対処するために三角形マッチングを利用する。マッチングの最後は、動的時間ワーピングによって妥当性が評価される。その結果はNIST Special Database 4参照集合に対して述べられており,85%の正解率(15%は非正解率:false negative=1‐正解率)で、拒絶率は0.05%であったことから、この手法の有効性が示されたと言える。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


階層的判別回帰分析
Hierarchical Discriminant Regression

Wey-Shiuan Hwang, Juyang Weng

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 11, pp.1277-1293, November 2000

Keywords: Discriminant analysis, classification and regression, decision trees, high-dimensional data, image retrieval

本論文の主要目的は、画像データを効率的に検索できるように数値化して、困難な高次元データについて、新規な識別・回帰分析手法を提案することである。従来,大規模なデータの識別には多大な演算時間を必要とした。これに対して,木構造の階層的分類は高速である。しかし、数値データを木のノードに割り当てることは今まで手作業に頼らざるを得なかった。ここに提案する新規な手法は、識別課題(出力結果はクラスのラベル)と、回帰分析課題(出力結果は数値)の2つの課題を、統合回帰課題とみなす。この統一的視点からは、識別問題を数値情報として出力空間に表現することが可能であるが,これは従来、識別課題としては見なされなかったものである。つまり、クラスター化されたクラスラベル間の距離によって、疎で、かつ、詳細な識別ラベル付けをする。二重にクラスター化された部分空間に基づく階層的判別回帰(HDR)法が、ここで提案される手法である。この手法の主要特徴は、1)二重クラスターと呼ばれる、出力空間および入力空間における各ノード点において、クラスタリングが実行される。2)入力空間における判別子は、入力空間のクラスターから自動的に導かれる。これらの識別子は、木の内部ノードにおいて識別部分空間を張っている。3)この内部ノードにおける得られる判別部分空間に、階層的確率分布モデルが適用される。これによって、入力サンプルが階層的判別部分空間において、疎から詳細に至る確率分布が実現可能となる。グローバルな確率分布モデルを仮定する必要が無い。4)従来の判別分析手法で必要なクラスごとのサンプルを緩和するため、標本数に依存する負対数尤度(negative-log-likelihood (NLL))を導入する。この新たに導入された手法は、自動的に小標本数用や、大標本数用や、非平衡な標本数用に適応できるよう設計されている。5)このHDR手法は、経験的に時間対数の計算複雑度を持っているため、高速である。この手法はどんなデータにも適応できるが、我々は以下の3つのデータ形式に適応した結果について報告する:最適に近い効率を調べるための人工的データ、大規模な顔の実写画像データベース、従来の手作業で選択された特徴量を持った従来型のデータベースである。そして、それに付随するcart, C5.0, OC1のような主要な比較用手法との比較結果を示す。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


共分散を有するデータの表面のフィッティングについて
On the Fitting of Surfaces to Data with Covariances

Wojciech Chojnacki, Michael J. Brooks, Anton van den Hengel, Darren Gawley

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 11, pp.1294-1303, November 2000

Keywords: Statistical methods, surface fitting, parameter estimation, covariance matrix, maximum-likelihood, renormalization, conic fitting, fundamental matrix

特別な形式の方程式によって表現されるモデルのパラメータ推定問題について考察する。円錐曲線フィッティング、基礎行列の推定など、広範囲のコンピュータビジョン問題解析において、課題特有なモデルが生じる。ノイズは、測定の不確かさを特徴付ける、既知の共分散行列で表されると仮定する。コスト関数は、最尤化の定式化においてまず得られ,課題を解くためにある種の必要な近似を当てはめる。ここで、コスト関数を最小化するための、新規な、ニュートン法に似た、繰り返し解法が作られた。これに代わるSampson法とか、再正規化法に比べ、この新規な方法はコスト関数最小化器としての理論的限界を持っている。さらに、この方法は簡単に表現することができ、我々のテストによれば、効率的であるが、一般的手法と比べて卓越した方法ではない。この手法の重要な特徴は、色々な推定手法の理論的比較をする基礎として役立つことである。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


背景と前景を利用した複数回数の接触を許す手書き数字のセグメンテーション
Segmentation of Single- or Multiple-Touching Handwritten Numeral String Using Background and Foreground Analysis

Yi-Kai Chen, Jhing-Fa Wang

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 11, pp.1304-1317, November 2000

Keywords: Thinning, multiple-touching, segmentation, mixture Gaussian probability

複数回の接触を許す手書き数字(2桁)画像の新規なセグメンテーション法を提案する。接触数字をセグメント化するほとんどのアルゴリズムは、前景画素に着目する。背景画素に着目する解析はわずかであり、その他は認識器の結果を利用している。本論文では、複数回の接触を許す手書き数字列ために、我々は前景分析と背景分析を併合する。まず、接触した数字列画像の前景領域と背景領域の両方が細線化処理され、前景と背景骨格経路から、それぞれの特徴点が抽出される。これらの中から、可能性のある複数のセグメンテーション経路が構成され、不要なストロークは除去される。最後に、各可能なセグメンテーション経路の幾何学的性質のパラメータが決定され、これらパラメータは、混合ガウス確率関数によって解析され、最良セグメンテーション経路を決められたり、あるいは拒絶される。NIST特別データベース19や、我々独自の画像データを使った実験結果によれば、正解率が96%, 拒絶率が7.8%であった。これは、論文で知られている他の結果と比較されて遜色無いことを示している。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


混合ガウス分布のためのモード発見
Mode-Finding for Mixtures of Gaussian Distributions

Miguel A. Carreira-Perpinan

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 11, pp.1318-1323, November 2000

Keywords: Gaussian mixtures, maximization algorithms, mode finding, bump finding, error bars, sparseness

クラスタリングや回帰を応用する場合の課題である混合ガウス分布のすべてのモードを見つけるために、勾配2次形式および固定点繰り返しアルゴリズム、および妥当な制御パラメータが導かれた。見つかったモードの重要性は局所的にはヘッセに基づく誤りバー(Hessian-based error bars)、全体的にはエントロピーによって、それぞれ独立に定量化された。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


透視的距離センサーによって撮られた3次元画像における視点の推定
Viewpoint Estimation in Three-Dimensional Images Taken with Perspective Range Sensors

Jose M. Sanchiz, Robert Burns Fisher

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 11, pp.1324-1329, November 2000

Keywords: Range images, viewpoint

中心投影距離センサーを使って撮影された3D画像の視点位置を推定する方法を紹介する。我々は3D座標系を持っており、既知のトポロジーに基づいて整理されているが、かなりのノイズが含まれていると仮定する。画像中のいくつかの点において深さ方向に表面の不連続点が存在する場所(ステップ光線)においては,線形補間によってステップ光線を推定した。視点は、ステップ光線への最小距離点として求まった。ノイズへの対処は偏りの無い距離尺度の定義によって行った。距離の合計値の最小を示す点が視点となる。古めかしい教会の3D画像を使っていくつかの実験が行われた。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


カメラキャリブレーションのための柔軟な新手法
A Flexible New Technique for Camera Calibration

Zhengyou Zhang

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 11, pp.1330-1334, November 2000

Keywords: Camera calibration, calibration from planes, 2D pattern, flexible plane-based calibration, absolute conic, projective mapping, lens distortion, closed-form solution, maximum likelihood estimation, flexible setup

カメラをキャリブレートするための柔軟で、新しく、簡単な方法を提案する。カメラで平面状のパターンを少なくとも2回、異なる方位から撮影するだけでよい。カメラも平面も相対位置は自由である。動きについての知識は不要である。この提案手法は閉形式の解を持ち,さらに最尤法に基づいてこれを詳細化できる。コンピュータシミュレーション、および、実データによって、提案手法を試験した結果、非常に良い結果が得られた。古典的な矩形平面の被写体を利用する方法に比べ,提案手法は簡単で柔軟性がある。これによって3Dコンピュータビジョンはもう1段、実験室から実世界への利用へと進展するであろう。これに対応するソフトウエアは著者のウェブページから入手可能である。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


画像識別と検索における最近接特徴線法の効率評価
Performance Evaluation of the Nearest Feature Line Method in Image Classification and Retrieval

Stan Z. Li, Kap Luk Chan, Changiiang Wang

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 11, pp.1335-1339, November 2000

Keywords: image classification, image retrieval, nearest feature line (NFL), nearest-neighbor (NN) search, similarity metrics

最近接特徴線法という新しい方法を使って画像識別と検索に利用できるが、多くの実験によって従来法と本手法の比較し、その効率を評価した。本手法は多数のクラスを代表する複数のプロトタイプの知識を有効に利用していることが示される。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


「モーメント法によるノイズの多い画像へのロバストな直線フィッティング」についてのコメント
Comments on: "Robust Line Fitting in a Noisy Image by the Method of Moments"

N. Kiryati, A.M. Bruckstein, H. Mizrahi

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 11, pp.1340-1341, November 2000

Keywords: Line fitting, outliers, Hough transform

Qjidaa とRadouaneは、最近、ロバストな直線フィッティング法を提案し、我々の方法を含む他の方法と実験的に比較した。彼らによる我々のアルゴリズムの適用結果は正しくない。QjidaaとRadouaneが使ったデータに我々のデータを適用した結果、我々のアルゴリズムの頑健性と精度が実証された。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


IEEE Transactions on Pattern Analysis and Machine Intelligence (IEEE) Vol.22, No.12


技術黎明期の年末に当たり、内容に基づく画像検索のレビュー
Content-Based Image Retrieval at the End of the Early Years

Arnold W.M. Smeuiders, Marcel Worring, Simone Santini, Amarnath Gupta, Ramesh Jain

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 12, pp.1349-1380, December 2000

Keywords: Review, content based, retrieval, semantic gap, sensory gap, narrow domain, broad domain,.weak segmentation, accumulative features, salient features, signs, structural features, similarity, semantic interpretation, query space, display space, interactive session, indexing, architecture, evaluation, image databases

本論文は、内容に基づく画像検索に関する200件の参照文献についてのレビューである。最初に、内容に基づく検索の作動環境の議論から開始している:利用するパターン、絵のタイプ、意味の役割、検出ギャップなどはどうであるか? 次の節では画像検索システムの演算について議論している。このレビューの第1ステップは、色、テクスチャーおよび局所形状によってソートされた検索のための画像処理である。次に、検索のための特徴量が論じられており、これらは全体的累積特徴、顕著なポイント、オブジェクトと形状を表す特徴量、符号、および、これらの構造的組み合わせによってソートされている。絵の類似性や、画像中のオブジェクトの類似性は、各特特徴量のタイプ別にレビューされているが、これはシステムのユーザーが対話によって与えることができるフィードバックの種類と手段に関連付けられている。データベース、システムアーキテクチャ、および評価についてのシステムエンジニアリング面について簡単に述べる。結論部ではこれについての我々の見解を示す:本応用分野の牽引力、コンピュータビジョンの遺産、コンピュータビジョンへの影響、類似性と相互作用の役割、データベースの必要性、評価上の問題点、意味上のギャップについて、など。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


不確実性の伝搬と、特徴量グループ化としての交差点マッチング
Uncertainty Propagation and the Matching of Junctions as Feature Groupings

Xinquan Sheri, Phil Palmer

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 12, pp.1381-1395, December 2000

Keywords: Feature tracking, junction, uncertainty propagation, junction matching, junction topology, topological matching, epipolar Geometry

系列画像(動画)から3次元世界を理解するためには情景中の鍵となる特徴量の同定と対応が必須である。本論文では、情景中のオブジェクトに関する特徴量のグルーピングのロバストなマッチングアルゴリズムについて述べる。ここでは、特徴検出段階での不確実性を、グルーピング段階を通して伝搬させ、マッチング段階での不確実性の尺度として提供することを考える。対象を室内の情景とし、一点で交差する多数の直線群の交差点マッチングに着目する。交差点検出に於ける不確実性のモデルについて述べ、エピポーラ制約下での交差点不確実性が決定される。交差点対応は、交差点を形成する各線分のマッチングによって行う。マッチングの尤度は、まず検出不確実性が、交差点のトポロジー情報と組合せられ、類似度が定義され、それから導かれる。ロバストなマッチングアルゴリズムをここに提案し、対になった画像からの交差点抽出に利用した。これを実画像に適用した結果、このマッチングアルゴリズムは、動きから構造を抽出するような応用にも耐えられる、十分信頼性のある結果を示した。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


スケール・空間フィルタリングによるクラスタリング
Clustering by Scale-Space Filtering

Yee Leung, Jiang-She Zhang, Zong-Ben Xu

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 12, pp.1396-1410, December 2000

Keywords: Hierarchical clustering, scale space theory, cluster validity

パターン認識や画像処理とか、クラスター解析の主要な応用分野において、人間の視覚はオブジェクトをまとめ、重要な構造を効率的・効果的に見つける方法において、特異な才能を持っているらしい。従って視覚系をシミュレートするクラスタリングアルゴリズムは、この研究領域の基本的問題を解くことができる可能性がある。この視点から、スケール・空間理論に基づく網膜側方結合のボケ効果をモデル化する方法によって新規なデータクラスタリング法を提案する。本手法では、データ集合は光源を基準点に置いた画像とみなす。この画像をボケさせるとき、小さな光の塊は大きなものに併合され、最低の解像度レベルにおいて最後は1つの塊になる。各塊をクラスターとして同定することで、このボケ処理のプロセスは、階層的なクラスタリングの族を形成する。この手法の特長は, 1)アルゴリズムが計算上安定であり、初期値に鋭敏でなく、全体的最適化問題のような困難な計算が不要なことである。2)クラスターが正しいかどうかのチェック機構を持ち、データ中のノイズやスケール変化に対する充分なロバスト性を持っている。3)超楕円による分割が仮定されてない場合はもっとロバスト性が上がる。4)クラスタリングにおいて、例外点が存在する場合にも構造や統一を保つのに有効である。5)クラスタリング結果は、人間が視察で行ったものに極めて近い。6)この新手法によって、最近多くの異なる分野で導かれたスケールが関与するクラスタリングアルゴリズムのための統一的枠組みができる。その分野とは、評価理論、自己組織化特長マップについての再帰的信号処理、情報理論と統計力学、動径基底関数型ニューラルネットワークといった分野である。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


研磨用粉体粒子を特徴付ける、形体分類のための2次元ラドン変換
Use of the Two-Dimensional Radon Transform to Generate a Taxonomy of Shape for the Characterization of Abrasive Powder Particles

Violet F. Leavers

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 12, pp.1411-1423, December 2000

Keywords: Face recognition, facial expression information extraction, facial action encoding, facial expression emotional classification

研磨用粉体粒子の形状・角張り状態を表す特徴的なパタメータを抽出する、新規な画像処理手法を提案する。画像データを直接解析することはしない。角張り状態と形状表現情報は2値化画像のエッジ画像をパラメータ変換することによって抽出された。この変換処理には、1対多、すなわち、各画像点は変換空間においてすべての可能な曲線を生成するラドン変換が使われたが、結果として得られる分布はこれら多数の証拠の累積として表せる。一旦画像データがセグメント化さえすれば、これは、オペレータの関与なしに調査対象の粒子の角張り形状を広範囲に数値的に表現する潜在力を持つことになる。こうして得られたパラメータは、検査対象形状のカテゴリー化の有用度に応じて分類に供される。この手法の新規な点は、コーナーや頂点の解析的定義を与え、凸外皮に一致する突出だけを自動的に選択するという機能の観点である。従って、研磨剤の処理に役立つに違いない。この手法の利点と欠点について、実画像データを使って示し、考察した。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


顔の表情の自動解析:最新技術について
Automatic Analysis of Facial Expressions: The State of the Art

Maja Pantic, Leon J.M. Rothkrantz

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 12, pp.1424-1445, December 2000

Keywords: Face detection, facial expressio n information extraction, facial action encoding, facial expression emotional classification

人間は情景中に存在する顔や表情を検出し、理解するのにほとんど、あるいは、全く努力を要しない。しかし、自動的にこれを行うシステムを開発することは未だに困難な課題である。これにはいくつかの関連する課題がある:顔画像セグメントの検出、顔表情の抽出、表情の識別(即ち、感情の識別)。人間と機械の間で人間がする様に、これらの演算を正確に実時間で行うシステムを作るには大きなギャップがある。本論文はこれら課題を解くための過去の研究を調査したものである。これらの課題に対する人間の視覚系の能力についても論じられている。これは、表情を自動的に解析する機械を開発するための最終ゴールと、それに向かってのガイドとなる勧告を提供することを目的としている。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


剛体的動きからのステレオキャリブレーション
Stereo Calibration from Rigid Motions

Radu Horaud, Gabriella Csurka, David Demirdijian

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 12, pp.1446-1452, December 2000

Keywords: camera calibration, projective reconstruction, metric reconstruction, rigid motion, stereo vision, epipolar geometry

本論文では、一般的な、あるいは平面的動きから、対となったステレオカメラのキャリブレーション方法について述べる。この手法は3D投影表現を、動きパラメータとか3Dレイアウトとかの事前知識無しに、アフィン表現やユークリッド表現の上位表現することが1つの目的である。我々は無限遠平面への投影表現とその代数的性質と、1対のカメラを剛体と見なし、カメラ固有パラメータについて調べた。すべての演算は標準的な線形解法を利用して実施した。誤差解析によって、キャリブレーション各ステップの相対的重要性が明かになった:投影からアフィンへの変換、アフィンから距離へのアップグレード。この手法を広範囲の更正済みデータや、自然データに適用実験した結果、誤差を解析することができ、シミュレーションデータによって感度も調べられた。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


人の3次元的動きをモデルに基づいて予測
Model-Based Estimation of 3D Human Motion

Ioannis Kakadiaris, Dimitris Metaxas

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 12, pp.1453-1459, December 2000

Keywords: Motion estimation, human motion estimation, deformaisle models, model-based tracking, physics-based modeling

本論文は複数のカメラを使った、人の動きについて、我々が開発したモデルに基づく3次元動き予測法の定式化と手法について紹介する。この手法は被写体のシルエットを時空間における解析に基づいており、その利点の1つは、被写体はマーカーや、他の機器を装着した服を着る必要がない。隠蔽が大きいとき、人の複雑な動きを復元する追跡実験結果を示す。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


情景モデル化のための制約下でのセンサー計画
Constraint-Based Sensor Planning for Scene Modeling

Michael K. Reed, K. Allen

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 12, pp.1460-1467, December 2000

Keywords: 3D scene reconstruction, model acquisition, sensor planning, active vision

我々は2種類の要素が交互に作用するような自動的情景モデル化システムについて述べる:距離画像装置からソリッドなモデルを逐次形成するモデラーと、出来たモデルを解析し次のセンサー位置を計算するセンサー計画器の2つである。この計画要素は目標牽引型であり、画像表面と未探索空間に関するモデルを利用して、次のセンサー位置を計算する。この手法は形状に依存せず、検知データの精度を保持する連続空間表現を利用する。センサー位置の探索を何度も繰り返すことにより、未探索情景の隣接領域の可視体積を決定するために部分モデルを利用して、完全な情景を得ることが可能である。この可視体積部は、隠蔽の生じないセンサー設置条件の制約と組み合わせることができ、モデル品質の改善が保証される。複数の独立した、隠蔽の大きな情景の処理結果を示す。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ファジーな方位のクラスタリング解析のための妥当性尺度
Validity Measures for the Fuzzy Cluster Analysis of Orientations

Reginald E. Hammah, John H. Curran

IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 22, No. 12, pp.1467-1472, December 2000

Keywords: Fuzzy cluster analysis, cluster analysis, cluster validity index, cluster performance measure, cluster validity indices, cluster performance measures, discontinuities, orientations, spherical data, directional data

ファジーk-meansクラスタリング法は、適当なアルゴリズムに適応化させた後には、不連続集合の自動的同定に応用可能である。データ集合中のクラスター数を決定するために、Gath and Geva, Xie-Beni および Fukuyama-Sugenoたちによる妥当性尺度を変形・改良した尺度を、本論文で紹介する。

Ej

Copyright (c) 2000 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


[インデックス] [前の年] [次の年]