[前の年]

Computer Vision and Image Understanding (Academic Press) Vol.73, No.1

多次元パラメータ空間で非解析的な対象物を抽出する遺伝的アルゴリズム
Genetic Algorithm for the Extraction of Nonanalytic Objects from Multiple Dimensional Parameter Space

P. K. Ser, Clifford S. T. Choy, and W. C. Siu

Computer Vision and Image Understanding Vol. 73, No. 1, January, pp.1-13, 1999

遺伝的探索アルゴリズムを使用した、ハフ変換の新しいアプローチが提案され る。この方法を使うことによって、ハフ空間のために膨大なメモリが必要にな るというハフ変換の主要な問題点が解決できる。この遺伝的ハフ変換の技術の アイデアは解析的なパターンにも非解析的なパターンにも適応可能である。 4次元の一般化ハフ変換のパラメータ空間におけるピーク形状の解析に基づい て、対象物があるかどうかを統計的な重みで表現する適合関数が得られる。パ ラメータ空間でピークを抽出するために遺伝的アプローチを使用することによっ て、4次元ハフパラメータの物理的なメモリ容量が検出の処理の間には必要と ならない。一方、検出されたパラメータの精度は意味のある向上がはかられる。

M.T.

Copyright(c) 1999 Academic Press, Inc.


ロバストなファジークラスタリングに基づいたロバストかつ高精度な3次元の 登録方法
A Coarse to Fine 3D Registration Method Based on Robust Fuzzy Clustering

Jean-Philippe Tarel

Computer Vision and Image Understanding Vol. 73, No. 1, January, pp.14-28, 1999

コンピュータビジョンにおける重要な問題の1つは、画像から抽出された特徴 を保持しているモデルにどのように結び付けるかを決定することである。本論 文では、登録の問題、すなわち一部あるいは全体でいくつかの3次元データセッ ト間のユークリッド変換パラメータを得ることに焦点を当てる。この問題の難 しさは、周辺のデータに対してはロバストで、かつ同時に高精度な方法を得る ことにある。我々はファジークラスタリング手法に基づいたロバストな3次元 の位置決め、フィッティングを行なう一般的な方法を提案する。ファジー的な アプローチは不確実な環境下では実用上効果があることが知られている。登録 の問題における本アプローチの有効性を示すために、生成されたデータと実際 の3次元データの両方に対する結果を示す。

M.T.

Copyright(c) 1999 Academic Press, Inc.


画像モーメントからのグループ変換の抽出
Extracting Group Transformations from Image Moments

Jun Sato and Roberto Cipolla

Computer Vision and Image Understanding Vol. 73, No. 1, January, pp.29-42, 1999

観測者とシーンの間の相対的な動きによって誘発された画像の歪みは、シーン の動きと構造を回復するための重要なキーとなる。画像中の歪みはユークリッ ド変換やアフィン変換のような変換グループと射影グループによって表現され ることが知られている。本論文では、画像の曲線のモーメントがどのようにグ ループ変換によって変化するかを調べ、画像モーメントにおける変化と変換グ ループの不変ベクトルフィールドとの間の関係を得た。その結果は、画像中の 曲線の断片の方向モーメントの変化からアフィン変換の不変ベクトルフィール ドを抽出するための方法を正当なものとするために使われる。この方法は実時 間のロボット視覚ナビゲーションに応用される。

M.T.

Copyright(c) 1999 Academic Press, Inc.


複雑な物体の曲面近似とセグメンテーションの同時処理
Simultaneous Surface Approximation and Segmentation of Complex Objects

Chia-Wei Liao and Gerard Medioni

Computer Vision and Image Understanding Vol. 73, No. 1, January, pp.43-63, 1999

変形モデルは収集されたデータ点から物体を近似する有効なアプローチである。 主として単純な物体やトポロジーが知られた物体を扱うのにデザインされた基 本的なアプローチを拡大する方法を提案する。 我々のアプローチは、(1)余剰データ点(2)近似する表面でフィッティングしな い部分(3)適当なブール代数の演算を使用してトポロジー的に複雑な多くの物 体を近似するために1つ以上の曲線や曲面を同時にフィッティングできる。2 次元ではB-snakesがおのおのの物体(パターン)を近似するために使われる。 3次元では要素の検出に基づいた解析的な曲面の表現が提案される。3次元物 体の全体的な表現は要素とその連結性の表現においてB-スプラインとベジェ曲 面の形式を取る。ベジェ曲面は異る要素を連結するために使われ、連結された 曲面自体はエネルギー最小のもとで近隣のデータポイントに従う。この方法に よりG連続曲面は根本的な3次元物体として処理される。 2次元と3次元の合成されたデータと実際のデータでの実験結果を示す。これ らの実験では貫通する穴を持つ多くの複雑なパターンと物体が切り出される。 このシステムは人間による操作や対象物体のトポロジーに対する事前知識なし で自動的に動作する。

M.T.

Copyright(c) 1999 Academic Press, Inc.


単一のビデオ画像を使用した3次元空間での特徴ベースの物体認識と位置決め
Feature-Based Object Recognition and Localization in 3D-Space, Using a Single Video Image

G. Hausler and D. Ritter

Computer Vision and Image Understanding Vol. 73, No. 1, January, pp.64-81, 1999

単一の2次元ビデオ画像から3次元空間で物体を認識し、すべての6自由度で 物体を位置決めするロバストなアルゴリズムを紹介する。入力画像でおのおの 点での特徴が使われ、付け加えられたエッジ情報がグルーピングに提供される。 初期段階では認識対象となるすべての物体の3次元モデルが特徴によって表現 されコンピュータの中に保持されている。2次元の入力されたシーンで検出さ れた特徴量の場所と3次元のコンピュータモデルの特徴量を組み合わせること で、おのおのの特徴は決定されるべき場所のパラメータの可能な範囲を持つこ とになる。対応する軌道の交差点がハフテーブル上で可能な解決点として計算 される。解決の可能性の空間の中で最も高いピークの場所が、例え部分的に隠 れた部分がある物体でも、求められている回転と移動のパラメータを示す。十 分に解析的なアルゴリズムは透視投影カメラモデルと同じ位にweak perspective(orthographic and scale)カメラモデルに適合する。距離画像へ の応用は要求された3次元の参照物体の自動的な特徴モデリングを必要とする。

M.T.

Copyright(c) 1999 Academic Press, Inc.


人間の動きの視覚的解析:サーベイ
The Visual Analysis of Human Movement: A Survey

D. M. Gavrila

Computer Vision and Image Understanding Vol. 73, No. 1, January, pp.82-98, 1999

ビジョンによって人間とその行動を認識する能力は、機械が人間の居住環境で 賢くそして何の努力もなく対話するためにキーとなる。多くの本質的に大切な アプリケーションのために、「人間を見る」ことは現在、コンピュータビジョ ンにおける最も活動的な分野の1つとなっている。このサーベイでは多くの有 望なアプリケーションを示し、この分野の最近の開発状況の概要を述べる。こ のサーベイの範囲は全身または手の動きを扱うものに限定されており、人の顔 に関するものは含まれていない。重点を様々な方法についての議論に置いてい る。ここで扱う方法は、明示的な形状モデルを使用する、あるいは使用しない 2次元のアプローチと3次元のアプローチにグルーピングされている。また、 適当にシステムがレビューされている。将来の方向性についていくつかの考え を述べ結論づけている。

M.T.

Copyright(c) 1999 Academic Press, Inc.


2値画像に対する連結されたモーフォロジー演算子
Connected Morphological Operators for Binary Images

Henk J. A. M. Heijmans

Computer Vision and Image Understanding Vol. 73, No. 1, January, pp.99-120, 1999

本論文は2値画像に対する連結されたモーフォロジー演算子に関して包括的な 議論を行なう。与えられた空間での連結性を導入し、どの画像も前景と背景の 要素に分割される。連結された演算子は入力画像に対してこの分割を粗く行な うものである。連結された演算子は次に述べるローカルな性質を持つならば grain演算子と呼ばれる。その性質は、任意の点xでの出力画像の値がxを含む 入力画像の部分ゾーンによって排他的に決定されるというものである。どの grain演算子も2つのgrain基準、1つは前景、もう1つは背景の要素に対する ものでユニークに決められる。良く知られた基準は与えられたしきい値より下 回っていないゾーンの領域を要求する領域の基準である。本論文の2番目の部 分は連結されたフィルターとgrainフィルターについて述べる。grainオープニ ングとクロージングから得られる選択的な連続フィルターは強いフィルターで 強く吸収する性質であることを示す。この2つの性質は古典的な不連結の場合 には保持できないものである。

M.T.

Copyright(c) 1999 Academic Press, Inc.


特徴生成モデルを用いた構造的形状インデクシング
Structural Shape Indexing with Feature Generation Models

Hirobumi Nishida

Computer Vision and Image Understanding Vol. 73, No. 1, January, pp.121-136, 1999

構造的インデクシングは,大量のモデルを用いた画像パターンの効率的分類と検索 のための有望な方法である.この方法の基本的アイディアは,モデル集合について 用意された大規模データ構造上に,モデル識別子が付随した特徴を分散配置し,抽 出された特徴を参照してモデルに投票を行うことによって分類するというものであ る.画像特徴を離散的なインデックスに変換することによって生じる本質的な問題 は,インデクシングがノイズ,観測スケール,局所的変形に敏感になることと,大 量の学習データがないときには,各クラスに対して,変形パターンの特徴分布につ いての先験的知識が利用できないことである.これらの問題に対応するために,構 造的インデクシングに,形状特徴生成手法を採り入れる.ある種類の変形について ,特徴変換の解析を行い,少数の異なる場合から成る特徴生成規則を導く.その規 則を用いて,ノイズや局所的変形によって生じる変形パターンから抽出され得る特 徴を生成する.モデルデータベース構築と分類の両方の過程において,輪郭から実 際に抽出された特徴とともに,変換規則による生成特徴を,構造的インデクシング と投票に用いる.大量のサンプルデータを用いた実験により,提案する方法の有効 性を示す.さらに,画像データベースからの形状検索への応用を述べる.形状特徴 生成により,分類精度と効率が大きく向上する.

HN

Copyright(c) 1999 Academic Press, Inc.


ラインの応答からの姿勢の反復計算
Iterative Pose Computation from Line Correspondences

Stephane Christy and Radu Horaud

Computer Vision and Image Understanding Vol. 73, No. 1, January, pp.137-144, 1999

本論文は、ラインの応答から既知の3次元物体に関してカメラの位置と方向を 推定する方法を述べる。この方法の主なアイデアは、weak perspectiveある いはparaperspectiveカメラモデルのどちらでも姿勢を推定し、反復によっ てこの姿勢の精度を向上させることにある。収束時の結果はperspectiveカメ ラモデルと同等である。この線形(アフィン)カメラモデルの反復による精度 向上は既に点には使われているがラインには拡張されていない。ラインの応答 から姿勢を計算する良く知られた方法では、閉ざされた形式や最小化のテクニッ クを使用して解決する非線形方程式のセットを扱う。これらの方法は多くの解 決方法を扱わなければならない。それに対して我々の方法は本来の解決方法に 大変近い方法で開始し、反復もさほど多くなく収束する(典型的には3〜5回 の繰り返し)。それぞれの反復で解決される線形システムの解析はアルゴリズ ムを覆す幾何学的形状を特徴づけることができる。

M.T.

Copyright(c) 1999 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.73, No.2

3D物体探知のためのセンサー計画
Sensor Planning for 3D Object Search

Yiming Ye

Computer Vision and Image Understanding, Vol.73, No.2, Feb. pp.145-168,1999

本論文は、物体探知のためのセンサー計画について体系的な研究を行う。 物体の場所に関する探知エージェントの知識は、離散確率密度として符号化され、 探知行動がある度に更新される。 エージェントの探知行動は、視点、観察方向、視野、および認識アルゴリズムの応 用で定義される。 センサー計画は、最小コストでターゲットを探知する確率を最大化することを目 標とする最適化問題として定式化される。 この問題はNP完全であることが証明され、そのために発見的戦略が望まれる。 この理論的枠組みを、現実の稼働システムに当てはめるため、パン(pan)や チルト(tilt)やズーム(zoom)ができるカメラを装備したロボットのセンサー 計画戦略を提案する。 探知行動を、処理時間に関して効率的に決定するために、カメラ位置固定の膨大 な可能な行動空間を分解し、考慮されるべき行動の有限集合とする。 次の行動は、方向尤度と各行動のコストとの比較により、上述の行動有限集合 から選択される。 そして、探知は現在位置でありそうにないと、ロボットはターゲット探知の確率を最 大 にするように別の場所に移動する。

LXP

Copyright(c) 1999 Academic Press, Inc.


自律的ナビゲーションタスクのための新しい能動的ビジョンに基づくスレトキュー
Novel Active Vision-Based Threate Cue for Autonomous Navigation Tasks

Sridhar R. Kundur

Computer Vision and Image Understanding, Vol.73, No.2, Feb. pp.169-182,1999

本論文は、視覚的スレトキュー(Visual Threat Cue, VTC)と呼ばれる、 ビジョンベースの行動キューを論ずる。これは、衝突回避と間隔維持 のような自律的ナビゲーションのタスクに適している。 VTCは、時間に基づくスカラー・パラメータであり、3D表面と移動する観察者 との間の範囲および間隔の相対的変化の測度を与える。 これは観察者の周囲の3D環境から独立であり、事前知識が不要である。 3Dテクスチャー表面の画像系列からVTCを抽出する実用的な方法もまた、 示される。 これは、画像品質測度(Image Quality Measure)と呼ばれる大局的な画像相 違度の抽出に基づくものであり、濃淡画像の生データから直接的に抽出される。 測定されたIQMの相対的な変化に基づいて、VTCが抽出される。 いくつかの実験結果を提示する。

LXP

Copyright(c) 1999 Academic Press, Inc.


走査線近似に基づく距離画像中のエッジ検出
Edge Detection in Range Image Based on Scan Line Approximation

Xiaoyi Jian and Horst Bunke

Computer Vision and Image Understanding, Vol.73, No.2, Feb. pp.183-199,1999

本論文では、走査線近似技法に基づいて、距離画像のエッジを検出する アルゴリズムを提案する。 文献にある既知の方法に比べ、我々のアルゴリズムは多くの利点がある。 このアルゴリズムが与えるエッジ強度は、そのまま幾何学的に解釈で きるものであり、エッジポイントの更なるサブタイプ分類を支援する。 最適なエッジ検出器を定義した後、我々のアルゴリズムとこの理論モデルとを 比較する。 特性がまったく異なる四台の距離スキャナーで得られた実距離画 像を使って、大量の実験を行った。 簡単な輪郭閉包技法を用いることで、我々のエッジ検出方法が、 距離画像から領域へのセグメンテーションを完全にできることを示す。 このエッジ・ベースのセグメンテーションアプローチは、 切り出し品質と計算効率の両方において、 多くの領域ベースの方法より優れていることがわかる。 これらの良い結果は、我々のエッジ検出アルゴリズムが実用に役立つことを 示した。

LXP

Copyright(c) 1999 Academic Press, Inc.


2Dと3Dデータの統合による3D物体識別のための制約充足的アプローチ
A Constrain-Satisfaction Approach for 3-D Object Recognition by Integrating 2-D and 3-D data

Michael Boshra and Hong Zhang

Computer Vision and Image Understanding, Vol.73, No.2, Feb. pp.200-214,1999

本論文は、2Dと3Dのセンサー・データを統合して、 3D物体を認識する枠組みを提案する。 本研究の要旨は、認識処理の計算量を減らすために、認識の初期段階において、 2Dと3Dのすべての関連データを有効に利用することにある。 この目標を達成するため、我々はこの問題を制約充足問題 (constraint-satisfaction problem, CSP)として定式化する。 指数的複雑さをもつCSPを直接的に解く代わりに、低次の多項式時間の 複雑さを局所的な整合条件に課すのみである。 この局所整合性のステップにより、後段の認識モジュールの計算量が 大幅に軽減されるのだが、その理由は以下のとおりである。

(1) シーンとモデル特徴との間の対応付けの不確実性が大幅に減少する。

(2) 誤ったモデル物体と、重要でないシーン特徴とが除かれる。

2Dと3Dのシーン特徴の結合に対応するCSPを、効率的に構築する新しい方法 を提示する。 視覚的(2D)データと触覚的(3D)データとを使った模擬および実実験により、 提案された枠組みの性能を示す。

LXP

Copyright(c) 1999 Academic Press, Inc.


2次元と3次元における最適姿勢推定
Optimal Pose Estimation in Two and Three Dimensions

S. H. Joseph

Computer Vision and Image Understanding, Vol.73, No.2, Feb. pp.215-231,1999

本論文は、姿勢推定問題、特に線形/非線形の方法を異方性誤差分布に応用する 問題に関するものである。 増分的な手法とバッチ的な手法が論じられ、ノイズモデルを参照して、二次元的問題 を線形的に解決する方法が開発される。 この場合、正規方程式の操作が、いずれに手法に対しても、柔軟で 透過的な枠組みを提供しうることがわかる。 この枠組みは、3D画像問題に対するバッチ反復的な解法をサポートするのに 用いられ、安定性の範囲、反復回数、毎回の反復計算をおよそ2倍に改善する方法が 開発される。 3次元の合成データを用いたバッチ手法の実験結果を報告し、カルマンフィル ターに基づく増分的手法と比較する。 増分的手法は、意義深いことに準最適な結果をもたらし安定性に限界がある ということがわかる。 実用的には、新しいバッチ手法の計算効率は増分法のそれよりも優れている ことがわかる。 この手法は、3Dデータの2D画像に対して、単一およびステレオ投影の形式で 拡張される。 合成画像データと実画像データとを用いた実験が示すところによると、 重みを(均質でなく)不均質に適宜選択すると、垂直誤差測定よりも、高い 精度とロバスト性がもたらされるということである。 また、再構成あり/なしのステレオ推定について調べる。

LXP

Copyright(c) 1999 Academic Press, Inc.


活動のパラメータ化されたモデリングと認識
Parameterized Modeling and Recognition of Activities

Yaser Yacoob and Michael J. Black

Computer Vision and Image Understanding, Vol.73, No.2, Feb. pp.232-247,1999

本論文では、人間の活動(微小活動)の一つのクラスを考察する。 この活動は、有限一時ウィンドウ(歩行サイクル中の身体各部の運動など) において観測される測度の集合として表現され、その実行時の変動空間は 相対的に小さいものとする。 主成分分析と解析的大局変換の手法を用いた、微小行動のモデリング および認識への新しいアプローチを提案する。 互いに類似し、しかも類似する身体部動作を含むような活動の実例 に対して、その集合のモデル化は、主成分分析を用いる表現をパラ メータ化することで成し遂げられる。 モデル化された活動の変化形の認識は、起こり得る許容パラメータ変換の 空間を探索することでなされる。 この定式化により、 観測された活動が属するクラスの認識と、そのクラスのモデルと活動を 関連づける変換パラメータとが、反復的に改善される。 画像の運動パラメータから得られる、関節化され変形可能な人間の運動 を認識するいくつかの実験について報告する。

LXP

Copyright(c) 1999 Academic Press, Inc.


多重スケールアプローチによる簡易ネット(Thin Nets)の抽出
Thin Nets Extraction Using a Multi-scale Approach

N. Armande, P. Montesions, O. Monga and Guy Vaysseix

Computer Vision and Image Understanding, Vol.73, No.2, Feb. pp.248-257,1999

簡易ネット(Thin nets)とは、与えられた方向に濃淡レベル関数が極値をとる線の ことである。 最近、我々は画像表面の色々な性質を用いて、簡易ネットを特徴付けること が可能であることを示した。 しかし、異なる幅を有する構造においては、この方法はうまくいかない。 本論文は、異なる幅をもつ thin nets の抽出過程では、画像に関する多重スケ ール解析が要求されることを示す。 多重スケール情報の融合過程を設計するために、スケール空間において、 画像表面の様々な微分的性質(特に曲率)を研究する。 衛星および医療画像から、異なる幅を有する道路と血管を抽出することで、提案さ れた多重スケールアプローチの有効性を示す。

LXP

Copyright(c) 1999 Academic Press, Inc.


校正カメラのための単眼画像系列からのロバストな動き推定
Robust Motion Estimation for Calibrated Cameras from Monocular Image Sequeces

Robert Wangner, Feiyu Liu, and Klaus Donner

Computer Vision and Image Understanding, Vol.73, No.2, Feb. pp.258-268,1999

単眼画像系列から得られた点対応の集合から、カメラの自己動作を推定する新しい 計算的なアプローチを提案する。 その基礎となる理論は、モデルパラメータの完全集合を、個別に最適化 される適切な部分集合に分解することに基づいている。 たとえば、カメラ校正に関するすべての固定パラメータは、前もって調整 される(校正ありの場合)。 本論文の最初の部分では、その数学モデル(円錐誤差モデルと呼ばれる)につ いて述べる。 既存手法とは対照的に、この円錐誤差モデルを用いると、 3D対象点に関連して画像を対応付けることが、実行可 能か否か(カメラの前にあるか後ろにあるか)を区別することができる。 この「半遠近法」の観点に基づいて、バランスのよい目的関数が導出され、 これによって、ミスマッチ(誤照合)と明確な相対的動きとが適切に検出 されるようになる。 本論分の第二の部分では、自然画像系列を取り上げたテストの結果を 提示し、解析する。 実験結果が明らかに示すのは、この新しいアプローチの数値安定性が、 比較可能な方法、すなわち「全遠近的」モデリングと関連エピポー ラ幾何に基づく方法よりも、優れているということである。 したがって、結果として得られる自己動作推定の精度は、優れたものである ことがわかる。このことは、さらなる時間フィルタリングなしに、である。

LXP

Copyright(c) 1999 Academic Press, Inc.


合成パノラマ画像における誤差の特徴付け
Characterization of Errors in Compositing Panoramic Images

Sing Bing Kong

Computer Vision and Image Understanding, Vol.73, No.2, Feb. pp.269-280,1999

パノラマ画像は、水平360度の視野を持ち、観測者がシーンに取り込まれる かのような感銘を与えることができる。 パノラマ画像の生成は、まずカメラを垂直軸で回転しながら一連の画像を撮る ことから始まる。 次に、これらの画像を縫い目なく合成する前に、円筒形の表面に投影する。 円筒形パノラマの横断面の円周は、合成長と呼ばれる。 本研究は、いくつかの固有パラメータの誤差によって引き起こされる、合成 パノラマ画像中の誤差を、特徴づけるものである。 ここで考えられた固有のカメラ・パラメータとは、カメラの焦点距離と 放射歪み係数とである。 合成長の誤差は、カメラ焦点距離の誤差に比べて、より敏感であることを示す。 特に重要なのは、合成長の相対的誤差が、焦点距離の相対誤差よりも、常に 小さいことを発見したことである。 これが意味するのは、新しくてより正確な焦点距離を計算するために、 合成長を反復的に用いることで、焦点距離の誤差が修正されうるとい うことである。 カメラ校正に対するこの合成アプローチの利点は、特徴検出および分離 された事前校正のいずれも不要なことである。

LXP

Copyright(c) 1999 Academic Press, Inc.


制約付き局所ヒストグラム均等化による画像コントラスト強調
Image Contrast Enhancement by Constrained Local Histogram Equalization

Hui Zhu, Francis H. Y. Chan, and F.K. Lam

Computer Vision and Image Understanding, Vol.73, No.2, Feb. pp.281-290,1999

ヒストグラム均等化は、画像のコントラスト強調に広く使われている。 大局的ヒストグラム均等化が全画像のコントラストを強調するのに対し、 局所ヒストグラム均等化は、原画像の異なる場所にある同一濃淡値に、 異なる変換を施すことによって、多くの画像細部を強調することができる。 しかしながら、この局所ヒストグラム均等化処理は、しばしば原画像の 外観に受け入れ難い変更を生じさせる。 本論文は、制約付き局所ヒストグラム均等化の方法を提案し、対立する二 つの要求の両立を図る。対立する要求とは、画像細部の強調と、画像全体 の外観の維持とである。 我々の方法は、制約条件を均等化処理に導入できるようにするため、ヒスト グラム均等化を様々な形式で用いる。 この制約条件は、局所濃淡値変換が空間ドメインで連続的に変化することを 強制するものである。

Experimental results of different kinds of images show the effect of our method. 色々な画像を使った実験結果で、この方法の効果を示す。

LXP

Copyright(c) 1999 Academic Press, Inc.


コーナー性質の測定
Measuring Corner Properties

Paul L. Rosin

Computer Vision and Image Understanding, Vol.73, No.2, Feb. pp.291-307,1999

本論文は、濃淡レベルのコーナーに関する以下の性質を測定する方法 について述べる。すなわち、対角、方向性、コントラスト、鈍さ(頂 点での丸み)、(先端の)境界曲率などの性質についてである。 これらの性質を抽出する方法として、すでに公表されたものがあるが、 これらと異なるのは、新しい方法が、比較的簡単で、効率的で、ロバ ストだということである。 新しい方法では、 標準的なオペレータによって予め検出されているコーナーに依拠するので、 測定問題がより取り扱いやすくなる。 13000の合成画像を使って、これらの方法について、ある範囲の条件 (方向性と対角を変えたコーナー、および程度の異なるノイズ)で評価した。

LXP

Copyright(c) 1999 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.73, No.3

ランダムサンプリングと投票プロセス基づいた動画像解析
Motion Analysis by Random Sampling and Voting Process

Atsushi Imiya, Iris Fermin

Computer Vision and Image Understanding, v 73, n 3, March, 1999, p309-328

コンピュータビジョンにおいて、動画像解析は基礎的な課題である。 ノイズの多いデータ中から、 一部を隠蔽された物体を認識するために用いられている手法として、 計算機上の幾何と幾何学的ハッシング法に対して、 合同の検出の概念を適用する手法がある。 この手法を動画像解析に適用することで、 完全に測定可能な剛体と部分的に隠蔽されている剛体の両方について、 2次元あるいは3次元ユークリッド空間における動作変数を推定する、 新しいランダムサンプリングの手法を提案する。 まず、それぞれの画像フレームにおける、 2あるいは3次元空間上での物体の頂点の位置は、 レンジセンサーやステレオ技術等の適当な手法を用いることで決定できると仮定した。 その上で、量子化誤差とランダムサンプリングによる動作変数の評価誤差の間の関係を解析した。 その結果、提案手法を用いることで得られる解法は 量子化の解像度が増加するにつれて真の解法に収束する事を示すことが出来た。

mNt

Copyright(c) 1999 Academic Press, Inc.


曲線検出の為の制限つきハフ変換
Constrained Hough Transforms for Curve Detection

Clark F. Olson

Computer Vision and Image Understanding, v 73, n 3, March, 1999, p329-345

ハフ変換において、 局地化による誤差を効果的に変数空間に伝搬させることで、 高速かつ高精度に曲線を検出する手法について述べる。 まず最初に形式的なハフ変換の定義を復習し、 そして、局地化による誤差を形式的に取り扱えるように ハフ変換の定義を修正した。 つぎに、現在のハフ変換手法を修正した定義の観点から解析した。 その結果、ハフ変換はその性能を低下させること無く、 多くの細かい副問題に分解出来る事が明らかになった。 その際、それぞれの副問題は、 局地化誤差の範囲内に収まる範囲で、 境界画素の部分集合を受理する曲線だけを考慮するように制限される。 この特性によって、 誤検出無しに頑強に曲線を検出する事が保証されるので、 正確かつ能率的に局地化誤差を変数空間に伝搬することが可能となる。 画像の複雑さの観点から重要な意味を持つ、 曲線の検出のみを対象とした場合、 無作為化手法を用いることで、 本手法の計算量の最大値はnを境界画素の数とした場合に O(n)にすることが出来る。 実験によって、曲線検出においては、本手法は従来手法を上回る事が示された。 また、実画像中から線分と円を検出した。

mNt

Copyright(c) 1999 Academic Press, Inc.


速度スネーク:速度空間における追跡の為の能動的輪郭
The Velocity Snake: Deformable Contour for Tracking in Spatio-Velocity Space

Natan Peterfreund

Computer Vision and Image Understanding, v 73, n 3, March, 1999, p346-356

スネークとして知られている 弾力的な能動的輪郭モデルのクラスについて、 速度制御を適用することで得られる新しい能動的輪郭モデルを用いて、 非剛体の輪郭追跡と位置予測を行った。 提案手法では、 画像の外見上の速度と輪郭の速度の差である エネルギー消散関数を最小化するように制御する。 そして、ビデオ画像を時間にそって連続的に測定されたものとして取り扱うことで、 提案する制御手法は頑強な追跡を実現する。 このことは、 画像(物体)の速度に応じて追跡誤差が生じ、 その結果、画像中のノイズに対して高感度である、 元のスネークモデルと対比的である。 また、この動画像解析から非剛体輪郭の位置予測も可能となる。 本論文では、提案する制御手法に基づいて、 バッチモード制御による評価モデルから 実時間適応制御モデルまでの様々なモデルに対して、 実時間輪郭追跡の新しいクラスを提案する。

mNt

Copyright(c) 1999 Academic Press, Inc.


ガウス誤差モデルを用いた同時の姿勢および対応点決定問題の解法
Solution of the Simultaneous Pose and Correspondence Problem Using Gaussian Error Model

Frederic Jurie

Computer Vision and Image Understanding, v 73, n 3, March, 1999, p357-373

仮定を確認していく手法は、 モデルに基づいた認識に関する文献中にしばしば現れる。 その際、仮定の確認は、姿勢に基づいて変換されたモデルの特徴のどれほどが、 画像の特徴と一致したかによって行われる。 姿勢の算出に多くのノイズを含んでいた場合、 特に物体が部分的に隠蔽されていた場合には、 測定された姿勢は不正確で、確認を行うのが困難となる。 この問題に対応するために、 画像中のノイズをガウス分布に基づいてモデル化した。 確率的な骨組みによって、マッチングを確率的に評価することが可能となり、 また、姿勢空間中で、姿勢の存在する範囲を知る事も可能となる。 ここで、姿勢の変換がアフィン変換の場合には、 2次計画法(quadratic programming)が必要となる。 マッチングの確率は、 最適な姿勢を算出するアルゴリズムにおいて用いられる。 姿勢の算出は、 姿勢空間において、探索の進行している最中に、 マッチしたデータ中からはずれ値を削除しながら、 再帰的に多解像度の探索を行うことで行われる。 本論文では、多くの2次元あるいは3次元の認識実験を示した。

mNt

Copyright(c) 1999 Academic Press, Inc.


並列処理装置における市街地距離変換の最適計算手法
Optimal Computing the Chessboard Distance Transform on Parallel Processing Systems

Yu-Hua Lee, Shi-Jinn Horng

Computer Vision and Image Understanding, v 73, n 3, March, 1999, p374-390

距離変換は、 フォアグラウンド画素の形状と位置の相互の関係に関する情報を抽出する 際に用いられる画像算出ツールである。 距離変換では、 それぞれの画素はもっとも近いフォアグラウンド画素からの距離に対応した値を持つように、 2値画像を多値画像に変換する。 この距離変換に要する計算量は、 異なる距離の計量に完全に依存している。 特に、距離変換が正確であればあるほど、計算量は多くなる。 近年では、多くの場面で数千の画像が限られた時間内に処理される。 直列計算機では実時間距離変換に関して、 そのような計算をおこなうことは不可能である。 効果的な距離変換計算を行うためには、 距離変換に関して並列処理可能なアルゴリズムを開発することが望ましい考えられる。 本論文においては、対角伝搬手法に基づいて、 NxNサイズの画像について市街地距離変換を計算する 計算量O(N2)の直列アルゴリズムをあたえる。 ここでは、距離変換は市街地距離計量を用いている。 先の直列アルゴリズムに基づいて、 NxNサイズの2次元2値画像に対して市街地距離変換を行うのに、 O(N2/logN)個のプロセッサーを用いたEREW PRAMモデルでは計算量はO(log N)である。 同様に O(N2/logN log N)個のプロセッサーを用いたCRCW PRAMモデルでは計算量はO(log log N)であり、 O(N2/logN)個のプロセッサーを用いたhypercube計算機では計算量はO(log N)である。 Lee と Horng によって提案されたマッピングに従えば、 骨格化も能率的に行うことが出来る。 NxNサイズの2次元2値画像に対して骨格化を行うのに、 O(N2/logN)個のプロセッサーを用いたEREW PRAMモデルでは計算量はO(log N)である。 同様に O(N2/logN log N)個のプロセッサーを用いたCRCW PRAMモデルでは計算量はO(log log N)であり、 O(N2/logN)個のプロセッサーを用いたhypercube計算機では計算量はO(log N)である。 ここで提案された並列アルゴリズムは前処理のセットから構成されており、 それぞれの前処理においては、加算と最小の処理のみが行われる単純なものであるので、 本アルゴリズムは非常に実用的である。

mNt

Copyright(c) 1999 Academic Press, Inc.


誘導を用いた手書き線画の会話型マッチング
Interactively Matching Hand-Drawings Using Induction

Adrian R. Pearce, Terry Caelli

Computer Vision and Image Understanding, v 73, n 3, March, 1999, p391-403

手書き記号と模式図に見いだされる、 パターンマッチングの作業の、 それぞれの要素と関連について検討した。 コンピュータビジョン特有の関心事は、 課題グラフ(problem-graph)マッチングに基づいた認識と 構文ルールに基づいた(syntactic rule-based)アプローチによる認識に対する 2つのアプローチの統合にある。 実時間でマッチングとルール発生のプロセスを親密に結合することで、 要素と関連をマッチする処理を開発し、CLARETと名付けた。 このシステムは、手書き記号と模式図を解釈する会話型装置であり、 キャンバス上に描かれた画像について、 回転や変倍、位置ずれ、突出の影響を受けない。 この手法について、 新しい記号への適応と オリエンテーション質問への応答についての能力を分析た。 また、経験的に学習機械技術(machine learning techniques)との比較を行った。

mNt

Copyright(c) 1999 Academic Press, Inc.


Chamfer距離計算によるユークリッド順序付け
Euclidean Ordering via Chamfer Distance Calculations

Stephane Marchand-Maillet, Yazid M. Sharaiha

Computer Vision and Image Understanding, v 73, n 3, March, 1999, p404-413

本論文においては、 連続/離散距離の間のマッピングについて検討する。 連続距離としてはユークリッド距離が広く用いられている。 一方、離散距離としては3x3マスクに基づいたChamfer距離が相当すると考えられる。 ここで、ユークリッド距離を離散距離で近似した場合に生じる、 位相的エラーの理論的な特徴付けを行った。 最適なChamfer距離計数は、 ユークリッド距離値の近似の観点よりも、 それが誘発する位相的な順序付けの観点から特徴づけた。 そして、Chamfer距離計数に関わり無く、 位相的に正確な距離マッピングの為に、 グローバルな上限を儲ることで、 理論的な側面からの結論を得た。 また、この上限から導かれる最小計数を確認した。 本論文では、実例と共に、 広く知られているユークリッド最短距離法問題の、 解法の骨組みを示す事によって得られた結果について、 その実用上の重要性を説明する。 この問題は離散最適化問題として数式化され、 それゆえに、アルゴリズムのグラフ理論(algorithmic graph theory)と 整数算術を用いることで解くことが出来る。

mNt

Copyright(c) 1999 Academic Press, Inc.


車線維持と3次元道路復元アプリケーションにおける 道路の透視射影の媒介変数モデル
Parametric Model of the Perspective Projection of a Road with Applications to Lane Keeping and 3D Road Reconstruction

Antonio Guiducci

Computer Vision and Image Understanding, v 73, n 3, March, 1999, p414-427

道路の3次元構造と 画像上の車線に対する車載CCDカメラの移動状態 を計算するアルゴリズムについて述べる。 まず、画像中の車線の透視射影の媒介変数モデルを導入し、 その変数を算出する高速で信頼性の高いアルゴリズムを示した。 このモデルの物理的な重要性は、 車線内における車の位置、ハンドルを切る方向、 道路の局部的な構造を、 モデルの変数が完全に特定している事で証明された。 モデルの適応性の条件も明らかにし、 テスト走行の間に撮影された連続画像に適用した結果についても論じた。 本手法は実時間アプリケーションに適している。 実際、MOBLABのハードウエア上では12画像/秒のフレームレートで実行された。

mNt

Copyright(c) 1999 Academic Press, Inc.


人間の動作解析:レビュー
Human Motion Analysis: A Review

J. K. Aggarwal, Q. Cai

Computer Vision and Image Understanding, v 73, n 3, March, 1999, p428-440

人間の動作解析はコンピュータビジョンの研究者の間で ますます注目を集めている。 それは、この分野におけるアプリケーション領域が非常に広い為である 例えば、競技パフォーマンス解析、監視、マン-マシンインターフェース、 コンテンツ-ベースの画像保存/検索、テレビ会議などがある。 本論文では人間の身体の動作解析を含む様々な研究に対する レビューを行った結果を報告する。 我々は人間の動作解析に関連して、3つの大きな分野に焦点を当てた。 (1)人間の身体の部分を含む動作解析 (2)単/複視による移動する人間の追跡 (3)連続画像中からの人間の動作の認識 人間の身体の部分を含む動作解析では、 連続画像中の2次元の映写を用いて、 人間の身体について低レベルの分割を行い、 それを関節でつなぎ合わせ、 人間の身体の3次元構造を復元する。 単/複視による移動する人間の追跡では、 高レベルの処理に焦点をあてた。 ここでは、移動する人間はその身体の部分を認識すること無しで追跡される。 連続画像中で、あるフレームから次のフレームへ 移動する人間の画像のマッチングに成功したならば、 人間の動作と活動が自然に理解出来、 このことは人間の活動の認識に対する議論を深める事になる。

mNt

Copyright(c) 1999 Academic Press, Inc.


離散輪郭発展に基づいた形状分解の為の凸ルール
Convexity Rule for Shape Decomposition Based on Discrete Contour Evolution

Longin Jan Latecki, Rolf Lakmper

Computer Vision and Image Understanding, v 73, n 3, March, 1999, p441-454

2次元物体を視覚的にの意味のある部品、 すなわち視覚部品(visual parts)に分解する手法について論じる。 単純に考えると、 物体の凸部品が視覚部品を決定するという意見はもっともである。 しかしながら、ここで問題となるのは、 視覚部品の中には、凹型の視覚部品も存在する為、 多くの重要な視覚部品が凸とは限らないということである。 この問題を解決するために、 異なるステージで凸部品を確認し、 非常に重要な視覚部品は、 発展の高次のステージでは必ず凸部品(convex object parts)となる 輪郭発展手法を提案する。 提案手法では、 階層的凸ルール(the hierarchical convexity rule)と呼ばれる 2次元物体を視覚部品に分解する優れたルールを用いている。 そのルールによればそれぞれの視覚部品は、 輪郭発展のそれぞれのステージにおける 凸最多角形境界弧(maximal convex boundary arcs)に包含される。 このルールは境界曲線の部品を定めるのみならず、 直接に物体の視覚部品を定めている。 さらに、階層の発展のステージは、視覚部品の階層的構造を誘発する。 そして、輪郭発展のステージが進むほど、 得られた視覚部品の形状への寄与が大きくなる。

mNt

Copyright(c) 1999 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.74, No.1

顔画像からの年齢分類
Age Classification from Facial Images

Y.H.Kwon and N.V.Lobo

Computer Vision and Image Understanding, vol.74, No.1, pp.1-21, April 1999.

 本論文では、顔画像から外見上の年齢を分類する理論と実行方法を述べる。 現在、この理論では、入力画像を、子供、青年、老人の三つの世代に分類する。 その計算は、cranio-facial 展開理論と皮膚の皺の解析に基いている。この方 法は、まず顔の基本的特徴を見出し、続いて第二の特徴解析を行う。基本的特 徴は、眼、鼻、口、顎、顔の最上部と顔の側部である。これらの特徴により、 青年と老人から、子供を切り分けるための比を計算する。第二の特徴解析では、 皺の「地図」が皺の検出と計測を助けるために用いられる。計算された皺の指 数が十分な値であれば、青年と子供から老人が切り分けられる。このように、 比と皺の指数を組み合わせる規則によって、三つの世代に顔を分類することが 可能となる。実験結果は実画像を用いたものである。本研究が年齢分類を行っ た、また、自然の皺を検出して用いた最初のものである。良好な実験結果は、 顔特徴が分類に十分であることを示し、何が顔解析に適した表現なのかを議論 するために重要であるかの知見を示している。

Copyright(c) 1999 Academic Press, Inc.


離散運動群上の相関によるパターンマッチング
Pattern Matching as a Correlation on the Discrete Motion Group

A.B.Kyatkin and G.S.Chirikjian

Computer Vision and Image Understanding, vol.74, No.1, pp.22-35, April 1999.

 本論文では、平行移動、回転、膨張を含むような自然な状態でのパターン認 識におけるテンプレートマッチングの問題に対して、相関に基く方法を展開す る。その相関法は、「離散運動群(discrete motion group)」上のフーリエ 解析と高速フーリエ変換法を用いている。離散運動群上でのフーリエの方法を 簡単に紹介し、この方法の効果について論ずる。また、いくつかの例に対して 数値実験の結果を示す。

Copyright(c) 1999 Academic Press, Inc.


画像解析とコンピュータービジョン:1998
Image Analysis and Computer Vision: 1998

A.Rosenfeld

Computer Vision and Image Understanding, vol.74, No.1, pp.36-95, April 1999.

 本論文は、コンピュータービジョンと画像解析に関する 2250 以上の文献を 内容別にまとめたものである。コンピューター技術、特徴抽出と分解、画像解 析とシーン解析、二次元形状、パターン、カラーとテクスチャ、マッチングと ステレオ、三次元復元と解析、三次元形状、動きといったトピックを含む。い くつかの文献は、幾何学とグラフィクス、圧縮と処理、センサーと光学、視覚、 ニューラルネットワーク、人工知能、パターン認識、およびその応用を関連す るトピックとして含んでいる。

Copyright(c) 1999 Academic Press, Inc.


固定周期サイン曲線の同定とラベリングのためのハフ変換の実行法
An Implementation of the Hough Transformation for the Identification and Labelling of Fixed Period Sinusoidal Curves

L.Glossop, P.J.G.Lisboa, P.C.Russell, A.Siddans, and G.R.Jones

Computer Vision and Image Understanding, vol.74, No.1, pp.96-100, April 1999.

 ハフ変換は画像内で特定の形状を検出するための計算機的に有効な方法とし て長く用いられてきた。本論文では掘削坑の音波像における岩石の特徴を特定す るためのハフ変換の実用的な方法について述べる。掘削坑の音波画像では、平 面的な特徴は、理想的には掘削坑の周長を周期とするサイン曲線になる。ノイ ズや擾乱の著しい超音波反射画像において、サイン曲線にある三つの自由度、 すなわち振幅、基線位置、位相を決定することに成功した。

(※) sinusoid curve について

数学辞典によれば、sinusoid curve は

       y = sin( 1/x )    [ x ≠ 0 ]
       −1 ≦ y ≦ 1            [ x = 0 ]

とありましたが、この論文の本文には、sinusoid として

       y = ρ・sin( ω・x + θ ) + d

という式が書かれていましたので、サイン曲線だと解釈しました。

Copyright(c) 1999 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.74, No.2

只今, 作成中です. ご迷惑お掛け致しますが, もうしばらくお待ちください.

Computer Vision and Image Understanding (Academic Press) Vol.74, No.3

異なる大きさの対応付けセットからの3D認識における画像点位置の 不確かさ推定について
On Estimating the Uncertainty in the Location of Image Points in 3D Recognition from Match Sets of Different Sizes

Ilan Shimshoni

Computer Vision and Image Understanding, Vol.74, No.3, June 10, 1999, p163-173

効率的でロバストなモデルベースの認識系に要求されるのは、以下のこと である。すなわち、幾つかのモデル点から対応する画像点への対応付けが 与えられたときに、画像上の他のモデル特徴が存在可能な位置を、高信頼 かつ迅速に推定できること、である。 探知データに誤差があると、オブジェクトの算出ポーズに不確かさがもた らされ、これがさらに、位置における不確かさをもたらす。 我々は、これらの不確定領域を推定するための、効率的で正確な方法を紹 介する。 基本となる方法では、3つの点に関する初期的な対応付けが扱われる。 わずかな計算コストを追加すると、同一の対応付け三つ組みを用いて、多く のモデル点投影の不確定領域を計算することができる。 この方法は、統計的手法を用いてさらに拡張される。すなわち、任意サイ ズの初期対応付けが与えられたときに、不確定領域を推定することができる ようになる。 まさにこれが、本稿のもつ主要な実用的貢献である。というのは、対応付け における点の数が増えるにつれて、不確定領域の大きさは劇的に減少する からである。 これは、モデルベースの認識アルゴリズムにおいて、正しい対応付けと誤っ た対応付けとを峻別するのに役立つ。

SR

Copyright(c) 1999 Academic Press, Inc.


単眼画像系列における人物の追跡
Tracking Persons in Monocular Image Sequences

S. Wachter, H.-H. Nagel

Computer Vision and Image Understanding, Vol.74, No.3, June 10, 1999, p174-192

人物の動きの定量的で幾何学的な記述は、3次元人物モデルの投影を、 画像系列の連続フレームに当てはめることによって得られる。 人物モデルの動きは、同種の画像変換ツリーによって与えられ、その身体各部は 適切な楕円形のコーンによってモデル化される。 可変である自由度(体関節、カメラから相対的にみた人物の位置と方位) の値は、アプリケーションと画像系列の種類にしたがって決められる。 自由度の決定は、反復型拡張カルマン・フィルタ(IEKF)によって解かれる推定 問題として理解される。 この目的のために、人物モデルは、IEKF の予測ステップで使われるすべて の自由度に対して等速であるような簡単な動きモデルによって強化される。 更新ステップでは、領域情報とエッジ情報の両方が使われる。 種々の実験が我々のアプローチの効率を示す。

SR

Copyright(c) 1999 Academic Press, Inc.


局所計数アルゴリズムによる表面領域推定を改善するための代替的タイリング
Alternative Tilings for Improved Surface Area Estimates by Local Counting Algorithms

Erik G. Miller

Computer Vision and Image Understanding, Vol.74, No.3, June 10, 1999, p193-211

本稿では、まず周囲長推定のための局所計数手法についてレビューする。 対象は、区分的に滑らかな二値図形であり、その格子形状は、正方形、 六角形、および三角形である。 局所計数アルゴリズムを使うと、六角格子や三角格子を用いて、よりよい 周囲長推定が得られることを確かめる。 続いて、この技術を用いた表面領域推定を比較するのだが、 対象は、3つの準正則多面体(立方体、切り落とされた八面体、菱形十二面体)の タイリング下での二値的な3Dボリュームである。 ここで示されるのは、 一様分布を持つ任意方向の表面に対して、期待される表面推定誤差は、 標準的な立方体または四角柱のタイリングよりも、 切り落とされた八面体または菱形十二面体のタイリングの方が小さい、 ということである。 これら切りばめ細工のさらなる特性がレビューされ、 よりよい表面領域推定の応用可能性について論じられる。

SR

Copyright(c) 1999 Academic Press, Inc.


破線の文法的な推論
Grammatical Inference of Dashed Lines

Arnold Jonk, Rein van den Boomgaard, Arnold Smeulders

Computer Vision and Image Understanding, Vol.74, No.3, June 10, 1999, p212-226

線図形において、破線は一般的で意味的に重要な要素である。 本稿では、グラフィカルシンボルのストリームを与えられたときの、 破線の文法推論を扱う。 文法的パターン認識に基づいて、事前知識無しで任意の文法を推論 できる手順が紹介される。 開発されたアルゴリズムの計算複雑度の詳細が、我々の手順の有用 性を証明する実験と同様に紹介される。

SR

Copyright(c) 1999 Academic Press, Inc.


濃淡画像のテクスチャ解析のための二値モデルの使用
The Use of Boolean Model for Texture Analysis of Grey Images

P. Garcia, M. Petrou, S. Kamata

Computer Vision and Image Understanding, Vol.74, No.3, June 10, 1999, p227-235

ここでは、濃淡テクスチャ解析のための1次元二値モデルの使用を一般化する。 それぞれの濃淡画像は、まず、異なる基準を用いて、8つの二値画像に分けられる。 これらの二値画像は、1次元二値モデルの助けを借りて個別に解析され、 そこから特徴が抽出される。 最終的な濃淡テクスチャの認識は、これらの特徴に基づき、いくつかの 分類基準を用いてなされる。 実験は、30の濃淡テクスチャをもつ画像データベースを用いてなされた。 画像はすべて512×512画素である。 先の分類基準にしたがうと、正しく分類できたのは、95%から100% の間であった。

SR

Copyright(c) 1999 Academic Press, Inc.


Computer Vision and Image Understanding (Academic Press) Vol.75, No.1/2

MPEGビデオデータベースからの最適キーフレーム抽出のための 確率的フレームワーク
A Stochastic Framework for Optimal Key Frame Extraction from MPEG Video Databases

Yannis S. Avrithis, Anastasios D. Doulamis, Nikolaos D. Doulamis, Stefanos D. Kollias

Computer Vision and Image Understanding, v 75, n 1/2, July/August 1999, p3-24 (ID cviu.1999.0761)

本論文では、MPEG圧縮ドメインからの、制限はあるが、重要な情報の直接抽出のた めの、ビデオコンテンツ表現のフレームワークを提案する。各ビデオショットに階 層的な色と動きのセグメンテーションを適用し、フレームベースの表現を特徴ベ ースのものに変換する。その方式は、再帰的最小木 (RSST) アルゴリズムの多重解 像度のインプリメンテーションに基づいている。そして、類似のセグメントが異な るクラスに分類される確率を減らすために、ファジー多次元ヒストグラムを使って 、すべてのセグメント特徴を集める。各ショットに対して、内容に基づいたレート でのサンプリングを行って、キーフレーム抽出を行う。キーフレーム抽出に対して は、2つのアプローチを考える。第一のものは、特徴ベクトルの軌跡の時間変動の 解析に基づき、第二のものはビデオフレームの相互相関基準の最小化に基づく。第 二のアプローチの効率的実現のために、対数的探索(確率的方法を含む)とGAを 提案する。人工データと実際のMPEGビデオを使った実験により、提案する方法の性 能を示す

HN

Copyright(c) 1999 Academic Press, Inc.


ビデオ系列のための距離尺度
A Distance Measure for Video Sequences

Donald A. Adjeroh, M. C. Lee, Irwin King

Computer Vision and Image Understanding, v 75, n 1/2, July/August 1999, p25-45 (ID cviu.1999.0764)

ビデオは、時間と空間の間に強い拘束条件を持つという点で、ユニークなマルチメ ディアのデータタイプである。したがって、内容によるビデオ検索では、ビデオ系 列における情報の視覚的性質を失うことにないように、系列固有の時間的順序付け を取り入れた、系列間の照合方法が必要になる。そのような方法では、ビデオ系列 間での信頼度の高い類似性尺度が必要になる。本論文では、ビデオ系列間の照合問 題を、パターン照合問題として定式化し、ビデオ系列に適した距離尺度としての文 字列編集距離を提案する。

HN

Copyright(c) 1999 Academic Press, Inc.


ベクトル角による距離尺度を用いた、ベクトルベースのカラー画像検索の新方法
A Novel Vector-Based Approach to Color Image Retrieval Using a Vector Angular-Based Distance Measure

D. Androutsos, K. N. Plataniotis, A. N. Venetsanopoulos

Computer Vision and Image Understanding, v 75, n 1/2, July/August 1999, p46-58 (ID cviu.1999.0767)

色は画像のインデクシングや検索にもっとも使われる特徴であり、色のヒストグラ ムは、単純であるが故に、もっとも広く使われている。しかしながら、ヒストグラ ム類似性の知覚的な良い尺度がないこと、ヒストグラムが示すのは全体的な色の内 容であること、ガンマ非線形性により誤った検索結果が得られることにより、より 良い方法が必要になっている。知覚的に顕著な色領域を同定するために、再帰的 HSV空間のセグメンテーションを用いた新しい方法を提案する。これらの抽出された 領域の平均色ベクトルは、画像インデックスを構築するのに用いられ、非常に小さ な格納領域しか必要としない。我々の検索方法では、2つのベクトルの間の角度に 基づいた組み合わせ距離尺度を用いている。我々のシステムでは、精度の高い検索 結果と高い検索率が得られる。単独、または、複数の色による検索のほか、排除す る色を指定した検索が可能である。我々の距離尺度とデータベース画像の検索順位 を決める多次元探索空間によって、このような柔軟な検索が可能になっている。さ らに、我々の方式はガンマ非線形性に対して非常に安定しており、広い範囲のガン マ非線形値に対して、頑健な検索結果が得られる。一般に、画像の獲得源は未知で あるので、このような性質は非常に重要である。

HN

Copyright(c) 1999 Academic Press, Inc.


動的データベースの類似性検索のための次元縮約
Dimensionality Reduction for Similarity Searching in Dynamic Databases

K. V. Ravi Kanth, Divyakant Agrawal, Amr El Abbadi, Ambuj Singh

Computer Vision and Image Understanding, v 75, n 1/2, July/August 1999, p59-72 (ID cviu.1999.0762)

データベースは、地図、画像、オーディオ、ビデオのようなマルチメディア・オブ ジェクトを蓄積するのに使われるようになってきている。R*-treeやSS-treeのよう な多次元インデックス構造を使って、これらのオブジェクトの蓄積と検索が行われ る。次元が増えると、これらのインデックス構造の検索性能が低下する。一般に 「dimensionality curse」と呼ばれるこの現象は、データの次元を減らすことによ り避けることができる。このような次元縮約は、しかしながら、検索結果の精度を 落とすことにもなる。現在のQBICのような方式では、高い検索精度を保持するため に、特異値分解(SVD)に基づく次元縮約を用いている。この方法の欠点は、SVDの 計算量が多いために、動的データベースに適用できないことである。本論文では、 SVDに基づいて動的データベースでの次元縮約を行うための新しい方法を提案する。 データ分布が大きく変化するために、検索精度が低下するときには、SVD変換を再 計算し、それを既存のインデックス構造に取り入れる。SVD変換の再計算のために、 データ全体ではなく、既存のインデックスからデータの集まりを使う新方法を提 案する。この方法により、検索精度を落とすことなく、SVD計算時間を減らすことが できる。そして、再計算されたSVD変換を既存のインデックス構造に取り入れる効率 的方法を考える。これらの方法により、カラーとテクスチャ画像ベクトルでの計算 時間が、実験では20倍減少した。SVDの近似計算による誤差は10%未満である。

HN

Copyright(c) 1999 Academic Press, Inc.


画像からの特徴領域の発見
Finding Salient Regions in Images

E. J. Pauwels, G. Frederix

Computer Vision and Image Understanding, v 75, n 1/2, July/August 1999, p73-85 (ID cviu.1999.0763)

内容による画像検索(CBIR)の大きな問題は、知覚的に特徴のある画像領域を教師 無しで同定することである。画素をさまざまな特徴空間へ変換し、それらをグル ーピングのアルゴリズムにかけることによって、この問題に取り組むことができる と我々は考える。本論文では、CBIRアプリケーションで発生する、不均等で非常に 不規則なクラスターを処理することができる、頑健で、一般的なノンパラメトリッ クなクラスタリングのアルゴリズムを開発する。我々の方法の強みは、クラスタリ ングそのものにそれほど依存せずに、むしろ、クラスターのトポロジーに独立な 、2つのクラスターの妥当性を示す指数を定義し、利用していることである。それ らを組み合わせることにより、最適なクラスタリングを同定し、実験により、クラ スターがたしかに知覚的に特徴ある画像領域に対応していることを確認する。

HN

Copyright(c) 1999 Academic Press, Inc.


WWW上での内容による画像検索のための、テキスト特徴と視覚的特徴の統合
Unifying Textual and Visual Cues for Content-Based Image Retrieval on the World Wide Web

Stan Sclaroff, Marco La Cascia, Saratendu Sethi, Leonid Taycher

Computer Vision and Image Understanding, v 75, n 1/2, July/August 1999, p86-98 (ID cviu.1999.0765)

WWW画像データベースの内容による検索のための、単一のインデックス・ベクトルで のテキスト的統計と視覚的統計を組み合わせたシステムを提案する。テキスト的統 計は、HTML文書中のテキストに基づいた、潜在的意味のインデクシングを用いてベ クトル形式で獲得される。視覚的統計は、色と方向のヒストグラムを用いたベクト ル形式で獲得される。統合アプローチを用いることにり、文書内容(潜在的意味内 容)と画像内容(視覚的統計)の間の統計的組み合わせを利用することができる。 組み合わせアプローチにより、内容に基づく検索の瀬能を向上させることができる。 WWWから集めた350,000の画像を含むデータベースに対する検索性能を報告する。

HN

Copyright(c) 1999 Academic Press, Inc.


画像インデクシングのための高速ウェーブレット・ヒストグラム法
Fast Wavelet Histogram Techniques for Image Indexing

M. K. Mandal, T. Aboulnasr, S. Panchanathan

Computer Vision and Image Understanding, v 75, n 1/2, July/August 1999, p99-110 (ID cviu.1999.0766)

内容による画像検索は、デジタルライブラリとマルチメディア・データベースの応 用とともに、重要な研究分野となってきている。インデクシング法の主流は、ヒス トグラム、色、テクスチャ、形状などの画素領域特徴をもとにしたものである。し かしながら、最近の画像圧縮の発展とともに、計算複雑度が低いために、圧縮領域 でのインデクシング方法が、関心を集めてきている。最近、ウェーブレット変換の 方向特性を利用したウェーブレット・ヒストグラム法が、提案されている。この方 法は、テクスチャ画像に対して、高い検索性能を示しているが、その計算複雑度は 高い。本論文では、ウェーブレットヒストグラム法の複雑度を減らすための3つの 方法を提案する。これらの方法では、どれも、複雑を大幅に軽減しながら、より高 い性能が得られる。したがって、ウェーブレットに基づく画像蓄積・検索システム 開発のための有力候補と考えることができる。

HN

Copyright(c) 1999 Academic Press, Inc.


ASSERT: HRCT画像データベースのための医者取り込み型の内容ベース検索システム
ASSERT: A Physician-in-the-Loop Content-Based Retrieval System for HRCT Image Databases

Chi-Ren Shyu, Carla E. Brodley, Avinash C. Kak, Akio Kosaka, Alex M. Aisen, and Lynn S. Broderick

Computer Vision and Image Understanding Vol 75, Nos. 1/2, July/August, pp. 111-132, 1999

今や、多くの領域において、内容ベースの画像検索というのは完全 自動のアプローチでは実行されえない、ということが認識されている。 医療分野もその一つであり、画像のなかで診断に役立つ情報は、 画像のごく局所的な領域の濃淡変化で構成されるというのが、典型的である。 現状では、これらの領域を、画像の自動切り出し技術で抽出する のは可能ではない。 この問題に取り組むために、人間(特に医者)を取り込むかたちの アプローチを実現した。 このアプローチでは、異常支持領域と画像の解剖学的目印の集合とを、 画像をデータベースに取り込む時点で、人間が叙述するのである。 このように目印付けられた領域に対して、低次コンピュータ・ビジョンと 画像処理アルゴリズムを適用して、濃淡変化に関連する属性や、テクスチ ャー、形状、その他…を抽出するというアプローチである。 さらに、このシステムは、関連情報を獲得する属性を記録する。 関連情報とは、たとえば、特定の解剖学的目印に関する異常支持領域の 位置などのことである。 これらの属性値に基づいて、各画像に対し、すべての多次元インデックス を割り当てる。

Sz

Copyright(c) 1999 Academic Press, Inc.


画像中の落葉樹を位置決めする特徴およびその分類方法
Features and Classification Methods to Locate Deciduous Trees in Images

Niels Haering and Niels da Vitoria Lobo

Computer Vision and Image Understanding Vol. 75, Nos. l/2, July/August, pp. 133-149, 1999

画像中の落葉樹を位置決めする特徴とその分類方法について、まず比較 を行う。 この比較から結論されるのは、バック・プロパゲーション型ニューラル・ ネットが、我々の試した他のいかなる方法よりも、よい分類結果を達成 するということである。 さらに7種の特徴抽出方法から得られる51の特徴の関連性を解析し、 その結果、それぞれの特徴が重要な情報に貢献していることが示される。 抽出方法とは、具体的には、濃淡共起行列、ガボア・フィルタ、フラク タル次元、操縦可能(steerable)フィルタ、フーリエ変換、エントロピー およびカラーなどである。 次に、13の特徴部分集合をいかに得るかについて示すのだが、この部 分集合は、特徴集合全体の有する能力とロバストさの大半を保持したま まで、特徴抽出時間を大幅に減ずることができる。 ここで判ったことは、特徴の最適な部分集合とは、各抽出方法の特徴を 組み合わせたものであるということだ。 特徴についての、分類および関連性決定の方法は、特徴(主成分分析や 線形/二次識別器)の共分散行列あるいは相関行列に基づいているが、 一般には使用可能とはいえない。 というのは、特徴の数がわずかであっても、通常は線形の意味で冗長性 が高く、これが共分散行列あるいは相関行列を損なうので、逆変換が困 難なほど特異となるからだ。 ここで論じるのは、落葉樹と他の多くの対象物を、豊かな画像記述によ って表現するならば、分類の大きな助けになる、ということである。 我々は、特別な仮定を、形状、位置、視点、視点からの距離、光源条件 およびカメラ・パラメータに関して定めることはしない。 ただ期待するのは、リーズナブルな画質を保持するための走査方法と圧 縮スキームとだけである。

Sz

Copyright(c) 1999 Academic Press, Inc.


内容ベースの画像検索に向けての確率的な特徴関連性の学習
Probabilistic Feature Relevance Learning for Content-Based Image Retrieval

Jing Peng, Bir Bhanu, and Shan Qing

Computer Vision and Image Understanding Vol. 75, Nos 1/2, July/August, pp 150-164, 1999

既存の画像検索システムのほとんどは、類似画像を検索するのに、データ ベースに対する one-shot キュエリーを用いる。 典型的には、K最近傍則のたぐいのアルゴリズムが用いられるが、そこで は、与えられた類似尺度の計算において、入力次元に沿った特徴の重要度 を測る重みは、固定のまま(あるいは手動による調整)とされる。 しかしながら、類似性は、同じ強さで変わるのではないし、キュエリー画 像から生じる特徴空間において、全方向で同じ比率で変わるのでもない。 これらの重みを手動で調整するのは、処理時間を要し、総当たり的である。 そのうえ、洗練された調整者(ユーザ)が必要である。 そこで本稿では、確率に基づく新しい手法を提案する。 これは、画像検索手続きが、ユーザからのフィードバックに基づいて、特 徴関連性を自動的に把握することを可能とするものであり、キュエリー位 置に対して高度に適応的なものである。 実験結果が示すところによると、模擬データおよび実データの両方に対し て、この技法の効率がよいことがわかる。

Sz

Copyright(c) 1999 Academic Press, Inc.


複合領域テンプレートを用いる画像分類と質問
Image Classification and Querying Using Composite Region Templates

John R. Smith and Chung-Sheng Li

Computer Vision and Image Understanding Vol 75, Nos. 1/2, July/August, pp. 165-174, 1999

デジタル画像が途方もなく増大したため、画像解析、カタログ化、および検 索に対する、より洗練された方法への要求が生じている。 ここでは、領域または対象物の空間的順序に基づいて、画像の分類・質問を 行う方法を示す。この方法は、複合領域テンプレートと呼ばれるものを用い る。 複合領域テンプレートは、空間情報を統計的に把握し、領域の挿入・削除・ 置換・複製・再配置がある場合の類似性を測るロバストな方法を与える。 複合領域テンプレートを、画像の分類・注釈付けに用いることも可能である。 この場合、領域や対象物に記号を割り当て、画像の空間走査から記号列を抽 出すればよい。 画像を自動的にラベル付けし分類するために注釈づけられた複合領域テンプ レートのライブラリを用いて、記号列を複号化することができる。 また、複合領域テンプレートを、スケッチや例示による検索に用いることも できる。この場合は、画像の類似性を、複合領域テンプレートの相対計数に 基づいて計測すればよい。

Sz

Copyright(c) 1999 Academic Press, Inc.


内容ベース検索のための柔軟な画像データベース・システム
A Flexible Image Database System for Content-Based Retrieval

Andrew P. Berman and Linda G Shapiro

Computer Vision and Image Understanding Vol 75, Nos 1/2, July/August, pp 175-195, 1999

画像データベースの検索において、厳密なキーワードではなく、画像内容 の類似性に基づいて探索できないかという要求が増大しつつある。 距離計算というのは、高コストとなりうるので、距離を算出せずに候補画 像を除くことができるような、インデクシング・システムとアルゴリズム が要求されることになる。 また、ユーザの要求は、セッション毎に変わりうるわけであるから、距離 尺度を実行時に創造することも要求される。 本稿では、柔軟な画像データベースシステムFIDSを提案する。 FIDSでは、ユーザが、あらかじめ定義された何十という距離尺度の複雑な 組み合わせをベースとして、データベースに質問をすることができる。 三角不等式に基づくインデクシングとアルゴリズムを用いているので、 FIDS は、キュエリー画像にマッチする画像を返す際に、データベースのわ ずかならざる比率の画像との間で直接的な比較をしなくてよい場合が、し ばしばある。 本稿は、内容ベースの画像検索に向けての、FIDSアプローチの技術的貢献 について述べるものである。

Sz

Copyright(c) 1999 Academic Press, Inc.


階層的多重解像度ビデオ・ショットの遷移を検出する方法
A Hierarchical Multiresolution Video Shot Transition Detection Scheme

Hong Heather Yu and Wayne Wolf

Computer Vision and Image Understanding Vol 75, Nos 1/2, July/August, pp 196-213, 1999

デジタル・ビデオ・セグメンテーションの問題は、多くの異なるアプリケ ーションにおいて生ずる。 セグメンテーションは、あくまでも第一ステップであって、その先には自 動的なビデオ・インデクシングや、自動編集、知覚的符号化…などがある。 我々は、階層的多重解像度ショットの遷移を検出する方法を開発した。 これは、ショット遷移検出を高精度化するためのビデオを生成する局面に おいて、利点を有するものである。 新しい特徴が提案される。 その目的は、異なる種類のショット遷移について、その統計量変化を把握 し、abrupt型(ショットが突然かわるもの)遷移のみならず、gradual型 (ショットが次第に遷移するもの)遷移をも同定することにある。 複雑な遷移、たとえばdissolves(次第に薄れる)や wipe(一掃される) を同定することは、それらが映画のストーリー構造の視覚的手がかりとな りうる、という意味で重要である。 本稿では、収集と検証からなる2パス型アルゴリズムを提案し、dissolve型 遷移と wipe型遷移を検出する問題を研究する。 この問題は、ショット遷移検出問題のなかで最も難しいものである。 画像を多重解像度に分解するのに、ウェーブレット変換を用いる。 実験結果が示すのは、この方法が、既存のアルゴリズムと比較して、より 高い精度をもつということである。

Sz

Copyright(c) 1999 Academic Press, Inc.


[前の年]