Computer Vision and Image Understanding (Academic Press) Vol.65, No.1 |
G. SOUCY AND F. P. FERRIE
Computer Vision and Image Understanding, Vol.65, No.1, January 1997
複数画像からのシーン記述の復元という課題において重要な問題となるのは, 複数の観点から得た情報の融合である. そこで本論文では,重なりのある距離画像から面の再構築を行なう アルゴリズムのセットについて記す. ここで前提として面は滑らかであるとするが,剛体である必要はない. 回転や移動といった画像間を繋ぐ動きのパラメータは,曲率は滑らかに変化すると いう仮定にしたがって局所的にもとめられる. したがって,この復元問題は2つの画像間にわたって曲率を維持する動き パラメータのセットを求めることに集約される. 真の動きパラメータに近い凸面が,関数的に適当な類似性を持つことが導出される. このことにより,勾配降下法による動きパラメータ推定の有効な 局所的アルゴリズムが導かれる. フレーム間の点のマッピングを行なう極所動き推定を適用することで, 異なる視点からの情報の融合が達成される. しかし上記の推定は局所的に行なわれるので,ノイズや量子化誤差の影響を 受けやすい. ロバスト性を増すために,動きの一貫性(すなわち近傍領域の速度の変化も また滑らかであるという)制約を付け加える. これは,近傍点における関連する位置と方向の差分を最小化する動きパラメータ のセットを探索するという第2の極所最小化問題に帰着される. この結果得られるアルゴリズムは,局所的な変動をスムーズにし, 近傍面のパッチを合成することとなる. 大局的な剛体の動き推定方法と対比して,異なる視点からの面の再構築という 我々の方法は,点の一致についての極所エラーに強く,分節的な物体についても 適応可能である.
Copyright(c) 1997 Academic Press, Inc.
Dong-Gyu Sim and Rae-Hong Park
Computer Vision and Image Understanding, Vol.65, No.1, pp.19-37, January, 1997.
本論文では,特徴点マッチングとモジュール間の関連性に基く,連続画像のた めの二段階オプティカルフロー評価アルゴリズムを提案する.第一段階では, 特徴点に関する弛緩法を用いて平行移動と回転のパラメーターの初期値を計算 し,連続,非連続領域内の物体に関連した異方性の伝播を求める.第二段階で は,画像ごとに繰り返し現れる強いモジュール間の関連性と適応平滑化に基い て,逐次改善的にオプティカルフローの評価が導かれる.提案したアルゴリズ ムと従来のアルゴリズムによるコンピューターシミュレーションの結果を紹介 する.
Copyright(c) 1997 Academic Press, Inc.
RIK D. T. JANSSEN and ALBERT M. VOSSEPOEL
Computer Vision and Image Understanding, Vol. 65, No. 1, January, pp. 38-56, 1997
線図形画像をベクトル化する新しい方法を提案する。 提案する手法は標準的なベクトル化アルゴリズムや最大閾値モルフォロジー のシーケンスに基づいていおり、ある適合基準を満たすまで繰り返すことが できる。
まず、おおざっぱなベクトル化で「錨(いかり)点」を見つける。 それぞれの錨点の位置をモルフォロジー操作によって修正し、その後固定する。 次に錨点間で再度正確にベクトル化する。 この方法は、入力された原画像を使ってベクトル化の精度を高めることから 適応的である。 ベクトル化される線画の特定の特性に対して後処理を付加することもできる。 このベクトル化の方法を様々な縮尺や解像度が異なる線画画像を用いて評価した。
Copyright(c) 1997 Academic Press, Inc.
Graeme A.Jones
Computer Vision and Image Understanding Vol.65, No.1, January, pp.57-78, 1997
2枚の画像から3次元データを抽出するためには、対応付け問題を解く ことが不可欠であり、トークンの種類やマッチングの拘束、 用いられる探索方法において数多くの異なるアルゴリズムが 開発されてきた。 最近、複雑度が増していくように多層化されたトークンを利用する 階層的マッチング手法が登場している。stereopsisに関する以前の 評論には、すべての異なる寄与のうちのどれを評価すべきかについて 一般的な枠組みが示されてるものはなかった。 本論文では対応付け問題をその一般的な要素:トークンの種類、 マッチングの拘束、マッチング情報をコード化し探索するのに 用いられる方法、に分解する。 他でも報告されているように、マッチングは最適化問題として考えられ、 マッチングの機能定義を解空間の探索に用いられる方法とは切り離す ことができる。 この非常に一般的な枠組みの下で、階層的な拘束をマッチングアルゴ リズムの中にどのように定式化するかに関する提案を含めて、 階層的マッチングを詳しく議論する。 階層的なアプローチの有用性をいくつかの例をもって示す。
Copyright(c) 1997 Academic Press, Inc.
SOTIRIS MALASSIOTIS AND MICHAEL G. STRINTZIS
Computer Vision and Image Understanding Vol. 65, No. 1, January 1997
本論文では首尾一貫性を利用するため,動き,構造の推定を統合する. 物体表面とその動きのためのモデルを利用し,画像強度のマッチング基準 によりモデルパラメータを推定するアルゴリズムが提案される. 可視シーン表面はパラメータが変形可能で空間的に適応的な ワイヤフレームモデルで記述される. 良く知られている剛体的な動きの仮定と quaternion rotation 表現を用いて 物体の動きはまずモデル化される. 剛体的なモデル化またはその改善の代わりに用いる方法として 有限要素法を用いた動きの非剛体的なモデル化も研究される. 機能的に含まれるimage matching と 表面のなめらかさの制約は 未知のモデルパラメータに対し,最小化される. 物体の境界を越えてなめらかさの制約を非活性化する 不連続検出法が研究されている. 粗から密へという戦略をとる正則化法が採用される.
Copyright(c) 1997 Academic Press, Inc.
Ehud Rivlin and Isaac Weiss
Computer Vision and Image Understanding Vol. 65, No. 1, January, pp.95-108, 1997
我々は2つの構成要素を持つ変換に関する不変性について研究する。 1つは任意の変形が大きなアフィン変換である。これは視点が変化したような 状況に近い。 2つ目は小さいが、しかし一般的な非線形な変形である。このような変形は物 体自体が変わってしまうことも含むいくつかの原因から生じる。例えば、それ ぞれの「りんご」の形がわずかに違っても、「りんご」と認識したいような場 合が考えられる。この場合には本当の不変量というものは存在しないが、アフ ィン不変量が疑似アフィン変換の疑似不変量であるということを本論文では示 す。また、これが大局的な変換でも局所的な変換でも不変量となっていること も示す。 この方法を実際の画像に適応した。
M.T.
Copyright(c) 1997 Academic Press, Inc.Computer Vision and Image Understanding (Academic Press) Vol.65, No.2 |
Richard Mann, Allan Jepson, and Jeffrey Mark Siskind
Computer Vision and Image Understanding, Vol. 65, No. 2, February, pp. 113-128, 1997
相互作用を及ぼし合っている物体の観測結果を理解するためには、定性的なシーン 力学について推論することが必要である。例えば、手が缶を持ち上げるのを観測す ると、「受動的な」缶を持ち上げるために、「能動的な」手が(つかむことによ り)上向きの力を作用させていると、我々は推論するだろう。カメラ入力から、直 接、力学的な記述のようなものを導き出す計算理論を実現した。我々のアプローチ は、単純化したシーンモデルのニュートン力学の解析を基盤としている。解釈を、 シーンの運動学的・力学的性質についての断定によって表現する。線形計画問題に 還元することにより、ニュートン力学による解釈の実現可能性を決定する。最後 に、可能性の高い解釈を選ぶために、優先階層を使って、複数の実現可能解を比較 する。我々のモデルが様々な画像系列を記述するのに十分な表現力を持つことを例 示するために、計算例を挙げる。
HN
Copyright(c) 1997 Academic Press, Inc.
I. Kakadiaris, D. Metaxas, and R. Bajcsy
Computer Vision and Image Understanding Vol. 65, No. 2, February, pp.129-147, 1997
我々は移動中の多部品物体の2次元的な部品分割、形状と運動の推量に関する一つの 新しいアプローチを提案する。 我々の手法は、移動中の多部品物体の外見輪郭の幾何および観察された変形と、その 物体の構造の間の関係を探索する。 この手法の斬新さはその物体および物体の部品に関する事前モデルを一切使用して いないところにある。
我々は、ある部品分割アルゴリズム(Part Segmentation Algorithm, PSA)を開発 した。このPSAは移動物体の外見輪郭の変形を監視し且つ推論することによって、 その物体の全ての移動部品を再帰的に修復する。 変形中の外見輪郭の時間に対するパラメータと分割を見つかるために、我々は最初に 、 ある単一変形可能なモデルを次のように調和する。つまり、このモデルの時間に対す る 大局的と局部的な変形を用いることによって、我々はその部品の根本的な構造に関す る 仮説を立てることができる。 この仮説は、そのモデルの部品間の相対運動の更なる監視すること、及び一定の基準 を 満たすことによって検証される。 この部品仮説の検証に基づいて、外見輪郭をよりよく適合するように、この初期変形 可能なモデルを二つまたはそれ以上のモデルに分割する。 この再帰的な作業は、抽出された部品の数と形状の時間に対する洗練を得ることが できる。
複数の変形可能なモデルを用いて、この多部品物体の外見輪郭のモデルを立てる とき、データポイントにで力を施す必要があるという、変形可能なモデルの不確実 性が生じる。 この問題に対応するため、我々はデータから多重モデルへ力を割り当てるような 力割り当ての新しいアルゴリズムを提示する。 最後に、このアプローチの有効性が様々な物体に対する一連の実験を通して示される 。
LXP
Copyright(c) 1997 Academic Press, Inc.
Computer Vision and Image Understanding Vol. 65, No. 2, February pp 148-162,1997
ここでは1つのアプローチが述べられる。それは、低い計算コストで 変形可能モデルに一般的かつ強い拘束条件を課すものであり、その際に snake的モデルのもつよい収束性は保たれる。 我々は、以下のように信じる。すなわち、この能力は本質的なものであって、 それは個々の対象物の正確なモデリング――既知の幾何的かつ意味的な拘束 条件に従う――においてそうであり、それのみならず対象物の集合の一貫性 のあるモデリングにおいてもそうである、ということをである。 この問題に対するアプローチの多くは、ビジョン分野の文献に見られたように、 目的関数にペナルティー項を加えるということによっている。 それらは、拘束条件の数が増すと急速に手に負えなくなる。 応用数学者たちは、強力な拘束最適化アルゴリズムを開発した。 それを用いると、理論上はこの問題に近づくことができる。 とはいえ、これらのアルゴリズムは典型的にはsnakes特有の性質を利用 するわけではない。 それゆえに新しいアルゴリズムを作ったわけである。 それはLagrangian法にきわめて関連深く、画像理解の分野で用いられる 変形可能モデルの特定のものを集めるように、あつらえられている。 我々はこのアプローチの有効性を示す。まず2次元については合成画像を用いるこ ととし、さらに3次元については実際の地域画像を用いて一貫性という拘束条件の もとに、地形、道路、尾根線を同時にモデル化する。
Copyright(c) 1997 Academic Press, Inc.
Juergen Luettin and Neil A. Thacker
COMPUTER VISION AND IMAGE UNDERSTANDING Vol. 65, No. 2, February pp 163-178,1997
本論文では多値動画像中において、唇の位置を検出し、追跡する頑強な手法 について述べる。 提案手法では学習データから形状パターンを学習し、 画像中の唇を探索する際には学習データと類似した変形モデルのみを探索する。 まず、学習された多値画像のモデルに沿って画像検索が行なわれる。 モデル中にはさまざまな形状の唇が表現されている。 モデルの形状の多様性は、個人差や光の当たり方、口の開き具合、光の反射具 合、歯や舌の見え具合などによるものである。 読唇のための視覚的特徴量は唇の追跡結果に基づいて抽出され、形状と輝度の 情報で表現される。 本論文で示す読唇システムでは、 特徴量をガウス分布に基づいてモデル化し、 特徴量間の連接関係を隠マルコフモデルで表現している。 本論文中では、唇の位置の特定、追跡、読唇に関する結果を示している。 実験には多くの人間について収集したデータベースを用いている。 データベース収集の際には特定の光源を用いたり、唇に検出のためのマークを つけるなど、特別な処理は一切行なっていない。 提案手法では、視覚情報のみから話者に依存しない認識処理を行なうので、 システムの学習に用いた話者と、学習に用いない話者のそれぞれに対する認識率は ほぼ同等である。
mNt
Copyright(c) 1997 Academic Press, Inc.
CHAHAB NASTAR, BABACK MOCHADDANI and ALEX PENTLAND
Computer Vision and Image Understanding, Vol.65, No.2, Feburary 1997
2次元画像における形状(x, y)とテクスチャ(I(x, y))を取り入れた変形可能な 輝度面をベースとした,マッチングと認識の新しい方法について述べる. 該輝度面は,Lagrange力学に従う(x, y, I(x, y))空間における変形可能な 3次元メッシュとしてモデル化される. 2つの(振動の解析的な用語としての)面のマッチングに有効な方法を使うことで, 2画像間の濃度の一致する空間(または3Dワープ)を得ることができる. 更に,対象物特定の変形に関する事前知識を規定するために,妥当な変形の クラスの統計的な学習を行なう. この結果,実際のトレーニングデータにおける変動の統計的な形態と同様に 変形の物理的な形態に基づく,コンパクトな表現が導かれる. イメージマッチング,画像補間,そして顔画像データベースからのイメージ リトリーバルに適用した実験によって,本方式の有効性を示す.
Copyright(c) 1997 Academic Press, Inc.
Matthew Brand
Computer Vision and Image Understanding, Vol.65, No.2, pp.192-205, February, 1997.
シーンに内在する物理〜どのようにシーンの要素が相互作用し,力に反応する か〜を理解することは,シーンがどのように成り立っているか,時間がたつに つれてシーンがどのように発展していくか,操作に対してどのように反応する かを推論するための前提条件である.本論文では,画像からそのもととなる構 造を再現するための,計算機的コストの小さい方法を提案する.その方法では, シーンのモデルがインターリーブ的なセンシングや解析を通じて段階的に構築 される.推論は,剛体の相互作用についての一般的な性質の知識を使用する. それは,さまざまな物体を表す画像領域の間で再利用可能であり,子どもが発 育するときに獲得され活発化すると考えられる概念に似ている.内在する制約 の伝播がシーンのモデルの自由度を変則的なものにすることは明らかであるが, 推論がそれらを解き明かすための直感的な方法をもたらす.センシング操作は その視野において,例えば視るという操作や固有受容(proprioception)のよ うに,高度に指向的であり局所的である.推論の奥行きと“触る”画素の数は シーンの複雑さにより制限される.高度に構造化されたシーンのいくつかの画 像領域においての再利用に成功した,アルゴリズムとその意味論を示す.とく にリバースエンジニアリングにおけるビジョンシステムについて詳しく述べる.
Copyright(c) 1997 Academic Press, Inc.
MICHAEL HAAG. THOMAS FRANK, HENNER KOLLNIG and HANS-HELLMUT NAGEL
Computer Vision and Image Understanding, Vol. 65, No. 2, February, pp. 206-225, 1997
往来の実画像を用いての乗物のモデルベースの追跡は様々な理由で失敗する。 失敗した実験を詳しく解析してみると、誤って一致した場合に 他のシーンの構成部分に属する画像の特徴に対する乗物のモデルの部分 を含んでいることがわかった。 この結果は乗物が静的なシーンの一部かまたは他の動いている乗物によって 遮蔽されると現れる。 我々は遮蔽されたシーンの構成部分を明確にモデル化し良い結果を得たが、 しかし部分的に遮蔽された乗物を正しく追跡できなかった例もある。 この研究成果において我々はいくつかの実画像を用いた追跡に成功した 結果を示し、失敗した例について議論する。 さらに、我々は遮蔽の発生の概念的な特徴づけの枠組を示す。 その枠組は研究の過程における実験的な解析に従う。
Copyright(c) 1997 Academic Press, Inc.
James Williams and Lawrence Wolff
Computer Vision and Image Understanding Vol.65, No.2, February, pp.226-236, 1997
肺血管樹をCTスキャンした容量画像から位相的な局所構造 情報を抽出する。 それから樹の位相と幾何についての理論モデルを作る。それは 物理的なモデルを生成するのに適している。 生理学者は血管樹をチューブのつながったネットワークとして モデル化しているが、今日までのところ、そのようなモデルを作る のに用いられる唯一の正確なデータは、解剖後に測定したものであった。 生きた組織中の樹の動的なふるまいをモデル化することは、これまで 不可能だった。 CTスキャンからモデルを構築すれば、生理学研究と医療診断の 両方に用いることができる情報の量と質が増すだろう。 我々はチューブネットワークの容量画像に対する有効で 正確な解析手法を提案する。 モルフォロジーにもとづく手法と微分幾何を結び付ける局所演算を 用いて、容量からチューブネットワークを通る理想的な軸平行な 流体のながれに類似したベクトル場に変換する。 この場から、画像の目立った特徴を、 拡大した'Euclidean minimum spanning tree'(EMST)に集約させる ための情報が得られる。 この拡大EMSTは血管樹の使いやすく理にかなった理論表現である ことがわかった。
Copyright(c) 1997 Academic Press, Inc.
W. NEUENSCHWANDER, P. FUA, G.SZEKELY AND O.KUBLER
Computer Vision and Image Understanding Vol.65, No.2, February, pp.237-245, 1997
変形可能モデルの使用に基づいた方法が広く用いられているが, それらのアウトプットの質はクリティカルにモデルの初期状態に依存する. 本当に有用なシステムの実装の鍵であるにも関わらず, そのようなモデルの初期化の問題にはあまり注意が払われていなかった.
そこで我々は新しい3次元(3-D)形状の分割方法を示す. この分割法ではまず初期化を行い,次に3-D表面モデルを最適化する. 3-Dモデルはデータと非常に少ない3-Dシード点,対応する表面への 法線のみからなる. このことは,シード点が自然に与えられる医学,ロボティック, 地図製作などのアプリケーションでは,有用な能力である. 要するに,表面モデルは,ベルクローが閉められるのに暗示されるような 方法で物体境界に固定される. 立体像と体積測定(volumetric)医学データのために開発された方法の 応用が示される.
Copyright(c) 1997 Academic Press, Inc.
Huseyin Tek and Benjamin B.Kimia
Computer Vision and Image Understanding Vol. 65, No. 2, February, pp.246-258, 1997
画像から構造を切り出すことは、コンピュータビジョンの分野で本質的に難し い問題であり、例えば医療画像の分野などにおいては広範なアプリケーション への展開の妨げとなっている。
本論文は領域の均質性や図柄のセグメンテーションに対してグローバルな構造 を形成するエッジ応答のような局所的な証拠を集めていくアプローチを述べて いる。このアプローチはショックベースの形態形成的な言語によって誘導され る。この場合、完全な形状の記述において4つのタイプのショックの成長とい うものが生じる。特に、物体は成長、マージ、分離、縮退の4つのショック( シード)の形でランダムに変形が仮定される。一般的には物理的な力の下での 変形で、ゆっくりとほんのわずか異なる構造への変形が仮定される。
このアプローチによる3次元画像のセグメンテーションでは2つの重要なこと がある。1つは3次元バブルによる3次元画像のセグメンテーションは、変形 に対して本質的に2次元であり3次元の情報は使用しない2次元バブルや2.5 次元バブルによる逐次的なセグメンテーションより優れているということであ る。特に、有利な点は根本的な幾何や再構築の精度の本質的な扱いにある。 2つ目は、ギャップや弱いエッジ、これは2次元や3次元のセグメンテーショ ンにおいてしばしば重大な問題になるが、これらが拡散の過程からなる曲率依 存の曲線と曲面の変形によって標準化される。
3次元の反動拡散空間において成長する3次元バブルは、現実の例で示したよ うに医療及びその他の画像のセグメンテーションにおけるパワフルなツールと なる。
M.T.
Copyright(c) 1997 Academic Press, Inc.
W.J. Niessen, J.S. Duncan, M, Nielsen, L.M.J. Florack, B.M. ter Haar Romeny, and M.A. Viergever
Computer Vision and Image Understanding, Vol. 65, No. 2, February, pp. 259-268, 1997
オプティカル・フローをもとにした速度推定においては、画像輝度制約方程式が使 われる。しかしながら、ある特定のスケールで行われる測定には、輝度制約方程式 が適用されない。したがって、最近になって開発された、オプティカル・フローと 尺度空間理論を仲介する方法を使うことにする。その方法は、画像計測のスケール (aperture)を取り入れており、既存の方法とは本質的に異なるものである。唯一 の速度場を求めるためには、データから導かれる情報を物理的知識と組み合わせな ければならない。データから導かれる情報と外部情報をはっきり分離させておくこ とにより、画像から導かれる情報に影響を与えることをせずに、ユーザから与えら れた情報を局所的に適応させたり、修正することができる。時間と空間での2つの 自由なスケール・パラメータを、attentive vision(特定の速度や物体の選択) や、速度推定の信頼性の向上に使うことができる。
HN
Copyright(c) 1997 Academic Press, Inc.
B. A. Maxwell and S. A. Shafer
Computer Vision and Image Understanding Vol. 65, No. 2, February, pp.269-295, 1997
我々は、画像形式の多重の物理的な仮説を用いた複雑な風景のセグメンテーション の一般的な枠組みを提示する。 これらの仮説は単純画像領域の形状、イルミネーション、および材料性質の 広範囲のクラスを明細に記述する。 これらの仮説の解析、集約、およびフィルタリングによって、この 枠組みはあるランクされたセグメンテーションのリストを作成する。 この枠組みに基づき、われわれはあるアルゴリズムを実施し、多重色の、 断片的な、ユニフォーム誘電性の物体を含めた景色のセグメンテーション の応用例を示す。
この新しいアプローチを用いることによって、従来の物理学的なアルゴリズムに 比べ、より複雑な物体を含めた景色を上手にセグメンテーションすることができる。 実験の結果から明らされたように、一般的な物理学なモデルを用いて得られた セグメンテーションは色だけを用いて得られたセグメンテーションに比べ、 よりよく景色中の物体に対応を取れる。
LXP
Copyright(c) 1997 Academic Press, Inc.
Kobus Barnard, Graham Finlayson, and Brian Funt
Computer Vision and Image Understanding Vol. 65, No. 2, February, 1997
ここで提案するのは、二種類の情報、つまり表面反射と照明変化から得られる 情報に基づいて、色再現性の問題を解決するアルゴリズムである。 この種のアルゴリズムのほとんどがもつ仮定は、情景を横切る照明は一定 であるというものであるが、これは現実の画像に対して成り立たないこと がきわめて多い。 ここで提案される方法は、照明変化を同定して除去するというものであり、 さらに解き方に制限を付けるためにその照明変化を用いている。 その拘束条件は、表面反射から検出される拘束条件に続けて適用される。 したがって、表面反射の十分なバリエーションがあるか、照明変化の 十分なバリエーションがあるか、あるいは両者がともにあるような場合に は、このアルゴリズムはよい色再現性を提供する。 いくつかの実際の情景画像に対して走らせた結果を示すが、それは非常に勇気 づけられるものである。
Sz
Copyright(c) 1997 Academic Press, Inc.
MICHAEL S. LANSER and STEVEN W. ZUCKER
Computer Vision and Image Understanding Vol. 65, No. 2, February, 1997
光源と照明の計算モデルを導入することにより、照明に光を向けることを試みる。 空間的に変わる照明は、空間で多方面にわたる光線についての座標変換を用いて 計算され、光線の多様な広がりは4次元であることが示される。 照明モデルは、直接の照明が空間を横切って変化する状況における shape from shadingの復元に用いられるものであり、異なるタイプ の光源に関連する基礎を提供する。 光源の形式的な定義は現れるが、それは源の標準的な定義をエミッター(発する もの)として一般化するものであり、異なるタイプの源が埋め込まれる4次元光 源ハイパーキューブに通じている。
Sz
Copyright(c) 1997 Academic Press, Inc.
Stephen Lin and Sang Wook Lee
Computer Vision and Image Understanding Vol. 65, No. 2, February, 1997
多重視界から得られる色と偏光についての情報のsynergisticな統合に基づく、 specularity検出の方法を提案する。 画像にspecularityが存在すると、多くの従来どおりのコンピュータ・ビジョン プロセスが引き起こされ、誤った結果を生み出すことがある。 最近の物理学ベースの検出方法は、specularityの位置決めに多くの成功を おさめた。しかしながら、specular 反射の全体構造については、いかなる 手がかりも明らかにされてはいない。
我々の方法は、物理的に独立できわめて効果的な手がかりであるところの 多重視界の色と偏光とを、相互に利益をもたらしあうように合わせるとい うものである。 融合された色・偏光空間において、提案されたアルゴリズムは、 specularityの検出のための多重視界から得られるセンサー・データの分布を 比較する。 この新しい手がかりの有効性が部分の和を越えて広がることを示し、 確信できる実験結果を示す。
Sz
Copyright(c) 1997 Academic Press, Inc.
Joel Fan and Lawrence B.Wolff
Computer Vision and Image Understanding Vol. 65, No. 2, February, 1997
滑らかな対象物表面上の相互に反射しあう各々の点において、視点を中央にした 曲率行列(スカラーまで)を直接に復元する多重反射技術について述べる。 この技術は、反射方向、局所的な表面方向、および拡散する表面albedoといった要因 についての知識とはまったく独立である。 この技術の基礎は、滑らかな表面の数学的特性であるところの積分可能性 という拘束条件を用いている。 積分可能性という拘束条件は、各対象点における等式の導出を可能とする。これは、 初期的には未知である反射方向のパラメータを含む量に関して、線形である。 これらの量は、グラディエント比定数と呼ばれるが、同じ数の対象点から得られる 5つ以上の等式から同時に解かれる。 これらのグラディエント比定数を導出することにより、各対象点において 視点を中心とする曲率行列を計算するための反射幾何に関する口径測定の 情報が、ちょうど十分なだけ与えられることを示す。
我々はこの技術の3つの重要な応用を示す。 1)ガウシアン曲率の符号による対象物表面の分割、 2)非負のガウシアン曲率の凹凸へのさらなる分割、および、 3)反射方向と拡散する表面albedoについての知識から独立な、表面の高さの再構成
Sz
Copyright(c) 1997 Academic Press, Inc.Computer Vision and Image Understanding (Academic Press) Vol.65, No.3 |
Ilan Shimshoni and Jean Ponce
COMPUTER VISION AND IMAGE UNDERSTANDING Vol. 65, No. 3, March, 1997
K.Sugihara(Artif. IntelL 23, 1984, 59-95) に続き、多面体の線図形に よって課される幾何的な拘束条件を、線形の等式および不等式の集合とし て表現する。 彼と違うのは、頂点の位置における不確かさを明示的に考慮したことである。 これによって、不確かさ除くことなく拘束条件の過度の厳密さを回避する ことができるようになる。 与えられた誤差境界に対して、ある線図形が多面体の正しい投影であるか 否かを決める問題が、線形プログラミングの問題となり、3次元形状の復元が、 線形の拘束条件の下での最適化の問題となる。 我々の方法は、あらゆる多面体物体について、その反射が正確にモデル化されうる ならば、その形状復元に用いることができるものである。 これを以下の反射モデルのために実現した。それは、Lambertian モデル、相互反射 のあるLambertian モデル、および鏡状物体のレフレクタンス・モデルである。 実際の画像を用いて得られた結果を示す。
Sz
Copyright(c) 1997 Academic Press, Inc.
Riccardo Poli
COMPUTER VISION AND IMAGE UNDERSTANDING Vol. 65, No. 3, March, pp. 361-381,1997
本論文では、1枚のX線画像から解剖学上の3次元構造を復元する手法、 すなわち放射線密度を用いた形状特定手法 (SFRD:Shape from Radiological Density)について述べる。 提案手法では、画像を入力する過程での非可逆性を解決する為に、 身体に関して最小限の仮定を公式化し、SFRDの制約として用いた。
SFRD には以下の4つの問題がある。 (a)X線画像を得る処理の線形化 (b)領域分割 (c)それぞれの解剖学的な部分構造における濃度マップの評価 (d)境界と濃度マップからの3次元構造の復元
本論文では、(a),(b)については従来から直面している問題であると仮定し、 (c),(d) の問題点に関する解決方法を提案し、 合成画像、実験用のX線画像および実画像に対して実験を行なった結果を報告する。
mNt
Copyright(c) 1997 Academic Press, Inc.
ANDRE S. E. KOSTER, KOEN L. VINCKEN, CORNELIS N. DE GRAAF, OLAF C. ZANDER, and MAX A. VIERGEVER
Computer Vision and Image Understanding, Vol.65, No.3, March 1997
本論文では,マルチスケール画像分割における新しいアプローチを示す. それは,スケールスペースにおける近傍レベルの画素をリンクすることと, 原画像における分割を表現するルートをラベリングすることについて 述べるものである. 既存のマルチスケール分割の方法は,リンク付けとルートのラベリングは ほぼ輝度のみによるものであった. 一方,本方式は,一つの指標によってリンク付けとルートのラベリングが おこなえる,複数のヒューリスティックな機構を持つ. 領域分割の性能を求めるのに必要な後処理の量を計測することで,この領域分割は 有効となる. 異なる特徴の3つの2次元合成画像と,2つの脳の磁気反響画像を使用して 評価を行なった. ピラミッド分割方法と比較を行なった結果,本方式の優位性が示された. 最適な重み付けをすることで,全てのイメージにおいて所望する分割結果を 得ることができる.
Copyright(c) 1997 Academic Press, Inc.
Jacques Feldmar, Nicholas Ayache, and Fabienne Betting
Computer Vision and Image Understanding, Vol.65, No.3, pp.403-424, March, 1997.
医療における課題に,核磁気共鳴コンピュータートモグラフィー(MRI/CT)の 画像と実際の患者との対応づけがある.これは,例えば神経外科や放射線治療 や内視鏡検査(腹腔鏡)などで生じる.本論文では,人工的な目印を付けるこ となしに,このような問題を解決する三つの新しいテクニックについて示す. そのため,三次元物体をその物体の二次元画像上にマッピングする,三次元〜 二次元投影変換(精密な変位測定と透視投影からなる)を開発した.物体のモ デル(曲線か表面か)や撮像システム(X線やビデオなど)に依存するため, テクニック自体は異なるが,枠組は共通である.
・まず,複接線(bitangent line)や複接平面(bitangent plane)を用い, 変換の評価法を導き出す.これらは,一次の半微分(semidifferential) 不変量となっている.
・それから,法線や接線を導入し,三次元物体と二次元画像との距離を定義 して,ICP(Iterative Closest Point)法により最小化する.
・マハラノビス距離の計算や一般化χ二乗検定を行なうことにより,孤立点 に関するきわどい問題を取り扱う.
これらの手法の有効性を実証するため,さまざまな現実の医療データに対する 結果を示す.
Copyright(c) 1997 Academic Press, Inc.
ZYGMUNT PIZLO, AZRIEL ROSENFELD and ISAAC WEISS
Computer Vision and Image Understanding, Vol. 65, No. 3, March, pp. 425-433, 1997
我々は視覚の幾何学的なモデルの問題を示す。 この問題は少なくとも2つの理由で興味深い。 第一にどんな視覚の理論(人間またはコンピュータ)も知覚した物体を 表現するのにどの幾何学を使うかを決定しなければならない。(例えば ユークリッドか投影か) 我々はこの表現は画像装置(目やカメラ)の幾何学的な特性と 互換性があるべきだと信じている。 第二に視覚の幾何学的な特性の解析は、標準的な幾何学の有用性を確かめ、 数学それ自身の発展へ導くことができる。 我々は画像の定式化の幾何学を解析し、人間の視覚が幾何学の新しい分野を含む と思われることを示す。 その幾何学の特性は伝統的な幾何学の特性とは大きく異なる。 これらの特性を定式化し、形の知覚のモデルを引き出すためにそれらを使う。 最後に我々の理論的な解析に対する知覚的な説明を示す。
Copyright(c) 1997 Academic Press, Inc.
Computer Vision and Image Understanding (Academic Press) Vol.66, No.1 |
Alain Jacot-Descombes and Thierry Pun
Computer Vision and Image Understanding Vol.66, No.1, April, pp.1-24, 1997
本論文は現実の複雑な画像から構造化された2次元の 幾何プリミティブをボトムアップに復元する問題を扱う。 知覚グルーピングに対する新しいアプローチを与えるが、 そのために、より多くの情報を持つプリミティブを他の プリミティブより先に処理することを基本原理とする 非同期的方法を用いる。 本研究の主な成果はグルーピング処理の計算量を画像の輪郭数に ついて線形となるまで減らしたところにある。 提案手法のもうひとつの優れた特長は設定すべきパラメータが 2つしかない点である。 非同期的知覚グルーピングは、凸度にしたがって決まる 順序づけをされた輪郭プリミティブのデータフローを処理する。 先に処理された他の隣り合うプリミティブにつづいて現れる 各輪郭プリミティブのグルーピングを次々と試みる。 現在の輪郭を受理するか棄却するかは、画像中で隣り合う部分の 幾何形状による;調べられる性質として、近接度、直線性、 線状性、平行性が含まれる。 画像全体に現れる関係構造のモルフォロジーだけでなく、 トポロジーも格子グラフに反映される。 接続点と面の特性は容易に抽出することができ、それらは インデックス付けや認識システムのための適切なプリミティブを 選択するのに役立つ。
Copyright(c) 1997 Academic Press, Inc.
NAOKI MUKAWA
Computer Vision and Image Understanding Vol. 66, No. 1, April 1997
シーンの動きを分析するアルゴリズムのほとんどは 物体と観測者を含む3次元幾何学モデルを利用し, 光学的プロセスを重要視しない. そのため光源を伴うような現実的なシーンには適用できなかった. したがって本論文では観測者と光源を持つ3次元光学モデル に基づいた包括的な画像分析を示す. 光学モデルは光源と表面形状の幾何学的関係を記述する, 光度測定制約を規定する. 制約は,オプティカルフロー,物体形状,表面反射係数, 連続画像からの発行方向の推定を行う,新しいアルゴリズム の基礎となる. パラメータがオプティカルフロー推定の補正項だけではなく 物理的意味を持つ光度測定項であることを示す. このことは投射光源と表面反射係数がパラメータを使って推定可能 であることを示すことによって証明される. 本論文の分析はコンピュータグラフィックス技術を使った シーン再生のための十分なパラメータを与えることができる.
Copyright(c) 1997 Academic Press, Inc.
Azriel Rosenfeld
Computer Vision and Image Understanding Vol. 66, No. 1, April, pp.33-93, 1997
本論文はコンピュータビジョンと画像解析に関連する約2150の文献の書誌事項 をその扱っている主題ごとに並べて書いてある。
カバーされるトピックスは、計算上のテクニック、特徴量検出及びセグメンテ ーション、画像及びシーン解析、2次元形状、パターン、カラー及びテクスチ ャー、マッチング及びステレオ、3次元復元及び解析、3次元形状、モーショ ンを含んでいる。いくつかの文献は、アプリケーションばかりでなく、幾何及 びグラフィックス、圧縮及び処理、センサー及び光学、視覚認知、ニューラル ネットワーク、人工知能、パターン認識を含んでいる関連トピックスも扱って いる。
M.T.
Copyright(c) 1997 Academic Press, Inc.Computer Vision and Image Understanding (Academic Press) Vol.66, No.2 |
Fred L. Bookstein
Computer Vision and Image Understanding Vol. 66, No. 2, May, pp.97-118, 1997
過去十年間、モフォメトリック(物体形状の多変量統計処理) に前例のない理論的と実践的な進歩があった。 このアプローチでは、形状をEuclid相似グループの演算下での離散的な点集合の 同値類として定義する。 三つの基本アイディアがこの枠組みの科学的な解析の基礎になる。 第一に、任意の一組の形状間の距離(Procrustes距離)は最小二乗数式によって 特徴づけられる。 この尺度によって形状の集合がRiemannian多様体(Kendall形状空間)になり、故に、 形状サンプルを平均化する頑丈なアルゴリズムを導出できる。 第二に、平均の形状の近隣にある多様体の接平面上に、これらの同値類の 通常の投影をした後、これらの同値類に関する完全な線形的多変量解析 を更に行うことである。 第三に、形状における効用(例えば、グループ平均の比較)が細い板スプライン を用いて可視化することができ、さらに、補間も間接的に接空間の正規直交基底 を提供する。 これらの方法は、対応点(ランドマーク)に基づくシーンの表現に相当一般的に応用 されている。また、特徴付けの形状の平滑曲線の付加情報にも拡張応用できる。 本論文では、現行のツールキットの三つ主要な特徴、基礎となる統計的と 幾何学的なモデル、及びその応用範囲(いくつかが既に実演され、いくつかが また構築中)をレビューする。これらのものは普通診療用と科学的研究用 のバイオ医学画像の付加情報内容にも適用される。 これらのツールに適する仕事は、Euclid相似変換或はせん断変換に耐えるシーン の標準化、グループ内またはグループ間の形状パターンの変形に関する検出、 判定、エンコーディング、または可視化などを含める。 数多くの従来の画像理解の問題に対するこの新しい方法が提供する最適なプロト コルは他のアプリケーション領域での適用も考えられる。
LXP
Copyright(c) 1997 Academic Press, Inc.
Takayuki Okatani and Koichiro Deguchi
Computer Vision and Image Understanding, Vol.66. No.2, May. pp.119-131.1997
本論文では、内視鏡画像から陰影に基づいて対象物の3次元形状を 再構成する方法について述べる。 ここでの主たる問題は、内視鏡の点光源が対象物の表面に近いことにある。 ところが既存のSFS技法の多くは、点光源が対象物の表面から離れ たところにあるものと仮定して、分析を簡略化している。 点光源が表面に近いという問題をうまく扱うために、内視鏡の以下の 構成を利用する。すなわち、内視鏡の点光源は、投影中心に仮の点光 源を置くことでよく近似されるというものである。 さらに、対象物表面の等距離輪郭という概念を導入する。 つまり、画像の陰影を利用して輪郭を伝播させることで、対象物形状 の再構成を行うのである。 これは、SFS の Kimmel-Bruckstein アルゴリズムの内視鏡画像への 拡張である。 胃壁についての現実の医用内視鏡画像に対する実験結果は、この方法 が実現可能であることを示すとともに、人間の内臓諸器官の腫瘍に対 するモルフォロジカル分析への利用が有望であることを示す。
Sz
Copyright(c) 1997 Academic Press, Inc.
Z.Sibel Goktepe Tari, Jayant Shah and Homer Pien
COMPUTER VISION AND IMAGE UNDERSTANDING Vol. 66, No. 2, May, pp. 133-146,1997
コンピュータビジョンの分野において、骨格表現は形状の表現とその顕著な 特徴を見つけ出す為に用いられてきた。 研究の初期の段階での試みは、モルフォロジカルなアプローチに基づいていた。 ここでのモルフォロジカルなアプローチでは 元の形状を連続的かつ一様に侵蝕して、骨格形状を得ていた。 このアプローチの最大の問題点はノイズに対する敏感さであり、 この問題を解決する為のいくつかの手法が提案されている。 本論文においては、スムージングによるノイズの拡散に基づき、高い頑強性で 骨格表現を抽出する新しい手法を提案する。 提案する手法では、骨格表現を得る処理の過程において骨格表現を部品に分 割した部分表現を同時に得ることが出来る。 本手法で形状を探索する際に持ちいる最も重要な道具は 「エッジ強度関数("edge-strength" function)」である。 エッジ強度の等高線は、モルフォロジカルな侵蝕の間に得られる連続した輪 郭線に対して、スムージング処理を行なったものと等価である。 新しい手法は曲線発展(curve evolution)の手法に密接に関連しているが、 それを上回るいくつかの利点がある。 一般的に制御方程式が線形の限りは、実装は容易で高速である。 そこで、新しい手法では同じ方程式を高次の問題に対しても適用する。 他の手法の多くと異なるのは、新しい手法は3差路の様な交差点に対しても 適用可能な点である。 さらに、新しい手法は輪郭上のギャップに対する頑強性も高い。 対象を多値画像とした場合、ノイズの多い多値画像からは「完全な」輪郭を 得ることは困難であるが、「完全」では無いにしても非常に重要な特徴を得 ることが出来る。 ここで重要なのは、対象が多値画像の場合には、輪郭を抽出すること無しで、 多値画像からエッジの強度が直接算出可能であるという点である。 つまり、本手法は多値文字画像に対して直接適用が可能な手法である。
mNt
Copyright(c) 1997 Academic Press, Inc.
M. Naf, G. Szekely, R. Kikinis, M. E. Shenton, 0. Kubler
Computer Vision and Image Understanding, Vol.66, No.2, May 1997
本論文では,大きく複雑な量子化3DデータのBlumスケルトン(中心軸)を生成する 方法について述べる. ここで提案する手法は,2次元形状にはよく適用されているボロノイ・スケルトンの コンセプトを3次元に適用したものである. 100,000点からなるような巨大なデータ集合に対して3Dボロノイ図を生成する アルゴリズムについて説明する. 刈り込み手法における落し穴と欠点について論ずる.そして,ボロノイ図の 結果を整形するのに,トポロジー的に正しい整形アルゴリズムを与える. MRデータから脳の白質部を検出するという巨大で複雑な解剖学的課題において, 合成データを生成し,提案手法を適用しその性能を調べた.
Copyright(c) 1997 Academic Press, Inc.
Petia Radeva, Amir A. Amini, and Jiantao Huang
Computer Vision and Image Understanding, Vol.66, No.2, pp.163-178, May, 1997.
今日まで,異なる断層画像からの MRI-SPAMM(磁化の空間的な動きの核磁気共 鳴画像) データは個々に解析されてきた. 本論文では,新たに考案した歪曲B立体(B-solid)によって,SPAMMデータの 三次元タグの位置決めと追跡の手法を提案する. B立体はBスプラインの三次元テンソル積によって定義される. Bスプライン立体のアイソパラメトリック曲線(isoparametric curve)は特 に重要である. これらは異なる画像にあるタグ線からの力を受けているように歪曲し,インプ リシットスネーク(implicit snake)と呼ばれる. タグ線の位置決めと追跡は,B立体の連続性となめらかさの制限のもとでなさ れる. 境界からの動きを追跡するためと心筋に対する力を制限するために,心外膜と 心内膜のBスプライン表面の組のように立体的モデルが採用される. 左心室(left ventricle)の歪みを回復するために,タグと左心室の境界デー タに対しエネルギー最小化問題が用いられる. この枠組は,短軸心臓画像からのタグデータ上で実行されたが,短軸左心室境 界だけでなく,現在長軸データを含むように拡張しているところである.
Copyright(c) 1997 Academic Press, Inc.
Alison Noble, Dale Wilson and Jean Ponce
Computer Vision and Image Understanding Vol. 66, No. 2, May, pp. 179-192, 1997
本論文では医療画像の解析と解釈への適用を前提として、 ボリューム画像データから物体のアスペクト・グラフを計算する際の 問題点について述べる。 解剖学上の(臓器の)表面は滑らかであると仮定されており、 3次元密度関数の0集合としてとらえられる。 (例えば、CT、MR、超音波画像) 正射影アスペクト・グラフは無限遠の観測球(view sphere)をvisual event(*) 曲線によって分けられた最大の領域に切り分けることによって構築される。 (* visual event:Kergosienによって定義さており、さらにlocal eventsと multilocal eventsに分られる。) これらのeventsは特異な接線に制御されている表面を持つ観測球の交わりであり、 その接線は臨界曲線の集合に沿った物体の表面に接している。 それぞれのvisual eventに対して、提案したアルゴリズムは 元の関数や、その導関数から新しい密度関数を構築する。 また、その新しい密度関数の0集合と共に、対応する臨界曲線を 物体の表面の交わりとして計算する。 臨界曲線が一旦追跡されると、対応するvisual eventsによって 輪郭を描かれた球の領域はセルへの分解を通して構築される。 そしてそれぞれの領域に対して、標本観察方向に対して遮蔽された輪郭を 計算することによって、代表的な表面を構築する。 提案した方法をインプリメントし、様々なデータや実際の医療データを 用いた実験について示す。 断面の画像の場合への拡張についても議論する。
Y.A.
Copyright(c) 1997 Academic Press, Inc.
J.Feldmar and J Declerck, G.Malandain, and N.Ayache
Computer Vision and Image Understanding Vol.66, No.2, May, pp.193-206, 1997
本論文では3次元医療画像に対する、輝度をベースとした、新しい レジストレーションおよび修正アルゴリズムを与える。 その基本的な考え方は、4次元の点(xj,yj,zj,ij)で画像を表現し、 この表現にもとづいた全体のエネルギー関数を定義するというもの である。 最小化のために、この評価関数をパラメータに関して微分して導関数を 計算する必要のない方法を提案する。 それはICP(Iterative Closest Point)アルゴリズムの拡張として、 あるいは L.Cohen により提案されたやり方(ICCV '95)の応用として 考えることができる。 2つのパラメータを用いると、解像度と変形の両方に対し、粗い方 から細かい方へという進み方ができる。 我々の方法には明快かつ全体的な評価関数を最小にするという利点がある ので、さまざまなタイプの変換(例えば剛体、アフィン、ボリューム スプライン、動径基底関数等)を扱うことができ、実装も簡単で、 現実に効果が高い。 実際の脳と心臓の3次元画像に対する結果から我々のアプローチの 妥当性を示す。 また、可能な変形の組を学習によって制限したり、異なるグループを 見分けるための変形パラメータに関する基本的な統計的性質を、人は どのようにして求めているのかについても説明する。
Copyright(c) 1997 Academic Press, Inc.
Christos Davatzikos
Computer Vision and Image Understanding Vol.66, No.2, May, pp.207-222, 1997
空間的変換と脳の断層撮影的な画像に対するアルゴリズムの発達は 計算機支援神経外科学,機能的画像解析,形態学など, 幾つかの臨床,基礎科学医学においてキーとなる事柄である. 本論文は弾力的に変形可能なモデルに基づいた 脳画像の空間的変換方法について述べる. deformable surfaceアルゴリズムは外側の皮質表面のパラメトリック表現 を見つけ,次に二つの脳画像において一致する皮質領域をマッピングする ために用いられる. このマップに基づいて,3次元的弾力的歪み変形を決定し, 二つの画像を登録する. この変形は画像を外部の力の場によって互いに変形登録する 不均等な弾力的物体としてモデルにする. 画像の弾性的特性は、領域毎に変化するが、そのため脳室のような、より 変形しやすい脳の領域が、より変形しにくい領域に比べて、自由に変形で きるようになっている。 最後に,prestrained 弾性の枠組みは構造的不規則モデルと,とくに 老化または病気,腫瘍の発達と共に発生するventricularの拡大に用いられる. 磁気共鳴画像を用いて性能測定を行う.
Copyright(c) 1997 Academic Press, Inc.
J.A.Little, D.L.G.Hill, and D.J.Hawkes
Computer Vision and Image Understanding Vol. 66, No. 2, May, pp.223-232, 1997
医用画像を登録するアルゴリズムは、画像中の物体を単一の剛体として扱うこ とが可能であることを常に仮定している。実際、患者のある部分は常に骨ばっ た構造を持ち剛体として動くかも知れないが、他の部分は変形するかも知れな い。このことに対応するために、画像中の同一と見なされる物体が剛体として 移動でき、残りの部分は滑らかに変形できるように扱える新しい方法を開発し た。
その変換は画像内の剛性の構造に基づいた距離変換を使用することによって修 正された極座標の基底関数に基づいている。これらの距離変換は画像の補間処 理を保証する根本の変換を形成するのにも使われる。この変形の技術はどのよ うな次元においても正しい結果が得られ、基底関数の選択が重要になる。本論 文では、このアルゴリズムをボランティアから集めた核磁気共鳴の画像と同じ ような2次元の実例の画像に適応し、その結果を示す。
M.T.
Copyright(c) 1997 Academic Press, Inc.
Wiro J, Niessen, Koen L. Vincken, Joachim A. Weickert, and Max A. Viergever
Computer Vision and Image Understanding, Vol.66, No.2, May, pp.223-245, 1997
画像を分割するためには、多重スケールでの情報を使うことが重要である。ハイ パースタック法(連結モデルをもとにした分割手法)では、スケール空間スタック の隣接したレベルの点を連結するために輝度を用いている。この方法は、線形多重 スケール表現への応用において、成功してきた。因果性基準と微分形式における半 群の性質という、2つのスケール空間の性質を満たす多重スケール表現も、正当な 入力となる。本論文では、線形スケール空間、勾配に依存した拡散、そして、 Euclidean shortening flow について考える。後者の2つの方法では大局的スケー ルパラメータが利用できないので、発展時間と情報理論的尺度をもとにして、そし て、物体の個数を数えることにより、スケールレベルを比較する。テスト画像とM R画像の分割性能によって、多重スケール表現を比較する。非線形表現により後処 理のステップの数が減るにもかかわらず、ハイパースタック法が、基盤となってい る多重スケール表現に対して、かなり安定していることが示される。
HN
Copyright(c) 1997 Academic Press, Inc.
B. A. Mair, Z Reti, D. C. Wilson, E. A. Geiser, and B. David
Computer Vision and Image Understanding Vol. 66, No. 2, May, pp.247-254, 1997
離散的ガウシアンが引き起こす画像のボケを修正する方法を提示する。 Jakobi-Ramanujanの古典定理に基づくこの方法は、ボケ修正の正確な数式を与え られることだけでなく、元画像と再構築された画像の一致度を評価する条件数と 誤差境界を与えることもできる。 ヤコビ三項積定理(Jakobi Triple Product Theorem)を用いることによって、 上述の数式を三つの無限級数の積に因数分解のに便利である。 これら三つの級数は、一個の定数、一個のToeplitz演算子、およびそれの 転置写像に対応する。 最終的に、この因数分解は、ある行列をいくつかのToeplitz行列の積に分解する ことになる。そこでのエントリーは簡単な再帰数式で計算できる。 選ばれたσに対して、条件数字はこれらの演算子のために計算される。 このように得られた結果はKimiaとZuckerが開発した方法の結果に似ている。
LXP
Copyright(c) 1997 Academic Press, Inc.Computer Vision and Image Understanding (Academic Press) Vol.66, No.3 |
Bang-Hwan Kim and Rae-Hong Park
Computer Vision and Image Understanding, Vol.66, No.3. June, pp.255-270,1997
本論文では、新しい反復型の SFS(shape from shading) アルゴリズムを 提案する。 この方法では、与えられた3次元表面はルジャンドル多項式によって 近似され、その表面と導関数の間の関係が多項式の係数ベクトルを用 いてマトリクス形式で表現される。 続いて、相対的深さとその導関数とが、係数ベクトルを更新することに よって反復的に計算される。 さらにまた、提案されるSFSアルゴリズムは、ステレオ光度測定 にも拡張される。 このステレオ光度測定アルゴリズムでは、まず反射率マップが線形化 され、4次マトリクス形式で表現されるコスト関数が最小化される。 ここでもまた、相対的な深さとその導関数とが、それらを反復的に更 新することで求められる。 提案されたSFSとステレオ光度測定アルゴリズムの性能は、3つの異なる エラー測度によって評価される。 すなわち、明度誤差、方向誤差、および高度誤差である。 さらに、既存のSFSアルゴリズムとの性能比較が示される。
Sz
Copyright(c) 1997 Academic Press, Inc.
Filiberto Pla and John A. Marchant
COMPUTER VISION AND IMAGE UNDERSTANDING Vol. 66, No. 3, June, pp. 271-285,1997 ARTICLE NO. IV960512
連続画像中において信頼性の高い対応点を求めるための階層的な手法を提案する。 本手法では、まず最初に連続的に分割した画像の境界の間におけるマッチング処 理を行なう。 つぎに、最初の処理でマッチした領域の特徴量間のマッチング処理を行なう。 ここで領域は、同じ領域内の特徴量についての構造的表現を提供する。 そして2つの対応領域の特徴量間のマッチングを行なうために、 関連木(relational graph)が作成される。 特徴量のマッチングは 「排他(exclusion)」「近接(proximity)」「厳格(rigidity)」の3つの原理に基づく 。 最大得票検出によるサブグラフマッチング技術の利用は 部分的な隠蔽やフレーム間における特徴量の消失を取り扱える手法を提供する。
mNt
Copyright(c) 1997 Academic Press, Inc.
K. Delibasis, P. E. Undrill, and G. G. Cameron
Computer Vision and Image Understanding, Vol.66, No.3, June 1997
超2次の変形を利用した解剖学的3Dデータのシンプルなモデル化と, 遺伝的アルゴリズム(GAs)を使用した位置最適化について以前報告した. 今回,その延長として,3Dフーリエ記述子(FD)表現による物体探索の 複雑さについて範囲を拡大し,物体の位置と形状の最適化をGAによって再度 行なう. 磁気共鳴画像データを使用して実験を行なった. 脳の側部空洞を抽出するのに,フーリエ記述子をGAのシード値 として使用した.7データセットにおいて,左右の側部空洞検出実験を行なった. 本方式が,通常の生物学的バリエーションをなぞらえることができることを 示す. 最後に,FD/GA方法と手動で対話的に領域生成する方法との比較を行なう. voxelのクラス分けにおいて78±10%の正解を得た.これは 2.2プラスマイナス0.4mmの平均エッジ位置誤りに相当する.
Copyright(c) 1997 Academic Press, Inc.
J. M. Lavest, C. Delherm, B. Peuchot, and N. Daucher
Computer Vision and Image Understanding, Vol.66, No.3, pp.301-315, June, 1997.
本論文では,ズームレンズ付き静止カメラを用いて三次元情報を推定するため の新しい手法を表す. この手法におけるモデル化アルゴリズムでは,較正モデルを前もって明らかに しておく必要はまったくなく,必要とされる計算も単純なものである. この方法は,較正の処理として,マイクロメーターテーブル上の規則正しい格 子の画像のいくつかを使用する. 基本的なアイデアは,CCDで検出した歪曲した格子とカメラの前に位置する 本来の格子との間の関係を立証できる局所変換を計算することである. この関係は,自動的に歪曲現象を考慮することとなり同じ分野での従来の研究 よりもはるかに正確な再構成の結果を得ることができるようになる. 実データにおける実験が与え,ズーム画像が近軸データであったとしても三次 元情報を計算できることを示す.
Copyright(c) 1997 Academic Press, Inc.
Stephane Marchand-Maillet and Yazid M. Sharaiha
Computer Vision and Image Understanding Vol. 66, No. 3, June, pp. 316-329, 1997
本論文では8近傍に基づいた離散的な幾何学における結果を16近傍に拡張する。 16近傍とはチェス盤距離(8近傍)が1の点とナイトの動く点の和集合である。 まず初めにグリッド上の最短経路で表現される8連結の弧と16連結の 弧の間のアナロジーについて述べる。 我々は16連結の弧を8連結の弧に一意にマップする変換について述べる。 (逆についても述べる) 実際の弧のグリッド交点量子化(GIQ)を16近傍を用いて定義する。 GIQによって16連結の直線を定義することができる。 それから2つの新しい距離関数を定義する。 これらの関数はメートル法の特性を満たし、拡張された隣接空間を記述できる。 これらの関数に基づいて、離散的な凸状と16連結の直線性に関する いくつかの新しい結果を述べる。 特に16連結の直線の凸状について示す。 さらに、16近傍空間においてデジタル的な直線を特徴づけるための 新しい特性を定義する。 8近傍空間との比較において、提案した16近傍のコーディングは 情報を全く失わずによりコンパクトな表現を提供する。
Y.A.
Copyright(c) 1997 Academic Press, Inc.
Angelo Marcelli, Natasha Likhareva, and Theo Pavlidis
Computer Vision and Image Understanding Vol.66, No.3, June, pp.330-346, 1997
本論文では、与えられたサンプルを識別する際に用いるプロトタイプ の数を減らすことにより文字認識処理の速度を向上させるための 構造的な手法を与える。 与えられたサンプルに最もよくマッチしそうなプロトタイプを選ぶ ために、文字形状の簡素化された記述を用い、大分類を行なう。 その記述は文字形状を表現するための多層的なデータ構造の中に 保存される。そのようなデータ構造における最も低いレベルには、 文字の骨格特徴の詳細が含まれる。 中間のレベルは各々が文字の部品を表現する特徴グループのリスト からなる。上位のレベルは最終的には、異なるタイプの上位特徴に 等しい次元をもつインデックスベクトルとなる。 このインデックスベクトルを用いることにより、マッチングの結果、 候補にあがると考えられるプロトタイプを速く正確に選ぶことが できる。 プロトタイプのサブセットが得られれば、骨格特徴にもとづくより 詳細な記述を要求し、メインの識別器が起動される。
実験の結果、本手法が有効で正確であることが示された。大分類で 選ばれるプロトタイプのサブセットにはつねに正解が含まれていたから、 システムの精度に影響を与えることなく識別時間を減らすことができる。
Copyright(c) 1997 Academic Press, Inc.
Computer Vision and Image Understanding (Academic Press) Vol.67, No.1 |
P.L.Palmer, J.Kittler, and M.Petrou
Computer Vision and Image Understanding Vol.67, No.1, July, pp.1-23, 1997
本論文では、ロバストな投票核を持つハフ変換アルゴリズムの 累算における、ピークの位置決めに対する最適化アルゴリズムを 与える。 累算におけるピークの位置決めによる精度についての詳細な議論を与え、 直線パラメータの推定に関する誤差範囲が、つねに最小2乗誤差以内に あることを示す。 これは投票核がロバストな性質をもつことに起因する。 直線群に対する標準パラメータ空間におけるピークの形が シヌソイド状の峰を持つから、最適化アルゴリズムをある程度 詳細に記述できる。 したがって通常のアプローチではうまくいかないが、実験結果をみれば、 ここで述べる方法がロバストであることがわかる。 後処理についてもいくらか議論されている。それによると 長い直線が近いパラメータを持ついくつかの直線に分かれてしまうという、 通常のハフ変換手法の欠点を矯正することができる。 また直線パラメータについて、その累算値にもとづく信頼度を用いる ことも考察しており、これが直線と直線に含まれるエッジ点との平均 2乗距離に関係することを示す。 最後に、様々な応用分野と思われる中から選んだ互いに異質な画像の組に ついて、このハフ変換の最適化によって得られる結果を与え、 この手法が広範囲に有効であることと、わすかな計算コストで よい精度が達成できることを示す。
Copyright(c) 1997 Academic Press, Inc.
IVAN BRICAULT AND OLIVIER MONGA
Computer Vision and Image Understanding Vol. 67, No. 1, July, pp. 24-38, 1997 ARTICLE NO. IV960501
本論文では,ボリューム医療画像より得られた3次元物体の形状から どのようにして信頼できる情報を抽出するか,について述べる. 物体表面の特性の差異を利用した領域最適拡大アルゴリズム (optimal region-growing algorithm)が提案され, 2次表面の patches 集合に分割することが安定的に可能になった. 最後に,認識および目的部分構造のグローバルな解剖学上への配置は この分割に基づいて行われる.
Copyright(c) 1997 Academic Press, Inc.
Daniel Lopresti and Jiangying Zhou
Computer Vision and Image Understanding Vol. 67, No. 1, July, pp.39-47, 1997
実験結果により1回のOCRで発生する誤りの20%から50%が単純に3度スキャニ ングしコンセンサスの連続投票を実行することで無くせることを示す。このテ クニックは分子生物学から生まれ、一般には指数関数的な処理時間が必要にな るが、重要なケースに最適になるように処理時間の速いヒューリスティックス に特化することが可能である。
認識の精度向上はOCRの誤りの分布についての事前の仮定を行なわないで達成さ れる。すなわちトレーニングを要求しない。
M.T.
Copyright(c) 1997 Academic Press, Inc.
Hagit Zabrodsky and Daphna Weinshall
Computer Vision and Image Understanding Vol. 67, No. 1, pp. 48-57, July 1997
これまでの応用では、物体の左右対称性は、認識のような分野での 記述的特徴、あるいは、運動からの構造推定の計算複雑度を減らす ための方法として使われていた。 本論文では、3次元復元の精度を改善するのに、左右対称性をどの ように使うことができるかを示す。 対称性の性質を、再構築の前後でデータを「対称化」するのに使う。 まず、ノイズを含むデータを与えられたときに、それにもっとも近 い、対称な2次元と3次元形状の計算法を示す。 これによって対称化の手続きが与えられ、それを復元の前に画像に 適用し、さらに、それを復元の後に3次元形状に適用する。実際の 画像に対して、かなりの改善が得られたことを示す。 合成、および、実際のデータを使って、復元の前後の対称化の利点 を示す。
HN
Copyright(c) 1997 Academic Press, Inc.
C. Chatterjee, V. P. Roychowdhury, and E. K. P. Chong
Computer Vision and Image Understanding Vol.67 No.1, July, pp.58-80, 1997
本研究では、カメラの較正問題の非線形構造について議論し、 非共面および共面の場合に対処できる新しくかつ 収束性が証明可能なアルゴリズムを提示する。 最適化理論の見地から、この非線形問題への我々の解決のため、次の特徴 を含めた。
(1) 初期化アルゴリズムでは、大域最小に近いおおよその解を 初期値として求める。
(2) 本体の推定方法では、ブロック・コンポーネントについて Gauss-Seidel 最適化手法を用い、パラメータ空間を分割する。
非共面の場合、固有レンズ変形のパラメータは 線形反復で計算され、或は、毎回の反復では閉じた形式をもって計算される。 非線形的な最適化は、三次元の縮小したパラメータ空間で行われる。 共面の場合、レンズ変形は線形反復で計算される。 上記いずれの場合でも、カメラベクトルの正規直交条件が満たされている。 このようにして、全パラメータについて非線型最適化を行うとき、 我々は線形的な方法の多くの利点を保ちつつ、最適な解を求めていく。
(3) このアルゴリズムについて、 Laypunovタイプの収束解析がなされた。
各反復において、目標関数の構造が解析される。 また、 共面の場合について、画像中心およびスケール要素のパラメータの 初期推測を求める新しい方法について議論する。 更に、 レンズ変形について、ラジアル (radial), 中心ハズレ (decentering), 及び薄いプリズム変形モデルを用いて考察した。
LXP
Copyright(c) 1997 Academic Press, Inc.
Aldo Laurentini
Computer Vision and Image Understanding Vol. 67, No. 1, July, pp.81-87, 1997
3D対象物(Oとする)の2Dシルエットは、対象物Oを次のように制限付ける。 すなわち、その容積内部は、始点からシルエットを逆射影 することにより得られるという制限である。 シルエットの集合は、容積Rの境界、すなわち各シルエット による容積の交わりを特定する。 3D対象物の再構成についてのこのアプローチは、容積交差(略してVI) と呼ばれる。 すべての凹状対象物Oが、そのシルエットから正確に再構成可能であるとは限らない 。 容積交差(VI)によって得られる対象物Oの最もよい近似は、 その視覚的な外殻である。 その視覚的な外殻と一致する対象物のみが、正確に再構成されうる。 実際には、対象物や視覚的な外殻を再構成するには、やはり計算量の 問題に直面せざるをえない。 本論文では、対象物再構成を可能とするのに必要なシルエットの 理論的な最小数を見つける問題について述べる。 一般に、表面に関して制限付けられた数nをもつ多面体の最適な再構成は、 無制限のシルエット数を取りうる。 多面体が、正確に再構成可能であるか、あるいは多面体状の視覚的外殻 を有するかのいずれかであり、視点がその多面体の凸閉包の内側にもあ る場合は、オーダーO(nS)のシルエットで十分であることを示し、 それらの視点を見つけるためのアルゴリズムを述べる。
Sz
Copyright(c) 1997 Academic Press, Inc.
TONY LINDEBERG AND MENG-XIANG LI
Computer Vision and Image Understanding Vol. 67, No. 1, July, pp. 88-98,1997 ARTICLE NO. IV960510
本稿では分割点を自動的に抽出し、分割されたエッジを 最短記述(minimum description lendth:MDL)で近似する手法を用いた エッジの分割と分類手法について述べる。 提案手法では、まず始めに 連結された注目領域と共に接合点候補を生成するマルチスケールの前処理において 接合点の候補を抽出する手法を用いる。 次に、これらの接合点の特徴は空間上の一致に基づいてエッジと組み合わされる。 得られたそれぞれの(接合点とエッジの)組について、接合点に最も近いエッジ 点に仮の分割点が導入され、 これら特徴の組はMDL近似法に入力される。 MDL近似法では仮分割点の妥当性を検討し、 各々の(分割された)エッジを「直線」と「曲線」に分類し、処理が終了する。 この手法の現実性は、実データにおけるデモンストレーションで確認されている。
mNt
Copyright(c) 1997 Academic Press, Inc.Computer Vision and Image Understanding (Academic Press) Vol.67, No.2 |
R. C. Agrawal, S. C. Sahasrabudhe, and R. K. Shevgaonkar
Computer Vision and Image Understanding Vol. 67, No.2, August, pp.99-111, 1997
コンピュータビジョンや画像処理の分野では,離散実景画像から シーンの特性を推量することが必要となる場合がままある. したがって,データがデジタイズされているという条件下で, 異なる種類の特性を取得することが重要となってくる. 本論文では,単純閉曲線のトポロジカルな特性がデジタイズによって受ける 影響について調べることで,各特性の保存される条件を求めることを 目的とする. 格子状のデジタイズについて考察を行ない, 有限数の極値を持つ単純な閉曲線において, トポロジカルな特性の保存のための格子空間上で上限が存在すること を示す. さらに,測度0の集合以外の全てのグリッド変換において特性が保存される.
Copyright(c) 1997 Academic Press, Inc.
J.Hsieh, H.M.Liao, K.Fan, M.Ko, and Y.Hung
Computer Vision and Image Understanding vol.67, No.2, pp.112-130, August 1997.
効率的な画像の記録について、エッジにもとづく新しい方法を提案する。 提案した方法は、ウェーブレット変換を用い記録の基礎となる特徴点を抽出する。 選ばれた各特徴点は、近傍の中でエッジらしさとしての値が最大となる点である。 直線近似モデルを用いて、すべての特徴点におけるエッジ方向が、変換画像のエッジ 出力から評価される。 部分的に重なりのある二つの画像間での方向のずれを評価するために、いわゆる“角 ヒストグラム”を計算する。 角ヒストグラムを用いて、二つの対象画像のずれの補正に使用可能な回転角を、ヒス トグラムの最大値に対応する角度を探索することで決定できる。 その回転角にもとづき、初期マッチングを実行できる。 実際のマッチング処理中に、正しく適合した組となり得るかどうか、前もって候補の 組をチェックする。 このチェックのため、相互相関を含む多くの不要な計算は、あらかじめ除くことがで きる。 したがって、正しく適合した組を得るための探索時間はかなり削減される。 最後に、正しく適合した特徴点の組にもとづいて、部分的に重なった画像間の変換が 決められる。 提案した方法は、ざっと10%のスケールの変動に耐性があり、画像の位置と方向の 制限がない。 さらに、選択された特徴点のすべてがエッジ点であるから、探索空間を削減でき、そ のぶんマッチング処理が高速化できる。 従来のアルゴリズムと比較して、提案した方法は画像記録問題における効率と信頼性 の点で大きな改善されている。
Copyright(c) 1997 Academic Press, Inc.
Ari Gross and Longin Jan Latecki
Computer Vision and Image Understanding Vol. 67, No. 2, August, pp. 131-142, 1997
デジタル直線を理解することは、以下の二つの部分を含む。 (i)与えられたデジタル集合がデジタル線分であるかどうかを決定すること、 すなわちR^2上に直線へデジタイズする本当の直線が存在するか (ii)与えられたデジタル線分にデジタイズする直線の空間を再現すること コンピュータビジョンやデジタル幾何の研究者によって広く研究されてきたが、 使用されてきた主なデジタイズモデルは物体の境界の量子化であり、 コンピュータビジョンにおいて現実的な知覚モデルではない。 本論文ではデジタイズされたエッジの現実的で数学的なモデルを与える。 そのモデルはぼかしと任意の閾値処理の両方を扱う。 我々は、幾つかの未知の閾値に対して得られた ぼけた半平面の閾値処理されたデジタル画像は、 物体の境界を量子化して得られたのと同じ傾きを持ち、 完全に焦点の合った半平面の画像と等しいことを示す。 この結果は以下のことを示す。 ぼけた半平面(その画像はいくつかの未知の閾値に対して得られる) の傾きを再現することは、物体境界の量子化において 完全に焦点の合った半平面の傾きの再現へと変換される。 それゆえに直線の再現の従来の結果やアルゴリズムは、 主に物体境界の量子化を前提としており、 もし我々がこのより現実的なデジタイズモデルを仮定しても有効である。
Y.A.
Copyright(c) 1997 Academic Press, Inc.
Kyoung Mu Lee and C.-C.Jay Kuo
Computer Vision and Image Understanding Vol.67, No.2, August, pp.143-160, 1997
従来のほとんどのSFS(shape from shading)アルゴリズムは、 問題を単純化するため、面の性質と撮像配置について3つの 基本的な仮定をおいて開発されてきた。すなわち、Lambertian面、 遠方点光源、そして正射影である。 本研究では、回折と鏡面反射の効果、および近接点光源と透視射影 を含む、物理ベースの一般化反射率地図モデルを導く。 そして、陰影付きの画像から形状を直接復元する新しいアルゴリズム を与える。 我々の解法の基本的なアイディアは、画像の照度方程式を三角形の 有限要素面モデルを用いて離散化し、その結果得られる非線形 方程式系を深さを示す変数だけで表し、非線形方程式を線形化して 2次のコスト関数を最小にすることによって、物体の形状を 復元することである。 1つ、あるいは複数の光度ステレオ画像について数値実験を行ない、 導出した物理ベースの反射率地図モデルと提案したSFSアルゴリズムの 性能を示す。
Copyright(c) 1997 Academic Press, Inc.
Daniel Crevier and Richard Lepage
Computer Vision and Image Understanding Vol. 67, No. 2, August, pp. 161-185, 1997 ARTICLE NO. IV960520
この10年間,エキスパートシステムシェルからエキスパートシステムへの 画像理解システムのソフトウェアの開発は研究の対象として大きな地位を占めている . 本論文ではこの分野を適切に,首尾一貫して概観する. 画像理解における明示的な知識表現の利点について述べた後, 2つの主な項目について取り組む. 画像理解の知識について数多くの研究がなされているが, まず最初に,これらの知識の特質を明らかにする. その結果,我々は7つのモジュールからなる知識分類を作り上げ, タスクドメインの知識からソフトウェアシステム利用についての 一般知識までの特殊性について整理した. 次に,研究者が様々な種類の知識をどのように表現しているかを調べた. 人工知能として知られるほとんどの知識表現は運用されており, それらの関連する長所についての議論がなされている.
Copyright(c) 1997 Academic Press, Inc.
Yuh-Lin Chang and J.K.Aggarwal
Computer Vision and Image Understanding Vol. 67, No. 2, August, pp.186-201, 1997
本論文は連続画像における2つの画像の線分のマッチングに関する問題を扱う。 知覚できるグルーピングと特徴マッチング過程とを統合するために弛緩ラベリ ングを用いる新しいアルゴリズムを提案する。
時間的なグルーピング過程として2つの画像の特徴マッチングと、それに加え て1つの画像の中の知覚できるものとして良く用いられる空間的なグルーピン グを考える。弛緩ラベリングでは1番目の画像の線と2番目の画像の複数の候 補とマッチングし比較する。対応付けの曖昧さは繰り返し線の回りの束縛条件 を伝搬することで解決する。この線の回りの範囲は知覚できるグループによっ て定義される。
この研究の応用は動く物体の検出、画像の登録、動くロボットのナビゲーショ ン、動きからの3次元構造抽出がある。本論文では新しいアルゴリズムを論じ、 性能解析と実際の連続画像での実験結果を示す。
M.T.
Copyright(c) 1997 Academic Press, Inc.
Zhengyou Zhang
Computer Vision and Image Understanding Vol. 67, No. 2, pp. 202-204, August 1997
点と線をもとにした運動からの構造推定の線形アルゴリズムで使われ ているSpetsakis-Aloimonos の三重線形制約に対して、より強い下界 を与える。線形アルゴリズムでは、3枚の画像の間での点対応に対し て、「3つ」だけの独立な方程式が利用できることが主張されていた。 ここでは、実は、「4つ」の独立な方程式が存在することを示す。 これにより、線形アルゴリズムで必要な点の最小個数は「9」ではな く「7」であるという重要な結果が得られる。
HN
Copyright(c) 1997 Academic Press, Inc.Computer Vision and Image Understanding (Academic Press) Vol.67, No.3 |
Tanveer Fathima Syeda-Mahmood
Computer Vision and Image Understanding Vol.67 No.3, September, pp.205-222, 1997
モデルに基づく物体認識の主要な問題の一つは、選択である。 つまり、画像の中にある単一物体らしいのものによって形成 されている領域の孤立化問題である。 この孤立化問題は画像データのみに基づいて解決できるし(データ駆動型)、 このモデル物体に関する知識を取り入れて解決することもできる(モデル 駆動型)。 本稿では、物体の線の間の近接平行 ( closely spaced parallelism ) の性質を考察し、データ駆動とモデル駆動選択を行うアプローチを 提示する。 特に、次の方法を提示する。この方法は、複数の画像中の近接平行線の グループを特定する。これにより、小サイズかつ信頼できるグループの 線形的ナンバーを生成し、認識のためのグルーピング・スキームに 必要な幾つかの要求を満たせる。 このように生成された線のグループはデータ駆動型とモデル駆動型の 選択の基礎を形成する。 データ駆動型選択は突出尺度の判別で突出線のグループ を選択し、単一物体の間の相似の度合いを強調する。 一方、モデル駆動型選択では、モデル物体の近接平行線のグループに関する 記述を用いている。この記述はモデル物体の近接平行線のグループを 幾つかの許容された変形を持つモデルグループの射影と見なし、 閉塞 ( occlusions) , イルミネーション変化, 及び 成像エラー ( imaging errors ) を考慮に入れる。 次に、線のグループに基づく選択の有用性について、認識に関わる検索 作業の軽減の観点から議論する。これは独立した選択メカニズムとしても、 または、他の手がかり(例えばカラー)と結合しても使用できる。 最後に、平行線のグループに基づく選択を取り入れたある認識システム の性能改善を示す実験結果を提示する。
LXP
Copyright(c) 1997 Academic Press, Inc.
Jose Santos-Victor and Giulio Sandini
Computer Vision and Image Understanding Vol. 67, No. 3, September, pp.223-238, 1997
本稿では、モバイル・ロボティクスにおけるドッキング操作のための、 視覚に基づくふるまいについて述べる。 二つの異なる状況が提示される。 ひとつは、自己(ego)ドッキングであり、これは各ロボットにカメラを装備し、 その動きが表面へのドッキング時に制御されるというものである。 いっぽう、エコ(eco)ドッキングでは、カメラおよび必要な計算資源のすべてが 単一の外部ドッキング・ステーションに置かれる。ステーションは、複数の ロボットを扱いうる。 いずれの状況においてもゴールは同じであり、方向を制御してカメラの光学軸 を面の法線に合わせることと、接近速度(動作中に遅くなる)を制御する ことである。 これらのゴールは、環境の3次元的な再構成にいかなる労力をもかけず、 しかも位置決め補正の必要性なしに成し遂げられるのであり、この点で 従来のアプローチとは対照的である。 その代わりとして、モバイルロボットの制御ループを閉じるために、複数の画像 測度が直接に使われる。 提案アプローチにおいて、ロボットの動きは時空間画像の一次導関数 によって直接に駆動される。これは頑強かつ高速に推定されうる。 ドッキングシステムは実時間で動き、その性能はいずれのドッキング パラダイム(エゴおよびエコ)においても頑強である。 実験についても述べる。
Sz
Copyright(c) 1997 Academic Press, Inc.
Sven J. Dickinson, Henrik I. Christensen, John K. Tsotsos and Goran Olofsson
Computer Vision and Image Understanding Vol. 67, No. 3, September, pp. 239-260,1997 ARTICLE NO. IV960532
平面画像中の立体の探索に関する注目点制御の仕組みと、 物体の特徴を曖昧さを除いて復元するための視点制御方式 を結合して能動的に物体を認識する手法について提案する。 注目点を定める仕組みは、 予期される特徴の観測方法を階層化して確率的探索を行なう手法と、 輪郭の形状に応じて分類された領域の組に物体を分類する手法により構成される。 我々は画像の領域を焦点特徴として用いることに興味を持ち、 オブジェクトの推量における不確実性と 線分や角などのより一般的に用いられている特徴の不確実性を比較した。 注目の局面において、探索している立体に関して単一の位置が得られない間でも、 特徴が復元される場合には、確率的特徴階層を用いてカメラを立体の曖昧さを除 ける新しい視点に導くことが出来る。 基礎表現を用いることで、 これら物体認識の振舞いを1つの枠組で統一出来る。 論文中では手法について詳細に説明し、 その性能を身体障害者補助装置を供給するプロジェクトの観点から評価した。
mNt
Copyright(c) 1997 Academic Press, Inc.
Dominique Attali
Computer Vision and Image Understanding Vol. 67, No.3, September, pp.261-273, 1997
スケルトンは対象物の代用的そして細線化した表現であり,形状記述 に役立つ. 外郭点のボロノイ図を使用して連続形状のスケルトンを近似する方法が 最近複数の論文で提案されている. ここでは,オリジナルな公式化を示す.それはポリボール(ポリボールとは 有限なボールの合体である)を使用した表記である. このスケルトンは,単純な要素(2次元では線素であり,3次元では ポリゴンである)により構成されることが予備実験で示される. 3次元の連続スケルトンの効果的な単純化方法も示す. 我々の方法の新規性は,トポロジーを変更せずに形状を単純化することと スケルトンにおいてその変更を含むことである. 異なる要求に対処できるように,表面スケルトンとワイヤーフレームスケルトンの それぞれを求める方法を提案する. 提案した2つの角基準によって,サイズに依存しない単純化スケルトンの 階層が構築できる.
Copyright(c) 1997 Academic Press, Inc.
S.Udomkesmalee, D.Q.Zhu, and C.Chu
Computer Vision and Image Understanding vol.67, No.3, pp.274-284, September 1997.
惑星の縁や日なたの明るい部分と陰の暗い部分との境界を抽出するための新しい画像 処理テクニックを提案する。 従来のエッジにもとづくヒストグラムによる方法は、境界線追跡を用いていた。 縁と明暗境界線との分かれ目は、二次元の媒介変数表示された境界線を表す二つの式 が、一致する部分を特定することでなされていた。 このテクニックは、かなり効率的でロバストである。 満月状の円形(円形に近い)惑星像のみで詳しく述べられていたが、提案した手法で は、部分的かつ/または任意の形の像に拡張可能である。 これらの場合に関する公式が与えられる。 代表的なテストの例として、ボイジャー1号、2号からの実際の惑星画像により、提 案した方法の有効性を示す。
Copyright(c) 1997 Academic Press, Inc.
OLTVIER MONGA, NASSER ARMANDE, AND PHILIPPE MONTESINOS
Computer Vision and Image Understanding Vol. 67, No. 3, September, pp. 285-295, 1997
本論文では多値画像においてTNを抽出する新しい方法について述べる。 我々の方法のキーポイントはTNを画像の表面の尾根線として モデル化することである。 尾根線とは、曲率の最大値が対応する主要な方向において極大になる線である。 我々はこれらの線を画像の第1、第2、第3派生を用いて定義する。 これらの画像の派生はガウシアンフィルターとその派生を近似する再帰的な フィルターを用いて計算される。 適応的なスケールファクターを用いて、この方法を衛星写真中の道路、 医療画像中の血管、人の顔画像からの尾根線の抽出に適用した。
Y.A.
Copyright(c) 1997 Academic Press, Inc.
Sing Bing Kang, Richard Szeliski and Heung-Yeung Shum
Computer Vision and Image Understanding Vol.67, No.3, September, pp.296-310, 1997
本論文では大規模な画像系列に対する特徴追跡器を与える。それは 隣り合う画像小領域の集まりの運動と変形を同時に推定すること をもとにしている。 共通の角ノードを共有することにより、小領域を独立に追跡する のに比べて、それらの安定性が高くなる。 またすべての双線形な変形をモデル化することで、平行移動で ない運動や遠近法的な縮小効果をたくさん持つような系列の追跡が 可能になる。 実験結果を使って、我々の方法が従来のアルゴリズムに比べて すぐれていることを示す。
Copyright(c) 1997 Academic Press, Inc.
BjOrn Lillekjendlie
Computer Vision and Image Understanding Vol. 67, No. 3, September, pp. 311-317, 1997 ARTICLE NO. IV960529
本論文では2次元空間中の点の集合に対し,円をフィッティングする方法 について述べる. 本方法では, 3次元 Riemann sphere に対する2次元空間中の点の円上へのマッピングに ステレオグラフィック投影を利用する. 次に,変換された点に平面をフィッティングし, 特定された平面のパラメータから 求められた円に対するパラメータを決定する. この方法は直接的であり, 評価に1階の正確さの偏りがないことが示されている. 最良の結果が得られるのは, 円が単位半径で,中心が元の点と同じ場合である. この場合,本手法は2階の偏りがなく, 人工的なデータを用いた実験により本手法は 実用において偏りがないことが示される. さらに,単位半径,元の点と同じ中心はさほど厳密に必要と されないことがシミュレーションにより示される. 現実的なノイズレベルで 円弧は下限45゜まで評価された. 他の3手法との比較を行った結果, 正確さ,計算コストにおいてたの手法よりも優れていることがわかった.
Copyright(c) 1997 Academic Press, Inc.
Computer Vision and Image Understanding (Academic Press) Vol.68, No.1 |
Farzin Mokhtarian
Computer Vision and Image Understanding, Vol.68, No.1, October pp.1-17,1997
空間曲線が3D表面と物体の表現に有用であることが論じられる。 本論文は、空間曲線を表現するために、ねじれ尺度空間 (torsion scale space, TSS ) という多重尺度な形状表現を導入する。 実験により、この表現がいかなる尺度・方向においても、雑音のある曲線の 識別にロバスト(頑丈)かつ適切であることが示される。 この方法は、不変な幾何的特徴を用いて様々な変化レベルで曲線を記述する、 という考え方に基づいている。 この表現の計算に異なる3種類の方法があり、それぞれに異なった特性を もつことが述べられる。 マッチングアルゴリズムは、TSSマッチングとそれに続く変換パラメータ 最適化の2段階からるが、これは識別タスクにおける表現にとって有用である。 抽象レベルを増しながら曲線を記述する過程を、曲線の進化と呼ぶことにする。 空間曲線の進化特性のいくつかが、本論文で述べられる。 同時に、これらの結果は、ここで導入された表現方法の正確な理論的基礎を 与える。
LXP
Copyright(c) 1997 Academic Press, Inc.
G. Csurka, C. Zeller, ZY Zhang, and O.D. Faugeras
Computer Vision and Image Understanding, Vol.68, No.1, October pp.18-36,1997
本論文で扱うのは、基本行列の不確実性の分析についてである。 基本的なアイディアは、基本行列とその不確実性とを同時に計算する というものである。 我々は二つの異なる方法を提示する。 一番目は統計的なアプローチである。 すべての統計的手法と同じように、結果の精度は分析されたサンプルの数に 依存する。 つまり、サンプルの数を増やすことによって結果を常に改善できる。 しかしながら、このやり方は非常に時間がかかる。 代替案として、我々はこの統計的手法の結果に近い分析結果が得られる 非常に簡単な手法を提案する。 合成データと実データとを用いた実験が、提案方法の有効性を検証する ために行われた。 最後に、推定された基本行列の不確実性の三つの用途を提示する。つまり、 ステレオマッチングのためのepipolar bandの定義、投影的な再構築、 および自己較正である。
LXP
Copyright(c) 1997 Academic Press, Inc.
C.R. Rothwell, O. Faugeras, and G Csurka
Computer Vision and Image Understanding, Vol.68, No.1, October pp.37-58,1997
最近、非較正ステレオを処理するためのいくつかの異なるアプローチ が提案されている。それらは、複数のビューから投影的な再構築を可 能とするものである。 これらを使用するとエピポーラ幾何によって表現される較正が弱まるため、 カメラの固有/非固有パラメータについての知識は不要である。 本論文では、我々がビュー組からの投影的な再構築について考え、いくつかの 方法と比較する。 投影的なステレオアルゴリズムは、3D座標の計算の仕方によって分類されうる。 一番目のクラスは、3D世界の幾何が陽的であるという意味で、 従来からのステレオアルゴリズムに似ている。 つまり、プロセスの初期段階には3D座標を計算するためのカメラ マトリックスの推定作業を常に含んでいる。 我々は、カメラマトリックスの計算に関し、それがどのように点対応 から計算されるか、あるいはいかに基本マトリックスの制約を受ける かについて示す。 アルゴリズムの二番目のクラスは、画像の陰的な測度に基づいている。 この測度は、画像の対応関係から投影的な不変性を計算するのに用いられる。 これらの不変量はケーリー代数と交差比率に基づくものである。 これらのすべての場合、不変量は3D座標の関数である。 我々は、ある範囲の意味のある合成/実画像を用いて、これら異なる方法の 安定性について報告する。 これらの議論から、我々は3Dの非較正的な再構築に依存する応用 において、どの方法が一番有効であるかについて結論付けることが できる。
LXP
Copyright(c) 1997 Academic Press, Inc.
Hirobumi Nishida
Computer Vision and Image Understanding, Vol.68, No.1, October pp.59-71,1997
手書き認識のような複雑な問題に取り組むにあたって、解析と合成の組み合わせは 強力な方法である。手書き文字の変形パターンの合成方法がいくつか提案されてい るが、既存の方法は、(1) 多様なパターンの合成のために、多くの標準・初期形状 を指定する必要がある、(2) 複雑な曲線構造を持つ形状を取り扱うことができない 、というような問題がある。一方で、手書き文字の複雑な変形に対処するためには 、形状記述とマッチングにおいて、構造記述と幾何・統計的情報の統合が強力であ ることが示されている。このアイディアをパターン合成に応用して、形状の構造記 述と曲線生成方法を組み合わせた、変形パターンの合成アルゴリズムを示す。いく つかの種類の情報を統合した高いレベルの特徴による形状モデル(クラス記述)に もとづいて、画像変換の単純な方法に依存したり、標準・初期パターンを指定した りせずに、構造・統計・幾何的変形を取り入れた多様なパターンを合成できる。パ ターン合成のいくつかの例と実験結果を示し、合成パターンを使った手書き数字認 識の結果を示すとともに、その結果を実際のデータの認識と比較する。
HN
Copyright(c) 1997 Academic Press, Inc.
Kyujin Cho and Peter Meer
Computer Vision and Image Understanding, Vol.68, No.1, October pp.72-89,1997
本論文では、画像分割の新しいアプローチを提案する。 同一の入力を元にわずかに異なる画像分割結果の集合が求められ、最終結果は それらのコンセンサス情報に基づいて求められる。 ここでは摂動を導入する。それは、領域隣接グラフをピラミッド状に 分割する際の確率的構成要素を用いることでなされる。 初期分割の集合から共起確率場が求められる。そこでは、描かれた 領域に関する大局的な情報が、局所的にも利用可能となる。 最終的な分割結果は、この場に基づいており、領域隣接グラフのピラミッド 技法と同じように階層的な技法を用いて求められる。 ユーザが設定すべきいかなるパラメータもなく、内容に依存するしきい値 も不要である。
LXP
Copyright(c) 1997 Academic Press, Inc.
A.K. Das and N.A. Langrana
Computer Vision and Image Understanding, Vol.68, No.1, October pp.90-108,1997
現存するCADシステムには利点があるが、それを 従来の製図方法を用いて手動で作られた大量の設計図面に利用する ことはできない。 そのため、 このような図面をスキャンし、現存するCADシステムで認識できる CADファイルに変換できるような自動システムが、切実に望まれている。 この変換過程で重要な要素は、寸法情報の自動認識・理解である。 寸法情報というのは、図面にある様々の存在物の正確な寸法と位置 とを示すのに用いられている。 本論文で論じるのは、 図面のベクトル化画像から寸法(の集合)を認識し、 その寸法集合と幾何的情報との間の局所関係を求めることを目的として 開発されたシステムについてである。 認識された寸法集合はまた、対象物の幾何的情報と統合される。 このとき、前処理でもたらされた誤りを修正するために、 変動幾何的アプローチが用いられる。 このようなプロセスを経て得られた図面は、2種類の情報を含んでいる。 一つは基本となる幾何的実体に関する正確なベクトル化表現であり、 もう一つは寸法駆動型のCADシステムで利用可能な寸法集合のベクト ル化表現である。
LXP
Copyright(c) 1997 Academic Press, Inc.
Y.H. Lee, S.J. Horng, T.W. Kao, and y.J. Chen
Computer Vision and Image Understanding, Vol.68, No.1, October pp.109-119,1997
距離変換とは次のような変換操作のことである。 つまり、白・黒の画素からなる画像を他の画像に変換するにあたり、 変換後の各画素が最も近い黒画素までの距離(あるいは位置)を表す 値(あるいは座標)をもつようにする変換である。 これは、画像処理とコンピュータ・ビジョン分野の基本的操作の一つであり、 膨張、収縮、細線化、分割、クラスタリング、形状計算、物体再構築などに 用いられている。 近似的なユークリッド距離変換アルゴリズムは、数多く文献に見られるが、 ユークリッド測度に関して距離変換を求めるのは、とても時間がかかる。 だから、計算速度を高めることが重要となる。 本論文で論じられる並列アルゴリズムは、N x N 二値画像のすべての画素の 黒画素に対する正確なユークリッド距離変換を計算するためのものである。 本論文の目的は、時間最適なアルゴリズムを開発することである。 メッシュ木とハイパーキューブ・コンピュータの両方にとって、 O(log N)の時間最適なアルゴリズムを提案する。 この問題の解決に、前者に使われるプロセッサの数は N x N x N/log N であり、 後者には N^2.5 である。 圧縮されたメッシュ木用に一般化されたアルゴリズムをも提案する。 このアルゴリズムは N x N x N/m log N 個のプロセッサを用いて O(m log N) 回で 計算できる。但し、 m は 1 <= m <= sqrt(N)/log N のような定数である。 前の結果と比べ、一般化されたアルゴリズムの時間計算量は m 回因子に 用いられるプロセッサの数に反比例している。
LXP
Copyright(c) 1997 Academic Press, Inc.
C.K.I. Williams, M. Revow, and G.E. Hinton
Computer Vision and Image Understanding, Vol.68, No.1, October pp.120-126,1997
変形モデルは、手書き文字のようにクラス内変形に富んだ対象の認識にとって 魅力的なアプローチである。 しかしながら、このモデルをデータに当てはめるには、いくつかの探索問題が 伴う。よい探索開始点が得られるならば、探索の作業は減少できる。 入力画像から変形モデルの実例化をいかに予測するかをニューラルネット に学習させるならば、上記のようなよりよい探索開始点が得られることを示す。 この方法は、変形可能なモデルを用いて手書き数字を認識するシステムに 実現されている。そこで、認識性能を犠牲することなく探索時間を大幅に 削減できるという結果を得た。
LXP
Copyright(c) 1997 Academic Press, Inc.Computer Vision and Image Understanding (Academic Press) Vol.68, No.2 |
Noshir A.Langrana, Yuan Chen, and Atish K.Das
Computer Vision and Image Understanding Vol.68, No.2, November, pp.127-145, 1997
スキャンされた設計図面をベクトル化したものから、2D幾何学的特徴を 同定するアルゴリズムを開発した。 基本的にはパターンマッチング・プロセスであり、ベクトル化された図面 に存在するものが、特定のパターン・プリミティブと照合される。 ある存在物に含まれるパターン・プリミティブは、その存在物全体の方向 と比較される。これは、存在する2D特徴に達するまで続けられる。 比較のため、2D幾何学的特徴のライブラリーが開発された。 3D再構成と特徴認識のために、まず分離参照点が検出される。 これにより存在物が上部面、前面、右側面といったそれぞれのビューに グループ化される。 さらにこの分離参照点を用いて、3つの直交するビューに属している点 (これは2D座標系で表現される)が3D座標系に変換される。 2D特徴の認識アルゴリズムが3つのビューのそれぞれに適用される。 各ビューで認識された2D特徴は、マッチング・プリミティブとマッ チング規則の集合に基づいて結合される。これは、対象にある3D特 徴へと向かう。 認識されうる3D特徴は、線形スイープあるいは回転スイープであり、 太さが一様であるものである。
Sz
Copyright(c) 1997 Academic Press, Inc.
Richard I. Hartley
Computer Vision and Image Understanding Vol.68, No.2, November, pp.146-157, 1997
本論文では、較正と姿勢とが既知であるカメラで撮られた2枚の画像に おいて、あらかじめ位置が与えられた点に関し、その点の空間上 での位置を検出する問題について考える。 このプロセスは、空間上の2つの既知光線の交差を要するものであり、 一般には三角形分割として知られている。 ノイズがない場合は、この問題は自明である。 ノイズがある場合は、2つの光線は一般に交わることはなく、そのため に交差の最適点を検出する必要がある。 この問題は、対象物空間に関して意味のある測量情報が存在しない場合 の再構成(アフィン的で射影的)において、特にきわどいものとなる。 望むらくは、空間の射影変換に不変であるような三角形分割方法を見つ けることであろう。 本論文では、上記の問題を解くために、画像座標系の摂動に対するガウ シアン・ノイズモデルを仮定する。 そうすると、三角形分割の問題は2乗誤差最小化の問題に定式化される ことになる。 本稿で述べる方法は、繰り返しを用いずに大局的な最小解の探索を行う。 通常であれば極小解が発生するような特定の配置に対して、新しい方 法を用いるとそれが避けられることを示す。 この方法を幾つかの他の方法と大規模に比較したところ、一貫して前 者の方が優れた結果を示している。
Sz
Copyright(c) 1997 Academic Press, Inc.
Konstantinos Daniilidis
Computer Vision and Image Understanding Vol.68, No.2, November, pp.158-169, 1997
固定化(fixation)は、環境上の同一点に向かう視線方向を時間を通じて 保つこと、と定義される。 過去に示されたことによれば、固定化は、受動的な視覚ナビゲーションに おける未知数を5から4へと減ずることが知られている。 本稿では、固定化によって3Dの動き推定がよりいっそう簡略化されるこ とを示す。というのは、動きパラメータ空間が緩和されるからである。 ここでは、画像球の二つの異なる極に関する球状の動き場を、二つの緯度 方向に射影する。 第一の射影により、変位の方向とねじれに関する経度の計算が可能となる。 第二の射影から得られるのは、固定化された情景点の不一致となる時間と、 これに加えて固定の方向と変位との間の角度とである。 いずれの射影の計算ステップも、画像球の子午線に沿った1次元探索に基 づいている。 観測者は、自由度6のすべてに関する移動が可能である。 カメラの固定化された回転のコピーを用いることはない。 このアルゴリズムの性能は、オフラインでなされた固定化、あるいは 能動的カメラを用いた記録時の固定のいずれかを伴う実世界系列に対 して試すことで調べられる。 固定化の長所についての多くの理論があるが、それらを包括的にレビュー することで、それらと我々のアプローチとの差異が明確になる。
Sz
Copyright(c) 1997 Academic Press, Inc.
Gregory Dudek and John K. Tsotsos
Computer Vision and Image Understanding Vol.68, No.2, November, pp.170-189, 1997
ここで提案する技法は、対象物の形状表現と認識を対象としている。 この技法は、多重解像度の曲率情報に基づいている。 これは、3次元空間の面/平面曲線についての分解/認識のための 一つの枠組みを与える。 分解操作と同時にデータ内挿、データ平滑化およびセグメンテーション がなされる。 これらの3つのステージが統一されて平滑化操作となり、 記述で用いられるプリミティブと結合される。 曲率調整に加えて、 最小化オペレータのそれぞれもまた異なる空間感度機能をもつ。 その結果、異なる可能な記述は、多重空間解像度において情報を捉える。 これによって、対象物の一つの領域が、適切ならば一つ以上の方法で記述さ れうるようになる。 結果として得られる表現の実用性は、平面曲線の認識によって示される。 マッチング戦略としては、DP(動的計画法)が用いられる。 類似対象物の連続スペクトラムが ターゲットにとても類似したものから非常に異なるものまでを対象に、 定義される様子が示される。
Sz
Copyright(c) 1997 Academic Press, Inc.
Horace H.S.Ip and W.H.Wong
Computer Vision and Image Understanding Vol.68, No.2, November, pp.190-208, 1997
我々が導出した定理は、連続空間における平行な曲線の検出に関する ものである。 本稿では、連続なアルゴリズムを離散化する問題について研究し、 さらに人間の平行性認識につながる認知的な特徴についても研究 する。 これらの特性はいくつかの特有な力という観点から定式化される。 この定式化により力駆動型モデルが作られるが、このモデルは、 曲線マッチングにおける点間の対応確定を実行するための新しい 最適化戦略となる。 この力駆動型メカニズムは、よい結合(対応付けマッチング)結果を与える。 その結果というのは、曲線間の平行性の正確な検出にとっての必要条件である。 アルゴリズムの収束性と実現時の効率性についても調べ、論ずる。 実験は、これらの力の相対的重み付けについてなされた。その結果は、 人間の視覚系に課される認知上の優先度を解明するのに役立つ。
Sz
Copyright(c) 1997 Academic Press, Inc.
C.P.Lam, S.Venkatesh, and G.A.W.West
Computer Vision and Image Understanding Vol.68, No.2, November, pp.209-236, 1997
本稿で提案するのは、濃淡画像から得られる対象物の形状と最終的には その機能とを決定する方法である。 ここでは2D解析関数を用いて、既知カメラ動作の合間に3D特徴を 追跡する。 3つの解析関数が提案される。 それらは、点間の関係を記述するのだが、対象となる点は変化がないも のであるか、あるいは隠蔽された境界上にあるかどうかに依存して 動くものかのいずれかである。 対応付け問題の多くを簡略化する方法として、foveation 、既知カメラ動作、 能動的ビジョン法がある。 ここで示されるのは、3つの解析関数を用いると、形状に関する すべての3D情報を用いずともいくつかの3D対象物の機能に関す る仮説を詳細化しうるということである。
Sz
Copyright(c) 1997 Academic Press, Inc.
G.Sudhir, Subhashis Banerjee, and Andrew Zisserman
Computer Vision and Image Understanding Vol.68, No.2, November, pp.237-246, 1997
本稿で述べるのは、3D対象物が非剛体的(アフィン)動作をし、画像 が時間軸に沿って変化するときの系列における点対応計算の問題につい てである。 ここでは、アフィン射影を経て画像が得られるものと仮定する。 対応付けは、対象物の未知3Dアフィン構造の分析によってのみ確立さ れるのであり、特徴点の他のいかなる属性をも用いることはない。 それらは、対象物のユニークなアフィン構造を生み、しかも計算は多項式 時間で可能であるという意味で、点の対応付けを一意に(対象まで)確立 できるということが示される。 点の対応付けを計算する2つの異なるアルゴリズムについて述べられる。 実験結果は、様々な実画像系列を対象としたものであり、なかには独立に 動く対象物を含むものもある。その結果により、動き対応付け問題に対し、 構造ベースのアプローチを応用できることが示される。
Sz
Copyright(c) 1997 Academic Press, Inc.
Guillermo Sapiro
Computer Vision and Image Understanding Vol.68, No.2, November, pp.247-253, 1997
本稿では、ベクトル値画像の対象物切り出しに関する一つの枠組みに ついて述べる。 提案される第一のスキームは、幾何学的な能動的輪郭に基づいており、 これがベクトル値画像において検出されるべき対象物に向かって動く というものである。 対象物の境界は geodesics すなわち最小の重み付き距離を持つ曲線 として求められる。このときの測度は、ベクトル値データのエッジ の定義により与えられる。 提案される能動的輪郭に対応する曲線フローは、形式的な存在性、一意性、 安定性を保持し、正確な結果をもたらす。 このスキーマは、曲線位相の変形に伴う変化を自動的に扱うものである。 この技法は、多重解像度表現のみならず、たとえば、カラー/テクスチャー 画像にも適用することが可能である。 さらに、ベクトル値画像を切り出すための画像フローを提案することで、 ベクトル能動的輪郭を拡張する。 このアルゴリズムは、 画像レベル集合の各々を、提案されたベクトル能動的輪郭に沿って動かす ことに基づいている。 この拡張はまた、能動的輪郭といくつかの偏微分方程式に基づく画像処理 アルゴリズムとの関係が、等方性拡散と衝撃フィルタの関係にあることを 示す。
Sz
Copyright(c) 1997 Academic Press, Inc.Computer Vision and Image Understanding (Academic Press) Vol.68, No.3 |
A. Ray Chaudhuri, B.B.Chaudhuri, and S.K.Parui
COMPUTER VISION AND IMAGE UNDERSTANDING Vol. 68, No. 3, December, pp. 257-275,1997 ARTICLE NO. IV970550
ドットパターンの外形を定義する新しい手法を提案する。 また、その手法を用いることで、 ドットセットに対する直観的な輪郭を得ることが出来る。 本手法は s-shape と呼ばれる新しい定義に基づいており、 s-shape はデータ駆動型の手続きで生成される。 s-shape では階段状の疑似輪郭が生成される。 多角形の輪郭を得るためには、r-shape が定義される。 r-shape で用いるパラメータ r は s-shape のパラメータ s から算出される。 本手法のもっとも大きな利点は、 n 画素のドットパターンに対する計算量が O(n) と少ないことである。
本手法は大きく分けて3つのステップから構成される。 (1)与えられたドットセットから適切な s(および r)を選択する (2)r-shape を生成する (3)辻褄の合わない部分を r-shape から削除する r-shape のエッジから矛盾なく構成される図形は、 ドットパターンの知覚的な輪郭と見倣すことが出来る。 本論文中では、散布行列(dispersion matrix)と呼ばれる 新しい構造的な根拠に関する議論も展開する。 また、本方式をデジタルに展開した場合についても議論する。 本方式による知覚的輪郭の検出は高速である。 なぜならば、処理の多くが非負の整数の和と論理式の計算によるからである。 さらには、本方式はドット空間上でそれぞれの処理が局所的であるので、 並列処理も可能である。
mNt
Copyright(c) 1997 Academic Press, Inc.
Minas E. Spetsakis
COMPUTER VISION AND IMAGE UNDERSTANDING Vol. 68, No. 3, December, pp. 276-289,1997 ARTICLE NO. IV970555
不連続性と大きな画像の移動は、物体の動き検出において いくつかの大きな問題をもたらしている。 通常、不連続な輪郭部分における、輪郭に関する制約の混合に関し、 隣接画素間においてそれぞれの制約条件は両立させ難い場合があり、 その場合の処理が問題となっている。
本論文では、不連続な輪郭を横切る制約条件の混合を避ける為の 変形を行なうフィルターのセットを提案する。 本アルゴリズムは、大きな移動に対応する為、 高解像度画像における手法を低解像度の場合に 適用するものである。 論文中では本アルゴリズムが良好に動作していることが示されている、 実画像と人工画像における例もいくつか示す。
mNt
Copyright(c) 1997 Academic Press, Inc.
Josef Bigun
COMPUTER VISION AND IMAGE UNDERSTANDING Vol. 68, No. 3, December, pp. 290-307,1997 ARTICLE NO. IV970556
対称性の測定による一般的な曲線族検出の理論について述べる。 対称性は座標変換を定義する共役調和関数対の等濃度曲線を用いてモデル化される。 つまり、調和関数対座標により目的曲線パターンを平行線と見倣すことが出来、 平行線はここでは線形対象と定義される。 これらの線を検出すること、つまり、一般的な線形対象当てはめは、 変換に対するりー群の不変特徴を見つけることに相当する。 当てはめに関して、不変パラメータの評価の為の最小自乗法に基づいた 手法について述べる。 そこでは、特徴抽出手法を構築するにあたり、りー無限小オペレーターを用いること で、 効果的かつ単純な実装を可能としている。 一般化ハフ変換の拡張として示されるこの手法は、 探索パターンの形跡に関して、投票と蓄積を行なうことによる検出を可能としている 。 本手法では、複素数の投票が許されているので、 投票の局面によって、検出可能なパターンの族の構成要素を確認出来る。 最後に実験により、理論および 実画像と人工画像に対するアプリケーションを示している。
mNt
Copyright(c) 1997 Academic Press, Inc.
A. N. Rajagopalan and S. Chaudhuri
COMPUTER VISION AND IMAGE UNDERSTANDING Vol. 68, No. 3, December, pp. 309-329,1997 ARTICLE NO. IV970534
多重焦点画像からの奥行き復元においては、 焦点の浅い領域で必要とされるカメラの焦点に関する変数が、 画像に及ぼす影響をモデル化することで、 画像中の複数の点においてその奥行きを計算する必要がある。 従来、多重焦点を用いるアプローチにおいては、 かなり広い部分領域に関して、奥行きは一定であると仮定し、 システムは部分領域においては移動に対して不変であると想定して 逆投影を行なうことで、奥行きを算出していた。 しかしながら、奥行きの算出において、 それぞれの部分画像を切り離して処理することで、エラーが生じていた。
本論文においては、多重焦点画像を用いた奥行きの算出について、 2つの新しいアプローチを提案する。 1つ目のアプローチにおいては、 多重焦点画像を用いた奥行き算出システムを、 ブロックの移動に対して可変なものとしてモデル化し、 ぼけの相互作用を用いて奥行きの算出精度を向上させた。 2つ目のアプローチでは、 多重焦点画像を用いた奥行き算出の問題を 空間周波数表現の枠組における問題としてとらえた。 特に、複素数スペクトグラムとWigner分布は 多重焦点画像から奥行きを復元する候補として適当であることを示す。 提案手法については実画像と人工画像のそれぞれに対して 性能を示す実験を行なった。 その結果、提案手法においては良好な結果が得られ、 従来手法との比較も行なわれた。
mNt
Copyright(c) 1997 Academic Press, Inc.
Yang Wang and Prabir Bhattacharya
COMPUTER VISION AND IMAGE UNDERSTANDING Vol. 68, No. 3, December, pp. 330-345,1997 ARTICLE NO. IV970551
任意の格子系における2次元多値画像の連結性の新しい定義を提案する。 かつて四角格子系に対して Rosenfeld が証明した 離散画像に対するジョルダン曲線理論とその逆理論を拡張する。 ここでは、Latecki らによって導入された well-composed sets の概念を 2つの側面から拡張した。 1つ目は、well-composed sets の概念を 2次の格子系から任意の格子系に対して拡張した。 そして2つ目は、我々が先に紹介した変数依存の連結成分の概念を用いることで、 異なる画素値を持つことを許容した。 このことで、連結成分における連結性の概念は、 さらに広い意味合いを持つこととなった。
mNt
Copyright(c) 1997 Academic Press, Inc.
P.Golland and A.M.Bruckstein
COMPUTER VISION AND IMAGE UNDERSTANDING Vol. 68, No. 3, December, pp. 346-362,1997 ARTICLE NO. IV970553
動作推定におけるカラー画像の利用方法について調査を行なった。 カラーの構成要素を同じ画像中の部分画像として用いる直接的な アプローチとは異なり、新しい手法においては、動作に対して不 変なカラー特徴量を利用する方法について論じられている。
本論文では、2組の異なる、カラーに対して局所的に計算可能な動作不変特徴につい て その解析と実験を行なった。 新しい手法による動作推定の結果を RGBの明度関数を直接用いた手法と比較している。
mNt
Copyright(c) 1997 Academic Press, Inc.