AbstractClub - 英文技術専門誌の論文・記事の和文要約


[インデックス] [前の年] [次の年]

・・・
IEEE Multimedia (IEEE) Vol.3, No.1


EFX編集・特殊効果環境
The EFX Editing and Effects Environment

Sherman Alpert, Mark Laff, W. Randall Koons, David Epstein, Danny Soroker, David Morrill, and Arthur Stein (IBM Entertainment Systems)

IEEE MultiMedia, Spring 1996, Vol. 3, No. 1

EFXディジタル編集・特殊効果環境は、高度な画像操作の特殊効果を持った、 ディジタル化された映画(film)・ビデオ・オーディオのノンリニア編集のため の装置を統合するものである。EFXは、マルチメディア創作のための、直観的・ 視覚的・直接操作的なユーザインタフェースを提供する。本論文において述べ るこのフロントエンドは、その特殊効果を計算し、圧縮されていないディジタ ル化された映画・ビデオをリアルタイムで再生する強力な並列計算機と結びつ けられている。


DIVEシステムにおけるインタラクティブなマルチユーザ仮想環境
Interactive Multiuser VEs in the DIVE System

Olof Hagsand (Swedish Institute of Computer Science)

IEEE MultiMedia, Spring 1996, Vol. 3, No. 1

マルチユーザ仮想環境(Virtual Exvironment, VE)は、いかにユーザがオブジェ クトやアプリケーションや他のユーザと相互作用を行なうか、またユーザ数が 増大した場合に、いかに分散環境にあるVEが振舞うか、ということについての 難しくも興味深い研究課題を提起している。DIVE(The Distributed Interactive Virtual Environment, 分散インタラクティブ仮想環境)は、多く の分散VEアプリケーションに対してツールキットとして働く、マルチユーザVE のためのソフトウェアプラットフォームである。DIVEは、ネットワーキングや 人間とコンピュータの相互作用を高め、自律的な動作駆動のオブジェクトや輻 輳の検出や、オーディオや3Dのナビゲーションを支援するものである。


仮想世界アニメーションの視覚的プログラミング
Visual Programming of Virtual Worlds Animation

Alberto Del Bimbo and Enrico Vicario (Universita di Firenze)

IEEE MultiMedia, Spring 1996, Vol. 3, No. 1

仮想現実感インターフェースにおいては、仮想エージェントの現実的なアニメー ションは、仮想環境における直接的な「かみあわせ」(engagement)を支援する ことにより、人間とコンピュータの相互作用を高める。例による視覚的なプロ グラミングにより、設計者らはエージェントを『訓練する("training")』こと によってアニメーションのルールを定義することができ、それにより、振舞い に関するルールを仮想環境の実行中に自動的に動作する記述モデルに築き上げ るのである。この例による視覚的なプログラミングは、実生活における現象の 直接的かつ効果的な応答や、環境の刺激に対するエージェントの反応を考慮し たものである。


マルチメディア文書のための再生スケジューリング
A Playback Schedule Model for Multimedia Documents

Ahmed Karmouch and James Emery (University of Ottawa)

IEEE MultiMedia, Spring 1996, Vol. 3, No. 1

マルチメディア文書は、テキストや幾何学的な図形からなる従来の文書と大き く異なる。音声、動画、CG画像といった連続的なメディアの導入により、文 書の表現や情報蓄積についての新しい要求が課せられている。筆者らは、論理 構造・レイアウト構造・描画のシナリオによるマルチメディア文書作成のため のアーキテクチャを設計した。このアーキテクチャは、すなわち文書再生のた めのスケジューリングといえる。


ビデオ会議の索引づけの四つのパラダイム
Four Paradigms for Indexing Video Conferences

Rick Kazman and Reem Al-Halimi (University of Waterloo) William Hunt and Marilyn Mantei (University of Toronto)

IEEE MultiMedia, Spring 1996, Vol. 3, No. 1

参加者が映像・音声・共有コンピュータアプリケーションによって接続された 会議は、それぞれの情報ストリームを生成する。筆者らは、これらの並行した ストリームにアクセスするための音声ストリームの内容ベースの索引づけを用 いる会議索引づけ手法(Jabberと呼ぶ)を開発した。本手法(Jabber)は、音声ス トリームについて音声認識を行ない、認識された言葉を意味的に関連づけられ た木構造にグルーピングするものである。ユーザインタフェースは、会議中の 混乱が最小になるように情報を表示するように設計されている。


・・・
IEEE Multimedia (IEEE) Vol.3, No.2


ライブ放送のための仮想スタジオ:モナリザプロジェクト
A Virtual Studio for Live Broadcasting: The Mona Lisa Project

Laurent Blonde (THOMSON multimedia R&D France), Matthias Buck (Daimler-Benz A.G.), Ricardo Galli (University of Balearic Islands), Wolfgang Niem (Universitaet Hannover), Yakup Paker (University of London), Wolfgang Schmidt (DVS Digitale Videosysteme GmbH) and Graham Thomas (Kingswood Warren)

IEEE MultiMedia, Summer 1996, Vol. 3, No. 2

近年のコンピュータ技術における進歩は、コンピュータビジョンや画像生成に おける研究と結び付き、テレビ番組制作手段に大きなインパクトを与えている が、テレビ番組制作手段は、カラーテレビが導入されて以来変わっていない。 仮想スタジオは、スタジオにおける現実の背景セットを、コンピュータが生成 した合成シーンと置き換える。ヨーロッパのいくつかの大企業と学術研究機関 とのコンソーシアムであるモナリザプロジェクトは、3Dモデルの構築・操作・ 実時間描画(rendering)のために要求される技術(アルゴリズム・ソフトウェア・ ハードウェア)を開発・統合するという目的を持っていた。これにより、番組 制作者は、スタジオにおける現実の前景シーンと、コンピュータによって生成 された背景とを組み合わせた画像列を生成することができる。


時間的関係と同期エージェント
Temporal Relations and Synchronization Agents

Yahya Y. Al-Salqan and Carl K. Chang (West Virginia University)

IEEE MultiMedia, Summer 1996, Vol. 3, No. 2

マルチメディアオブジェクトと関連づけられた時空間的意味は、データやアプ リケーションを生成したり制御したりすることをより複雑にしてしまう。知的 な同期エージェントは、絶対的なスケジューリングの要求および相対的なスケ ジューリングの要求の双方をたやすく処理することができるものであり、それ ゆえ、マルチメディアの統合に理想的なものである。この論文(paper)は、エー ジェントのふるまいを記述するため、および分散しているマルチメディアオブ ジェクト間に存在する時系列的な意味を抽出するための、形式的な仕様記述モ デルである「相互操作性のあるペトリネット(IPN)」をも含んでいる。


フレキシブルな仕事のためのユーザインタフェースとエージェントの プロトタイピング
User Interface and Agent Prototyping for Flexible Working

Koji Takeda, Mitsuyuki Inaba, and Kazuo Sugihara (University of Hawaii at Manoa)

IEEE MultiMedia, Summer 1996, Vol. 3, No. 2

本論文は、分散マルチメディアシステムのプロトタイプを提示し、フレキシブ ルな仕事環境の設計に対するそのプロトタイプの価値を議論するものである。 フレキシブルな仕事環境を記述するためのグラフモデルは、複数の、有限状態 機械であるペトリネット、およびそれら複数のペトリネット間で交換される情 報に基づいている。このモデルにおける実行可能な記述を解釈(interpret)す るプロトタイピングツールを紹介する。


インタラクティブなビデオ再生(playout)のためのストリーム変換
Stream Conversion for Interactive Video Playout

Ming-Syan Chen and Dilip D. Kandlur (IBM T.J. Watson Research Center)

IEEE MultiMedia, Summer 1996, Vol. 3, No. 2

本論文においては、再生デバイスにおいてMPEG符号化されたビデオストリーム のインタラクティブな再生(playout)を支援することの問題について述べてい る。著者らは、それぞれのPフレームの伸長と再生の後、PフレームをIフレー ムとして符号化するというストリーム変換機構を考案した。P-I変換が、コス ト的に効果的であり、実装が簡単であり、さらに高画質のインタラクティブな 再生を提供することが可能であることが示され、それゆえ、P-I変換は、クラ イアント端末におけるMPEGビデオのインタラクティブな再生を支援するための 発展性のあるアプローチ方法であると考えられる。


地理情報システムにおけるマルチメディア統合
Integrating Multimedia in Geographical Information Systems

Meeno-Jan Kraak (Delft University of Technology)

IEEE MultiMedia, Summer 1996, Vol. 3, No. 2

地理情報システム(Geographycal Information Systems, GIS)は、しばしばユー ザのアプリケーションに基づくモデルにリンクし、データ統合と空間解析のた めの可視化を用いる。本論文は、空間データを探索・解析・表示するためのマ ルチメディアの将来起こり得る効果について議論するものである。ハイパー地 図という概念を、ユーザのナビゲーションを高めるために個々のマルチメディ ア要素を構造化ための強力な手段として紹介する。


・・・
IEEE Multimedia (IEEE) Vol.3, No.3


マルチメディアのための拡張ビジュアル言語
Extending Visual Languages for Multimedia

Shi-Kuo Chang (University of Pittsburgh and Knowledge Systems Institute)

IEEE MultiMedia, Fall 1996, Vol. 3, No. 3

ビジュアル言語は、ユーザがアイコン的な『文』をカスタマイズすることを可 能にするものであるが、ユーザがメディアに直接的にアクセスすることができ るように、このビジュアル言語をマルチメディアオブジェクトに適応させるよ うに拡張することが可能である。遠隔行動(Teleaction)オブジェクトや、知識 構造を持つマルチメディアオブジェクトは、イベントに自動的に反応したり、 仮想図書館において「関連書籍を探す」というタスクを実行するために、ビジュ アル言語を用いて設計することができる。


オーディオの内容ベースのクラス化、探索、検索
Content-Based Classification, Search, and Retrieval of Audio

Erling Wold, Thom Blum, Douglas Keislar, and James Wheaton (Muscle Fish)

IEEE MultiMedia, Fall 1996, Vol. 3, No. 3

多くのオーディオやマルチメディアのアプリケーションは、キーワードによる ものよりも、オーディオの特性に基づいたオーディオのクラス化や探索の能力 から利益を得るであろう。これらのアプリケーションはマルチメディアのデー タベース、ファイルシステム、ディジタルライブラリ、オーディオの音帯を用 いた自動セグメンテーションあるいは(例えばニュースやスポーツの場面といっ た)ビデオのインデックス、監視、(音響)効果のデザイナーや音楽家のための サウンドブラウザを含んでいる。本記事は、音を、聴覚的かつ音響的な特徴に 帰せしめるオーディオの解析、サーチ、およびクラス化を行うエンジンについ て述べている。これらの特徴に基づいて事前に学習されたクラスを記述するこ とにより、あるいは参照用音声を選択・入力し、この参照音声に似ている(あ るいは似ていない)音を検索するようにエンジンに求めることにより、サウン ドをサーチしたり検索したりすることができる。上述したようなアプリケーショ ン領域のいくつかにおいて用いることができるようなエンジンの例を紹介する。


分散VODシステムにおける階層的蓄積管理
Hierarchical Storage Management in a Distributed VOD System

David W. Brubeck and Lawrence A. Rowe (University of California at Berkeley)

IEEE MultiMedia, Fall 1996, Vol. 3, No. 3

蓄積管理アルゴリズムは、階層的分散ビデオ・オン・デマンドシステムにおけ るビデオサーバ上に蓄積された連続的なメディアオブジェクトを取り扱う。第 三の蓄積デバイス上に永久的に蓄積されたメディアオブジェクトは、必要な時 にビデオサーバに移される。アルゴリズムは、ビデオサーバにおける分散キャッ シュを管理し、要求されたオブジェクトを配置すべきビデオサーバの選択を行 う。オブジェクト配置アルゴリズムは、システムの性能(パフォーマンス)を最 大にするために、サーバの負荷、ネットワークの負荷、およびサービスの待ち 時間を利用する。


分散マルチメディアアプリケーションのためのサービス、枠組、パラダイム
Services, Frameworks, and Paradigms for Distributed Multimedia Applications

Max Muhlhauser (University of Linz) Jan Gecsei (University of Montreal)

IEEE MultiMedia, Fall 1996, Vol. 3, No. 3

分散マルチメディアアプリケーションの発展は、増大するサービスによって支 えられている。このようなサービスは、分散システムにおいても高度に複雑に なったマルチメディア支援に向かう道を舗装する一方、これらのサービスを用 いることによって、開発者らの仕事が面倒なものになっている。これは、異なっ た特徴をもたらすためにいくつかの相容れないサービスを接触しなくてはなら ないためである。この問題を緩和するひとつの方法として、すべてのサービス が統一されたパラダイムのもとで提供されるような包括的な枠組のための実例 (case)を作成する。まず、配置に注目して現存するマルチメディアサービスの 概観を与え、いわゆる抽象化の集合として、マルチメディアを一般的な枠組へ 拡張することに対して課せられる要求点を抽出する。分散アプリケーションの ための公知の開発環境は、明らかにこのような包括的な枠組の候補になる。こ れらの開発環境を、四つの有名なパラダイム(クライアント−サーバのリモー トプロシージャコール、オブジェクト指向、ハイパーメディア、オープンドキュ メント)に基づいて論評する。また、可能なマルチメディア拡張について検証 を行い、これらのパラダイムの「表現力」について論じる。結論として、オブ ジェクトとハイパーメディアとを混合したパラダイムに基づいた包括的枠組に 向けたいくつかの段階を提案する。


分散マルチメディア・オン・デマンドのためのコストベースのプログラム領域 確保
Cost-Based Program Allocation for Distributed Multimedia-on-Demand Systems

Chatschik C. Bisdikian and Baiju V. Patel (IBM Thomas J. Watson Research Center)

IEEE MultiMedia, Fall 1996, Vol. 3, No. 3

本記事においては、多くの地理的に散乱しているマルチメディアサーバからユー ザに随意にプログラムを供給する、ある分散マルチメディア・オン・デマンド システムにおけるマルチメディアプログラムの領域確保(アロケーション)につ いての研究を行っている。おのおののユーザはそれらのサーバのひとつ(ロー カルサーバ)に結びつけられているが、あらゆるサーバに存在するあらゆるプ ログラムに透明に(サーバの違いを意識することなく)アクセスすることも可能 である。

我々はこの問題を定式化し、階層的かつメッシュ型に配置された分散ネットワー クのためのモデルおよび用語を導入する。我々の研究においては、ユーザのプ ログラムに対する要求、マルチメディアサーバの蓄積限界、および多種のプロ グラムを蓄積したり伝送したりするために招かれるコスト、について熟考して いる。いくつかの種類のシステムにおいて、プログラムのコピーの数および通 信コストを最小にするそれらのプログラムの蓄積配置についての解決策を提案 する。


・・・
IEEE Multimedia (IEEE) Vol.3, No.4


マルチモーダル統合
Multimodal Intergration

Meera M. Blattner and Ephraim P. Glinert

IEEE MultiMedia, Winter 1996, Vol. 3, No. 4

マルチメディアシステムにおける近年の発展、およびいわゆる仮想現実感やデー タ可視化のための没頭(immersive)環境への探求は、標準的な対話技術につい ての我々のレパートリーが、テキストやビジュアルな領域を越え、触覚・ジェ スチャー・音声・三次元音声を含む広がるまでそう遠くないことを暗示してい る。人間とコンピュータのコミュニケーションのための単一の様式(modality) の利用においては、かなりの進歩をとげてきたが、統合されたマルチモーダル システムの設計に関する問題については十分に理解されていない。この記事は、 この問題の正しい認識、および提案されたり実装されたいくつかのアプローチ を評価を得るために、マルチモーダルの対話を支援するための一般的なプラッ トホームを提供することを目標とした活動を特に強調して、この領域における 近年の研究について調査を行うものである。重要な用語も定義あるいは明確化 し、様式(modality)のためのいくつかの分類を検討する。


言語およびマルチモーダルインタフェースのためのユーザ中心モデル
User-Centered Modeling for Spoken Language and Multimodal Interfaces

Sharon Oviatt (Oregon Graduate Institute of Science & Technology)

IEEE MultiMedia, Winter 1996, Vol. 3, No. 4

自然に発声された音声や言語において言語の多様性があるという複雑な根源を モデル化することにより、人間の入力をシステム処理機能に適合させるように、 ユーザに気づかせることなくガイドを行うようなインタフェースを設計するこ とができる。この研究は、次世代の自然言語およびマルチモーダルシステムの ための、よりユーザ中心でよりロバストなインタフェースを生ずるであろう。


邪魔されない(? unencumbered)ジェスチャー対話
Unencumbered Gestural Interaction

Francis K.H. Quek (University of Illinois at Chicago)

IEEE MultiMedia, Winter 1996, Vol. 3, No. 4

三次元ジェスチャーにおいては、人間の手によるジェスチャーを手短に概観す ることが、計算上のアプローチを動機づける。そのモデルは、ジェスチャー動 作の定義や、その動作の最後における手のポーズの認識や、および動きの間の 手の動作の力学の定義を求める。拡張多値論理およびルールベースの帰納アル ゴリズムを用いたハンドジェスチャーの帰納的学習についての研究を紹介する。 著者とその共同研究者らは、そのシステムを用いて94%の認識率を得ることが できた。著者は、動いている手を表現する画像フローの領域の計算に関する研 究について述べている。


児童のためのペンベースの詩的(prosodic)ユーザインタフェース
Pen-Based Prosodic User Interface for Schoolchildren

Takayuki Dan Kimura (Washington University)

IEEE MultiMedia, Winter 1996, Vol. 3, No. 4

詩的ユーザインタフェースとは、ユーザによって何が入力されたかだけでなく、 いかに入力されたかをも扱うことのできるユーザインタフェースであると定義 される。ペンベースのユーザインタフェースは、マウスベースのグラフィカル なユーザインタフェースよりもより詩的な情報を与える。教育的な適応領域に おいて、ペンベースの詩的なユーザインタフェースへの要求が論じられている。 ペンベースの詩的なユーザインタフェースの簡単な例として、位置的な手書き 認識器というアイディアを紹介し、その実装について論じる。


可変ビットレート(VBR)ビデオサーバのためのコスト解析
Cost Analyses for VBR Video Servers

Ed Chang and Avideh Zakhor (University of California, Berkeley)

IEEE MultiMedia, Winter 1996, Vol. 3, No. 4

本記事は、複数のユーザが同時にアクセスすることのできる可変ビットレート (VBR)のビデオデータの蓄積および実時間による検索のための各技術を比較す るものである。著者らは、以下のような三種類のVBRデータの配置および検索 技術のクラスを比較している。(1)定時間長方式(CTL)は、等間隔の再生時間に 対応する単位でデータを配置し、検索するものである。(2)定データ長方式 (CDL)は、一定長の大きさのデータ単位を配置/検索するものである。(3)ハイ ブリッド方法は、CDLの配置を行うが、それぞれのサービスにおいてユーザご とにさまざまな数の単位を検索するものである。上記の各技術のコスト解析を 行うことにより、CTLおよびハイブリッド方式が、VBRビデオの跡(trace)を追 随する(pad)こと比較して、3倍まで総コストを削減することができるという結 論を得る。リードオンリーのシステムについては、CTLはユーザ単位のコスト を最も低くする。書き換え可能なシステムについては、ハイブリッド方式が低 コストと分裂(fragmentation)が低いことの良い折衷案を与える。

著者らは、また、三つの技術を比較することにより、使用許可制御方策につい ての問題についても述べている。統計に基づく許可制御はサーバの負荷の見込 みがあらかじめ設定された閾値を越えていないということを保証するために、 蓄積されたデータの統計を用いる。データ制限許可制御は、将来のサービスの 繰り返しにおいて、すべてのユーザによって要求される総データ量をあらかじ め計算することに基づいてユーザに許可を与えるものである。理想的な決定論 的な許可制御は、すべてのディスクのアクセス時間をあらかじめ計算するため に、ディスクのセクタのレベルにおいて、データの配置の制御が可能であるこ とを仮定している。データ制限許可制御は、示されるように、適度の利益を得 るために、適度の実装上の複雑さの増加を必要とする。著者らは、実験をしや すくするために、実時間ディスクよりも1000倍速く実行する高精度で完全なディ スクモデルシミュレータを実装した。最後に、著者らは複数ディスクの問題に ついて述べ、彼らのデータ配置や許可制御の、インターリーブディスクアレイ への適用について検討している。


[インデックス] [前の年] [次の年]