[前の年]
  IEEE Multimedia (IEEE) Vol.19, No.1  



UltraViolet:映画産業を再定義する
UltraViolet: Redefining the Movie Industry?

Kalker, T. , Innovation Center, Huawei Technol., Santa Clara, CA, USA Samtani, R. Xin Wang

IEEE MultiMedia, Vol. 19, No. 1, pp. 0-0 , January 2012

Keywords: Internet, digital rights management, entertainment, open systems, Hollywood studio, Ultraviolet, ecosystem, interoperability, movie industry, multiple digital right management system, online media delivery, premium video content, Digital Entertainment Consortium Ecosystem, digital rights management, digital video, multimedia, online video delivery, steaming video, Content management, Digital communication, Digital forensics, Entertainment, Intellectual property, Motion pictures, Streaming media

オンラインメディア配信はビッグビジネスであるが、リテイラー間、デバイス間の相互運用性について大きな問題がある。UltraVioletによりプレミアムビデオコンテンツのオンライン配信及び視聴のためのエコシステムを定義し、複数のデジタル権利管理(Digital Rights Management: DRM)間の適法な相互利用が可能になる。この活動はハリウッドの映画会社とメディア配信産業の多くの重要な会社に支持されている。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


法分野におけるアプリケーションのための顔画像マッチングと検索
Face Matching and Retrieval in Forensics Applications

Jain, A.K. , Dept. of Comput. Sci. & Eng., Michigan State Univ., East Lansing, MI, USA Klare, B. Unsang Park

IEEE MultiMedia, Vol. 19, No. 1, pp. 0-0 , January 2012

Keywords: computer forensics, face recognition, image matching, image retrieval, face matching, face retrieval, forensic face recognition, forensics application, low quality image processing, 3D face model, face recognition, face retrieval, facial aging, facial mark, forensic sketches, forensics, image enhancement, multimedia, Digital forensics, Face recognition, Forensics, Image recognition, Pattern recogniation, Solid modeling, Three dimensional displays

本稿では法分野における顔認識アプローチと顔画像マッチング及び検索の精度向上、および低品質画像の処理などの課題についてのサーベイを行う。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


画像編集スタイルを用いたオンラインオークションの販売者のプロファイリング
Profiling Online Auction Sellers Using Image-Editing Styles

Lin Yang Wei-Bang Chen Chengcui Zhang Johnstone, J.K. Song Gao Warner, G.

IEEE MultiMedia, Vol. 19, No. 1, pp. 0-0 , January 2012

Keywords: Internet, electronic commerce, fraud, security of data, account anomaly detection, auction templates, business, concurrent auction listings, fraudulent act, image editing style, online auction guides, online auction listings, product categories, product image, seller profiling, auction frauds, editing style, image matching, local feature, multimedia, user profiling, Feature extraction, Frequency measurement, Image coding, Image color analysis, Image edge detection, Image matching, Visualization, Weight measurement

商品画像はオンラインオークションで重要な役割を持っている。オンラインオークションサイトは繁盛しているビジネスであり、数百万のオークションが同時に行われている。(オークション検索の結果ページのサイズ・)スペースが限られているため、商品画像のみが商品の概要として購買者に提示される。他の競合から抜け出すために、ベテランの販売者は商品画像を編集し、潜在購買者へのアピールを強めている。これまでに多くの販売者が、彼ら独自の画像編集スタイルを確立し、繰り返しその手法で処理した商品画像をオークションサイトにアップしている。さらにはこれらのスタイルは多くの場合他の販売者のスタイルと異なるものである。これはすなわち、この画像編集スタイルが販売者のプロファイリングに用いることができる有望な特徴であることを意味している。販売者のプロファイリングは、オークションアユーザの異常行動を検出するための基本となるものであり、このような行動は詐欺行為に関連していることもある。多くのオンラインオークションサイトが、購買者に、販売者のオークションリスト(たとえば商品カテゴリやオークションテンプレート、またはテキストフォントを急に変更したりすること)の異常行動を確認することを推奨している。なぜならば、このような異常行動はオークションアカウントの乗っ取りを示唆していることがあるためである。このような特徴を抽出し、異常行動と詐欺を検出するための計算論的な方法が研究・提案されてきた。しかし、そのうちごくわずかの研究しか、オークションの主な情報源である商品画像を利用していない。画像編集スタイルを自動的に導出し販売者のプロファイルを自動生成するアルゴリズムを開発した。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


法務分野における画像検索:タトゥー画像データベースアプリケーション
Image Retrieval in Forensics: Tattoo Image Database Application

Jung-Eun Lee , Michigan State Univ., East Lansing, MI, USA Rong Jin Jain, A.K. Tong, W.

IEEE MultiMedia, Vol. 19, No. 1, pp. 40-49 , January 2012

Keywords: forensic science, image matching, image retrieval, law administration, learning (artificial intelligence), forensics, gang graffiti images, image retrieval, semisupervised learning algorithm, shoe prints, similarity measures, soft forensic evidence, supervised learning algorithm, tattoo image database application, tattoo image matching, tattoo image retrieval, unsupervised approach, Tattoo-ID system, biometrics, forensic databases, multimedia, near-duplicate image retrieval, tattoo images, Content management, Digital forensics, Fingerprint recognition, Forensics, Image retrieval, Iris recognition

本稿では、低画質タトゥー画像照合のための課題を明示的に扱うための適切な類似尺度を設計する教師なしアプローチを紹介する。将来的には、この照合アルゴリズムを教師付き及び準教師付き学習アルゴリズムを利用することで改良する予定である。タトゥー以外にも、靴跡や落書きなどの法律分野における弱度の証拠は画像の形態で収集・管理されることがある。本稿で紹介するTatoo-IDシステムでは、タトゥー画像照合及び検索にフォーカスし、このシステムのために開発された技術は他の法務分野の画像データベースに対しても応用可能である。将来的にはこのTatoo-IDシステムを他の応用分野に拡張したいと考えている。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


音声認証の現在の開発状況と将来のトレンド
Current Developments and Future Trends in Audio Authentication

Gupta, S. Cho, Seongho Kuo, C.-C.J.

IEEE MultiMedia, Vol. 19, No. 1, pp. 50-59 , January 2012

Keywords: audio coding, audio analysis, audio authentication, audio recording, camera footage, compressed audio features, forgery detection, multimedia, phone conversations, Benford's law, ENF, MP3, audio authentication, audio compression, audio recording, forgery, multimedia, Audio recording, Authentication, Digital forensics, Feature extraction, Forensics, Forgery, Spectrogram, Speech recognition

音声認証分野の最近の発展には、録音条件や圧縮音源特徴を利用した基本的な音声解析や高度な音声認証技術などがある。マルチメディアは我々の生活のそこかしこに浸透しており、世界中で起きるイベントについての情報を得るために、多くの人がさまざまなウェブサイトを利用している。我々はカメラで撮影された画像や、電話での会話、その他の記録に基づいて意見を決めている。いくつかの情報源は信頼できる情報を提供するが、他の情報源はねつ造された物かもしれない。マルチメディアデータの信頼性確保の方法についての懸念から、ねつ造検知の研究が始まったが、画像やビデオ分野におけるねつ造検知の研究に比べ、オーディオ分野でのそれはいまだ限定的である。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


マルチスケール画像指紋を用いた効率的なコピー画像検出
Efficient Image Copy Detection Using Multiscale Fingerprints

Hefei Ling , Huazhong Univ. of Sci. & Technol., Wuhan, China Hongrui Cheng Qingzhen Ma Fuhao Zou WeiQi Yan

IEEE MultiMedia, Vol. 19, No. 1, pp. 60-69 , January 2012

Keywords: affine transforms, copy protection, feature extraction, fingerprint identification, image coding, efficient image copy detection, illegal image copy identification, multiscale fingerprints, multiscale scale-invariant feature transform, copy detection, fingerprints, histogram intersection, multimedia, multiscale SIFT descriptor, visual words, Binary codes, Digital forensics, Feature extraction, Forensics, Hamming distance, Histograms, Image recognition, Table lookup, Visualization

マルチスケールかつスケールに非依存な画像特徴(SIFT)記述子により、違法な画像コピーを同定するための画像区別能力を向上させることができる。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


幾何ゆがみに対して耐性のある実時間圧縮特徴次元におけるビデオウォーターマーキング
Real-Time Compressed- Domain Video Watermarking Resistance to Geometric Distortions

Liyun Wang , Huazhong Univ. of Sci. & Technol., Wuhan, China Hefei Ling Fuhao Zou Zhengding Lu

IEEE MultiMedia, Vol. 19, No. 1, pp. 70-79 , January 2012

Keywords: optical distortion, video coding, video watermarking, aspect ratio change, geometric distortion resistance, real-time compressed domain video watermarking scheme, Applications, Computing Methodologies, Pattern Recognition, Security, Signal processing, and protection., integrity, Discrete cosine transforms, Discrete wavelet transforms, Histograms, Real time systems, Streaming media, Video recording, Watermarking

本稿で提案する実時間ビデオウォーターマーキング法は、回転、画像切り出し、変倍、アスペクト比変更、フレーム脱落、ユーレム入れ替えなどの幾何ゆがみに対して頑健である。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


没入型環境:通信における最新の特徴
Immersive Environment: An Emerging Future of Telecommunications

Abbasi, A. , King Fahd University of Petroleum and Minerals, Dhahran, Saudi Arabia Baroudi, U.

IEEE MultiMedia, Vol. 19, No. 1, pp. 0-0 , January 2012

Keywords: distance learning, entertainment, immersive environments, multimedia, multimedia applications, simulated learning, telecommunications, virtual reality, Distance learning, Entertainment, Games, Multimedia communication, Streaming media, Three dimensional displays, Virtual environments, Wireless sensor networks

本稿では没入型通信環境についてのサーベイを行い、また、高次の技術課題とアプリケーションについて述べる。本稿で著者は没入型計算環境を3つの主なカテゴリに分類している。それはエンターテインメント、ビジネスおよび社会、そしてシミュレーションによる学習度教育である。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


  IEEE Multimedia (IEEE) Vol.19, No.2  



光学的バイオプシー生検法(Optical Biopsy)セマンティック検索システムの解剖学
The Anatomy of an Optical Biopsy Semantic Retrieval System

Tous, R. , Univ. Politec. de Catalunya, Barcelona, Spain Delgado, J. Zinkl, T. Toran, P. Alcalde, G. Goetz, M. Ferrer Roca, O.

IEEE MultiMedia, Vol. 19, No. 2, pp. 16-27 , February 2012

Keywords: content-based retrieval, endoscopes, image retrieval, medical image processing, optical microscopy, query processing, CLE images, ISO/IEC 15938-12:2008, ISO/IEC 24800, JPEG search, MPEG query format, case-based computer-aided diagnosis system, confocal laser endomicroscopy, content-based image retrieval technique, interface compliant, interoperability, optical biopsy semantic retrieval system, semantic metadata, feature measurement, healthcare, image retrieval, metadata, multimedia, multimedia databases, standards, video retrieval, Biomedical optical imaging, Biopsy, Cryptography, Feature extraction, Feature recognition, Image retrieval, Medical services, Optical imaging, Transform coding

ケースベースのコンピュータによる補助を受けた診断システムは、医師及び他の医療関係者が、共焦点レーザー内部顕微鏡診断(confocal laser endomicroscopy:CLE)による光学的バイオプシー生検の結果を解釈する助けとなる。CLE画像検出は、セマンティックメタデータを低次元特徴から推測する有望な結果を示している。連携する可能性のあるサードパーティのアプリケーションとの相互運用性を効率的に確保するために、このシステムでは最近の標準であるISO/IEC 15938-12:2008(MPEG Quality Format)及びISO/IEC 24800 (JPEG Search)とインターフェース互換にしてある。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


テクスチャ解析を用いた医療診断
Using Texture Analysis for Medical Diagnosis

Parekh, R. , Jadavpur Univ., Kolkata, India

IEEE MultiMedia, Vol. 19, No. 2, pp. 28-37 , February 2012

Keywords: diseases, image texture, matrix algebra, medical image processing, object recognition, skin, wavelet transforms, gray level co-occurrence, human skin disease condition recognition, medical diagnosis, skin texture image, texture analysis, texture recognition, wavelet decomposition matrix, computer vision, gray-level co-occurrence matrix (GLCM), medical image analysis, multimedia, skin disease identification, texture recognition, wavelet decomposition, wavelet decomposition matrix (WDM), Biomedical imaging, Computer vision, Covariance matrix, Matrix decomposition, Skin diseases, Wavelength division multiplexing, Wavelet analysis

人間の皮膚疾患の状態を自動認識するシステムにより、皮膚のテクスチャ画像をグレーレベル共起及びウェーブレット分解行列に基づいたテクスチャ認識手法を用いて解析する。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


モバイルマルチメディアサービスのためのDMBアプリケーションフォーマット
DMB Application Format for Mobile Multimedia Services

Sabirin, H. , Korea Adv. Inst. of Sci. & Technol., Daejeon, South Korea Munchurl Kim Hui-Yong Kim Han-Kyu Lee Minkyu Park Yonghan Kim

IEEE MultiMedia, Vol. 19, No. 2, pp. 38-47 , February 2012

Keywords: IEC standards, ISO standards, digital multimedia broadcasting, interactive systems, mobile computing, telecommunication security, telecommunication standards, DMB application format, ISO/IEC 23000 MPEG-A Multimedia Application Formats standard, digital multimedia broadcasting, interactive DMB content, mobile multimedia services, secure DMB content packaging, structured file format, DAB, DAB+, DMB, file format, multimedia, multimedia application format, rich-media service, Automatic voltage control, Digital multimedia broadcasting, Media, Multimedia communication, Periodic structures, Streaming media, Transform coding

ISO/IEC 23000 MPEG-Aマルチメディアアプリケーションフォーマット標準のデジタルマルチメディア放送(Digital Multimedia Broadcasting:DMB)アプリケーションフォーマットパート9により、DMBコンテンツのセキュアなパッケージングとインタラクティブな利用のための構造化ファイルフォーマットを定義する。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


マルチメディア会議記録から情報を発見する
Finding Information in Multimedia Meeting Records

Popescu-Belis, A. , Idiap Res. Inst., Martigny, Switzerland Lalanne, D. Bourlard, H.

IEEE MultiMedia, Vol. 19, No. 2, pp. 48-57 , February 2012

Keywords: information retrieval, multimedia computing, records management, audio, documents, iterative software process, meeting browsers, metadata, multimedia meeting records, multimodal interfaces, video, evaluation, meeting browsers, meeting support technology, multimedia, user requirements, Browsers, Interviews, Meetings, Multimedia communication, Performance evaluation, User interfaces, Videoconferences

本稿ではAMI及びIM2という2つの大きなコンソーシアムで行われたmeeting browsersと呼ばれるマルチモーダルインターフェースを用いて会議の記録へのアクセスを向上させる研究についてのサーベイを与える。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


オブジェクト認識のための、ブースティング及びスパース制約のある双一次モデル
A Boosting, Sparsity- Constrained Bilinear Model for Object Recognition

Chunjie Zhang , Nat. Lab. of Pattern Recognition, China Jing Liu Qi Tian Yanjun Han Hanqing Lu Songde Ma

IEEE MultiMedia, Vol. 19, No. 2, pp. 58-68 , February 2012

Keywords: image representation, object recognition, SBLM, boosting-like procedure, higher-level visual elements, image representation, object recognition, sparsity-constrained bilinear model, computer vision, image processing, image/video retrieval, multimedia, object recognition, Adaptation model, Computer vision, Image processing, Image representation, Information retrieval, Object recognition, Robustness, Video communication, Visualization

画像を表現するために工事の画像要素を用いることで、スパース性制約のある双一次モデル(sparsity-constrained bilinear model: SBLM)を開発し、さらにSBLMをブースティングに近い手順と組み合わせることで性能向上を図った。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


スケーラブルメディアコンピューティング及び分散シナリオにおける知識のためのマイクログリッド
Micro Grids for Scalable Media Computing and Intelligence in Distributed Scenarios

Bellini, P. , Univ. of Florence, Florence, Italy Bruno, I. Nesi, P. Cenni, D.

IEEE MultiMedia, Vol. 19, No. 2, pp. 69-79 , February 2012

Keywords: grid computing, multimedia computing, semantic Web, small-to-medium enterprises, distributed scenario, micro grid technology, scalable media computing, semantic evolution, small-to-medium sized service, content processing, media computing, media grid language, micro grid, multimedia, semantic computing, Automation, Content management, Grid computing, Process control, Semantics, Social network services

マイクログリッド技術は小規模及び中規模のサービスのセマンティック革命において中心的な役割を果たしている。本稿ではメディアとセマンティックコンピューティングのためのマイクログリッドの主な要求事項とアーキテクチャを紹介する。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


  IEEE Multimedia (IEEE) Vol.19, No.3  



電子政府の文書画像のための著作権保護
Copyright Protection for E-Government Document Images

Rosiyadi, D. , Nat. Taiwan Univ. of Sci. & Technol., Taipei, Taiwan Shi-Jinn Horng Pingzhi Fan Xian Wang Khan, M.K. Yi Pan

IEEE MultiMedia, Vol. 19, No. 3, pp. 62-73 , July-Sept. 2012

Keywords: copyright, discrete cosine transforms, document image processing, genetic algorithms, government data processing, image watermarking, singular value decomposition, DCT coefficient, DCT-transformed watermark, GA operator, GA-based evolution, SFC, SVD, chromosome, control parameter, copyright protection, discrete cosine transform, e-government document image, genetic algorithm, image quality, inverse DCT, left singular vector, scaling factor optimal value, singular value decomposition, watermark image, zigzag space-filling curve, discrete cosine transform, e-government document, genetic algorithm, mean quantization, multimedia, singular value decomposition, Copyright protection, Discrete cosine transforms, Electronic government, Electronic mail, Genetic algorithms, Watermarking

提案する著作権保護方式は、離散コサイン変換 (Discrete Cosine Transform, DCT) と固有値分解 (Singular Value Decomposition, SVD) とを組み合わせ、制御パラメータを用いることで誤検出の問題を回避する。本稿では、電子政府 (e-government) の文書画像を対象とする効率的な著作権保護方式を提案する。まず、ホスト画像に対してDCTを適用し、DCT係数としてジグザグの空間充填曲線 (Space-Filling Curve, SFC) を利用する。ジグザグのDCT係数は、周波数ごとに矩形の4つの領域に配置される。次に、各領域に対してSVDを適用し、左側の固有ベクトルとDCT変換された透かしとを用いてホスト画像を更新し、透かし画像を埋め込む。左側の固有ベクトルと固有値は、誤検出の問題を回避するための制御パラメータとして利用される。領域ごとに最適な変倍係数を、遺伝的アルゴリズム (Genetic Algorithm, GA) により透かしの固有値に基づいて決定する。幾つかの最適化GA演算子を用い、変倍係数を染色体 (chromosome) によりシミュレーションする。更新された各DCT係数を元の場所へと再配置した後、提案する逆DCTにより透かし画像が生成される。実験結果から、本手法はGAベースの画質評価を向上させることでき、また幾つかの攻撃に対して頑健であることが示される。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


ここをクリックするな
Don't Click Here

Shamma, David A. , Yahoo! Research Slaney, M.

IEEE MultiMedia, Vol. 19, No. 3, pp. 4-6 , July-Sept. 2012

Keywords: Web research, data mining, interaction, media engagement, minus one click, multimedia, multimedia applications, multimedia research, zero-click interfaces, Behavioral science, Computer interfaces, Data mining, Information retrieval, Internet, Patents, Search methods, Streaming media, Web services

マルチメディア研究における最重要課題の1つは、ユーザの行動に関するデータ獲得である。1つのコンテンツあたり1回か数回程度のクリックしかない世界では、意味のある信号を得るために多数のユーザを必要とする。収益化のエコシステムは現在のマルチメディア研究を牽引し、人々、インタラクション、メディア接触、そしてデータ計測に対する我々の考え方を変貌させている。1つのクリック、タッチ、そしてゼスチャは、今では強力で、専ら複雑なインタラクションであり、日常会話 (everyday vernacular) の一部となっている。現在、非接触のインタラクションやゼロ・クリックのインタフェースが、我々に、コンテンツ、プッシュ通知、そして推奨プレイリストをもたらす。その先は、インタラクションの欠落、即ちマイナス・ワン・クリック、が最前線である。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


最新の動画符号化標準における並列計算の活用
Leveraging Parallel Computing in Modern Video Coding Standards

Kiho Choi , Hanyang University, Korea Jang, Euee S.

IEEE MultiMedia, Vol. 19, No. 3, pp. 7-11 , July-Sept. 2012

Keywords: CEAA, HEVC, High Efficiency Video Coding standard, co-exploration between algorithm and architecture, multicore processing, multimedia, multimedia standards, parallel processing, video coding standards, Algorithm design and analysis, MPEG 4 Standard, Multicore processing, Parallel programming, Standards, Video coding, Video signal processing

動画符号化は常に計算負荷の極めて高い処理である。近年、符号化効率の劇的な向上が実現されているが、そのアルゴリズムは益々複雑になり、マルチコア・プロセッサの能力を活用する必要性に対する認識が広まっている。本稿では、並列計算における近年の傾向が、最新の動画符号化標準の設計に如何に影響を与えてきたかについて議論する。具体的には、ISO/IEC JTC1/SC29 WG11 (MPEG) とTU-T SH16/Q.6 (VCEG) によって制定された高効率動画符号化 (High Efficiency Video Coding, HEVC) 標準が、アルゴリズムとアーキテクチャとの同時探索 (Co-Exploration between Algorithm and Architecture (CEAA) 方式の実装方法をどのように考慮しているかについて論じる。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


コミュニティとクラウド:マルチメディア・ベンチマーク・データセットの構築
The Community and the Crowd: Multimedia Benchmark Dataset Development

Larson, M. , Delft Univ. of Technol., Delft, Netherlands Soleymani, M. Eskevich, M. Serdyukov, P. Ordelman, R. Jones, G.

IEEE MultiMedia, Vol. 19, No. 3, pp. 15-23 , July-Sept. 2012

Keywords: Internet, benchmark testing, identification technology, information retrieval, multimedia computing, outsourcing, speech processing, video signal processing, Internet video dataset, MediaEval multimedia benchmark, community cooperation, crowdsourcing, genre tagging, multimedia benchmark dataset development, rich speech retrieval tasks, benchmarking, crowdsourcing, ground truth, large-scale multimedia data, multimedia, Algorithm design and analysis, Benchmark testing, Collaboration, Human factors, Internet, Large-scale systems, Multimedia communication, Outsourcing, Speech processing, Streaming media

MediaEvalマルチメディア・ベンチマークは、コミュニティの協力とクラウドソーシングを活用することで、ジャンルのタグ付け (Genre Tagging) 課題と、高度なスピーチの検索 (Rich Speech Retrieval) 課題のための大規模なインターネット動画データセットを構築した。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


画像検索を目的とする信頼性と再利用性の高い実験画像集の構築:ImageCLEFにおけるWikipedia課題
Building Reliable and Reusable Test Collections for Image Retrieval: The Wikipedia Task at ImageCLEF

Tsikrika, T. , Univ. of Appl. Sci. Western Switzerland, Sierre, Switzerland Kludas, J. Popescu, A.

IEEE MultiMedia, Vol. 19, No. 3, pp. 24-33 , July-Sept. 2012

Keywords: Web sites, image retrieval, ImageCLEF Wikipedia image retrieval task, ad-hoc image retrieval evaluation, large-scale collections, test collections, user-generated annotations, ImageCLEF, benchmarks, ground truth creation, image retrieval evaluation, incomplete judgments, measurement error, multimedia, ranking stability, test collections, topic development, Collaboration, Electronic publishing, Error analysis, Image retrieval, Internet, Large scale systems, Multimedia communication, Performance evaluation, User-generated content, Wikipedia

ImageCLEFのWikipedia画像検索課題は、大規模なWikipedia画像集とユーザにより生成されたアノテーションとを用いた、アドホックな画像検索評価を支援することを目的とする。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


大規模な、豊富にアノテーションされた顔表情データベースの映画からの収集
Collecting Large, Richly Annotated Facial-Expression Databases from Movies

Dhall, A. Goecke, R. Lucey, S. Gedeon, T.

IEEE MultiMedia, Vol. 19, No. 3, pp. 34-41 , July-Sept. 2012

Keywords: cinematography, face recognition, recommender systems, very large databases, visual databases, large facial-expression databases, movies, real-world conditions, richly annotated facial-expression databases, semiautomatic approach, subtitle based recommender system, emotion database, facial expression recognition, large-scale database, large-scale multimedia data, multimedia, real-world conditions, Databases, Face recognition, Facial features, Image retrieval, Large-scale systems, Motion pictures

高難易度の実世界環境を表現する2つの大規模顔表情データベースが、副題に基づく推奨システムを通じて半自動的に構築された。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


複雑な工場環境における活動とワークフローの認識のための三重データセット
A Threefold Dataset for Activity and Workflow Recognition in Complex Industrial Environments

Voulodimos, A. , National Technical University of Athens, Greece Kosmopoulos, Dimitrios Vasileiou, Georgios Sardis, Emmanuel Anagnostopoulos, V. Lalos, Constantinos Doulamis, A. Varvarigou, T.

IEEE MultiMedia, Vol. 19, No. 3, pp. 42-52 , July-Sept. 2012

Keywords: automobile production line, behavior recognition, dataset, ground truth, industrial environments, multimedia, workflow, workflow recognition, Automotive engineering, Behavioral science, Industrial plants, Large-scale systems, Office automation, Production systems, Workflow management software

従来研究とは異なり、ワークフロー認識の大規模データセットは、大手自動車メーカの実際の工場生産環境において撮影された動画系列集である。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


意味的拡張と視覚的分析によるオンラインの大規模なマルチメディア・リポジトリのインデックス化
Indexing Large Online Multimedia Repositories Using Semantic Expansion and Visual Analysis

Sevillano, X. , La Salle-Univ. Ramon Lull, Barcelona, Spain Piatrik, T. Chandramouli, K. Qianni Zhang Izquierdo, E.

IEEE MultiMedia, Vol. 19, No. 3, pp. 53-61 , July-Sept. 2012

Keywords: indexing, information resources, meta data, multimedia computing, semantic Web, video signal processing, associated textual metadata, complementary textual resources, large online multimedia repository indexing, online videos, semantic expansion, user tag prediction, visual analysis, visual features, MediaEval, bag-of-articles, geotagging, indexing, large-scale multimedia data, multimedia, semantic expansion, tagging, visual similarity, Electronic publishing, Feature extraction, Indexing, Internet, Prediction models, Semantics, Tagging, Videos, Visualization

提案フレームワークは、オンラインの動画のユーザ・タグを、視覚的特徴や対応するテキストのメタデータから自動的に推測する。テキストのメタデータは、補足的なテキスト・リソースを用いて意味的に拡張される。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


稼働中のモバイル・メディア:遠隔からのターゲットの位置特定と追跡
Mobile Media in Action: Remote Target Localization and Tracking

Qia Wang , University of Missouri Zeng, Wenjun Lobzhanidze, Aleksandre G.

IEEE MultiMedia, Vol. 19, No. 3, pp. 74-80 , July-Sept. 2012

Keywords: mobile application development, mobile communications, mobile media, multimedia, multimedia research, remote target positioning, smartphone, Computer applications, Media, Mobile communication, Research and development, Smart phones, Target tracking

スマートフォンは過去10年に渡り遠くまで来た。カレンダー・エントリや連絡先の単純なデータベースを保持するに過ぎなかった頃から、デジタルカメラ、電子コンパス、GPS、そしてスクリーンのボタンに触れるだけで得られる何千ものアプリを包括するまでに至った。人々は様々な理由からスマートフォンを好む。特に、それらの携帯性、使いやすいユーザ・インタフェース、多数の有用なアプリケーション、インタラクティブなゲーム、そして3Gネットワークを通じた高い通信速度が理由として挙げられる。技術的な視点からは、スマートフォン人気の裏にある根本的な理由は、それらが単に通信機器というだけでなく、強力なセンシングと計算のプラットフォームを提供することにある。従来PC上で実行されていた計算タスクは、スマートフォン上で実施されるようになってきている。これらの理由から、スマートフォンは、モバイル向けメディア・ストリーミング、動画編集、位置に基づくシステム、そしてモバイル視覚システムを初めとする分野に取り組む研究者の注目を集めつつある。モバイル・メディアに基づく遠隔からのターゲットの位置特定と追跡システムであるPositionItは、ネットワークに接続されたスマートフォンを用いて注目する遠隔のターゲットの位置を特定する、包括的なシステムの1つである。位置特定は、マイク、カメラ、並びに他の埋込センサから取得されたデータを統合することで実現される。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


NExT:ユーザ生成コンテンツの驚異的な検索を目的とするNUS- Tsinghuaセンター
NExT: NUS-Tsinghua Center for Extreme Search of User-Generated Content

Chua, T.-S. , National University of Singapore Luan, Huanbo Maosong Sun Shiqiang Yang

IEEE MultiMedia, Vol. 19, No. 3, pp. 81-87 , July-Sept. 2012

Keywords: NExT Center, NUS-Tsinghua Center for Extreme Search, data analytics, extreme search, geolocation, mobile applications, multimedia, social networking, user-generated content, Content based retrieval, Mobile communication, Search engines, Search methods, Social network services, Web services, Web sites

ウェブは我々が創造し、廃棄し、消費する情報に革命をもたらした。ユーザは情報の受動的な受給者から、能動的なコンテンツ消費者や製作者へと変貌した。そして情報の性質は静的な文章から動的なマルチメディアへと変化した。ソーシャル・ネットワークの利用が拡大したことに伴い、生のユーザ生成コンテンツ (User-Generated Content, UGC) はインターネットを支配するようになってきた。このようなUGCは、文章 (呟き、フォーラム、そしてFacebookのメッセージ) から画像(InstagramやFlickr)、動画 (YouTube) 、特定の場所でのチェックイン (Foursquare)、そしてコミュニティの質疑応答フォーラム (Yahoo!AnswersやWikiAnswers) まで、様々なメディアに及んでいる。驚異的な検索 (extreme search) を目的とするNUS- Tsinghuaセンター (NExTセンターとも呼ばれる) は、シンガポール国立大学(National University of Singapore, NUS)と精華大学 (Tsinghua University) との協力により設立され、UGCに対する一般からのアクセスを可能とするための、UGCの分析と管理に関する新しく困難な課題に焦点を当てている。本稿では、未編集のUGCやイベントが公開される過程をライブ監視する研究の、初期の活動を概説する。NExTセンターにより実施された研究プロジェクトのうち、生のUGCデータの収集、分析、そして可視化の過程に沿った6つプロジェクトに脚光を当てる。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


  IEEE Multimedia (IEEE) Vol.19, No.4  



電子保健サービスの技術的妥当性の検証を目的とする評価方法論
Evaluation Methodology for the Technical Viability of E-Health Services

Martínez, I. , Univ. of Zaragoza, Zaragoza, Spain García, J.

IEEE MultiMedia, Vol. 19, No. 4, pp. 38-47 , Oct.-Dec. 2012

Keywords: health care, medical computing, quality of service, e-health service technical viability, evaluation methodology, quality-of-service requirements, adaptive QoS mechanisms, e-Health services, evaluation methodology, technical viability, user dimensioning, Adaptation models, Data models, Medical services, Mobile communication, Multimedia communication, Quality of service

提案する評価方法論は、推奨されるサービス品質要求の下での、電子保健サービス (e-health service) の技術的妥当性を保証する一助となる。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


高性能顔検出システムにおける顔検出器と目検出器との組み合わせ
Combining Face and Eye Detectors in a High- Performance Face-Detection System

Nanni, L. , Univ. of Padua, Padua, Italy Lumini, A.

IEEE MultiMedia, Vol. 19, No. 4, pp. 20-27 , Oct.-Dec. 2012

Keywords: face recognition, feature extraction, object detection, quantisation (signal), eye detector system, face detector system, feature extraction, high-performance face-detection system, local phase quantization descriptors, multiresolution local ternary patterns, eye detection, face detection, feature combination, local phase quantization, multimedia, support vector machine, texture descriptors, Detectors, Eye, Face detection, Feature extraction, Quantization, Support vector machines

マルチ解像度の局所三値パターン (local ternary pattern) と局所位相量子化記述子 (local phase quantization descriptor) に基づく、顔検出器と目検出器とを組み合わせたシステムは、局所的に特徴抽出を行うことで顕著な性能向上を達成する。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


セッション開始プロトコルのための拡張Javaコール制御
An Extended Java Call Control for the Session Initiation Protocol

Femminella, M. , Univ. of Perugia, Perugia, Italy Giacinti, F. Reali, G.

IEEE MultiMedia, Vol. 19, No. 4, pp. 60-71 , Oct.-Dec. 2012

Keywords: Java, signalling protocols, telecommunication computing, telecommunication services, extended Java call control, functional mapping, session initiation protocol, telecom service management, JCC, JSLEE, Jain Service Logic Execution Environment, Java Call Control, Mobicents, SIP, Session Initiation Protocol, multimedia, open source, telecommunications, Java, Multimedia communication, Protocols, Servers, Telecommunication services

Javaコール制御 (Java Call Control, JCC) とセッション開始プロトコル (Session Initiation Protocol, SIP) との間の機能的マッピングにより、開発者は高度な通信サービスをより簡単に作成、展開、そして管理することができる。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


二次元セル・オートマトンを用いたデジタル画像のスクランブル化
Digital Image Scrambling Using 2D Cellular Automata

Dalhoum, A.L.A. , Comput. Sci., Univ. of Jordan, Amman, Jordan Mahafzah, B.A. Awwad, A.A. Aldhamari, I. Ortega, A. Alfonseca, M.

IEEE MultiMedia, Vol. 19, No. 4, pp. 28-36 , Oct.-Dec. 2012

Keywords: cellular automata, cryptography, image coding, 2D cellular automata, Game of Life, digital image scrambling method, image encryption technique, Game of Life, Lambda parameter, image scrambling, multimedia, two dimensional cellular automata, Algorithm design and analysis, Automata, Boundary conditions, Computational modeling, Correlation, Digital images, Encryption, Games

二次元セル・オートマトン (Cellular Automata) に基づくデジタル画像スクランブル化手法、具体的には広く知られたライフゲーム (Game of Life) 、により効果的な画像暗号化手法が実現される。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


マルチメディア質疑応答
Multimedia Question Answering

Hong, R. , Hefei Univ. of Technol., Hefei, China Meng Wang Guangda Li Liqiang Nie Zheng-Jun Zha Tat-Seng Chua

IEEE MultiMedia, Vol. 19, No. 4, pp. 72-78 , Oct.-Dec. 2012

Keywords: multimedia computing, natural language processing, question answering (information retrieval), domain knowledge, information overload, linguistic analysis, media content, multimedia question answering, natural language questions, Web search, media search, multimedia, multimedia question answering, search technology, Encyclopedias, Internet, Media, Multimedia communication, Streaming media, Text mining, YouTube

マルチメディア質疑応答 (Question Answering, QA) に関する近年の研究の調査から、本稿では文章からマルチメディアまでのQAの評価を行い、この分野における課題を特定する。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


研究、工学技術、そして芸術のための3Dモデルに対するリモート・アクセス
Remote Access to 3D Models for Research, Engineering, and Art

Ubik, S. Trávníček, Z. Žejdl, P. Halák, J.

IEEE MultiMedia, Vol. 19, No. 4, pp. 12-19 , Oct.-Dec. 2012

Keywords: art, data visualisation, engineering, natural sciences, research and development, solid modelling, teleconferencing, art, data visualizations, engineering, high-speed networks, humanities, low processing delay, low-latency remote access, network propagation delay, physically distributed teams, remote 3D models, research, response time, science, stereoscopic models, system architectures, videoconferencing systems, 3D models, 3D visualizations, latency, multimedia, processing delays, real-time interactive collaboration, remote visualizations, Interactive systems, Stereo image processing, Three dimensional displays, Videoconferences, Visualization

ステレオ (3D) モデルと可視化は、遠隔地の3Dモデルにアクセスする際に高レベルの没入感を提供することで、テレビ会議システムに付加価値を与えられる。高解像度の3Dモデルに対する高速ネットワーク越しの低遅延でのリモート・アクセスにより、物理的に分散した研究、工学技術、そして人文学の分野のチーム間でのより効果的な連携が可能となる。工学技術や科学から芸術や人文学に至る多くの研究分野において、3Dモデルにリモート・アクセスすることは有益である。本稿では、この分野の最先端技術だけでなく、既存の様々なシステム・アーキテクチャの調査を行う。筆者らはまた、チェコ技術大学において開発されたプロトタイプ・システムを用いた、遠距離 (10,000km以上) で実施された幾つかの実験についても説明する。実験結果から、避けることのできないネットワーク伝送の遅延に加え、送信者側と受信者側とに僅かな処理の遅延を付与しても、最終的な応答速度は許容範囲内であり、インタラクティブな感覚を提供できることが示される。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


動画監視を目的とする顔画像の事後記録
Posterity Logging of Face Imagery for Video Surveillance

Bagdanov, A.D. , Univ. of Florence, Florence, Italy Del Bimbo, A. Dini, F. Lisanti, G. Masi, I.

IEEE MultiMedia, Vol. 19, No. 4, pp. 48-59 , Oct.-Dec. 2012

Keywords: face recognition, target tracking, video streaming, video surveillance, face imagery, multiple target tracking, real-time posterity logging system, target detection, video stream, video surveillance, face detection, face logging, face pose estimation, forensics, multimedia, video surveillance, Detectors, Face detection, Forensics, Robustness, Streaming media, Surveillance, Target tracking

実時間の事後記録 (posterity logging) システムは、動画ストリーム内の複数のターゲットを検出して追跡し、顔画像を取得すると共に、検出された各ターゲットにつき最も高品質の画像のみを保持する。

SN

Copyright (c) 2012 Institute of Electrical and Electronics Engineers, Inc. All rights reserved.


[前の年]