• ポリテクセンター関東(関東職業能力開発促進センター)菊池 達也
  • tkikuchi@uitec.ac.jp

1.ディジタル・ビデオの概要

最近のパソコンの高性能化と低価格化には驚くばかりである。ほんの数年前では,困難と思われていた高度な処理が,パソコンで簡単に実現できる。その一つにディジタル・ビデオがある。パソコンによるディジタル・ビデオの歴史は,1992年米国アップルコンピュータ社のQuickTimeや米国マイクロソフト社のVideo For Windows(以下VFW)が開発されたことから始まった。ディジタル・ビデオ,すなわち映像・音声情報が,文字やデータ情報と複合的・一体的に利用し,コンピュータと対話的に情報処理するマルチメディア化の動きが進んでいる1)。

教育訓練分野においてもマルチメディアを利用した学習環境の整備や教育効果が期待されている。特に,マルチメディアは教室での授業,ビデオ,マニュアル等の特有の欠点をカバーし,個人の能力に基づいて,教育,訓練をすることができるからである。よく引用される調査だが,人は見たものの25%,見て聞いてみたものの40%,見聞きし,なおかつ実際に試したことの75%を覚えているという。マルチメディア以外の教育法は,結局1回きりの見せて話すタイプのバリエーションになってしまうが,マルチメディアでは見てやってみるものであり,理解できないことは何回でも繰り返して行うことができる。ユーザが,自分の学習をコントロールできるとき,学習は飛躍的に加速する2)。

本稿では,マルチメディア技術の大きな要素であるディジタル・ビデオ(動画)に話を絞って,その概要,制作方法を筆者の経験を交えて解説する。

1.1 ディジタル・ビデオの概要

ディジタル・ビデオは,静止画と動画に大別することができる。ディジタル・ビデオは,映像と音声がディジタル・データで表現されているのがその特長である。その描画の仕組みは,100年前の映画フィルムやアニメーションと基本的に変わりなく,静止画像(フレーム)を時系列に並べたにすぎない。例えば図1にロボットの動作を表したフレームは,前後にロボットに多少の変化がつけられている。一定の速度でフレームが移動すると,人の目の錯覚によりロボットが動作しているように見える仕組みだ。ディジタル・ビデオもテレビ信号も同様な方法で,動画を再現している。

図1
図1

1.2 動画データ量の算定

テレビやビデオで使用されるNTSC(National Television System Committee)方式のテレビ信号(カラー)は,30frame per second(fps),色は無限色。一方,パソコンのディジタル・ビデオは,コンピュータの処理能力に応じて,フレーム数,色数,画面サイズを適切な値を選択することが必要となる。ここで,1静止画面の情報量を考えてみる。コンピュータ画面はピクセル(Pixel)とよばれる点の集まりで,米国IBM社が取り決めたVGA(Video Graphics Array)画面の場合,縦480ピクセル,幅640ピクセルで構成(平面的)されている。また,各ピクセルは,色情報を含んでいるため,図2のように立体的に表現される。色情報は多いほど,自然色に近づくが情報量は増大する。色情報が3Byte(24bit)の場合224=1,677万色を表現することが可能で,これは人間の目が識別できる以上の色数である。

図2
図2

1秒間の動画データは30の静止画像のデータ量に匹敵し,その情報量は下記の式で求めることができる。

動画データ=縦(pixel)×横(pixel)×色数(Byte)×フレーム(fps)

単位:Byte

ここで,1秒間のテレビ画像をディジタル情報で換算すると,その情報量は,480×640×3×30=27,648,000Byte(約28MB)となる。この値はフロッピーディスク(1.44MB)に収まりきれず,またハードディスクの容量にもかなりの負担となる。記録メディアとしてはCD-ROM(650MB)が検討されるが,広く普及している2倍速CD-ROM装置のデータ転送速度は300kByte/sであり,1秒間に28MBの情報を転送することは可能である。

1.3 動画の圧縮

理想的なディジタル・ビデオを求められているが,低価格なCD-ROMの利用が望ましいことも考えると,ディジタル・ビデオのボトルネックは,その膨大な情報量であり,言い換えるとデータ転送速度である。すなわち,情報圧縮技術が問題解決の鍵となる。

この方法は,動画データ量をCD-ROM装置のデータ転送速度を満足するような値までに圧縮し,CD-ROMに記録する。次にパソコンで動画を再生する場合,圧縮データをCPUまたは専用LSIを利用して復元処理を行いディスプレイへ出力する(図3)。ここで行われる圧縮方法は,可逆符号化と非可逆符号化の2種類ある。可逆符号化は,圧縮前と復元後の情報を完全に等しくする方法である。非可逆符号化は,復元後の情報がおよそ圧縮前と等しければよいとする。すなわち,原画像が物理的に完全に再現されなくても,人の目で見たときに原画像と同じように見えればよい。人が知覚できない成分は画像符号化の観点からは一種の冗長度と見なし,その視覚的冗長度を効果的に除去して,高効率な情報圧縮が達成される3)。

図3
図3

パソコンの動画圧縮には,非可逆符号化が採用されており,Cinepak,Intel Indeo,Microsoft Video 1,MPEG4)などの形式があり,用途や目的に応じて使い分けられている。

2.ディジタル・ビデオに必要な機器

図4に筆者が使用している機器を参考までに紹介する(ここでのパソコンはNEC製PC-9801BX3を使用しているが,DOS/V,マッキントッシュ等のほかの機種でもディジタル・ビデオとマルチメディア教材の制作は盛んに行われている)。

図4
図4

2.1 パソコン

パソコンは,PC-9801BX3をベースに,2倍速のCD-ROM,オーバードライブ・プロセッサ(ODP486DX2-66Mz),メモリ(9MB),ハードディスク(540MB),Windows3.1とVideo for Windows(VFW)を付加している。圧縮されたディジタル・ビデオは複雑なアルゴリズムで復号化されるため,高速なCPUが求められる。

2.2 ビデオキャプチャカード

ビデオキャプチャカード(Video Capture Card)は,ビデオデッキからのビデオ信号をディジタル信号へ変換する(キャプチャは英語で「捕らえる」との意味)。ここで使用しているビデオキャプチャカード(I・O DATA製GI98)は,インテル社indeo(i750)LSIを内蔵し,ビデオ信号を取り込みながら,24bitカラー,最大340×240pixelの画面サイズへリアルタイムに画像データを圧縮する。本カードが採用している非可逆符号のIntel indeo形式は,VFWに対応している。

2.3 サウンドカード

ビデオキャプチャと同時に音声を記録するためにクリエイトラボ社のサウンドカード(SB16.GA/98)を使用している。本カードの16bitディジタル・サウンド機能は,ビデオデッキからのアナログ音声信号をディジタル信号へ変換する。また,グラフィック・アクセラレータの機能も併せ持っているので,64bitの専用LSIがCPUの代わりにグラフィックス描画を高速に処理する。

2.4 ビデオ機器

撮影用機材に8mmビデオカメラを使用した。映像機器の専門知識がなくても,家庭用ビデオカメラは手軽にきれいな映像を録画することができ,大変便利である(家庭用ビデオカメラを使用した撮影方法や台本の作り方を解説したテキスト5)を,職業能力開発大学校研修研究センターで作成されている。撮影技術を親切丁寧に解説しているので,ビデオ撮影を始めようとする人はぜひ参考にされたい)。また,編集時におけるビデオの再生には,ビデオデッキの使用を勧める。ビデオカメラでもビデオ信号を出力することはできるが,映像の頭出しやコマ送りが簡単にできるビデオデッキは編集作業が円滑に進む。

2.5 補助記憶装置

膨大なディジタル・ビデオデータで,ハードディスクの容量はすぐに一杯になってしまうので,容量の大きな補助記憶装置が必要となる。MOディスクは230MBまで記憶でき,書き換え可能で,携帯性に優れており,大容量の補助記録メディアとして広く普及している。筆者の場合,マルチメディア教材をCD-ROM化するとき,ライトワンスを依頼した相手との共通メディアとして,MOディスクを利用した経緯がある。最近は100MBまで書き込めるフロッピーディスクやCD-ROMと同じ容量をもつPDディスクなどの媒体も注目されているので,各自の目的や用途に応じて補助記録装置を選定すればよいと思われる。

2.6 ディジタル・ビデオ再生のパソコン環境

ディジタル・ビデオを再生するためには,図4のパソコンにビデオアクセラレータカード,サウンドカードとスピーカーを付加した程度で可能である。最近のマルチメディア・パソコン型と呼ばれる機種は,ディジタル・ビデオを再生する周辺機器をはじめから内蔵している。

図4
図4

3.ディジタル・ビデオの作成

ここでは,上記機器を利用したディジタル・ビデオの実際の作成手順を説明する6)。Windowsを起動し,キャプチャツールを実行すると図5に示すウィンドウが表示される。ウィンドウ中央には,ビデオデッキから出力される映像のモニタが映し出される。ビデオをキャプチャするまえに,オーディオやビデオの入力形式の設定を行う。

図5
図5

3.1 オーディオ形式の設定

音質に関する設定には次の3項目が用意されている(図6)。

図6
図6

(1) ステレオ/モノラル

使用するオーディオのチャンネル数を指定する。

ステレオは2チャンネル,モノラルでは1チャンネルを使用するので,ステレオではモノラルの2倍の情報量となる。

(2) ビットレート

サウンドのディジタル化に使用する記憶容量を設定する。16bitでは優れたダイナミックレンジを得ることができるが,情報量は多くなる。

(3) サンプリング周波数

オーディオサンプルの取得する割合を設定する。11.025kHzでは電話の音声程度,22.050kHzではAMラジオ程度の音質である。44.100kHzはオーディオCDで使われているサンプリング周波数である。筆者の経験から,モノラル,8bit,22.050kHzの設定は音質とファイル容量のバランスのとれた適当な値と思われる。

3.2 ビデオ形式の設定

画質に関する設定には次の3項目が用意されている。

(1) ビデオ圧縮方式

ビデオのキャプチャに使用する圧縮方式を設定する(図7)。ここで転送速度を指定する場合,作成したディジタル・ビデオの最終的な保存メディアの転送速度を指定できる。2倍速CD-ROM機器の転送速度は300kByte/sだが,コンスタントにその速度を保つとは限らないので余裕をみて規定値より遅めに設定したほうがよいだろう。また,転送速度の設定は,圧縮率の操作に他ならない。転送速度を低くすると,画質は下がるがファイル容量は小さくなる(圧縮率は高い)。一方,転送速度を高めると,画質は上がるがファイル容量は大きくなる(圧縮率は低い)。

図7
図7

(2) ビデオサイズ

取り込むフレームのサイズを指定する。ここでは,3種類の画面サイズ(160×120,240×180,320×240pixel)を指定できる。サイズが大きければビデオの解像度は増すが必要な記憶容量も大きくなる。小さな画面をメディアプレーヤーで表示倍率を拡大して再生することも可能だが,非可逆符号による画素の粗さが目立つようになる。

(3) 1秒当たりのフレーム数

1秒当たりに取り込むフレーム数を設定する(図8)。ここでのフレーム数は,テレビ信号(NTSC)と同じく30フレームが望ましいが,ファイル容量が大きくなりすぎてビデオの再生時においてパソコンはすべてのフレームを描画できない場合が発生する(ビデオサイズの大きさとも関係している)。なぜならば,VFWは30秒の動画は30秒間で再生を完結するように働く。結局,再生に間に合わないフレームを飛ばすことになり,局部において画像のコマ飛びや音飛びが発生する。CD-ROM装置を前提に検討すると,240×180pixel画面サイズのとき10から15fpsが適当な値と思われる。この値は,筆者が使用している図4の機器構成での目安と考えてほしい。

図8
図8
図4
図4

ビデオ設定は各自のパソコンに最適化した設定と,多くのパソコンで利用可能な標準設定の2つがある。参考までに,さまざまなWindowsパソコンで利用されることを前提に制作されたMicrosoft社のマルチメディア百科事典(ENCARTA'95)で採用しているビデオ形式は,Intel Indeo圧縮,24bitカラー216×192pixel画面サイズ,10fps,約100kByte/sデータ転送速度であり,オーディオ形式はモノラル,22.050kHz,8bitである。

(4) ビデオ入力カラー調整

図9のウィンドウを利用して,画面の水平位置,垂直位置,明るさ等の調整を行う。

図9
図9

3.3 キャプチャの開始

(1) ハードディスクの連続領域の確保

ビデオキャプチャでディジタル化されたデータは,ハードディスクに逐次,高速に書き込まれる。240×180pixelサイズ(10fps)を30秒間記録する容量は約3MBを必要とするため,ハードディスクの容量を十分に確保しなければならない。また,キャプチャしたデータをハードディスクに高速に書き込むためには,連続した記録領域を必要とする。ハードディスクの不連続領域にデータを書き込む場合,データアクセスにおいて余計な時間を費やしてしまう。そのことは結果として,キャプチャ時にデータのコマ落としを引き起こす。ハードディスクの連続領域の確保はビデオキャプチャの性能を大きく左右する要因である。連続領域を確保する方法として,ノートンユーティリティのスピードディスク・ツールやMS-DOS6.2に付属するデフラグメンテーション・コマンドの実行で解決できる。

(2) キャプチャ開始

ビデオデッキで記録開始点より数秒手前で映像の頭出しを行う。キャプチャツールのキャプチャの開始ウィンドウを表示させ(図10),ビデオデッキでビデオテープの再生を行う。記録開始点時点で,キャプチャ開始OKボタンを押す。記録終了時点で,エスケープキーを押すとキャプチャを終了する。キャプチャツールにより作成したディジタル・ビデオは,任意のファイル名にAVI(Audio Video Interleaved)拡張子をつけて保存する。

図10
図10

作成したビデオ情報は膨大な値となるので,長時間録画には適さない。そのため市販されているマルチメディア・ソフトに含まれるビデオの再生時間は,60秒以下が多い。

4.ディジタル・ビデオの再生

キャプチャツールで作成したAVIファイルの再生にはメディアプレーヤーを使用する。ファイル名を指定して,PLAYボタンをクリックすると動画の再生が始まる(図11)。再生とともにトラックバーが移動するので時間経過を把握できる。また,トラックバーをマウスポインタでドラッグし,ディジタル・ビデオの早送り,巻き戻しを瞬時に行え,動画もきちんと静止させられる。そして経時変化による画質の劣化を生じない。

図11
図11

ここで,ディジタル・ビデオを利用した簡単なマルチメディア教材例を図12に示す。図12-1の画面は,インターネットのホームページを閲覧するときに使用するWorld Wide Web Browser(以下,WWWブラウザ)と呼ばれるソフトウェアである。WWWブラウザは,マウスポインタでテキストや画像が指定されると,他のテキスト,音声,画像,動画やネットアドレス等とリンクする仕組みを備えている7)。このようなリンクする仕組みをハイパーテキスト(HyperText)といい,その指定をすることを英語でマークアップ(Markup)という。図12-2に示す例においては,マウスポインタでロボット制御実習の文章中のアイコンをダブルクリックすると,課題説明のディジタル・ビデオが再生される。

図12-1
図12-1
図12-2
図12-2

このような手続きを記述するプログラム言語は,Hyper Text Markup Language,HTMLと呼ばれる8)。ここで使用したプログラム・リスト(図12-2)を示すが,プログラムというより,書式をつけた文章ファイルに近い。そのためHTMLの習得は,他の言語習得と比較して容易で,簡単にマルチメディアに対応したハイパーテキストの作成が可能である。WWWブラウザは,ネットワーク網(Web)に点在したサーバのホームページを閲覧するソフトではあるが,ネットワークに接続されていないコンピュータ環境においても,ハードディスクやCD-ROM等の補助記憶装置をWWWサーバと見なして利用することも可能である注1)。図12に示す例においても,Aドライブから,HTMLを読み込んで表示させている。このような利用方法は,各教育訓練施設でのマルチメディア教材の制作に大変役立つものと思われる。WWWブラウザとHTMLを利用するメリットは以下のとおりである。

図12-2
図12-2
  • ・HTMLの習得は,他のコンピュータ言語と比較して容易である。
  • ・WWWブラウザは安価である。
  • ・HTMLで作成した文章は,Windows,Macintosh,Unix上で共通して利用できる。

マルチメディア教材に興味ある人には魅力的なWWWブラウザとHTMLであるが,現状では簡単なプレゼンテーション・ツール程度と思ったほうがよいだろう。また,HTMLで制作した教材を利用する場合,受講者はあらかじめWWWブラウザの操作学習を必要とするかもしれない。

HTMLの言語体系は改訂され続けており,オブジェクト指向言語の登場などで,教材応用への可能性も今後さらに広がるに違いない。

5.おわりに

映像やネットワークを自由に扱うことができるパソコンは,職業能力開発の教育訓練に大きく貢献する日も近い。本稿で紹介したディジタル・ビデオは録画時間は短いが,テープ方式より優れている長所を生かし教材へ応用することは可能と思われる。本稿が,各訓練施設のマルチメディア教材の自作に少しでも参考になれば幸いである。

今回,ディジタル・ビデオの制作にとどまらず,Adobe社のPremiereを使用したビデオ編集やディジタル・ビデオを利用した教材作成についても紹介したかったが,誌面の都合上できなかった。また,機会をあらためたい。なお,内容によっては筆者の思い違いなどがあるかもしれないが,専門家諸氏のご叱正を待つ次第である。最後に,本稿の執筆のチャンスを与えていただき,適切な指導を賜った職業能力開発大学校研究研修センターの広報普及室の皆様に厚くお礼申し上げる。

注1) 一部のWWWブラウザは,ネットワーク層を初期化しないと動作しない。WWWブラウザは,Netscape Navigator,Mosaic,Intemet Explorerなど多数ある。

〈参考文献〉

  1. 1) 大蔵省印刷局発行,通信白書(平成6年度版),郵政省編,pp.290-291,pp.304-305.1994年.
  2. 2) 佐野美知夫監訳,マグロウヒル マルチメディアハンドブック,フジテクノシステム,p.63.1995年9月.
  3. 3) 原島博,先端技術の手ほどきシリーズ 画像情報圧縮,オーム社,pp.11-12.1991年8月.
  4. 4) 安田浩,マルチメディア符号化の国際標準,丸善,pp.191-197.1991年6月.
  5. 5) 雇用促進事業団,ビデオソフト制作の入門,1995年1月.
  6. 6) アイ・オー・データ機器,GI-98ユーザーズ・マニュアル,pp.24-30.1994年9月.
  7. 7) Robert E.Horn,ハイパーテキスト情報整理学,日経BP社,pp.6-7.1991年11月.
  8. 8) 藪暁彦,田辺茂也,HTML早わかり,O'Reilly & As-sociates.Inc,p.180.1995年7月.
ページのトップに戻る