表紙

イベント

金子亘の作品

近藤直子のページ

リンク

リコーダー



◆人間を見るテレビカメラ

 平原で輪になって、みんなで座る。その輪のまんなかに、太鼓かタカの羽根をおい
てみる。すると、一人一人異なった角度から見ることになるため、目に映る太鼓や羽
根はみんな違って見える。人間のものの見方には、何層もの異なった見方があり、し
かもそれは人生のさまざまな出来事によって、多くの影響を受けている。ネイティブ
・アメリカンの人々の間に古くから伝わる教えである。ものの見方の難しさや不思議
さを端的に表すその輪の中に、絶えず動いて止まない私たち人間自身を立たせたな
ら、事態はさらに複雑化するだろう。
 コンピュータによる最先端の画像処理研究。カメラがとらえた手の動きをコン
ピュータに認識させるという高度なシステムを開発する現場においても、人間のもの
の見方の難しさは絶えずつきまとう問題であった。

手振りで図形描写

 上部の左右と真横に計三台のテレビカメラが設置されている。おもむろに手を差し
出すと、正面の大画面に自分の手が3次元の映像となって出現する。手のひらを握り
そのまま四角い形に手を動かすと、立方体や直方体が映し出される。あらかじめ関連
づけておいた手の動作とコンピュータの指示命令で、つくった図形をつかんで動かし
たり、拡大・縮小もできる。球体や三角錐をつくってつなげたり、表面の模様や色を
変えてみるとどうなるだろう…。コンピュータを操作しているというよりも、バー
チャルな世界で魔法を使っているような気分になってくる。
 関西文化学術研究都市にあるATR知能映像通信研究所の第一研究室では、コン
ピュータによる画像処理をベースにして人間の動きをとらえ、取り出したデータをも
とにして、CGなどを製作する最先端の研究が行われている。このほどATRで開発され
た、コンピュータに手振りを認識させ、素手でコンピュータ上に3次元の絵を描くこ
とができる実験システムである。この開発に携わっている研究員の内海章さんは、主
に人間の動きをカメラで認識する装置の開発・研究を担当している。

「隠れ」の問題

 日頃、私達が使っているコンピュータにはキーボードやマウスがついている。それ
によってコンピュータに指示を入力し、仕事をさせるというのが一般的な操作法であ
るが、人間の動作、特に手の動きをコンピュータのカメラに認識させることができれ
ば、入力の手間が省かれ、よりスムーズにコンピュータを操ることが可能になる。
 この研究自体は10年以上前からある、古くて新しいテーマだという。しかし、私達
にとっては当たり前でわかりやすい手の形でも、コンピュータにとっては複雑きわま
りない形に映るらしい。関節が何カ所もあって、各々が動き回る。指の微妙な曲がり
具合一つで、何通りもの形ができてしまう。
 従来、手振りを認識するシステムとして主に2通りの手法があった。まず、セン
サーを内蔵した特殊な手袋を装着し、カメラに手の形状を認識させる方法。この手法
の最大の欠点は、カメラに対して一定方向に手を向けていなければいけないという点
である。向きが固定されているので、応用分野も限られたものになってしまう。この
欠点を解消するため、手の完璧なモデルをコンピュータの中につくってしまう方法も
考案された。しかし、これはかなりやっかいな方法である。関節と関節の間が何セン
チで、各関節がどの向きに曲がっているか…。コンピュータの中で延々とモデルを検
索し続けるため膨大な時間がかかる。しかも、この研究に常につきまとってきた最大
の問題が解消されなかった。「隠れ(オクルージョン)」の問題である。

手のモデルは楕円形

 同じ手の形でも、見る向きによって、全く違った形に見えてしまう。小指と薬指が
くっついていても、離れていても、横から見るカメラにとっては同じ形だ。見えない
部分をどうやって見ればいいのか…。
 「見る位置や視点、つまりカメラの数を増やし、まず手の位置と向きを認識するこ
とから始めました。すると、コンピュータの中につくる手のモデルを、それほど精密
にする必要はないことに気がついたのです。見る向きを決めるためには、細かい情報
はむしろ余分なもの。指の曲がり具合や手の大きさよりも、見る向きによる変化の方
が重要なのです」。
 思い切って単純化した手のモデルは、なんと楕円体。丸くて平べったい円盤であ
る。さらに、位置と向きを認識するため従来から使っていた三角測量に、手のシル
エットの幅の大きさも計算項目に加えた。これによって、手を握っていても開いてい
ても、即座に手の位置と向きが認識できる。向きを認識してから、手のひらに対して
最も正面に近いカメラで、指の曲がり具合などの細かい情報をとらえればいいのだ。

人間の動きを追って

 内海さんが今一番興味があるのは、複数のカメラやセンサーによって一つの目的を
達成していく連携プレイ。現時点ではカメラが見る対象は一つの手だけであるが、複
数の手や、一人の人間の動きそのものを追うとなると、さらに複雑な作業となる。見
るべき人数が増えればさらに事態は困難になる。そのような場合における一番効率の
良いものの見方とは一体どのようなものなのか。
 「それが人間のものの見方なんでしょうね。人間の視覚は、普段生活する上でうま
くいくようなしくみが働いているのだと思います。人間の目はどこまですごいのか、
あるいは、そんなにたいしたことをやっていないのか。どちらにしても見るというこ
とは、難しいことですよ」。
 果たして私達はものの形を正確にとらえているのだろうか。人間の視覚をコン
ピュータに与えるためには、「正確である」こと以上の難しさがあるようだ。今回、
開発されたシステムは、まずはバーチャルコンピュータゲームの分野での応用が期待
されていて、ゲーム機やソフトの開発会社数社からすでに引き合いもきているとい
う。遠い未来、手で指図して扉を開けたり、物を取り出したり…魔法使いのような生
活を送ることができる時には、隠れて悪いことはできない「何でもお見通し」の時代
になっているかもしれない。