本文とサイドメニューへジャンプするためのナビゲーションスキップです。

スタートアップガイド

J-Net21 中小企業ビジネス支援サイト

  • J-Net21とは
  • スタートアップガイド
中小機構
  • メルマガ登録
  • RSS一覧
  • お問い合わせ

HOME > 製品・技術を開発する > デジ・ステーション

デジ・ステーション


5分でわかる最新キーワード解説
「超高速ロボットハンド」ってなんだ!?

日々進歩するIT技術は、ともすると取り残されてしまいそうな勢いで進化の速度を高めています。そこでキーマンズネット編集部がお届けするのが「5分でわかる最新キーワード解説」。このコーナーを読めば、最新IT事情がスラスラ読み解けるようになることうけあい。忙しいアナタもサラっと読めてタメになる、そんなコーナーを目指します。今回のテーマ「超高速ロボットハンド」は、1秒間に1000コマという高速な画像処理に支えられた認識と制御の技術です。人間や動物の知能と同じように、全ての処理を並列化することで、誰も見たことのない速度と精度でロボットが様々な運動を行うことが可能です!

1.「超高速ロボットハンド」とは?

超高速ロボットハンドとは

超高速ロボットハンドとは、東京大学の石川小室研究室が研究している秒間1000コマの高速ビジョンと並列情報処理技術が実現する超高速なロボット制御技術である。

図1 高速ドリブルロボット
ゴム製のボールを人間の目に見えないほどの速度(1秒間に約10回)でドリブルできる

http://www.keyman.or.jp/3w/prd/00/00006400/?p_id=30003685&url=http%3A%2F%2Fwww.k2.t.u-tokyo.ac.jp%2Ffusion%2FDynamicHolding%2Findex-j.html(石川小室研究室のサイトにて動画視聴が可能)
ゴム製のボールを人間の目に見えないほどの速度(1秒間に約10回)でドリブルできる

資料提供:東京大学 石川小室研究室

ボールのドリブルや投げ上げとキャッチ、ペン回しなど、いずれも従来の常識を超える超高速な物体操作をインテリジェントに実行できるロボットは、産業界はもちろんのこと、世界中の人々の注目を集めている。ロボットのデモ映像は、ウェブ上の無料動画配信サイト、Youtubeにも数多くアップされており、一般ユーザのブログなどでも広く紹介され、またTV番組などでも放送されている。

本をパラパラとめくるだけでスキャン
図2 本をパラパラめくってスキャンする装置
本をパラパラとめくるだけで、変形を補正した上で各ページをスキャン

http://www.keyman.or.jp/3w/prd/00/00006400/?p_id=30003685&url=http%3A%2F%2Fwww.k2.t.u-tokyo.ac.jp%2Fvision%2FBookFlipScan%2Findex-j.html(石川小室研究室のサイトにて動画視聴が可能)
本をパラパラとめくるだけで、変形を補正した上で各ページをスキャン

資料提供:東京大学 石川小室研究室

石川小室研究室の研究は、ロボットの制御だけが目的ではない。上のスキャン装置は、本をパラパラとめくる動作を高速ビジョンで認識し、その変形の仕方をリアルタイムで処理して、フラットベッドスキャナでスキャンするのと同じ、変形のないページに戻してスキャンすることを目指すもの。今流行の"自炊"(自分で漫画や雑誌、書物などを裁断・スキャンし、電子化すること)を行っている人にとってみれば、夢のような装置。そのアプローチは、人間を超える映像センシング技術を通じて、今までの常識を超える、さまざまな機械の能力を引き出そうというものなのだ。

2.超高速ロボットハンドの基幹技術「高速ビジョン」

超高速ロボットハンドの歴史は、1980年代にまで遡ることができ、その最初の10年間は、現在のロボットの目にあたる、高速ビジョンを担う装置「ビジョンチップ」の開発に費やされた。

図3 最初の高速ビジョン(1.2m×1.2m)とその機能をワンチップ化したもの(VLSI実装5.4mm×5.4mm)
1993年の最初の実装では1.2m四方だった64×64ピクセルのビジョンチップは、VLSI化して5.4mm四方となった。現在の技術では、512×512ピクセルで1cm四方の次世代チップが実現可能。

1993年の最初の実装では1.2m四方だった64×64ピクセルのビジョンチップは、VLSI化して5.4mm四方となった。現在の技術では、512×512ピクセルで1cm四方の次世代チップが実現可能。

資料提供:東京大学 石川小室研究室

一般的なカメラによる画像認識と情報処理のシステムは、市販の秒30コマまたは60コマのビデオカメラで撮影された映像を、カメラの外に配置された情報処理装置(多くの場合はPCなどのコンピュータ)で処理し、機械制御などを実行する仕組みとなっている。

一方、ビジョンチップでは、光を電気信号に変えるセンサの画素1つひとつに、デジタル画像処理を行う回路が付属しており、1秒間に1000コマの映像をデジタル信号として得る。それと同時に、下位の認識処理を行い、その結果を上位の認識と判断を行うシステムへと渡すことが可能となる。

ビジョンチップには、簡単な画像処理を高速で実行するプロセッシングエレメントの回路を実装したターゲット追跡専用のチップなども開発されている。これらのビジョンチップの出力するリアルタイムの高速デジタル映像信号を、上位の認識システムが、これに劣らぬ1秒間に1000回のスピードで処理することで、超高速ロボットハンドなどの機能が実現しているのだ。

並列処理と直交分解

超高速ロボットハンドの制御は、まず高速なビジョンチップの出力する、制御目的に最適化されたデジタル信号(映像をデジタル処理して得られたデータ)を、さらに複数の並列処理へと受け渡し、これらを同時に処理することによって行われる。

図4 階層的並列分散システム
図4 階層的並列分散システム

資料提供:東京大学 石川小室研究室

目標のトラッキングから、ロボットアームの目標への移動、対象を掴むための指の形状調節など、複数の目的のための情報処理と、制御量のモーターへの伝達までを高速で情報を交換しながら実行しつづけることが、超高速でロボットの制御を可能にするシステムの肝だといえる。

図5 タスクを並列に処理
複数の動きを同時並列で行う

複数の動きを同時並列で行う

資料提供:東京大学 石川小室研究室

具体的には、対象の動きを追いかけ、対象物へと手を伸ばし、それをつかめるように指を開いて、掴む、という動きを、それぞれ別々の制御要素として設計し、同時に動作させることではじめてロボットは、1秒間に1000回という映像情報を、高速かつ精密な動きへと変換して、目的の動作を成功させている。
 こうした処理および動きの要素は、それぞれが干渉しあわず「直交」する要素へと分解する必要がある。例えば、人間であれば、立ち上がろうとしながら、同時に地面に落ちているものを拾おうとすれば転んでしまう。脚の曲げ伸ばしに相反する複数の動作を要求してしまうからだ。こうした混乱を起こさずに、同時に実行するには「直交」した処理/動作が必要だ。

空間分解能よりも時間分解能

高速ビジョンが、従来のさまざまな制御システムの限界をはるかに超えた性能を発揮するのは、時間方向の分解能(映像でいう解像度)が、従来の60コマの20倍近い秒間1000コマに到達していることが、重要な役割を果たしている。

光学マウスの動作などでよく体感することができるが、どれほどdpi数(空間分解能)の高いセンサでも、トラッキングのジャンプは発生しうる。これはマウスが動く速度に、光学センサのスキャン周波数が、十分には追いついていないことが本質的な原因である。

図6 高速ビジョン
動きを認識するために重要なのは時間解像度

動きを認識するために重要なのは時間解像度

資料提供:東京大学 石川小室研究室

上の図のように、投げられたボールの動きを追う場合であれば、一秒間に60回という普通の映像では、動きを捉えることは本質的に不可能である。どれほど高い解像度のカメラを用いても、前のコマと次のコマは、乖離した位置にあるため、どう動いているかを認識するには、高度な動体予測処理や類推アルゴリズムが必要になる。
 秒間1000コマというビジョンチップの時間分解能があれば、一見高速で動作しているように見えるボールも、コマとコマの間では重なりあう程度の移動しかしていない。この場合、処理ははるかに単純なもので済むため、トラッキングのミスはありえず、システムの許容する範囲内では100%に近い認識を実現することができる。
 超高速ロボットハンドは、一見複雑な情報処理を超高速なCPUで実行しているように思えるが、実際には、この時間解像度の高さを生かし、処理は限界まで単純化、高速化されている。この超高速な処理同士を複雑なネットワークへと構築する技術が、従来の常識を超える認識と制御の能力の秘密だといえる。

3.幅広い応用範囲

石川小室研究室の開発したこの高速センサと処理のネットワークシステムは、産業界をはじめとする幅広い分野での活用が期待されている。
 自動車の自動運転システムや障害物の検出と回避、生産設備の位置決めや欠陥検出、前述した本のスキャンシステムのような高速度運動物の画像解析など、その対象は枚挙にいとまがなく、かつ広範なジャンルに渡る。
 この研究の特筆すべき点は、認識と制御の時間解像度を機械の限界にまで高めることで、人間がこれまで不可能と考えてきたことを可能にするところである。秒間1000コマのデジタル映像をリアルタイム処理することにより生まれる新しい機械制御の領域は、まだまだ始まったばかりだと言えるだろう。
 また、最新の脳科学では、人間の動作もまた意識よりも低レベルの場所で制御されているとの研究もある。「コップを手に取る」という動作は、意識が「コップを手に取ろう」とするよりも前に始まっていて、実際には意識は動作を追認しているという学説である。
 超高速ロボットハンドが行う並列処理は、予測や解析よりもより反射的な単純な処理によって動いているが、人間の動作も似たような制御機構なのかもしれない。そう考えると、認知科学や拡張現実システムなどの情報科学とも深い関連性を持つ研究だといえるのではないだろうか。

取材協力 :東京大学 石川小室研究室

掲載日:2010年10月27日

キーマンズネット

出典元:株式会社リクルート キーマンズネット 2010年9月22日掲載分

検索

このページの先頭へ