今週からZ会との共同事業、Summer Academy in Tokyoが始まった。アメリカで展開しているSummer AcademyIntro Track(4週間コース)を、忙しい日本の中高生向けに3週間に凝縮しての提供だ。アメリカのSummer Academyと同じく、毎週、日本のスタートアップ関係者を招待してゲスト講義を行ってもらう予定だ。今回、講師は日本人・日系アメリカ人が担当しているが、Z会の藤井社長の「日本の参加にシリコンバレーの風を感じてもらいたい」という強い思いのもと、英語で行われる。プログラミング経験に基づく選考は行わなかったため全くの素人という人も多いと思うが、日本の優秀な中高生が3週間でどんなプロダクトを生み出してくれるのか、今から楽しみだ。

以前、ブログでWillow Garageについてまとめ、先週はその内容に加筆する形でMONOistに寄稿した。寄稿記事の中で、iRobot社CEOによるROS活動の批判について触れているが、用途特化型サービスロボットのビジネスにおいて、技術による差別化は既に難しいというのが筆者の現状認識だ(PepperやJiboのような汎用型のコミュニケーションロボットについては、広義の音声認識エンジンが競争力になっていると思う)。ただ、標準ロボットであるPR2を作り、地味な研究も積み重ねてきたWillow Garageには、ROSとして公開されていないところで独自のノウハウを確立しており、それがWillow Garage出身のスタートアップの競争力に繋がっているのではないかと思う。そのノウハウというのがロボットのインタラクションデザイン、すなわち「Human-Robot Interaction(ヒューマンロボットインタラクション)」だ(以下、HRI)。今回は、HRIの研究とWillow GarageがHRIに与えた影響、そして元Willow GarageのHRIチームデザイナーとして、独自のデザインノウハウを受け継いだ3人のロボットデザイナーと彼らが働く3社のロボットについて見ていきたい。

なぜインタラクションデザインが重要なのか

ここ半年ほど、ロボット脅威論が後を絶たない。事故今年の2月にBoston Dynamics社の人間型ロボット「Atlas(アトラス)」の最新動画が公開され、後ろから突き飛ばされても立ち上がり、雪道などの悪路でもちゃんと歩き、あるいは箱を持ち上げることができる様子に対し、多くの人が驚きとともに恐怖も感じたことだろう。6月にはダラス銃撃事件で、車庫に立てこもった容疑者のそばに警察がロボットを使って爆弾を仕掛け、爆殺したという前代未聞の対応がなされた。この対応についてはシリコンバレーのロボットコミュニティの間でも議論になり、AP通信などのメディアからも手掛けたメーカーや、技術的な内容についての解説が記者から求められるということがあった(なお、CNNの報道ではNorthrop Grumman社製のRemotec Androx Mark V A-1というロボットではないか、という話だ)。7月にはパロアルトのスタンフォードショッピングセンターでKnightscope社製のK5というパトロールロボットが1歳4ヶ月の男児に衝突し、男児が転倒後も乗り上げようとしたという事件があった。

本来ロボットはどう振る舞うべきなのか。一つの方向性として古くから示されており、また、昨今のロボットに関わる法規制の議論のベースにもなっているのが、Isaac Asimovによる小説I, Robotで示されているロボット工学三原則だ(以下、Wikipediaからコピー)。

  1. 第一条
    ロボットは人間に危害を加えてはならない。また、その危険を看過することによって、人間に危害を及ぼしてはならない。
  2. 第二条
    ロボットは人間にあたえられた命令に服従しなければならない。ただし、あたえられた命令が、第一条に反する場合は、この限りでない。
  3. 第三条
    ロボットは、前掲第一条および第二条に反するおそれのないかぎり、自己をまもらなければならない。

2058年の「ロボット工学ハンドブック」第56版 、『われはロボット』より。

原則として、人に危害を与えないように、また、ロボットが人の命令に服従していることが分かるような振る舞い、インタラクションが望ましい。今月からTesla社のオートパイロットによる事故の報道が相次いでいるが、完全自動運転(レベル4)の実現までの技術移行期においては、運転支援システムというロボットが人の命令をどの程度遂行できているか(逆に、どの部分は不完全で人の助けが必要なのか)を人に伝えていく必要があるだろう。

このような背景から、ロボットのインタラクションデザインは、今後ロボットが社会に受け入れられていくかどうかを決める重要な要素と位置付けられる。また、冒頭に述べたように、会社単体の視点では、従来のロボット技術による差別化が困難になりつつあるなかで、新たな差別化要素としてもこのインタラクションの良し悪しが顧客獲得と継続に繋がっていく。

HRIの研究

ロボット工学三原則が発端となり、ロボットのインタラクションデザインについて研究する分野がHRIだ。HRIは人と一緒に、又は、人によって使われるロボットシステムの理解、設計、評価に関する研究分野であり、インタラクション、すなわちロボットと人の関り合いを通じてのより自然な意思疎通を実現することがゴールだ。

学際的な分野であり、工学(電気電子、機械、工業、設計)、コンピュータサイエンス(ヒューマンコンピュータインタラクション、人工知能、ロボティクス、自然言語処理、コンピュータビジョン)、社会科学(心理学、認知科学、コミュニケーション、人類学、ヒューマンファクター)、人文科学(倫理、哲学)といった様々な分野からなる研究者、実践家によって探求が進められている。なお、HRIの学会は1992年にIEEE International Symposium on Robot & Human Interactive Communication (RoMan)として、日本で始まったと言われている。

ロボットが工場の柵の中から柵の外、もしくは人が日常生活を行う空間に沁み出してくるにつれて、そして、ロボットの知能が発達するにつれて、社会的・文化的に正しいインタラクションが求められるようになり、また、専門家でなくとも扱えるよう、より簡単にコミュニケーションが取れるようなスピーチ、ジェスチャー、表情などの研究も進められている。ソーシャルロボットの研究で著名なKerstin Dautenhahn教授は”social rules for robot behaviour (a ‘robotiquette’) that is comfortable and acceptable to humans”として”Robotiquette”という言葉を定義し、ロボットは人がやるような要求や命令の表現に適応していくべきだと述べている。そして、そのためには人が住む複雑な環境を理解し、人の意図や感情を理解していくことが必要だとしている。また、ロボットに必要なソーシャルスキルの評価のために、以下の様な評価項目を示し、それに応じた社会性を持たせることを説明している。

  • contact with humans: from “none remote ” to “repeated long-term physical”
  • robot functionality(ies): from “limited, clearly defined” to “open, adaptive, shaped by learning”
  • role of robot: from “machines tools” to “assistants companions partners”
  • requirements of social skills: from “not required desirable” to “essential”

Dautenhahn教授の論文が出た当時(2007年)の課題として指摘されていたのは、

  • 異なる研究グループ間でHRIに関する実験結果を再現可能にするための理論、モデル、ツール、方法論の開発
  • 動物-動物、人−人のインタラクション研究やHuman-Computer Interaction (HCI)で積み重ねてきた知見・方法論のHRIへの適用

である。実験に使ったロボットの外見や性能が異なれば、人の反応も全く異なるものになるであろうし、また、いくら人に似せたといっても人と同じようには見てもらえない。こうしたHRIの研究のボトルネックの解決に一石投じたのがWillow Garageだ。

Willow Garage HRIチームの貢献

前置きが長くなったが、ようやくWillow Garageの話に入る。Willow GarageのHRI研究グループでは開発した標準ロボットのPR2を使って、どのようにロボットを操作するか(テレオペレーション、遠隔操作)、どのようにロボットを通じてインタラクトするか(テレプレゼンス)、どのようにロボットとインタラクトするか(HRI)の研究が行われていた。PR2という標準ロボットを使う・他のロボットと比較することで、これまでのHRI研究の一般化に取り組み、また、既存のHCIをはじめとする関連分野の研究成果をHRIに適用することに取り組んでいた。

特にHRIの研究については、PR2と他のロボットプラットフォームを使い、ロボットの形状や振る舞いが与える影響について考察することで、人がどのようにロボットに反応するかの理解を一般化することに注力した。例えば、ロボットの姿勢がパーソナルスペースに与える影響を調べたり、アニメーターやサウンドデザイナーとの協業によってロボットの表現を改善する方法を探したり、他のインタラクションの研究(人-人、人-動物、人-エージェントなど)のどのモデルが最もパーソナルロボットに当てはまるかを調査したり、ということを行っていた。

また、もう一つの注力領域として、人のロボットに対する認識がどのようにHRIの効果に影響を与えるかということも研究していた。人の認識の状態や認知能力、安全に対する感覚などがロボットの行うタスクの効果や結果として人が返す反応にどのような影響を及ぼすかを調べていた。例えば、ロボットの能力に対する期待値を設定することがどの程度人の信念に影響を与えるかや、どのような設計がロボットが自身のできること・できないことを人に伝えるために適しているのかなどである。

HRIのチームをマネジャーとして率いていたのは、Willow Garage前はPARCやNokiaに勤め、Willow Garage閉鎖後にはGoogle XでProject Wing(UAVによる宅配サービス)のUXデザインを研究していたLeila Takayama氏だ。彼女はHCIと心理学の両方の博士号をスタンフォード大学で取得しており、Fast CompanyやWorld Economic Forumで表彰されたこともある。

前述のようにHRIチームはアニメーターの力を借りていた。Willow GarageのHRIチームにアニメーターとしてPixar社から加わったのがDouglas Dooley氏だ。彼はPixar在籍13年の間にモンスターズインクやファインディング・ニモ、カーズなど様々なアニメーションの制作に携わっていた。Willow Garageではロボットのボディーランゲージの開発やロボットのキャラクターデザインを研究した。在籍期間は1年未満と短かったが、Willow Garageのロボットデザイナーたちは、ロボットの感情を人に伝えるためにはどのようなデザインが有効かを学び、表現をなるべくシンプルにすることを学んだという。

そして、Willow Garageで数少ないインダストリアルデザイナーとして活躍していたのが現在Savioke社の共同創業者、プロダクト・デザインリードを務めるAdrian Casono氏、Simbe Robotics社の共同創業者、プロダクトデザイナーを務めるJeff Gee氏、そしてFetch Robotics社でデザインリードを務めるDavid Dymesich氏の3名だ。シリコンバレー最高のロボットデザイナーと呼ばれるこの3名の手掛けるロボットとそのインタラクションのこだわりについて見ていこう。

ロボットデザインの三銃士、それぞれのこだわり

Relay(Savioke)

まずはCasono氏のSaviokeが手掛ける自走式の商品配達ロボット「Relay」だ。現在は複数のホテルで導入されており、宿泊客からのルームサービスのリクエストに応えている。充電ステーションで待機するRelayの商品格納庫にフロントのスタッフが品物を入れ、本体上部のタッチパネルを使って配達先の部屋番号を入力する。Relayはエレベータを使って移動することが可能であり、エレベータが混んでいる場合は乗らずに待機する。エレベータにはホテル内LAN経由でエレベータ管理システムにアクセスし、停止階を指示する。エレベータに乗る際はスピードをゆっくりと落とし、乗ったあとは人と同じようにドアの方を向く。配達先の部屋の前に到着すると、システムからホテルの内線システムに繋いで部屋の電話を鳴らす。宿泊客がドアを開けるとそれを感知し、商品格納庫が開くという仕組みになっている。

外形のデザインについてはアーチ状の背面と凹んだ胸はロボットの安定性の確保と、視覚的なボリュームの減少の効果を狙っている。ラインが後ろに伸びるようになっているため、ロボットを初めて見る人でもどこが正面なのかを直感的に理解できる。インタラクションデザインのポイントは、Relayが考えていることや気持ちを宿泊客に伝える言葉と表情を持っていることだ。上部のタッチパネルには吹き出しで今何をしているかが表示される。タッチパネルには「目」も表示されており、時折瞬きを行う。目を通じて周囲の情報をセンサで収集しているという事実、並びに、Relayの感情を表現している。音声については限定的で、スターウォーズのR2-D2やBB-8のような効果音を感情表現のために使っている。例えば、宿泊客はRelayによるサービスの満足度を入力することができるのだが、満足度が高いとRelayは喜びを意味する効果音を発する。Relayのプロトタイプ段階では、よりリアルな目を映像として表示したり、言葉を使った音声コミュニケーションを行ったりしてみたが、人に過剰な期待を持たせてしまう、人がセンサーで感知されていることに過剰に反応してしまう、恐怖心を抱いてしまうことから今の形に落ち着いた。

Tally(Simbe Robotics)

次はGee氏のSimbe Roboticsが手掛ける小売店向け在庫確認ロボット「Tally」だ。Tallyはスーパーやドラッグストアの商品陳列棚の状態を本体側面に搭載されたイメージセンサを使って撮影し、現在は人手で行われている品切れ・品薄や配置間違い、値札の付け違い、陳列の乱れといった内容の確認を、クラウド上にアップロードされた画像の物体認識・文字認識で実現する。これにより、店頭在庫不足による機会損失を防ぎ、また、現在ドラッグストア1店舗・1週間あたり平均30〜40人・時が掛かっているコストを削減する。

TallyのインタラクションデザインはRelayのものと類似点が多い。直接スーパーの買い物客にサービス提供を行うわけではないので、買い物客向けの凝ったデザインは無いが、Relayと同様、店内の3次元マップと各種センサーを頼りに、人や障害物を避けながら自走する。本体正面のディスプレイには、センサーの稼働状況を示す2つの「目」が表示されており、可能な限りシンプルに、ロボットの状態を人に提示したとのことだ。お世辞にも格好いいとは言えない外形デザインについては、Gee氏のこだわりが見られる。買い物客が「見られている」と感じることが無いように、3次元センサーをTallyの正面ディスプレイ上部のスペースに外からは見えにくいように格納している。また、米国の標準的な商品陳列棚は4フィート(122センチメートル)だが、それを2つ重ねた高さの棚を撮影するため、Tallyの最大撮影可能な高さは250センチメートルに設定されている。その高さに対応するため、Tallyのプロトタイプ段階では本体高さが2メートルを超えるロボットを作っていた。しかしながら、人を見下ろすようなロボットは人を怖がらせ、警戒心を芽生えさせてしまうのではという懸念があった。そのため、現在では高さ約1メートルの本体部分に、スライド式で高さ調整可能な板状の背面部分が取り付けられたようなデザインになっている。Simbe Roboticsと同じように店内の棚在庫管理用ロボットを手掛ける企業には、カーネギーメロン大学発スタートアップのBossa Nova Robotics社や、イオンリテールが試験導入したことで知られるCheckpoint Systems社があるが、Gee氏はそれらのロボットのデザインについて、HRIの理解が足りておらず、客足を遠のけてしまうのではないか、とコメントしていた。

Freight & Fetch(Fetch Robotics)

最後にDymesich氏のFetch Roboticsが手掛ける、倉庫での作業補助を行う自走型搬送ロボット「Freight」と派生ロボットについても触れておく。Fetch RoboticsではFreightを自走モバイルロボットのプラットフォームと位置付け、Freightの上にロボットアームが搭載された「Fetch」や棚が搭載された「hmishelf」、こうしたモバイルロボットのハードウェア群を管理するソフトウェア「fetchcore」など、物流倉庫の顧客のニーズに合わせた柔軟なソリューション提供を行っている。米国だけで600万人もの作業員が小売業の倉庫の中で働いており、その労働時間の50%が商品の移動に、また、25%が空のカートを戻すことに使われている。こうした状況に対し、モバイルロボットのプラットフォームによって、自動化を進めようとしている。

Fetch Roboticsのロボットは、上記2社と違い、一般人とのインタラクションが発生しない倉庫内で使用される。そのため、デザインのポリシーはとにかくシンプルであり、タブレットPCなどのインターフェースから「後を追う」「充電ステーションに行く」「止まる」などの選択肢を選んで操作し、想定外のことが起これば作業を中断する、というものだ。作業員の足を見て、適切な距離を保ちながら後を付いていく、障害物があればそれを避けるというようになっている。もし複数人の歩行が認識された場合は、(元々の作業員を識別するというわけでもなく)単純に最も近くにいる人に付いていくようになっている。倉庫内では作業員同士が接近することは少なく、ロボットを盗もうという悪意を持った人もいないからだ。ロボットが移動可能な空間の地図は、作業員がロボットを自ら操作して登録していく。地図への登録が不要な箇所は作業員側で選べばよく、ロボットに必要以上に情報を与えない、無駄なコンピューティングパワーを使わないという発想だ。Freightが稼働中、もし事前に登録された地図と現状が異なる場合にはタスクを中断し、充電ドックに戻ることになっている。ロボットが一方的な判断を自ら行い、暴走することを防ぐためだ。また、Amazon Picking Challengeで見られるように、自律ピッキングロボットを使って、ピッキング対象の微細な違いを識別するのは難しい(例えばコカコーラとペプシコーラの缶を見分ける、など)。Fetch Roboticsでは必要以上にロボットを賢くするのではなく、類似した商品は倉庫内の配置場所を変えるなど、ロボットの能力に合わせて環境側を変えることを推奨している。ロボットは不完全であるという前提に立ち、ロボットの判断に委ねることを極力減らすというアプローチになっている。

(余談だが、FreightやFetchのデザインはRelayやTallyと比べるとロボットファン以外には正直ダサく感じると思う。これは、他の2社と異なり、Dymesich氏がFetch Roboticsに加わったのが創業期ではなく、既にインダストリアルデザインが大方決まってしまっていたためだそうで、Dymesich氏も苦々しく思っているそうだ。)

インタラクションデザインの秘訣

UI/UXの洗練が進むウェブ・モバイルアプリの業界と比べて、ロボットのデザイン、HRI設計については各社手探りでやっているのが現状だと思う。ただ、学術的なHRI研究の積み重ねは存在しており、Willow Garageでその一般化と応用を担ってきた三人のデザイナーたちは、新たなロボットスタートアップの現場でノウハウを生かして、ロボット脅威論に打ち克って世の中に受け入れられていくための創意工夫を重ねている。サービスロボット時代のインタラクションデザインの秘訣にいて尋ねてみたところ、彼らは口をそろえて「とにかく顧客と話せ。試してみて人の反応を観察しろ。決してロボットファーストになってはいけない。顧客ファーストを貫け」とアドバイスをしてくれた。

参考資料