フィジカルAIは、ここ数年の進展によって、構想段階から実装検討の段階へ移りつつあります。ヒューマノイド型ロボットも、研究対象にとどまらず、社会実装の現実的な候補になり始めました。デロイト トーマツと国立情報学研究所(NII)の共同研究では、自律制御と遠隔操作の統合を目標に据え、自律移動と遠隔操作の連携、対話基盤の構築、指先把持の検証まで取り組みを広げてきました。最終回では、これまでの成果と課題を振り返りながら、フィジカルAIの社会実装に向けた論点と今後の方向性を、デロイト トーマツの松川達也とNIIの小林泰介氏が語ります。
松川 今回の共同研究の成果の一つが、自律移動機能の実装です。AI Experience Center内では、周辺環境を認識しながら自己位置を推定し、地図を作成するSLAM(スラム)*を活用することで、目的地を指定するだけでロボットが自律的に移動できるようにしました。さらに、着席や特定のポーズを検知すると挨拶や説明を自動で始めるなど、人の動きや状況に応じて振る舞いを変える機能も実装しました。
*ロボットが周囲の地図を作りつつ現在位置を把握する技術
遠隔操作では、VRヘッドセットや足首のセンサーを用い、オペレーターの全身の動きをロボットに反映する技術を実現しました。ロボットにオペレーターの動きを追従させながらも、転倒しないように自律的に全身のバランスを取るようにした点も重要です。
小林 自律で安定して動くところまで到達でき、期待以上の成果だったと思います。当初の工程表から後回しになった項目もありましたが、ロボットを実際に扱う中で、時間や工数の見積もりの難しさも実感しました。
松川 共同研究を通じて見えてきたのは、技術を積み上げる順序の重要性です。当初は複数のタスクを並行して進める計画でしたが、実際にやってみたら予想以上に難しく、並行してできるようなものではありませんでした。ですので、序盤で「まずは一つずつ確実に進める」方針へ切り替えました。その過程で、アプリケーション開発だけでなく、機体、通信、設備、検証場所、増設用のボードやカメラ、3Dプリンタの確保など、実装に向けて整えるべきことが想像以上に多いと実感しました。
そして大きな学びの一つが、人材の希少性です。アプリ開発人材に比べ、ロボットを扱い、機構や制御とAI・ソフトウェアを横断して統合できる人材は限られています。今回得られた知見を蓄積し、今後の育成につなげていくことが重要だと感じています。
小林 日本では、機械やソフトウェア、運用まで含めてシステム全体を設計・実装できる人材が不足しています。これからは、さらにAIも理解し活用できる人材が必要になるため、育成の重要性は一段と高まっています。
松川 また、現場ではAIそのもの以上に、機械や環境の条件が成果を左右します。カメラやセンサーの位置、照明、床の摩擦係数といったわずかな違いが、認識や移動、把持の精度に大きく影響します。こうした課題は、シミュレーションで学んだことを実機で再現する難しさにも直結します。さらに、遠隔操作では触覚がないため、把持が不安定になりやすく、ロボット側の触覚センサーや、操作者に振動などで感覚を返す仕組みが有効だと分かってきました。
小林 センサーについては、これまではSLAMが中心だったため、主にLiDAR*の位置の影響を見ていました。しかし、人の動作を手本に学ばせる段階に入ると、カメラの種類や照明条件の違いも大きく効いてきます。AI Experience Centerでは動いても、別の場所ではうまく動かないこともあります。これを補うには、データ量を増やし、シミュレーション側でデータの加工や拡張も進める必要があります。遠隔操作で物をつかむ場面では、触覚の情報がないと力加減が難しい。ロボットハンド側の触覚センサーに加え、VR側で振動などを返す仕組みも重要です。どの程度の感覚情報があれば操作性が上がるのかは、タスクごとに見極める必要があります。
*レーザー光を使って周囲の物体までの距離や位置を測るセンサー
松川 今回の実証で得られた示唆は明快です。フィジカルAIの社会実装を前に進めるには、AIを賢くするだけでなく、「感じて測る」ための基盤――センサー、精度調整、フィードバック――の質を高めることが欠かせません。
松川 今後ロボットに動作を学習させる方法としては、目線からの視点の動画だけで学習するアプローチや、手持ちの専用グリッパーを用いてロボットの手先の動きを記録する方法など、難易度もコストもさまざまだと感じています。ビジネス適用を考えると、まずは精緻さを追うよりも、多少動きが粗くてもビジネスインパクトの大きいユースケースから始め、技術進展やコスト低下に合わせて適用範囲を広げるのが現実的です。アカデミア側では、「まずはここから」という対象動作やユースケースの共通認識はあるのでしょうか。
小林 現時点では、特定のユースケースに絞るというより、「幅広く応用できる基盤をつくる」ことを重視する流れが強いですね。例えば、強化学習によって歩行や姿勢制御の安定性を高め、できるだけ多くの環境で移動できるようにする。さらに、さまざまな物体を扱える汎用的なモデルを用意し、最後は各社が用途に応じて調整する、という考え方です。ここには、個別の業務適用を急ぐ産業界とのギャップもあります。
松川 データ収集についても、お客様から「今のうちに何を取っておくべきか」と相談を受けます。ロボットを遠隔操作して取る方法、本人視点の動画を集める方法、その中間の方法もありますが、どれが有望でしょうか。
小林 それぞれ一長一短があります。ロボットを直接遠隔操作して集めたデータは、ロボットにとって使いやすく、少量でも価値が高い一方、準備や運用の負荷が大きい。本人視点の動画は大量に集めやすい反面、学習の計算負荷が高くなります。方針が固まっていない段階では、人が専用デバイスを装着して作業し、その動きを記録する中間的な方法が、実用上の落としどころになりやすいと思います。
松川 データ拡張や学習については、海外の大手テック企業も支援基盤の整備を進めており、これまで職人技に近かった領域が、徐々に標準化・簡便化していく可能性を感じています。そうなれば、企業は学習そのものより、データ準備や活用設計に力を注ぐ時代になるかもしれません。
小林 その方向には確実に進むと思います。使う人が増えるには、学習や導入のハードルが下がることが欠かせません。
松川 加えて、今回あらためて感じたのがエコシステムの重要性です。検討から導入、運用まで関わる技術や論点は多く、リスク評価や法対応、製造物責任(PL)への対応も含めると、一社だけで完結するのは難しい。だからこそ、今後もアカデミア、スタートアップ、クライアント企業などと連携しながら、良い技術を見極めて取り入れていきたいと考えています。
小林 ぜひ一緒に進めていければと思います。
松川 また、技術トレンドの変化は速く、プロジェクトの途中でも新技術が次々に登場します。不要な再発明を避けるためにも、継続的に動向を追い、技術を見極めることが重要です。小林さんの研究として、今後の方向性をどのように見ていますか。
小林 現在は、学習済みモデルを現場に導入し、動けば成功、動かなければ止まってしまうケースが少なくありません。今後は、実機から得たデータや現場のフィードバックを取り込みながら、使うたびに改善していく仕組みが重要です。例えば、ロボットの立ち位置が少しずれていたら、その指摘を次回に反映する。そうした積み重ねが、環境や機体の変化への対応力につながります。さらに、モデルごとに「何ができて、何が難しいのか」が見えるようになれば、ユーザーにとっては一段と使いやすくなるはずです。
松川 「やってみないと分からない」という段階から進み、モデルごとの得意・不得意が見えるようになると、社会実装はさらに進みそうですね。今回の共同研究、ありがとうございました。
小林 ありがとうございました。