AIは何を見て、何を考え、どう動くのか 「ルンバ」の仕組みと「環世界」
AI(人工知能)はどこまで進化するのか? 人間並みの知能を持つのか? あるいは人間を超えるのか? AIと人間の知能について、国内のAI研究の第一人者である中島秀之・札幌市立大学長が物語ります。
AI(人工知能)はどこまで進化するのか? 人間並みの知能を持つのか? あるいは人間を超えるのか? AIと人間の知能について、国内のAI研究の第一人者である中島秀之・札幌市立大学長が物語ります。
知能のあり方を考えるときに大事なのは、「環境との相互作用」を考慮した分析やデザインをすることだと思っています。
その話に入る前に「環境との相互作用とは何か」について、例を使って説明したいと思います。
淡墨
前回(第7回コラム)の読書案内で紹介した拙著『知能の物語』の題字は、淡墨で書いたものです。
淡墨というのは水分の多い墨です。
筆が描いた線から外側に滲(にじ)み出たり、線が交わる時に先に描かれた線の影響を受けたり、様々な面白い現象が起こります。
滲みは直接には制御できず、様々な模様ができ、そこが面白いのです。
函館の書家であった故中島荘牛氏は、普通の濃墨より淡墨の方がはるかに難しいと言っていました。
中島荘牛氏の弟子の今野翠花氏に頼んで、淡墨で題字を書いてもらいました。
濃墨でも書いてくれたので、両方を図1に示します。
陶芸
朝のNHK連続テレビ小説「スカーレット」のメインテーマだった陶芸も同じです。
図2は私の持っている備前焼ですが、この模様は火と灰が勝手に作ったものです。
盆栽
ひょっとしたら盆栽(図3)は、環境との相互作用を用いた芸術の頂点かもしれません。
墨の滲みや火の通り道は作者が制御しますが、偶然任せの面も大きいでしょう。
それに対し盆栽は作者がほぼ全面的に制御し、結果を見た後に修正も加わります。
しかし、相手は成長する木です。
木の成長自体を直接に制御できるわけではありません。
紙に墨で書いたり、粘土をこねたりするようにはいきません。
そういう意味で大変奥深いのだと思います。
次にアーキテクチャ(知能システムの設計図)の話をします。
環世界の説明に入る前に、対比のため初期のAIアーキテクチャを示します(図4)。
これは「初期のAI研究者たちは、人間や動物などの知的主体が環境の中でこのように行動していると考えていた」ということを表しています。
手順は次の通りです。
1. 環境の情報を認識し、それによって環境の内部モデルを構築する。
2. 内部モデルを使って推論を行う。
3. 推論結果に従って行動を決め、実行する。
一方、オーストラリア出身のロボット研究者で、掃除機「ルンバ」で有名なアイロボット社の創業者でもあるロドニー・ブルックスは、知的振る舞いをするために内部モデル(知識表現)は不要だと主張し、服属アーキテクチャ(subsumption architecture=図5)を提案しました。
このアーキテクチャの特徴は次の3点です。
1. 認識と推論と行動が並行して行われる
2. それぞれのモジュール(認識、推論、行動の3つ)は環境と直接やりとりする
3. 上位のモジュールは下位のモジュールに介入できる(服属させる)
各モジュールが環境と直接やり取りするので、このループを回る速さは初期のアーキテクチャ(図4)と比べ、段違いに速くなります。
また、上位のモジュールがなくても下位モジュールだけで、ある程度の機能を果たすことができます。
多くの家庭で使われているロボット掃除機「ルンバ」は、この最下位の「行動」だけを持ったものです(図6)。
つまり、障害物に当たらずに動き回っているだけなのですが、それが床掃除になるのです。
ブルックスはこのルンバ型のアーキテクチャで火星探索ロボットを作るべきだと提案していました(残念ながら採用されなかったようですが)。
現在の火星探査ロボットは図4のアーキテクチャを採用しています。
内部に持つ火星の地勢図と、センサーからの情報とを照合し、現在地を同定しながら進むので、照合の間は動けません。
それに対し、ブルックスのロボットは行ける方向に自動的に進むので速く動けます。
この考え方をもう一歩進めると、後述する環世界のアーキテクチャ(図8と9)になります。
AIや心理学の世界で有名な考え方に、アメリカの認知心理学者ジェームス・ギブソンが作った言葉「アフォーダンス」があります。
アフォード(afford)は「提供する」という意味です。
図4で示した通り、従来の心理学やAIの考え方は「人間や動物などの知的主体が環境を観察し、その情報を取り込んで、それを元に次の行動計画を立てる」というものでした。
それに対し、アフォーダンスの考え方では、知的主体と環境の主従関係を逆転させます。
つまり「知的主体は、環境が提供するもの(情報)を単に受け取っているだけ」というものです。
例えば、椅子は座ることをアフォードしている、となります。
だから、私たちは椅子に自然に座れるのです。
この考え方のポイントは、人間がデザインした椅子でなくとも、自然にある岩が座ることをアフォードしていれば、それは椅子になる、という点です。
さて、ここで問題です。
自然にある岩は椅子以外にも様々なことに利用できます。
漬けもの石にもなりますし、城壁にも使えますし、小さく砕けば鏃(やじり)にもなります。
それを使う人間の営みの前に、あらゆる可能性をアフォードしているって変じゃないですか?
また、特定の岩に座れる人の身長は、ある範囲に限られますよね。
老若男女、誰が座っても心地よい大きさの岩というのはありえません。
大きな岩は大きな人向けだし、小さな岩は小さな人向けだと思います。
私は、自然環境が一方的にアフォードしているのではなく、環境とそれを受け取る知的主体の相互作用だと考えるべきだと思います。
知的主体の側から環境を見る考え方は、ドイツの生物学者ユクスキュルが「環世界」として提唱しています。
実は、ギブソンがアフォーダンスの主張に使った根拠例(『生態学的視覚論―ヒトの知覚世界を探る』サイエンス社)と、ユクスキュルが環世界の説明に使った例(『生物から見た世界』岩波文庫)は酷似しています。
同じ現象を両者が逆から説明しているのです。
原著の出版はユクスキュル(1909年)の方が早いのですが、ギブソンの著書(1979年)には環世界への言及はありません。
ギブソンとユクスキュルの違いを説明するには、ヤドカリの例が良いでしょう。
図7は、ヤドカリがイゾギンチャクに出会った時の3通りの行動を示しています。
上段はすでに貝殻を身に纏ったヤドカリの場合で、イソギンチャクをカモフラージュ用に殻に付けます。
中段はまだ殻のないヤドカリで、イソギンチャクを殻にします。
下段は貝殻もカモフラージュも既に身に付けているヤドカリで、イソギンチャクを食べます。
ギブソンが書いているように、イソギンチャクがこの3通りをアフォードしていると考えるのは不自然でしょう。
ヤドカリの側がそれぞれ、カモフラージュ、殻、食料を探していて、出会ったイソギンチャクがそのように見えていると考えるのが妥当です。
私は、ヤドカリとイソギンチャクの相互作用によってヤドカリの行動が決まると考えます。
ユクスキュルはダニの例も使っています。
ダニは光センサー、酪酸(動物の皮膚から漂う成分)の匂いのセンサー、温度センサー、触覚を持っています。
ジャングルに住むダニの環世界はこうです。
1. 光センサーを使って明るい方に移動する。ジャングルでは低木の枝に登る行為になります。
2. 酪酸の匂いを感知すると落下します。
3. 温度センサーを使って、落下先が冷たければ1に戻ります。
4. 落下先が温かければ哺乳類に取り付くことに成功したので、触覚センサーを使って毛の少ない場所から血を吸います。
4つのセンサーを順に使って、環世界の中に自分の求めるものだけを見ていると言えましょう(図8)。
図4のような内部モデルを作らず、直接環境とのやりとりをしているのです。
図5の服属アーキテクチャと似ていますが、環世界を含めた全体が知能システムになります。
服属アーキテクチャでは外界は固定だと考えますが、環世界では環境が自分の推論(計算)の一部を担ってくれると考えます。
私は「環境に計算させる」と表現しています。
環境に計算させる一例として、登山の専門家がすすめる「ガレ場」の歩き方があります。
ガレ場というのは浮石の多い地形のことで、間違って浮石を踏むと危険です。
ある専門家は浮石の見分け方を教えるのではなく、軽く踏んでみろと言います。
それでグラグラしなければ全体重をかけて大丈夫だというのです。
石の反応で見分けているということです。
もう一例。
野球の外野手がフライの捕球に走るとき、ボールの角度や初速を測って軌道を計算しているわけではありませんね。
もちろん、経験による学習でおおよその落下地点は予測できるのですが、最終的な調整はボールの見え方だそうです。
視野の中でボールの位置が変化しないように走っていけば、ボールは自分のところに落ちてくるというわけです。
これも外界の見え方を使った行動だと言えましょう。
というわけで、図9が目指す環世界のアーキテクチャです。
「認識」「推論」「行動」はそれぞれ独自のセンサーを持ち、それに応じた計算をします。
しかし、最終的に環境に影響を与えるアクチュエーター(駆動装置)は最下層の「行動」を通してのみ制御できます。
上位の機能はこの「行動」を服属させることで、その目的を達成します。
そして、その効果が外界を通して再びセンサーに戻ってきます。
自分の考えをスケッチなどで外在化し、それを見ることによって新たなことに気づくという手法も、環境に計算させている例だと思います。
幾何の問題で、補助線を引くと解きやすくなるのも同様です。
この環世界アーキテクチャは、第4回コラムで述べた「日本語の視点」とも密接に絡んでいます。
日本語は「虫の視点」をとるからこそ、環境にある情報を使えるのです。
『木を見る西洋人 森を見る東洋人思考の違いはいかにして生まれるか』(ダイヤモンド社)を書いたアメリカの心理学者リチャード・E・ニスベットは、人種によらず全ての人は共通の認知機構を持っているとされてきた心理学の常識を覆し、人種の違い(むしろ文化と言うべきでしょうか)によって認識形態が異なることを明らかにしました。
水槽で泳ぐ魚の同じ動画を見せたとき、西洋人は魚の色や形を鮮明に覚えているのに対し、東洋人はむしろ背景の水草や水中の岩をよく覚えているというのです。
西洋は個体に注目し、東洋は環境全体を見ているのです。
これからのAIを考えていく上で、日本語の視点は重要な役割を果たすと思います。
ちなみに札幌にある円山動物園では、ユクスキュルの『生物から見た世界』は新人飼育員の必読書だそうです。
円山動物園では、環世界の考え方に基づき、動物の住環境を作り直しています。
これからは人間と環境との関わり方も変わってくるのでしょう。
最後に、ふと思ったのですが、日本庭園の「借景」も環境を使う手法ですね(図10)。
背景の山は庭園の一部ではないのですが、これがあることによって庭園の風景が生きてきます。
(朝日新聞社の経済メディア「bizble」で2021年11月4日に公開した記事を転載しました)
おすすめのニュース、取材余話、イベントの優先案内など「ツギノジダイ」を一層お楽しみいただける情報を定期的に配信しています。メルマガを購読したい方は、会員登録をお願いいたします。
朝日インタラクティブが運営する「ツギノジダイ」は、中小企業の経営者や後継者、後を継ごうか迷っている人たちに寄り添うメディアです。さまざまな事業承継の選択肢や必要な基礎知識を紹介します。
さらに会社を継いだ経営者のインタビューや売り上げアップ、経営改革に役立つ事例など、次の時代を勝ち抜くヒントをお届けします。企業が今ある理由は、顧客に選ばれて続けてきたからです。刻々と変化する経営環境に柔軟に対応し、それぞれの強みを生かせば、さらに成長できます。
ツギノジダイは後継者不足という社会課題の解決に向けて、みなさまと一緒に考えていきます。