Working in Lab: DeepMindの汎用人工知能

2025年11月27日木曜日

DeepMindの汎用人工知能

DeepMindの汎用人工知能（AGI）への挑戦：ゲームから科学的ブレークスルー、そして人類の未来へ

エグゼクティブサマリー

このブリーフィングドキュメントは、Google DeepMindが追求する汎用人工知能（AGI）の開発に関する主要なテーマ、マイルストーン、および洞察を統合したものである。DeepMindのミッションは、特定のタスクに特化するのではなく、人間のように学習し、あらゆる知的タスクに適応できる汎用的なシステム「AGI」を解明することにある。

創設者デミス・ハサビスは、認知神経科学から得た脳の仕組みに関する知見をAI開発に応用。強化学習を中核技術とし、ゲームをAI進化の試金石として活用した。アタリゲームをマスターしたDQN、囲碁の世界チャンピオンを破ったAlphaGo、そして人間の知識なしに自己学習するAlphaZeroは、その能力を段階的に証明した。

DeepMindの挑戦はゲームの世界に留まらず、科学の未解決問題へと向けられた。AlphaFoldプロジェクトは、50年来の生物学上の難問であった「タンパク質の立体構造予測問題」を解決し、AIが現実世界の複雑な科学的課題を解決できることを実証した。この成果は2億ものタンパク質構造データベースとして無償公開され、医学や生物学研究に革命的な影響を与えている。

一方で、AGIの急速な進化は、軍事利用、社会・経済への影響、制御不能のリスクといった深刻な倫理的・安全性の課題を提起している。DeepMindは技術の中立性を認識し、AIセーフティサミットなどで国際的な議論を主導するなど、責任ある開発の必要性を強く訴えている。AGIの出現は人類史の転換点となりうるため、その開発と活用には極めて慎重なアプローチが求められる。

--------------------------------------------------------------------------------

1. DeepMindの創設とAGIへのビジョン

1.1. 創設者デミス・ハサビスの原点：思考ゲームから科学へ

デミス・ハサビスのAGIへの情熱の根源は、幼少期の体験にある。チェスの神童として知られ、4歳でその才能を見出され、6歳で8歳以下のチャンピオン、10代で世界ランキング2位にまで上り詰めた。しかし、12歳の時、長時間の試合の末に経験した出来事が彼の価値観を大きく変える。

「なぜここにいる人たちはこんなことに脳を使う？」「ここにいる300人の頭脳を集約させればガンも治せるかもしれません」「チェスは大好きだが人生は懸けられない」

この経験から、彼は人間の知能をゲームのような閉じた世界ではなく、科学や医療といった人類の根源的な課題解決のために使うべきだと考えるようになった。この思想が、後のDeepMind創設の原動力となる。

1.2. 脳科学からのインスピレーションとシェーン・レッグとの出会い

ハサビスは、AGI開発のヒントが人間の脳にあると考え、ケンブリッジ大学でコンピューター科学を学んだ後、ユニバーシティ・カレッジ・ロンドン（UCL）で認知神経科学の博士号を取得した。彼の目標は一貫して「知能を明らかにしたい」というものであった。

「AGIの可能性を証明する唯一の存在が人間の脳だと思います」

UCLで、彼は同じくAGIに強い関心を抱いていたシェーン・レッグと出会う。当時、学術界ではAGIは主流の研究テーマではなく、二人は「誰も知らない秘密を２人で共有している気分でした」と語る。この出会いがDeepMind創設へと繋がった。

1.3. 創業と資金調達の困難

2010年、ハサビスとレッグはDeepMindをロンドンで創業した。ミッションは明確だった。

「世界初の汎用学習機械を作ること。“汎用”と“学習”がキーワードです」

しかし、その壮大なビジョンは当初、投資家たちに理解されなかった。ベンチャー投資家のデビッド・ガードナーは「今やる必要性や製品の詳細を聞かれます」「“インチキな野心家たち”」と見なされていたと振り返る。逆張り投資家として知られるピーター・ティールからの初期投資を得て、プロジェクトは本格的に始動した。

2014年、研究開発を加速させるため、DeepMindはGoogleによる4億ポンドでの買収を受け入れた。これは、研究の意義を理解し、短期的な利益を追求せず長期的な研究に専念できる環境を確保するための戦略的な決断であった。

2. ゲームを試金石としたAIの進化

DeepMindは、AIエージェントが自身の環境と相互作用しながら学習する「強化学習」を中核的なアプローチとした。その能力を検証し、進化させるための最適なテストベッドとして、複雑で明確な目標を持つビデオゲームやボードゲームが選ばれた。

2.1. アタリゲームとDQN：汎用学習の最初の証明

最初の挑戦は、古典的なアタリ社のビデオゲームだった。開発された「DQN」は、深層学習と強化学習（Q学習）を組み合わせた単一のアルゴリズムであり、ルールを教えずにピクセル情報と「高得点を取れ」という指示だけでゲームを学習する。

初期の失敗: 最初の試みでは、単純なゲーム「ポン」すらプレイできず、チームは「あきらめようと思いました」というほどの困難に直面した。
ブレークスルー: その後、DQNは学習を開始し、3ヶ月で人間を圧倒するレベルに到達。特に「ブレークアウト」では、ブロックの裏側にボールを送り込んで一掃するという、人間が考案した戦略を自ら発見した。
汎用性の実証: DQNは50種類の異なるゲームで検証され、多くで人間以上の成果を上げた。これは「汎用型AIの最初の事例」とされ、科学雑誌『ネイチャー』に掲載された。

2.2. AlphaGoと囲碁：世界の注目を集めた歴史的勝利

次にDeepMindが挑んだのは、計算上の複雑さが「宇宙の原子の数よりも多い」と言われるボードゲームの頂点、囲碁だった。

イ・セドルとの対決 (2016年, ソウル): AlphaGoは、過去10年で最強の棋士の一人であるイ・セドルと対戦。人間には思いつかない独創的な一手（37手目）を放ち、世界に衝撃を与え、4勝1敗で勝利した。この勝利は、AIが人間の直感や創造性の領域に踏み込んだ象徴的な出来事となった。
柯潔との対決 (2017年, 烏鎮): AlphaGoは世界最強の棋士、柯潔にも勝利。この出来事は中国に大きな衝撃を与え、「スプートニク・モーメント」と称された。エコノミスト誌のケネス・クキエは、これにより世界のAI開発競争が激化したと指摘している。

2.3. AlphaZero：人間の知識からの脱却と自己学習

AlphaGoの成功後、DeepMindはさらに進化を遂げる。人間の棋譜データを一切使用せず、ルールのみを教え、自己対戦を繰り返すことで学習する新アルゴリズム「AlphaZero」を開発した。

驚異的な学習速度: AlphaZeroは、囲碁だけでなくチェスや将棋にも対応。チェスでは、学習開始からわずか数時間で人間の能力を超え、一晩で世界最強レベルに到達した。
新たな知識の創造: 人間の定石にとらわれない独創的な戦法を生み出し、チェスのグランドマスター、マシュー・サドラーを「信じられない」「またチェスをやってみたくなった」と感嘆させた。これはAIが人間の知識を拡張し、新たな発見を促す可能性を示唆した。

2.4. AlphaStarとスタークラフト：複雑なリアルタイム戦略への挑戦

DeepMindの次の目標は、不完全な情報、多数のユニット、リアルタイムでの連続的な意思決定が求められる複雑なビデオゲーム「スタークラフト」だった。

プロゲーマーとの対決: 開発されたAI「AlphaStar」は、トッププロゲーマーと対戦し、10勝1敗という圧倒的な成績を収めた。AlphaStarは1分間に800回ものクリックを正確に行う人間離れした操作能力だけでなく、プロゲーマーのようなスマートな戦略的プレーを見せた。
より現実世界に近い環境: ターン制のボードゲームと異なり、スタークラフトでの成功は、より動的で予測不可能な現実世界の問題にAIを適用するための重要な一歩となった。

3. 科学への応用：AlphaFoldによるタンパク質構造予測問題の解決

ゲームで培ったAI技術は、人類が直面する最も困難な科学的問題の一つに向けられた。それが、生命の根幹をなすタンパク質の立体構造をアミノ酸配列から予測するという、50年来の生物学上の難問だった。

3.1. 50年来の生物学上の難問

タンパク質の形状を解明できれば、アルツハイマー病やガンの治療、新薬開発、環境問題の解決などに大きく貢献できる。しかし、実験による構造解析には膨大な時間とコストがかかり、計算による予測は極めて困難とされてきた。

3.2. CASPへの挑戦とAlphaFold

DeepMindは、タンパク質構造予測の精度を競う国際コンテスト「CASP」に「AlphaFold」で挑戦した。

CASP13 (2018年): 初参加でトップの成績を収めたが、予測精度にばらつきがあり、「実用可能なレベルではない」（ノーベル賞受賞者ポール・ナース）と評価された。チームは「うまくいったと思っていたのでショックです」と、課題の大きさを痛感した。
CASP14 (2020年): チームは生物学者も加え、アルゴリズムを根本から見直した。コロナ禍のロックダウンの中で開発は続けられ、AlphaFoldは飛躍的な進化を遂げた。結果、CASP14では他のチームを圧倒する驚異的な精度を達成し、大会主催者のジョン・モールト教授から「半世紀を経てやっと解決策が見つかりました」と宣言された。

3.3. 成果の公開と科学界へのインパクト

DeepMindは、この画期的な技術を商用利用するのではなく、科学界全体に貢献することを選んだ。

「当然公開すべきです。商売にする必要はありません」「世界中で使うべきです。新たな発見に貢献できます」

2021年、AlphaFoldのコードと、予測された2億以上のタンパク質構造を含む巨大なデータベースが全世界に無償で公開された。これは「人類への贈り物」と評され、生物学や化学の研究手法を根底から変える革命的な出来事となった。これにより、プラスチック汚染を解決する新酵素の発見や、ガン治療薬の開発などが加速している。この功績により、デミス・ハサビスとジョン・ジャンパーは2024年にノーベル化学賞を受賞した。

4. AGIの未来と倫理的課題

DeepMindの成功は、AGIがもはやSFではなく、現実的な目標であることを示している。しかし、その実現は人類に計り知れない恩恵をもたらす可能性がある一方で、重大なリスクもはらんでいる。

4.1. AGIがもたらす可能性と人類史の転換点

ハサビスは「AGIの出現は人類史を二分します。それ以前とそれ以降です」と語る。AGIは電気やインターネットを超える人類史上最も重要な発明となり、気候変動、病気の治療、エネルギー問題など、複雑な地球規模の課題を解決する究極のツールになり得ると期待されている。

4.2. 懸念されるリスクと責任

同時に、専門家たちはAIの急速な進化に警鐘を鳴らしている。

悪用の危険性: 元Google CEOのエリック・シュミットは「AI悪用の危険性は高まっています」と述べ、自律型兵器、金融市場の操作、監視社会の強化などを懸念している。物理学者スティーブン・ホーキングも「正しく物事を始めることが唯一の予防線になるでしょう」と警告した。
制御の問題: コンピューター科学者のスチュアート・ラッセルは「自分より強い者を前にどうやって力を保ちますか？」と問いかけ、AIに設定する「ゴール」の定義の難しさを指摘する。人間の価値観を正しく反映させなければ、意図しない破壊的な結果を招く可能性がある。
社会への影響: AIによる雇用の喪失やディープフェイクによる情報操作など、社会的な混乱も懸念されており、脚本家組合のストライキなど、既に反発の動きも見られる。

4.3. 責任ある開発と国際的議論の必要性

これらのリスクに対応するため、国際的な協力と規制が不可欠である。2023年に英国で開催された「AIセーフティサミット」は、その第一歩である。ハサビスは、AGIの到来を「有能な宇宙人が地球に来ると連絡をしてきた」状況にたとえ、世界全体で入念な準備が必要だと訴えている。技術開発者には、その使い方を慎重に議論し、制御方法を確立する責任がある。

5. 結論

DeepMindの歩みは、壮大なビジョン、科学的探究心、そしてゲームという遊び心あふれるアプローチが、いかにして人類史に残る科学的ブレークスルーを生み出すかを示している。AlphaFoldの成功は、AGIが人類の知性を拡張し、未解決の問題を解決する強力なツールとなり得ることを証明した。

しかし、その道のりはまだ始まったばかりである。AGIの進化は加速しており、その開発は技術的な挑戦であると同時に、人類全体に関わる倫理的・哲学的な問いを投げかけている。デミス・ハサビスが言うように、次世代が住む世界はAIによって劇的に変化する。その責任を担う上で、「目を離す隙はありません」。

Working in Lab