2025年12月31日水曜日

パラメトリック・スピーカー(指向性スピーカー)の仕組みと製作方法

 特定の範囲にのみ音を届けるパラメトリック・スピーカー(指向性スピーカー)の仕組みと製作方法を解説しています。この技術は超音波を利用しており、直進性の高い音波を特定のターゲットに照射することで、周囲の人に気づかれずに本人だけに音を聴かせることが可能です。テキスト内では、**振幅変調(AM)パルス幅変調(PWM)**といった信号処理技術に加え、空気の非線形特性による歪みの課題についても触れられています。また、LRAD(長距離音響発生装置)のような軍事・警備転用から、美術館や図書館での案内といった平和的な利用まで、幅広い応用例が示されています。設計の核心として、多数の超音波送信機を配列(アレイ化)することで、音圧の維持と高い指向性を両立させる手法が提案されています。最終的に、自作回路による実験結果を通じて、理論が実際に機能することが証明されています。

超音波指向性スピーカーシステムの構造

 超音波指向性スピーカー回路の作り方

この記事では、パラメトリックスピーカーとも呼ばれる超音波指向性スピーカーシステムの構造について説明しました。このシステムは、特定の場所または領域に音声周波数を送信することで、その場所にいる人は音を聞くことができますが、隣にいる人や領域外の人は音に全く影響を受けず、その動作に気づくこともありません。

発明・製作:三浦一徳(日本)

長距離音響装置(LRAD)の試験で得られた優れた結果を受けて、アメリカン・テクノロジー・コーポレーションはLRAD社に社名を変更しました。2010年3月25日、LRAD社はオーディオスポットライトとも呼ばれるこの装置をLolosonic Research Labs, Inc.の製品として開発し、軍事用途以外で使用されています。

この装置は、特定の領域のみに集中した音波ビームを生成するように設計されています。この装置は、美術館、図書館、展示ギャラリーなど、周囲の人が静かに過ごしている間に、音ビームを用いて警告メッセージを送ったり、特定の行動をとっている人に指示を出したりするのに非常に適しています。

このようなパラメトリックスピーカーシステムから発せられる集中的な音響効果は非常に正確で、対象者は、隣にいる人には全く気づかれない一方で、自分だけが集中した音響コンテンツを体験することに驚嘆するでしょう。

パラメトリックスピーカーの動作原理

パラメトリックスピーカー技術は、ほぼ視線方向を伝播する特性を持つ超音波領域の音波を使用します。

しかし、超音波領域は20kHzを超える場合(正確には40kHz)、人間の耳には全く聞こえない可能性があるため、システムはどのように集中ゾーンで音波を聞き取れるようにしているのでしょうか?

これを実現する一つの方法は、2つの40kHzビームを重ね合わせ、一方のビームに1kHzの可聴周波数を持たせ、特定の地点で合流するように角度をつけて配置することです。この2つの40kHzの成分は互いに打ち消し合い、特定の地点で1kHzの周波数が聞こえるようにします。

このアイデアは一見シンプルに見えますが、LRADとは正反対に、対象地点での音量が低いため、効果が出にくくなり、対象者を気絶させたり無力化したりするには不十分です。

超音波を用いて可聴指向性音を生成する他の現代的な方法としては、振幅変調(AM)、両側波帯変調(DSB)、片側波帯変調(SSB)、周波数変調(FM)などがありますが、これらの概念はすべて、最近研究されているパラメトリックスピーカーシステム技術に基づいています。

言うまでもなく、110dB以上の超音波は、長い気団「チューブ」を伝播する過程で、音圧分布が不均一になる可能性があります。

音圧の不均一性により、大きな歪みが生じる可能性があり、美術館やギャラリーなどの静かな場所での使用には非常に望ましくない場合があります。

上記の非線形応答は、空気分子が元の密度に戻るまでの時間が、分子を圧縮するのにかかる時間よりも比較的長いために生じます。高圧で発生する音は周波数も高くなり、分子が圧縮されている分子と衝突する際に衝撃波が発生する傾向があります。

正確に言うと、可聴音は振動する空気分子で構成されており、それらは完全には「元に戻らない」ため、音の周波数が高くなると、不均一性によって「空気粘性」と最もよく定義される効果により歪みが大きく聞こえやすくなります。

そのため、メーカーは歪みを最小限に抑えながら音響再生を大幅に向上させるDSP指向性スピーカーコンセプトを採用しています。

さらに、単一指向性でクリアなサウンドスポットを実現するために、高度なパラメトリックトランスデューサースピーカー配置を採用しています。

これらのパラメトリックスピーカーによって生み出される高い指向性は、その狭い帯域幅特性にも起因しており、マトリックス配置によって多数のトランスデューサーを追加するだけで、要求仕様に応じて帯域幅を拡大できます。

パラメトリック2チャンネルスピーカー変調器の概念を理解する

DSBはアナログスイッチング回路を用いて容易に実現できます。発明者は当初これを試みましたが、大きな音は得られましたが、非常に大きな歪みを伴いました。

次に、FM技術に似た概念を採用したPWM回路が試されました。結果として得られる音の出力ははるかに明瞭で歪みはないものでしたが、DSBに比べて強度がはるかに弱いことがわかりました。

この欠点は最終的に、最大50個の40kHzトランスデューサーを並列に接続した2チャンネルのトランスデューサーアレイを配置することで解決されました。







2025年12月29日月曜日

電気触覚ディスプレイの解説

 

皮膚下の神経を電気刺激することで触覚を提示する電気触覚ディスプレイの仕組みと設計手法を解説しています。機械的駆動部がないため軽量・薄型かつ低消費電力という利点がありますが、一方で感覚の安定性や回路設計の難易度が課題とされています。技術面では、神経膜を脱分極させるアクティベイティング・ファンクションの理論や、痛みを抑えつつ効率的に刺激を与えるためのパルス幅と高さの関係が詳述されています。また、電極の極性による感覚の違いや、高電圧スイッチング回路を用いたハードウェア構成についても触れています。さらに、汗や皮膚の状態による感覚のばらつきを防ぐため、インピーダンス計測を用いたフィードバック等の解決策が提示されています。最終的に、視覚障害者支援やタッチパネルへの応用など、将来的な実用化に向けた技術的要点をまとめた総合的なガイドとなっています。

2025年12月16日火曜日

データ分析企業Palantir(パランティア)とその創業者アレックス・カープ


 データ分析企業Palantir(パランティア)とその創業者アレックス・カープの歴史と戦略を概説しています。カープの特異な生い立ち(哲学への傾倒、失読症、株式投資の成功)から説き起こし、ピーター・ティールとの出会い、そしてPalantir設立の経緯を詳述しています。Palantirは、PayPalの不正防止技術を応用し、9.11テロ後のデータ統合の必要性から生まれ、当初はCIAからの投資で**「Gotham(ゴッサム)」を開発しました。また、初期の民間企業(B2B)への展開の苦労や、軍への導入をめぐる政治的な抵抗と訴訟による突破**、そして近年のAI事業(AIP)への戦略的転換が、創業時のビジョンと共に語られています。

2025年11月27日木曜日

DeepMindの汎用人工知能

 DeepMindの汎用人工知能(AGI)への挑戦:ゲームから科学的ブレークスルー、そして人類の未来へ

エグゼクティブサマリー

このブリーフィングドキュメントは、Google DeepMindが追求する汎用人工知能(AGI)の開発に関する主要なテーマ、マイルストーン、および洞察を統合したものである。DeepMindのミッションは、特定のタスクに特化するのではなく、人間のように学習し、あらゆる知的タスクに適応できる汎用的なシステム「AGI」を解明することにある。

創設者デミス・ハサビスは、認知神経科学から得た脳の仕組みに関する知見をAI開発に応用。強化学習を中核技術とし、ゲームをAI進化の試金石として活用した。アタリゲームをマスターしたDQN、囲碁の世界チャンピオンを破ったAlphaGo、そして人間の知識なしに自己学習するAlphaZeroは、その能力を段階的に証明した。

DeepMindの挑戦はゲームの世界に留まらず、科学の未解決問題へと向けられた。AlphaFoldプロジェクトは、50年来の生物学上の難問であった「タンパク質の立体構造予測問題」を解決し、AIが現実世界の複雑な科学的課題を解決できることを実証した。この成果は2億ものタンパク質構造データベースとして無償公開され、医学や生物学研究に革命的な影響を与えている。

一方で、AGIの急速な進化は、軍事利用、社会・経済への影響、制御不能のリスクといった深刻な倫理的・安全性の課題を提起している。DeepMindは技術の中立性を認識し、AIセーフティサミットなどで国際的な議論を主導するなど、責任ある開発の必要性を強く訴えている。AGIの出現は人類史の転換点となりうるため、その開発と活用には極めて慎重なアプローチが求められる。

--------------------------------------------------------------------------------

1. DeepMindの創設とAGIへのビジョン

1.1. 創設者デミス・ハサビスの原点:思考ゲームから科学へ

デミス・ハサビスのAGIへの情熱の根源は、幼少期の体験にある。チェスの神童として知られ、4歳でその才能を見出され、6歳で8歳以下のチャンピオン、10代で世界ランキング2位にまで上り詰めた。しかし、12歳の時、長時間の試合の末に経験した出来事が彼の価値観を大きく変える。

「なぜここにいる人たちは こんなことに脳を使う?」「ここにいる300人の頭脳を集約させれば ガンも治せるかもしれません」「チェスは大好きだが 人生は懸けられない」

この経験から、彼は人間の知能をゲームのような閉じた世界ではなく、科学や医療といった人類の根源的な課題解決のために使うべきだと考えるようになった。この思想が、後のDeepMind創設の原動力となる。

1.2. 脳科学からのインスピレーションとシェーン・レッグとの出会い

ハサビスは、AGI開発のヒントが人間の脳にあると考え、ケンブリッジ大学でコンピューター科学を学んだ後、ユニバーシティ・カレッジ・ロンドン(UCL)で認知神経科学の博士号を取得した。彼の目標は一貫して「知能を明らかにしたい」というものであった。

「AGIの可能性を証明する 唯一の存在が 人間の脳だと思います」

UCLで、彼は同じくAGIに強い関心を抱いていたシェーン・レッグと出会う。当時、学術界ではAGIは主流の研究テーマではなく、二人は「誰も知らない秘密を2人で 共有している気分でした」と語る。この出会いがDeepMind創設へと繋がった。

1.3. 創業と資金調達の困難

2010年、ハサビスとレッグはDeepMindをロンドンで創業した。ミッションは明確だった。

「世界初の 汎用学習機械を作ること。“汎用”と“学習”が キーワードです」

しかし、その壮大なビジョンは当初、投資家たちに理解されなかった。ベンチャー投資家のデビッド・ガードナーは「今やる必要性や 製品の詳細を聞かれます」「“インチキな 野心家たち”」と見なされていたと振り返る。逆張り投資家として知られるピーター・ティールからの初期投資を得て、プロジェクトは本格的に始動した。

2014年、研究開発を加速させるため、DeepMindはGoogleによる4億ポンドでの買収を受け入れた。これは、研究の意義を理解し、短期的な利益を追求せず長期的な研究に専念できる環境を確保するための戦略的な決断であった。

2. ゲームを試金石としたAIの進化

DeepMindは、AIエージェントが自身の環境と相互作用しながら学習する「強化学習」を中核的なアプローチとした。その能力を検証し、進化させるための最適なテストベッドとして、複雑で明確な目標を持つビデオゲームやボードゲームが選ばれた。

2.1. アタリゲームとDQN:汎用学習の最初の証明

最初の挑戦は、古典的なアタリ社のビデオゲームだった。開発された「DQN」は、深層学習と強化学習(Q学習)を組み合わせた単一のアルゴリズムであり、ルールを教えずにピクセル情報と「高得点を取れ」という指示だけでゲームを学習する。

  • 初期の失敗: 最初の試みでは、単純なゲーム「ポン」すらプレイできず、チームは「あきらめようと思いました」というほどの困難に直面した。
  • ブレークスルー: その後、DQNは学習を開始し、3ヶ月で人間を圧倒するレベルに到達。特に「ブレークアウト」では、ブロックの裏側にボールを送り込んで一掃するという、人間が考案した戦略を自ら発見した。
  • 汎用性の実証: DQNは50種類の異なるゲームで検証され、多くで人間以上の成果を上げた。これは「汎用型AIの最初の事例」とされ、科学雑誌『ネイチャー』に掲載された。

2.2. AlphaGoと囲碁:世界の注目を集めた歴史的勝利

次にDeepMindが挑んだのは、計算上の複雑さが「宇宙の原子の数よりも多い」と言われるボードゲームの頂点、囲碁だった。

  • イ・セドルとの対決 (2016年, ソウル): AlphaGoは、過去10年で最強の棋士の一人であるイ・セドルと対戦。人間には思いつかない独創的な一手(37手目)を放ち、世界に衝撃を与え、4勝1敗で勝利した。この勝利は、AIが人間の直感や創造性の領域に踏み込んだ象徴的な出来事となった。
  • 柯潔との対決 (2017年, 烏鎮): AlphaGoは世界最強の棋士、柯潔にも勝利。この出来事は中国に大きな衝撃を与え、「スプートニク・モーメント」と称された。エコノミスト誌のケネス・クキエは、これにより世界のAI開発競争が激化したと指摘している。

2.3. AlphaZero:人間の知識からの脱却と自己学習

AlphaGoの成功後、DeepMindはさらに進化を遂げる。人間の棋譜データを一切使用せず、ルールのみを教え、自己対戦を繰り返すことで学習する新アルゴリズム「AlphaZero」を開発した。

  • 驚異的な学習速度: AlphaZeroは、囲碁だけでなくチェスや将棋にも対応。チェスでは、学習開始からわずか数時間で人間の能力を超え、一晩で世界最強レベルに到達した。
  • 新たな知識の創造: 人間の定石にとらわれない独創的な戦法を生み出し、チェスのグランドマスター、マシュー・サドラーを「信じられない」「またチェスを やってみたくなった」と感嘆させた。これはAIが人間の知識を拡張し、新たな発見を促す可能性を示唆した。

2.4. AlphaStarとスタークラフト:複雑なリアルタイム戦略への挑戦

DeepMindの次の目標は、不完全な情報、多数のユニット、リアルタイムでの連続的な意思決定が求められる複雑なビデオゲーム「スタークラフト」だった。

  • プロゲーマーとの対決: 開発されたAI「AlphaStar」は、トッププロゲーマーと対戦し、10勝1敗という圧倒的な成績を収めた。AlphaStarは1分間に800回ものクリックを正確に行う人間離れした操作能力だけでなく、プロゲーマーのようなスマートな戦略的プレーを見せた。
  • より現実世界に近い環境: ターン制のボードゲームと異なり、スタークラフトでの成功は、より動的で予測不可能な現実世界の問題にAIを適用するための重要な一歩となった。

3. 科学への応用:AlphaFoldによるタンパク質構造予測問題の解決

ゲームで培ったAI技術は、人類が直面する最も困難な科学的問題の一つに向けられた。それが、生命の根幹をなすタンパク質の立体構造をアミノ酸配列から予測するという、50年来の生物学上の難問だった。

3.1. 50年来の生物学上の難問

タンパク質の形状を解明できれば、アルツハイマー病やガンの治療、新薬開発、環境問題の解決などに大きく貢献できる。しかし、実験による構造解析には膨大な時間とコストがかかり、計算による予測は極めて困難とされてきた。

3.2. CASPへの挑戦とAlphaFold

DeepMindは、タンパク質構造予測の精度を競う国際コンテスト「CASP」に「AlphaFold」で挑戦した。

  • CASP13 (2018年): 初参加でトップの成績を収めたが、予測精度にばらつきがあり、「実用可能なレベルではない」(ノーベル賞受賞者ポール・ナース)と評価された。チームは「うまくいったと 思っていたのでショックです」と、課題の大きさを痛感した。
  • CASP14 (2020年): チームは生物学者も加え、アルゴリズムを根本から見直した。コロナ禍のロックダウンの中で開発は続けられ、AlphaFoldは飛躍的な進化を遂げた。結果、CASP14では他のチームを圧倒する驚異的な精度を達成し、大会主催者のジョン・モールト教授から「半世紀を経て やっと 解決策が見つかりました」と宣言された。

3.3. 成果の公開と科学界へのインパクト

DeepMindは、この画期的な技術を商用利用するのではなく、科学界全体に貢献することを選んだ。

「当然 公開すべきです。商売にする必要はありません」「世界中で使うべきです。新たな発見に貢献できます」

2021年、AlphaFoldのコードと、予測された2億以上のタンパク質構造を含む巨大なデータベースが全世界に無償で公開された。これは「人類への贈り物」と評され、生物学や化学の研究手法を根底から変える革命的な出来事となった。これにより、プラスチック汚染を解決する新酵素の発見や、ガン治療薬の開発などが加速している。この功績により、デミス・ハサビスとジョン・ジャンパーは2024年にノーベル化学賞を受賞した。

4. AGIの未来と倫理的課題

DeepMindの成功は、AGIがもはやSFではなく、現実的な目標であることを示している。しかし、その実現は人類に計り知れない恩恵をもたらす可能性がある一方で、重大なリスクもはらんでいる。

4.1. AGIがもたらす可能性と人類史の転換点

ハサビスは「AGIの出現は 人類史を二分します。それ以前と それ以降です」と語る。AGIは電気やインターネットを超える人類史上最も重要な発明となり、気候変動、病気の治療、エネルギー問題など、複雑な地球規模の課題を解決する究極のツールになり得ると期待されている。

4.2. 懸念されるリスクと責任

同時に、専門家たちはAIの急速な進化に警鐘を鳴らしている。

  • 悪用の危険性: 元Google CEOのエリック・シュミットは「AI悪用の危険性は 高まっています」と述べ、自律型兵器、金融市場の操作、監視社会の強化などを懸念している。物理学者スティーブン・ホーキングも「正しく物事を 始めることが 唯一の予防線になるでしょう」と警告した。
  • 制御の問題: コンピューター科学者のスチュアート・ラッセルは「自分より強い者を前に どうやって 力を保ちますか?」と問いかけ、AIに設定する「ゴール」の定義の難しさを指摘する。人間の価値観を正しく反映させなければ、意図しない破壊的な結果を招く可能性がある。
  • 社会への影響: AIによる雇用の喪失やディープフェイクによる情報操作など、社会的な混乱も懸念されており、脚本家組合のストライキなど、既に反発の動きも見られる。

4.3. 責任ある開発と国際的議論の必要性

これらのリスクに対応するため、国際的な協力と規制が不可欠である。2023年に英国で開催された「AIセーフティサミット」は、その第一歩である。ハサビスは、AGIの到来を「有能な宇宙人が地球に来ると 連絡をしてきた」状況にたとえ、世界全体で入念な準備が必要だと訴えている。技術開発者には、その使い方を慎重に議論し、制御方法を確立する責任がある。

5. 結論

DeepMindの歩みは、壮大なビジョン、科学的探究心、そしてゲームという遊び心あふれるアプローチが、いかにして人類史に残る科学的ブレークスルーを生み出すかを示している。AlphaFoldの成功は、AGIが人類の知性を拡張し、未解決の問題を解決する強力なツールとなり得ることを証明した。

しかし、その道のりはまだ始まったばかりである。AGIの進化は加速しており、その開発は技術的な挑戦であると同時に、人類全体に関わる倫理的・哲学的な問いを投げかけている。デミス・ハサビスが言うように、次世代が住む世界はAIによって劇的に変化する。その責任を担う上で、「目を離す隙はありません」。

The Thinking Game


 この映像記録は、DeepMind共同創業者デミス・ハサビス氏が抱く知能解明への情熱と、世界初の汎用人工知能(AGI)の実現を目指す挑戦を追っています。初期の資金調達難を乗り越え、チームは強化学習と深層学習を組み合わせてAtariゲームを制覇し、その後、囲碁の世界王者を打ち破ったAlphaGoや、人間の知識なしで学習するAlphaZeroといった画期的なシステムを生み出しました。これらの汎用的な学習技術は、長年の科学的難問であったタンパク質の立体構造予測AlphaFoldによって解決し、医学や生物学の進展に革命をもたらすという具体的な成果を達成しました。しかし、インターネットや電気の発明にも匹敵するとされるこの急速な技術進化は、人類に未曾有の恩恵をもたらす一方で、軍事転用や情報操作といった深刻な悪用の危険性を内包しています。そのため、関係者たちは、AGIが人類史上最も重大な転換点であることを認識し、価値観を共有させ、この革命的な技術を慎重に開発する責任を強調しています。