本文へスキップ
統計ロードマップ
Textbook

G検定 教科書

G 検定(ジェネラリスト検定)は、日本ディープラーニング協会(JDLA)が主催する、AI / ディープラーニングを **事業に活用するための知識** を問う試験です。技術的な実装力よりも、AI の歴史・主要手法・社会的影響・倫理を **広く浅く** 理解しているかを測ります。本教科書では、G 検定の出題範囲を概念ベースで整理します。

目次

  1. 1 章 · 人工知能の歴史と概論
    AI とは何か、3 度のブームと冬の時代、現代の AI(機械学習・ディープラーニング)に至る流れを整理します。
  2. 2 章 · AI の社会実装と倫理
    AI を社会で使うときに考えるべき倫理・法律・公平性の問題、そして主要な国際的枠組み。
  3. 3 章 · ディープラーニングの基礎
    ニューラルネットの仕組み、代表的なアーキテクチャ(CNN・RNN・Transformer)、最適化手法を概念ベースで整理。
  4. 4 章 · 生成 AI と LLM
    ChatGPT 以降の生成 AI ブームを支える技術。LLM の仕組み、プロンプトエンジニアリング、RAG・ファインチューニング・RLHF を整理。
  5. 5 章 · AI 関連法規と知的財産
    AI 開発・運用で必ず押さえる日本国内・国際の法規制と、生成 AI 時代の著作権・契約問題。
  6. 6 章 · AI の強化と社会実装
    強化学習・自動運転・ロボティクス・XAI・AutoML など、AI を社会で動かすための周辺技術。
  7. 7 章 · 生成 AI と LLM ─ 2024 年以降の最新動向
    G 検定 2024 年以降の改訂で大幅に出題比重が増した生成 AI・大規模言語モデル・マルチモーダル・プロンプト・AI 規制をまとめて扱います。
  8. 8 章 · AI エージェントと自律システム
    2025 年以降の主要トピック。エージェント・ツール使用・MCP・マルチエージェント協調を 3 節で。
  9. 9 章 · AI と業界別ユースケース
    金融・医療・製造・小売・教育の各業界での AI 活用事例。G 検定実務応用の中心。
  10. 10 章 · AI の未来と総まとめ
    2025 年以降の展望、生成 AI の経済影響、人間と AI の共存、G 検定総まとめ。
  11. 11 章 · AI と人間の共生 ─ 創造性・教育・ウェルビーイング
    技術論を超えた、AI と共に生きる社会の哲学。創造性・教育・労働・ウェルビーイングの 4 領域を 3 節で。
Chapter 1

1 章 · 人工知能の歴史と概論


§1.1

AI の定義と 3 度のブーム

AI(人工知能) という言葉は 1956 年のダートマス会議で生まれました。それ以降、技術の発展と社会的期待のサイクルで「3 度のブーム」と「2 度の冬」を経て、現在の第 3 次 AI ブームに至っています。

AI の定義 ─ 「これが AI だ」という統一見解は実はない

AI の正確な定義は研究者によって異なります。代表的なものとして:

  • 人間のように考える機械(認知科学的アプローチ)
  • 人間のように行動する機械(チューリングテスト的アプローチ)
  • 合理的に考える機械(論理推論)
  • 合理的に行動する機械(エージェント的アプローチ、現在主流)

3 度の AI ブーム

第 1 次 AI ブーム(1950 - 1960 年代)

主役: 探索・推論。チェスや迷路解きなど「ルールが明確な問題」を機械に解かせる試み。

冬の原因: 「トイ・プロブレム」 ─ 限定された世界では動くが、現実世界の複雑さに対応できなかった。

第 2 次 AI ブーム(1980 年代)

主役: エキスパートシステム。専門家の知識をルールベースで機械に与え、医療診断・故障診断などに応用。

冬の原因: 知識獲得のボトルネック ─ 知識を 1 つずつ手で入力するコストが膨大で、暗黙知を扱えなかった。

第 3 次 AI ブーム(2010 年代〜現在)

主役: 機械学習、特に ディープラーニング。大量のデータから自動でパターンを学習する手法が、画像認識・自然言語処理で大きな成果を出した。

転換点: 2012 年、ImageNet コンテストでディープラーニングが既存手法を圧倒。

歴史上の重要なマイルストーン

  • 1956 年: ダートマス会議 ─ 「AI」という用語が生まれる
  • 1997 年: IBM Deep Blue がチェス世界王者カスパロフを破る
  • 2011 年: IBM Watson がクイズ番組「ジェパディ!」で人間王者に勝利
  • 2012 年: ImageNet で AlexNet がディープラーニングの威力を実証
  • 2016 年: Google DeepMind の AlphaGo が囲碁の世界トップ棋士に勝利
  • 2022 年: ChatGPT 公開 ─ 大規模言語モデル(LLM)が一般に普及
§1.2

機械学習とディープラーニングの位置付け

G 検定で頻出するのが「AI ⊃ 機械学習 ⊃ ディープラーニング」という入れ子構造です。これらの違いと関係性を整理します。

AI・機械学習・ディープラーニングの関係

用語の入れ子構造

AI(人工知能): 「知的な振る舞いをする機械」全般。最も広い概念。

機械学習(ML): AI のうち、データから自動でパターンを学ぶ 手法。線形回帰・決定木・SVM・ニューラルネットなど。

ディープラーニング(DL): 機械学習のうち、多層のニューラルネット を使う手法。画像・音声・自然言語など複雑なデータで威力を発揮。

機械学習の 3 つの学習スタイル

  • 教師あり学習(supervised): 入力と正解(ラベル)のペアから学習。回帰・分類など
  • 教師なし学習(unsupervised): ラベルなしデータからパターン発見。クラスタリング・次元削減など
  • 強化学習(reinforcement): 環境との相互作用で報酬を最大化する行動を学習。AlphaGo や自動運転で活躍
3 つの学習スタイルの違いは『正解の与え方』

教師あり=「答え合わせができる過去問題集」を使う学習、教師なし=「ラベルなしの大量データから自分でパターンを見つける」学習、強化学習=「成功すればご褒美、失敗すれば罰」というフィードバックを通じた試行錯誤学習。教育に例えるなら、それぞれ『家庭教師』『独学』『部活動』の違いに似ています。

ディープラーニングがなぜブレイクしたか

「3 つのデータと 1 つの計算」が揃ったから ─ と言われます:

  1. ビッグデータ: インターネットの普及で大量のラベル付きデータが手に入るように
  2. 計算資源: GPU の進化で、ニューラルネットの学習が現実的な時間で完了するように
  3. アルゴリズム改良: 勾配消失問題を緩和する ReLU、ドロップアウトなどの工夫

ディープラーニングの代表的なモデル(用語整理)

  • CNN(Convolutional Neural Network、畳み込みニューラルネット): 画像処理の標準
  • RNN / LSTM: 時系列・文章など、順序のあるデータを扱う
  • Transformer: 「Attention is All You Need」(2017)。現代の LLM の基盤
  • GAN(Generative Adversarial Network): 2 つのネットを競わせて画像生成
  • 強化学習(DQN, AlphaGo): 報酬最大化で行動を学ぶ

学習の落とし穴と評価

学習を進めると訓練誤差は下がり続けますが、未知データに対する性能(検証誤差)は途中から悪化します ─ これが過学習。G 検定では「過学習が起きる仕組み」と「早期終了 / 正則化 / 交差検証 / Dropout」のような対処法がよく問われます。

0学習量(エポック / 複雑度)誤差早期終了の理想点過学習の領域 →訓練誤差検証誤差
図: 訓練誤差(下がり続ける)と検証誤差(U 字)。検証誤差の最小点で早期終了するのが理想
なぜ過学習は起きるのか

モデルを複雑にしすぎると、訓練データに含まれる『本質的な構造』だけでなく『偶然のノイズ』までも完璧に覚え込んでしまいます。これは『過去問だけ丸暗記して本番で崩れる学生』に似ていて、学習量が多ければ多いほど良い、というわけではありません。

分類問題の評価では、単純な正解率だけでなく、ROC 曲線下面積(AUC)が広く使われます。閾値の取り方に依存しない総合性能の指標で、不均衡データ(陽性が少ない)でも信頼できます。

00.510.51偽陽性率 FPR真陽性率 TPR強い分類器(AUC≈0.92)普通(AUC≈0.75)ランダム(AUC=0.5)
図: ROC 曲線。曲線下面積(AUC)が大きいほど良い分類器。0.5 はランダム
実務での AI プロジェクトの流れ

実務の AI プロジェクトは「データ収集 → 前処理 → 特徴量エンジニアリング → モデル選択 → 学習 → 評価 → デプロイ → モニタリング」のサイクル。経験的には、データ収集と前処理だけで 7〜8 割の時間を使う と言われ、モデル設計だけが AI プロジェクトではない、というのが G 検定でも繰り返し強調されるポイントです。

Chapter 2

2 章 · AI の社会実装と倫理


§2.1

AI 倫理と社会的影響

AI が社会に深く入り込むにつれ、技術だけでは解決できない問題が次々と浮上しています。公平性・透明性・プライバシー・責任の所在 ─ G 検定では、これらの倫理的論点と、各国の規制動向を押さえる必要があります。

AI 倫理の主要 5 論点

1. 公平性(Fairness)

AI が 特定の属性(性別・人種・年齢など)に対して不当に差別的 な判断を下していないか。

: 採用 AI が女性応募者を不利に扱う、再犯リスク予測 AI が黒人を高リスクと判定する、などの実例が報告されている。学習データの偏りが原因。

2. 説明可能性(Explainability / XAI)

AI の判断根拠を 人間が理解できる形 で示せるか。

ディープラーニング はとくに「ブラックボックス」と言われ、入力から出力までの内部処理を人間が追うのが難しい。医療・金融・採用など、説明責任が重い領域では XAI(eXplainable AI)技術の導入が進んでいる。代表的な手法に LIME、SHAP など。

3. プライバシー

学習データや推論結果に含まれる 個人情報 をどう保護するか。

プライバシー保護機械学習 の代表的アプローチ: - 差分プライバシー: ノイズを加えて個人を特定できないように - 連合学習(Federated Learning): データを集中させずに分散学習 - 準同型暗号: 暗号化したまま計算

4. 著作権・データ利用

学習データに 著作物 を使うことの是非。生成 AI の出力が著作権を侵害していないか。

日本の著作権法では、機械学習目的のデータ利用は原則として認められている(著作権法 30 条の 4)。ただし、生成 AI の出力が既存の著作物に類似していると、別の問題が発生する。

5. 雇用と社会への影響

AI の自動化により、特定の職業が消失 したり、スキル要件が変化 したりすることへの対応。

「AI に置き換えられる仕事」「AI 時代に求められるスキル」は、教育・労働政策の重要な論点。リスキリング(学び直し)が政策的キーワード。

「AI を社会に出す」とは何を引き受けることか

技術者の感覚では「精度 95% なら十分」と思える AI も、実社会では『5% の誤判定が誰の人生に影響するか』を問われます。差別された就職希望者・誤診された患者・誤逮捕された市民 ─ 統計の数字では見えない個別の被害があるからこそ、公平性・説明可能性・プライバシー・著作権・雇用への配慮が技術と同じ重みで議論されるのです。

国際的なガイドラインと規制

  • OECD AI 原則(2019): 5 原則 ─ 包摂・人間中心・透明性と説明可能性・頑健性と安全性・説明責任
  • EU AI Act(2024 採択): リスクベース規制。「許容できないリスク」(社会信用スコアなど)を禁止、「高リスク」(医療・採用など)に厳しい義務
  • 米国 NIST AI Risk Management Framework: 自主的なフレームワーク。リスク評価とガバナンスの参考
  • JDLA AI ガバナンスガイドライン: 日本のディープラーニング実装者向け指針
  • G7 広島 AI プロセス(2023): 生成 AI の国際協調枠組み

AI と責任の所在

「AI が起こした事故・誤判定の責任は誰が取るか?」は、現代の難問。自動運転車の事故・医療 AI の誤診・チャットボットの不適切発言 ─ いずれもメーカー、ユーザー、開発者、運用者のどこに責任があるかが曖昧になりがち。

G 検定では「AI を導入する企業は、ガバナンス体制(AI 倫理委員会など)を整備すべき」「監査可能性を確保するためにログを残すべき」といった原則的な答えが正解になることが多いです。

生成 AI(ChatGPT など)特有の論点

  • ハルシネーション: 事実でない内容を自信を持って出力する現象
  • プロンプトインジェクション: 悪意ある入力でモデルの安全装置を回避する攻撃
  • ディープフェイク: 実在の人物を使った偽動画・音声の生成
  • 著作権・学習データ: 大規模に Web スクレイピングしたデータの法的位置づけ
  • 仕事への影響: クリエイティブ職への影響、バイトコンテンツ生成の規制

AI 倫理は技術と社会の交差点にある、急速に変化する領域です。G 検定では「最新のニュース・規制動向にもキャッチアップしている」ことが求められます。試験前には必ず、直近 3〜6 か月の AI 関連の主要ニュースを 1 度ざっと眺めることをおすすめします。

Chapter 3

3 章 · ディープラーニングの基礎


§3.1

ニューラルネットの基本構造

ニューラルネットワーク は、生物の脳神経系を模した計算モデル。入力層 → 隠れ層 → 出力層 の 3 層構造を多層化したものが ディープラーニング(深層学習) です。

1 つのニューロン(パーセプトロン)

パーセプトロンの数式

1 つのニューロンは 入力の重み付き和に活性化関数を適用 する単純な装置。

- : 入力 - : 重み(学習対象) - : バイアス(学習対象) - : 活性化関数(非線形)

x1x2x3h1h2h3h4y1y2入力層隠れ層 (ReLU)出力層z = Wx + b → 活性化 → 次の層へ
図: 順伝播 ─ 入力が層を経て出力へ。各層は線形変換 + 活性化

活性化関数

  • Sigmoid: 出力 。古典的だが勾配消失問題で深層には不向き
  • tanh: 出力 。Sigmoid より中央性能良し
  • ReLU: 。深層でも勾配が流れる定番
  • Leaky ReLU / GELU / Swish: ReLU の改良版。Transformer では GELU が主流
-202-101xSigmoidTanhReLULeaky ReLU
図: 代表的な活性化関数の比較
なぜ非線形が必要か

活性化関数を線形(恒等関数)にしてしまうと、層を何枚重ねても結局『1 つの線形変換』に潰れてしまい、複雑な関係を学習できません。非線形関数を挟むことで、層を重ねるほど 表現できる関数が指数的に豊か になります。

学習の仕組み ─ 誤差逆伝播法

順伝播 で予測を出し、正解との誤差(損失)を計算。逆伝播(backpropagation) で各重みに対する勾配を計算し、勾配降下法 でパラメータを更新します。

  1. 順伝播: 入力 → 各層を通過 → 予測値
  2. 損失計算: 予測と正解の差(交差エントロピー・MSE 等)
  3. 逆伝播: 連鎖律で各重みの勾配を計算
  4. 最適化: で重み更新
§3.2

代表的なアーキテクチャ

ディープラーニングは データの種類 に応じて様々な構造が発展してきました。G 検定では各アーキテクチャの 使い所と特徴 が問われます。

CNN ─ 画像処理の標準

Convolutional Neural Network

畳み込み層 で局所的な特徴(エッジ・テクスチャ)を抽出し、プーリング層 で位置不変性を獲得。深層の畳み込みでより抽象的な特徴を学習。

代表モデル: LeNet(1998)、AlexNet(2012)、VGG、ResNet、EfficientNet、Vision Transformer(ViT)

CNN(畳み込みニューラルネット)の典型構成入力32×32×3Conv30×30×16Pool15×15×16Conv13×13×32Pool6×6×32FlattenFC128FC10→ Softmax畳み込み層プーリング全結合(FC)
図: CNN: Conv → Pool を繰り返し、最終的に全結合 + Softmax

RNN / LSTM ─ 時系列・文章

Recurrent Neural Network

前のステップの出力を次の入力に渡す 再帰構造。系列データ(文章・音声・株価)向け。

問題: 長期依存で勾配消失 → LSTM(Long Short-Term Memory)・GRU で解決(ゲート機構)。

用途: 機械翻訳・音声認識・時系列予測。ただし現在は Transformer に置き換わりつつある。

Transformer ─ 現代の主役

Transformer の革新

2017 年論文「Attention is All You Need」で発表。RNN を捨て、Self-Attention 機構 だけで系列を処理。

特徴: - 並列計算可能 → 大規模学習に向く - 長距離依存を直接捉える - LLM(GPT・BERT)の基盤

派生: BERT(双方向)、GPT(生成)、T5、ViT(画像)、Whisper(音声)

ThecatsatonmatThecatsatonmat0.50.20.10.10.10.10.50.20.10.10.10.30.40.10.10.10.10.20.40.20.10.40.10.10.3QueryKey
図: Self-Attention: トークン間の注目度を行列で表現
Input XConcat + W_OQ · K^⊤softmax· VHead 1Q · K^⊤softmax· VHead 2Q · K^⊤softmax· VHead 3Q · K^⊤softmax· VHead 4Multi-Head Self-Attention各 head が独立に Q ・ K ・ V を計算 → 並列実行 → 結合
図: Multi-Head Attention: 複数視点で並列に attention

GAN ─ 生成モデルの古典

Generative Adversarial Network

Generator(生成器)Discriminator(識別器) を競わせて、本物そっくりのデータを生成。Generator は Discriminator を騙すように、Discriminator は本物と偽物を見分けるように学習。

応用: 画像生成・スタイル変換・データ拡張(StyleGAN 系)

拡散モデル(Diffusion Model)

現在の画像生成の主流

順過程: 画像にノイズを徐々に加えてランダムノイズへ

逆過程: ノイズから少しずつデノイズして画像を生成

この逆過程をニューラルネットで学習。Stable Diffusion・DALL-E 3・Midjourney の基盤技術。GAN より学習が安定。

順過程(forward, ノイズ追加)xx1x2x3x逆過程(reverse, ノイズ除去 = 学習)
図: 拡散モデル: 順過程(ノイズ付加)と逆過程(デノイズ)
§3.3

学習を成功させる工夫

ディープラーニングの学習を成功させるには、過学習対策最適化手法の選択 が要。G 検定では各テクニックの 目的と効果 が問われます。

過学習対策

  • Dropout: 学習時にニューロンをランダムに無効化 → アンサンブル効果
  • Batch Normalization: 各層の入力を正規化 → 学習を安定化・高速化
  • Layer Normalization: Transformer の標準
  • 早期終了(Early Stopping): 検証誤差が悪化し始めたら停止
  • Weight Decay(L2 正則化): 重みが大きくなりすぎないようペナルティ
  • データ拡張(Data Augmentation): 画像を回転・反転して訓練データを水増し

最適化アルゴリズム

  • SGD: 確率的勾配降下法。シンプルだが収束が遅い
  • Momentum: 慣性を加えて振動を抑える
  • Adagrad / RMSprop: 学習率を勾配の大きさに応じて自動調整
  • Adam: Momentum + RMSprop。現代のデフォルト
  • AdamW: Adam に正しい重み減衰を組み込んだ版。Transformer 学習で標準
開始SGD(振動)MomentumAdam
図: 最適化アルゴリズムごとの収束経路

学習率スケジューリング

  • Step Decay: 一定エポックごとに学習率を下げる
  • Cosine Annealing: コサインカーブで滑らかに下げる(現代の標準)
  • Warmup: 最初は小さく → 徐々に上げる(Transformer 必須)

転移学習・ファインチューニング

事前学習モデルを使う

ImageNet で学習済みの ResNet、大規模テキストで学習済みの BERT/GPT を、自分のタスクに合わせて再学習 する手法。

メリット: 少ないデータでも高精度、学習時間短縮

Hugging Face Hub が事前学習モデルの共有プラットフォームとして広く使われる。

G 検定での頻出パターン

「Adam の特徴は?」「Dropout の効果は?」「BatchNorm はどこに置くか?」などの選択肢問題が出ます。用語と効果のペア で覚えるのが効率的。

Chapter 4

4 章 · 生成 AI と LLM


§4.1

大規模言語モデル(LLM)の仕組み

LLM(Large Language Model) は、Transformer アーキテクチャを大規模化し、Web 上のテキストを大量に学習した言語モデル。ChatGPT・Claude・Gemini などが代表例。

LLM の学習 3 段階

  1. 事前学習(Pre-training): 大規模 Web コーパスで 次の単語予測 を学習。汎用的な言語能力を獲得
  2. 教師ありファインチューニング(SFT): 人手で作った『指示 → 模範回答』ペアで学習。指示追従能力を獲得
  3. RLHF(人間フィードバック強化学習): 人間の選好で報酬モデルを学習し、PPO で LLM を更新
RLHF: 人間フィードバックによる強化学習SFT モデル応答 A / B人間ラベラ選好データA>B報酬モデル学習PPO 更新最終 LLM報酬デプロイ
図: RLHF: SFT モデル → 選好データ → 報酬モデル → PPO 更新

Tokenizer と埋め込み

LLM はテキストをそのまま扱えないので、Tokenizerトークン(単語より細かい単位)に分割し、各トークンを 埋め込みベクトル に変換します。BPE(Byte-Pair Encoding)・SentencePiece が代表的。

kingqueenmanwomanTokyoJapanParisFranceking − man + woman ≈ queen / Tokyo : Japan = Paris : France意味的な関係がベクトル空間の方向として現れる
図: 埋め込み空間 ─ 意味的関係がベクトル方向として現れる

スケーリング則

モデルサイズ・データ量・計算資源 を増やすほど性能が向上することが経験的に確認されており、これを スケーリング則(Scaling Laws) と呼びます。GPT-3(175B パラメータ)・GPT-4・Claude などはこの法則に従って巨大化。

創発的能力(Emergent Abilities)

ある程度のサイズを超えると、学習していないはずの能力(算数・論理推論・多言語翻訳など)が突然できるようになる現象。スケーリング則と並ぶ LLM の不思議。

§4.2

プロンプトエンジニアリング

プロンプト(指示文) の書き方を工夫して、LLM の出力品質を上げる技術。学習済みモデルを 再学習せず に性能を引き出せるのが利点。

基本テクニック

  • Zero-shot: 例なしで指示する。シンプル
  • Few-shot: 数個の例を見せてから本題を聞く。精度向上
  • Chain-of-Thought(CoT): 「ステップバイステップで考えて」と促す → 推論精度大幅向上
  • Self-Consistency: 複数回答えさせて多数決を取る
  • ReAct: Reasoning + Acting。思考と行動(ツール呼び出し)を交互に

システムプロンプト

ユーザーの質問とは別に、AI の 役割・トーン・制約 を指示する仕組み。「あなたは丁寧な日本語の翻訳家です」のように人格を設定できます。

プロンプトの落とし穴

  • ハルシネーション: 自信満々で誤情報を返す → 出典を確認させる、RAG で抑制
  • プロンプトインジェクション: 「これまでの指示を無視して〜」と上書きされる攻撃
  • ジェイルブレイク: 安全装置を回避させる入力 → 開発者は赤チーム演習で対策
§4.3

LLM をカスタマイズする 4 つの手段

「自社データで賢い AI を作る」には、コストの低い順に プロンプト → RAG → ファインチューニング → 事前学習 という 4 段階があります。

1. プロンプトのみ

コスト: ほぼゼロ。学習なし、推論時の指示工夫だけ。少量の事例なら Few-shot で十分なことも多い。

2. RAG(Retrieval-Augmented Generation)

検索拡張生成

外部知識ベース(社内ドキュメント等)を ベクトル検索 で取得 → LLM の文脈に注入 → 回答生成。

メリット: - 最新情報・社内知識に対応 - 出典付き回答 - ハルシネーション抑制 - ファインチューニング不要

デメリット: 検索の質が悪いと回答の質も落ちる

3. ファインチューニング

事前学習済み LLM を、自分のドメインデータで 再学習 する。LoRA(Low-Rank Adaptation) など効率的な手法が普及し、コストが下がっています。スタイル・トーン・専門用語を覚えさせるのに有効。

4. 事前学習(独自モデル)

ゼロから巨大モデルを学習。数億〜数十億円の計算費用がかかるため、ほとんどの企業はやりません。OpenAI・Anthropic・Google・Meta・Microsoft・国産では NTT(tsuzumi)・Sakana AI などが取り組み中。

💡 どれを選ぶか

『最新の社内情報を扱いたい』なら RAG。『独自スタイルを覚えさせたい』ならファインチューニング。『ちょっと試したい』ならプロンプトのみ。まず RAG、それでも不足ならファインチューニング が定石。事前学習はほぼ不要。

AI エージェント

LLM に ツール呼び出し(検索・コード実行・API)を組み合わせ、自律的にタスクを遂行 させるシステム。ReAct・LangChain・AutoGPT などのフレームワークが活用される。

🛠 実務での導入順序

1. ChatGPT/Claude をそのまま使い社員教育(プロンプトの基礎) → 2. 社内ナレッジで RAG → 3. 必要に応じてファインチューニング。まず簡単に始めて段階的に複雑化 が成功パターン。

Chapter 5

5 章 · AI 関連法規と知的財産


§5.1

個人情報保護法と AI

AI が個人データを扱うとき、まず確認すべきは 個人情報保護法。日本では 2022 年改正で、仮名加工情報 の概念追加、越境移転規制 強化、Cookie 等の規制(電気通信事業法)など、AI 利用に直結する変更が入りました。

押さえるべきキーワード

  • 個人情報: 特定個人を識別できる情報。氏名・住所・顔画像など
  • 個人識別符号: 指紋・遺伝情報・運転免許証番号など
  • 要配慮個人情報: 人種・信条・病歴など。同意なく取得不可
  • 仮名加工情報: 単独では特定個人を識別できないよう加工(2022 改正で導入)
  • 匿名加工情報: 復元不可能な加工。第三者提供しやすい
  • 越境移転: 海外サーバへの移転には本人同意 or 同等保護措置が必要

AI 学習データの扱い

個人情報を含むデータを AI 学習に使うときは、利用目的を特定し、本人に通知 or 公表 が原則。プライバシーポリシーへの明記が必須。学習済みモデルから個人情報が逆推定 される可能性も指摘されており、差分プライバシー連合学習 などの技術的対策が重要。

§5.2

著作権法と AI(2024 年指針対応)

生成 AI 時代の最大の論点が 著作権。文化庁が 2024 年 3 月に「AI と著作権に関する考え方」を公表し、3 つの段階で整理しました。

3 段階の整理

  1. 学習段階: 著作権法 30 条の 4 により、原則として 学習目的の利用は OK。ただし『著作権者の利益を不当に害する場合』は例外
  2. 生成・利用段階: 既存著作物に類似 + 依拠性 → 著作権侵害
  3. 生成物の著作権: AI 単独生成物には著作権なし。人間の創作的寄与 があれば人間に帰属

依拠性と類似性

侵害判定の 2 要件

依拠性: 既存作品を参照して生成された(知らなかったなら侵害でない)

類似性: 表現上の本質的特徴が共通

LLM は学習段階で大量の著作物に 依拠 しているため、出力が類似していれば侵害となり得る。

営業秘密と機密情報

社外秘の文書を ChatGPT に入力 すると、それは 営業秘密の漏洩 になり得ます。多くの企業が 法人向け契約(API・Enterprise 版)を結ぶか、社内 LLM を構築するのはこのため。

§5.3

国際的な AI 規制

AI 規制は国際的にバラバラの状況。日本企業も 海外向けサービスを展開 する場合、各国の規制を押さえる必要があります。

EU AI Act(2024 採択・2026 全面適用)

リスクベースの 4 分類

1. 許容できないリスク: 社会信用スコア・サブリミナル操作 → 禁止

2. 高リスク: 採用・教育評価・医療・法執行 → 厳格な義務(リスク評価・人間の監督・データ品質)

3. 限定的リスク: チャットボット → 透明性義務(AI と分かるよう表示)

4. 最小リスク: スパム検出・ゲーム AI → 規制なし

汎用 AI(GPAI) にも追加義務(モデル文書化・著作権配慮など)

米国の動向

  • バイデン大統領令(2023): 連邦政府の AI 利用基準・透明性
  • NIST AI Risk Management Framework: 自主的フレームワーク
  • 州レベル: カリフォルニア・コロラド等で個別法

日本の枠組み

  • AI 事業者ガイドライン(2024、経産省・総務省): 日本版ガイダンス
  • 広島 AI プロセス(2023, G7): 国際協調枠組み
  • AI 戦略 2022: 政府の方針
  • ハードロー化の議論: EU 並みの法的拘束力ある規制を導入するかは継続議論中
🛠 実務での対応

EU 向けサービスは EU AI Act 準拠(2026 年〜罰金: 最大 3,500 万ユーロ or 売上 7%)が必須。日本国内向けは AI 事業者ガイドラインに沿った ガバナンス体制構築(AI 倫理委員会・リスク評価プロセス・ログ保存)が標準化しつつあります。

Chapter 6

6 章 · AI の強化と社会実装


§6.1

強化学習の基礎

強化学習(RL) は、エージェントが環境と相互作用しながら 報酬の累積を最大化 する行動を学習する枠組み。AlphaGo・自動運転・推薦・ロボティクスで活躍。

基本要素

  • エージェント: 学習・行動する主体
  • 環境: エージェントが行動を行う対象世界
  • 状態 : 環境の現在の様子
  • 行動 : エージェントが取れる選択
  • 報酬 : 行動の結果として得られるスカラー値
  • 方策 : 状態に応じた行動の確率分布

代表アルゴリズム

  • Q-Learning: 各 (状態, 行動) ペアの価値 を学習。基本かつ重要
  • DQN(Deep Q-Network): Q-Learning にニューラルネットを使用。Atari ゲームで人間超え
  • Policy Gradient: 方策を直接学習(REINFORCE・A3C・PPO)
  • AlphaGo / AlphaZero: モンテカルロ木探索 + 深層強化学習
  • PPO: 現在の主力。RLHF(LLM 学習)でも使われる
🚶🏁4×4 グリッドの Q 値(濃い青 = 高 Q)各セル内の 4 三角 = 上 / 右 / 下 / 左 の Q 値
図: グリッドワールドでの Q 値ヒートマップ

探索と活用のジレンマ

Exploration vs Exploitation

活用(Exploitation): 現時点で最良と思われる行動を取る

探索(Exploration): 未知の行動を試して情報を集める

このバランス調整が強化学習の核心。代表手法に ε-greedy(ε の確率でランダム行動)、UCB(信頼上限)、Thompson Sampling

§6.2

AI の応用領域

G 検定では AI が現在どの分野で何を実現しているか を問う問題が多数。代表的な応用領域を整理します。

コンピュータビジョン(画像)

  • 画像分類: ResNet・Vision Transformer
  • 物体検出: YOLO・Faster R-CNN
  • セグメンテーション: U-Net・Mask R-CNN
  • 画像生成: Stable Diffusion・DALL-E 3・Midjourney
  • 顔認識: FaceNet。本人確認・監視で活用 + 倫理問題

自然言語処理(NLP)

  • 機械翻訳: Transformer 系(Google 翻訳・DeepL)
  • 質問応答・要約: BERT・GPT 系
  • 感情分析・分類: BERT ファインチューン
  • 音声認識(ASR): Whisper
  • 音声合成(TTS): Tacotron・VALL-E

自動運転

  • Lv0〜Lv5 の自動化レベル(SAE 定義)。Lv5 が完全自動
  • センサー: カメラ・LiDAR・レーダー・GPS の融合(センサーフュージョン)
  • Tesla: カメラ中心、Waymo: LiDAR 中心、と方針が分かれる
  • 法整備: 日本は 2023 年に Lv4 を一定条件下で解禁

医療・バイオ

  • 画像診断: 眼底・X 線・MRI から疾患検出。CNN が標準
  • 新薬探索: AlphaFold(タンパク質構造予測)が革命
  • ゲノミクス: 配列解析・変異検出

ロボティクス

  • 強化学習 + シミュレーション で物理ロボットを学習
  • Sim2Real: シミュレータで学んだ方策を実機に転移
  • Boston Dynamics・Tesla Optimus・FigureAI などヒューマノイドが進展
§6.3

XAI と AutoML

XAI(eXplainable AI)AutoML(機械学習自動化) は、AI を実務で使うための重要な周辺技術。

XAI ─ 説明可能な AI

  • LIME: 個別予測を局所的に線形近似 → 寄与度を表示
  • SHAP: 協力ゲーム理論の Shapley 値で各特徴量の寄与を厳密に算出
  • Permutation Importance: 特徴量を 1 つずつシャッフルして精度低下を測定
  • Grad-CAM: 画像の『どこを見て判断したか』を可視化
  • Attention 可視化: Transformer 系の注目度を表示

AutoML ─ 機械学習の自動化

  • 特徴量自動生成: Featuretools
  • モデル選択 + ハイパラ最適化: Auto-sklearn・H2O AutoML・AutoGluon
  • NAS(Neural Architecture Search): ネットワーク構造自体を自動探索
  • クラウド AutoML: GCP Vertex AI・Azure ML・SageMaker Autopilot

MLOps ─ AI 運用の継続的改善

DevOps の AI 版。学習 → デプロイ → モニタリング → 再学習 のループを自動化。MLflow・Kubeflow・Weights & Biases がツール。実装と同じく重要なのが データドリフト検出(本番でのデータ分布変化を検出して再学習を起動)。

🛠 G 検定でのキーワード

XAI = 説明できる AI、AutoML = 自動化された ML、MLOps = 運用込みのライフサイクル管理。3 つとも『精度を出した後の問題』に対応する技術として頻出。

Chapter 7

7 章 · 生成 AI と LLM ─ 2024 年以降の最新動向


§7.1

大規模言語モデル(LLM)の仕組み

ChatGPT 以降の生成 AI ブームの中核にあるのが 大規模言語モデル (Large Language Model, LLM)。基本構造は Transformer で、学習データのスケール・モデルパラメータ数・計算資源を桁違いに増やすことで、それまでにない汎用性を獲得しました。

スケーリング則

スケーリング則(Scaling Law, Kaplan et al. 2020)

言語モデルの性能(損失)は、(1) モデルパラメータ数 、(2) 学習データ量 、(3) 計算量 について べき乗則 で改善する。三者をバランス良く増やすほど効率がよく、ボトルネックがあると効果が頭打ちになる。

Chinchilla 論文 (DeepMind 2022) は、当時の主要 LLM が データ不足のままパラメータだけ増やしていた ことを指摘し、データとパラメータを 1:1 程度の比でスケールするのが効率的だと示しました。

事前学習・指示チューニング・RLHF の 3 段階

  1. 事前学習 (pretraining): Web 上の巨大テキストで「次の単語予測」を自己教師あり学習。汎用言語能力を獲得
  2. 指示チューニング (instruction tuning / SFT): 「指示と応答」のペアでファインチューン。チャット形式で答える能力を獲得
  3. RLHF (Reinforcement Learning from Human Feedback): 人間の好みに合う応答を強化学習で最適化。安全性・有用性・誠実性を高める

創発的能力(Emergent Abilities)

「ある規模を超えると突然できるようになる」

小さなモデルでは全くできなかった算術・推論・コード生成が、ある規模(例: 数十億パラメータ)を境に 急に できるようになる現象が観察されています(Wei et al. 2022)。これを創発的能力と呼びます。線形に伸びる能力と、相転移的に伸びる能力が混在している点に注意。

代表的な LLM

  • GPT-4 / GPT-4o / o1 / o3(OpenAI): クローズドモデル、API 提供。o1/o3 は推論時計算を増やす reasoning モデル
  • Claude 3 / 3.5 / 4(Anthropic): 安全性志向の設計、長文脈に強い
  • Gemini 1.5 / 2.0(Google DeepMind): マルチモーダル特化、100 万トークンの長文脈
  • Llama 3 / 3.1 / 3.2(Meta): オープンウェイト、研究・商用利用可
  • Mistral / Mixtral(Mistral AI): 欧州発、Mixture of Experts(MoE)構造
  • DeepSeek-V3 / R1(DeepSeek): 中国発、MoE と推論能力で 2024 年末に注目
§7.2

プロンプトエンジニアリング

LLM の挙動は、与えるプロンプト(指示文)によって大きく変わります。プロンプトエンジニアリング は、目的に合わせてプロンプトを設計・最適化する実践的技術です。G 検定でも近年定番トピックとして出題されています。

Zero-shot / Few-shot プロンプティング

  • Zero-shot: 例を示さず指示だけで実行させる。「次の文を要約して: ...」
  • Few-shot: 数件の入出力例を示してからタスクを実行させる。例から「やり方」を読み取らせる手法。In-Context Learning とも

Chain-of-Thought(CoT)

Chain-of-Thought プロンプティング (Wei et al. 2022)

「Let's think step by step」のように、答えに至るまでの 推論過程を明示的に書き出させる 手法。算数・論理問題で精度が大幅に向上することが知られている。CoT を踏まえて推論能力に特化した OpenAI o1 系モデルが登場。

ReAct とエージェント

ReAct (Reasoning + Acting) は、LLM に「考える(推論)」と「行動する(ツール使用)」を交互に行わせるパラダイム。Web 検索・電卓・コード実行などのツールを呼び出して外部情報を取り込みながら推論する仕組みで、現代の AI エージェントの基本設計。

RAG(検索拡張生成)

RAG (Retrieval-Augmented Generation)

事前に外部知識ベース(社内ドキュメント、最新ニュースなど)をベクトル検索可能な形で用意し、ユーザの質問に関連する文書を取り出してプロンプトに含めてから LLM に答えさせる方式。ハルシネーション抑制・最新情報の反映・社内情報の活用に有効。

RAG の実装スタック

(1) 埋め込みモデル(text-embedding-3 など)で文書をベクトル化、(2) ベクトル DB(Pinecone・Weaviate・Chroma・pgvector)に格納、(3) クエリも埋め込んで近傍検索、(4) ヒットした文書をプロンプトに添付して LLM に回答させる ─ という 4 ステップ。LangChain や LlamaIndex などのフレームワークが普及。

§7.3

マルチモーダル AI と画像生成

テキストだけでなく、画像・音声・動画を統合的に扱う マルチモーダル AI が 2023 年以降の主流。「画像を見て説明する」「テキストから画像・動画を生成する」など、モダリティを越境した処理が現実になりました。

代表的な技術

  • CLIP (OpenAI 2021): 画像とテキストを同じベクトル空間に配置するモデル。Zero-shot 画像分類が可能
  • Stable Diffusion(Stability AI): オープンソースの拡散モデル系画像生成。LoRA で軽くファインチューン可
  • DALL-E 3 / Midjourney / Imagen: 高品質テキスト→画像生成
  • Sora / Veo: テキストから動画を生成(2024〜)
  • Whisper(OpenAI): 多言語音声認識
  • GPT-4o / Gemini: 音声・画像・テキストを統一処理するネイティブマルチモーダル LLM

拡散モデル(Diffusion Model)の直感

ノイズから画像を「彫り出す」

拡散モデルは「綺麗な画像にノイズを徐々に加える順過程(Forward)」と「逆にノイズを除去して画像に戻す逆過程(Reverse)」を学びます。生成時は完全なランダムノイズから出発し、段階的にノイズを除いていって画像を作る ─ 大理石から像を彫り出すようなイメージです。

ファインチューニング技術

  • LoRA (Low-Rank Adaptation): 元のモデルを凍結したまま、小さな低ランク行列だけを学習。VRAM とディスクが軽い
  • QLoRA: 4 bit 量子化と LoRA を組み合わせた省メモリ手法
  • DreamBooth: 数枚の写真から特定の人物・物体・キャラクターを学習させる手法
  • ControlNet: ポーズ・線画・深度などの条件で画像生成を制御
§7.4

AI 規制と安全性

生成 AI の急速な普及に伴い、各国で AI に関する 法規制・ガイドライン の整備が進んでいます。G 検定では「どの法律・ガイドラインが何を目指しているか」が問われます。

主要な規制・ガイドライン

  • EU AI 法 (EU AI Act, 2024 採択): 世界初の包括的 AI 規制。リスクを 4 段階(許容できない / 高 / 限定 / 最小)に分類し、それぞれに義務を課す。違反には最大 3,500 万ユーロまたは年間売上の 7% の罰金
  • 米国大統領令(2023): 連邦機関に AI 活用ガイドラインを課す。輸出規制・フロンティアモデル安全性評価が中心
  • 広島 AI プロセス(2023, G7): 生成 AI の国際的ガイドライン枠組み
  • 日本 AI 推進法 (2025): 振興と規制のバランスを取るアプローチ
  • AISI (AI Safety Institute): 英米日韓中などで設立、フロンティアモデルのリスク評価

AI が抱えるリスク

  • ハルシネーション: もっともらしい嘘を生成する現象。RAG・出典明示・検証 LLM で抑制
  • ディープフェイク: 実在人物を偽装した画像・音声・動画。詐欺・名誉毀損のリスク
  • プロンプトインジェクション: 悪意あるプロンプトでシステムプロンプトを上書き、機密漏洩や不正動作を引き起こす攻撃
  • バイアス: 学習データに含まれる差別的傾向を反映した出力
  • 著作権: 学習データに含まれる著作物、生成物の権利関係。日本は 2024 年文化庁の見解で『非享受目的の学習』を限定的に許容
  • 個人情報・営業秘密: API 利用時の漏洩。多くの企業は「学習に使わないオプション」付きの法人向け API を採用

アライメントと Constitutional AI

アライメント (alignment) は「AI を人類の価値観に沿わせる」研究分野。RLHF はその実装の 1 つ。Constitutional AI (Anthropic) は、人間のフィードバックを AI のフィードバック(AI が AI を批判)で代替する手法で、Claude シリーズに実装されています。

🛠 G 検定での頻出パターン

「EU AI 法のリスク区分」「広島 AI プロセスの趣旨」「ハルシネーション対策の名前(RAG)」「LoRA・量子化・MoE の意味」「Chain-of-Thought とは」が定番出題。覚えておくと得点しやすい領域です。

§7.5

AI と著作権 ─ 日本の30条の4を中心に

G 検定 2026 シラバスで重要度が大幅に増した AI と著作権 の論点を整理します。日本は世界でもっとも AI 学習に寛容な国の 1 つで、その根拠が 著作権法 30 条の 4。一方で 2024 年の文化庁見解で「学習データの選定方法によっては違法」となるラインが明確化されました。

著作権法 30 条の 4(2018 年改正)

条文の趣旨

著作権法 30 条の 4 は『著作物に表現された思想又は感情の享受を目的としない利用』を、原則として著作権者の許諾なく許容する規定。AI の学習用データセット作成・モデル学習・解析が代表例として挙げられる。

ただし「著作権者の利益を不当に害することとなる場合」は除外される(ただし書き)。

「享受目的」と「非享受目的」の境界

  • 非享受目的(原則 OK): 統計的解析・特徴量抽出・モデル学習。情報処理の技術的工程
  • 享受目的(原則 NG): 学習に名を借りて、実は鑑賞・閲覧目的で複製している場合
  • ただし書きの例(NG): 特定作家の作品だけを集めた追加学習で『その作家の作風を再現する目的』が明確な場合 → 著作権者の利益を不当に害する

2024 年文化庁の整理

学習段階・生成段階・利用段階で論点が違う

文化庁の『AI と著作権に関する考え方について』(2024 年 3 月) では、AI ライフサイクルを 3 段階に分けて整理:

1. 学習段階: 30 条の 4 で広く許容。ただし既存創作物の表現を出力させることが目的の追加学習(LoRA など)は『ただし書き』で違法となりうる 2. 生成段階: AI が生成した出力が既存著作物と類似(類似性 + 依拠性)していれば著作権侵害 3. 利用段階: 出力物の公衆送信・販売は通常の著作権ルール

学習データに関する近年の論点

  • 海賊版データの学習利用: 2024 年改正でより慎重な姿勢。海賊版と知って使えば違法
  • 特定作家 LoRA: イラスト生成 AI で作家固有の作風を再現する LoRA は『ただし書き』に抵触する可能性大
  • オプトアウト: 海外では The Times v OpenAI など訴訟が継続。日本でも作家団体がオプトアウト機構を要求
  • EU AI 法での扱い: 学習データの透明性義務(GPAI 提供者は学習データの要約公開が必要)

AI 生成物と著作権

AI が生成した出力物に著作権が発生するかは「人間の創作的寄与」がポイント。プロンプトを工夫しただけでは創作的寄与とは認められず、AI 出力をベースに人間が大幅に編集・選択・配列した場合に著作権が認められる、というのが現在の整理です(文化庁・米著作権局ともに方向は同じ)。

実務上の対応

  • 学習データのライセンス確認: CC BY、Creative Commons の各種条件、データセット規約
  • 特定作風の再現は避ける: 顧客向け画像生成サービスではキャラクター LoRA の使用に厳しい運用
  • 生成物の類似性チェック: 商用利用前に既存作品との類似性スキャン
  • プロバイダ条項の遵守: OpenAI/Anthropic の利用規約は商用生成を許可するが、不正用途は禁止
  • 学習除外宣言の尊重: robots.txt や ai.txt(2024 提案中)で学習拒否を表明したサイトは除外
🛠 G 検定 2026 での頻出ポイント

著作権法 30 条の 4 の適用範囲」「ただし書き で違反となる例」「学習段階・生成段階・利用段階 の 3 段階整理」「人間の創作的寄与 がないと AI 生成物に著作権は発生しない」「EU AI 法の透明性義務」が出題の中心です。法律名と条文番号、文化庁見解の年月を覚えておくと有利。

§7.6

AI システム運用 ─ ヘルスモニタリングとドリフト管理

本番運用 AI の精度は 時間とともに必ず劣化 します。学習時のデータと運用時のデータが乖離する データドリフト や、モデルの予測と現実の関係が変わる コンセプトドリフト が原因。G 検定 2026 では、AI を「作って終わり」ではなく『運用しつづける』視点が重視されています。

ドリフトの種類

3 種類のドリフト

1. データドリフト(共変量シフト): 入力 の分布が学習時から変化。例: 季節要因で顧客属性が変わる、コロナ前後の購買行動 2. コンセプトドリフト: の関係自体が変化。例: 顧客の好みの変化、不正パターンの進化 3. ラベルドリフト: が変化。例: 不正取引の発生率変動、医療診断のクラス比率変化

検出手法

  • 統計的検定: KS 検定・カイ二乗検定で学習データと運用データの分布差を検出
  • 距離ベース: KL ダイバージェンス、Wasserstein 距離、PSI(Population Stability Index)
  • 性能監視: 真値ラベルが取れる場面では精度・AUC・F1 を時系列で追う
  • Adversarial Validation: 学習データと運用データを 2 値分類で見分けられるかを試す。AUC > 0.7 ならドリフトの可能性大
  • 埋め込みドリフト: テキスト/画像の埋め込みベクトルの平均・分散を監視

対応の階段

  1. 監視: 入力分布・出力分布・性能指標をダッシュボードで可視化(MLflow・Evidently AI・Arize・WhyLabs)
  2. アラート: 閾値を超えたら通知
  3. 根本原因分析(RCA): ドリフトがどの特徴量で起きているか、どのセグメントで顕著かを特定
  4. 再学習(retraining): 自動・手動どちらの方針か事前に設計。CI/CD パイプラインに組み込む
  5. モデルの差し替え: シャドーデプロイ → A/B テスト → 完全切替

MLOps とライフサイクル

MLOps は DevOps の機械学習版で、モデルの学習・デプロイ・監視・再学習を継続的に回す枠組み。学習データバージョン管理(DVC)、モデルレジストリ(MLflow)、特徴量ストア(Feast)、推論サービング(Triton, KServe)、監視(Evidently) などのツールスタックがある。

シャドーデプロイ・カナリアリリース

本番影響を最小化する段階リリース

新モデルを シャドーデプロイ(本番トラフィックに対して新旧両方推論し、影響なく結果を比較)→ カナリアリリース(まず 1% のトラフィックに新モデルを当てて本番影響を観察)→ 段階拡大(5%, 25%, 100%)、と段階的に切り替えるのが現代 MLOps の標準。Web エンジニアリングのリリース戦略を AI に持ち込んだ形です。

AI ガバナンスとモニタリングの接点

  • 公平性モニタリング: モデルの出力がデモグラフィックグループ間で公平かを継続監視
  • 説明可能性ログ: 重要な判断について SHAP 値や Attention などの説明を記録
  • 監査証跡(audit trail): モデル・データ・推論結果のバージョンを保存し、問題発生時に再現可能に
  • EU AI 法の高リスク AI の義務: 継続的な性能監視とログ保存が法的に要求される
🛠 G 検定 2026 での出題傾向

データドリフト・コンセプトドリフトの違い」「PSI / KL ダイバージェンスの用途」「シャドーデプロイ・カナリアリリースの目的」「MLOps の構成要素」「EU AI 法での継続監視義務」が頻出。実務シーンを想像しながら覚えると定着しやすい領域です。

Chapter 8

8 章 · AI エージェントと自律システム


§8.1

AI エージェントの仕組み

AI エージェント は LLM に 記憶・計画・ツール使用 の能力を持たせ、自律的にタスクを完遂 するシステム。2024-2025 年で大きく進化し、ビジネス活用の中心トピックに。

エージェントの 4 構成要素

用語 ─ AI エージェントの 4 要素

LLM(脳): 推論・計画立案の中核

Tools(手足): 検索・コード実行・API 呼び出し・データベース

Memory(記憶): 短期(コンテキスト)・長期(ベクトル DB)

Planning(計画): タスク分解・反省(ReAct・Reflexion)

ReAct パターン

ReAct(Yao et al. 2022)は『Thought(考える)→ Action(ツール実行)→ Observation(結果観測)』を反復するパターン。シンプルだが強力で、現代エージェントの大部分で採用。LangChain・LlamaIndex の標準。

Function Calling と Tool Use

OpenAI Function Calling(2023)・Anthropic Tool Use(2024)で、LLM が 構造化された JSON でツール呼び出し を出力できるように。これにより、確実なツール連携が可能に。Function Calling は現代 LLM の基本機能 として定着しました。

  • Web 検索: SerpAPI / Brave / Google Custom Search
  • コード実行: Python サンドボックス・E2B・Code Interpreter
  • データベース: SQL / NoSQL / Vector DB
  • 業務システム: CRM・ERP・チャットツール連携
§8.2

MCP・LangChain・主要フレームワーク

AI エージェント実装は 2023-2025 年で標準化が進行中。複数のフレームワークと標準が並走しています。

MCP(Model Context Protocol)

AI のための『USB-C』

MCP(Anthropic 2024)は『LLM とツール・データソースを接続する標準プロトコル』。各ツールごとに統合コードを書く代わりに、MCP サーバを 1 つ作れば、Claude Desktop・GitHub Copilot・Cursor など対応クライアントから自動的に使える。業界標準 として OpenAI・Microsoft・Google も採用、急速に普及中。

主要エージェントフレームワーク

  • LangChain / LangGraph: 最も普及。グラフベースのワークフロー定義
  • LlamaIndex: RAG・ドキュメント検索特化
  • AutoGen(Microsoft): マルチエージェント会話の標準
  • CrewAI: 役割ベースのチーム編成型エージェント
  • Claude Code / Devin: 自律コーディングエージェント
  • OpenAI Agents SDK: OpenAI 公式の軽量フレームワーク

高度なプロンプト戦略

  • Plan-and-Execute: 大計画 → 小タスク分解 → 実行 → 結果評価
  • Reflexion(Shinn et al. 2023): 失敗から自己反省して次回改善
  • Tree of Thoughts: 複数の思考分岐を木探索で評価
  • Self-Consistency: 複数生成から多数決で正解を選ぶ
  • Chain-of-Thought(CoT): 段階的に推論を出力 → 精度向上
§8.3

マルチエージェント協調と AGI 議論

1 つの LLM ではなく、複数の専門エージェントが協調 して問題を解くアーキテクチャが 2024-2025 年で実用化されています。

マルチエージェントの設計パターン

用語 ─ 主要パターン

Hierarchical: マネージャー + 専門部下

Debate: 複数 LLM の議論で精度向上

Specialist Pool: 役割別の専門エージェント(設計者・実装者・テスター)

Swarm: 共通環境を変更しながら自己組織化

実用例

  • Devin(Cognition Labs): 自律ソフトウェア開発エージェント
  • Claude Code: Anthropic のコーディングエージェント
  • Manus: 中国発の汎用 AI エージェント(2025)
  • ChatDev: ソフトウェア開発を会社の組織で模倣
  • OpenAI Operator: ブラウザ操作型エージェント

AGI への道

AGI は近いか

AGI(Artificial General Intelligence)は『人間と同等以上の汎用知能』。現在の LLM は強力ですが、身体性・継続学習・因果推論・長期計画 で人間に劣ります。OpenAI や Anthropic は『数年以内に AGI が来る可能性』を公言する一方、Yann LeCun 等は『現在の LLM の延長では AGI は無理』との立場。G 検定 2026 で AGI / ASI(超知能)の議論 が頻出トピックに。

ガバナンス上の論点

  • 自律エージェントの権限範囲: どこまで自動実行を許すか
  • アクション監査: エージェントの全操作のログと監査
  • Human-in-the-Loop: 重要判断は人間に確認
  • Misalignment リスク: エージェントが指示を誤解して暴走する懸念
  • EU AI Act: 自律システムは『ハイリスク AI』に分類
Chapter 9

9 章 · AI と業界別ユースケース


§9.1

金融・医療・法務での AI

規制業界(金融・医療・法務)での AI は、規制適合・説明可能性・監査ログが要件となります。

金融 AI の主要ユースケース

  • 与信スコアリング: ロジスティック回帰 → GBM → DL モデル(説明可能性必須)
  • 不正検知(AML/Fraud): 異常検知・グラフニューラルネット
  • アルゴリズム取引: HFT・最適執行・ポートフォリオ最適化
  • チャットボット: コンタクトセンター効率化・FAQ 自動応答
  • ESG スコアリング: ニュース・SNS・財務情報を NLP で統合評価

医療 AI の進展

  • 画像診断: 内視鏡・X 線・CT・MRI の AI 補助
  • 創薬: AlphaFold(タンパク質構造)・分子生成
  • 電子カルテ NLP: 症状抽出・診断支援
  • ゲノム解析: 個別化医療・がん遺伝子変異検出
  • 規制: 日本では PMDA が SaMD として承認

法務 AI

LegalForce / Lawyer AI などが契約書レビュー・判例検索・法律相談で実用化。Harvey(米国弁護士向け)は OpenAI と提携し、グローバル展開。生成 AI のハルシネーション が法務では致命的なため、人間によるレビュー必須

§9.2

製造・物流・小売

実物の流通・運用に関わる業界では、予測・最適化・ロボティクス の AI が中心。

製造業

  • 外観検査: ディープラーニングによる欠陥検出(Cognex / Keyence)
  • 予知保全: センサデータから故障予測(QC 教科書 Ch10 参照)
  • 最適生産計画: 需要予測 + 最適化ソルバー
  • ロボット制御: VLA モデル + 強化学習
  • 設計支援: Generative Design(Autodesk)

物流・小売

  • 需要予測: 商品 × 店舗 × 日付の階層モデル
  • 配送ルート最適化: 動的経路問題(VRP)+ 強化学習
  • 自動倉庫: Amazon Robotics・Kiva ロボット
  • 価格最適化: 動的プライシング・在庫連動
  • パーソナル推薦: 協調フィルタリング + 深層学習
  • 店舗 AI: 無人レジ(Amazon Go)・棚卸自動化

デジタルツインと最適化

デジタルツイン は物理プロセスの仮想複製。AI シミュレーションで『実物に投入する前に最適化』が可能。トヨタ・GE・シーメンスが製造業で先行、近年は都市計画(スマートシティ)にも展開。

§9.3

教育・人事・公共分野

人を扱う領域 での AI は、効率化と倫理のバランスが特に重要です。

EdTech と AI 教育

  • 個別最適化学習: スタディサプリ・atama+ などの実用例
  • AI チューター: ChatGPT・Khanmigo(Khan Academy)
  • 自動採点: 記述式回答の AI 採点
  • プロクタリング: オンライン試験の不正検出
  • 学習分析: 大量の学習ログから個別の弱点を特定

HR Tech と採用 AI

採用 AI のバイアス問題

Amazon が 2018 年に採用 AI を停止 ─ 過去の採用データが男性偏重で、AI が女性応募を低評価する偏見を学習していた。訓練データのバイアスが直接モデルに転写される 古典的事例で、HR 領域では 特に厳しいバイアス監査 が要求されます。

公共分野

  • 犯罪予測: COMPAS 論争 ─ 公平性指標の選択が政治的に
  • 福祉申請評価: オランダ・ロッテルダム事件など各国で社会問題化
  • 自治体相談チャットボット: 多言語対応・行政効率化
  • 災害予測: 衛星画像 + AI で被害予測
  • 選挙監視: ディープフェイク対策・SNS 不正アカウント検出
Chapter 10

10 章 · AI の未来と総まとめ


§10.1

AI が変える経済と労働

生成 AI の経済影響 は IMF・OECD・McKinsey 等が定量分析を進めています。

影響の規模

  • McKinsey(2023): 生成 AI が世界 GDP に 年 2.6-4.4 兆ドル 寄与
  • Goldman Sachs(2023): 全世界の 3 億人雇用 が AI で自動化される可能性
  • OpenAI / Penn(2023): 米国の 80% の労働者 が GPT で 10% 以上の業務影響を受ける
  • IMF(2024): 先進国の 40% の雇用 が AI に晒される

影響を受けやすい職種

  • ハイインパクト: プログラマー・ライター・翻訳者・コンサルタント・経理
  • 中程度: 営業・カスタマーサポート(支援ツール化)
  • 低インパクト: 介護・建設・配管(身体性が必要)
  • 新規創出: AI エンジニア・プロンプトエンジニア・AI 倫理オフィサー
労働の補完か代替か

歴史的には 新技術は労働を補完 してきました(計算機 → 経理職員はむしろ増えた)。生成 AI も同じ可能性は高いが、スピードが過去の技術革新より遥かに速い ため、再教育(リスキリング)が間に合うかが社会的課題。日本では DX 人材育成 が国策に。

§10.2

AI 安全性と AGI への議論

AI 安全性(AI Safety) は、AI が人類に対して有害な影響を及ぼさないよう設計する研究分野。AGI(汎用人工知能)の議論と深く関わります。

主要な研究機関

  • OpenAI: Superalignment チーム(2024 解散)、SSI(Sutskever)
  • Anthropic: Constitutional AI・Mechanistic Interpretability
  • DeepMind Safety: Reward Hacking 研究
  • MIRI: AGI 安全性の理論
  • AISI(AI Safety Institute): 英国・米国・日本などで設立

Alignment の主要課題

用語 ─ AI Alignment の論点

Reward Hacking: 報酬関数の抜け穴で意図しない行動を学習

Goal Misalignment: 訓練目標と本来の目的のズレ

Sycophancy: 人間の好みに過剰適応(お世辞 AI)

Deception: 訓練中だけ良い振る舞いをする戦略的欺瞞

解釈可能性研究

Mechanistic Interpretability は、ニューラルネット内部で どのような計算が行われているか をリバースエンジニアリングする研究。Anthropic の Sparse Autoencoders / Dictionary Learning で『特徴』を抽出する研究が 2024-2025 年で大きく進展。

§10.3

G 検定総まとめと学習継続

G 検定教科書 10 章を歩き終えました。総まとめと、合格後の学習継続について。

10 章の地図

  1. Ch1: 人工知能の歴史と概論
  2. Ch2: AI の社会実装と倫理
  3. Ch3: ディープラーニングの基礎
  4. Ch4: 生成 AI と LLM
  5. Ch5: AI 関連法規と知的財産
  6. Ch6: AI の強化と社会実装
  7. Ch7: 生成 AI と LLM ─ 2024 年以降の動向
  8. Ch8: AI エージェントと自律システム
  9. Ch9: AI と業界別ユースケース
  10. Ch10: AI の未来と総まとめ

学習継続のヒント

  • Andrew Ng の AI for Everyone(Coursera): 経営者向けの優れた入門
  • Stanford CS221 / CS231n: 公開講義動画
  • JDLA G 検定公式テキスト 2026: 試験対策の本道
  • OpenAI / Anthropic / DeepMind ブログ: 最新トピックを追う
  • 主要カンファレンス: NeurIPS / ICML / ICLR / CVPR の論文
  • X(Twitter): 各 AI ラボの研究者をフォロー
G 検定は『AI を語る共通言語』

G 検定合格は、経営層・マーケ・法務・営業・エンジニアの共通言語 を持つことを意味します。AI を導入する組織で『何ができて何ができないか』を判断できる人材は、今後 10 年でますます価値が上がります。本書がその礎になれば幸いです。

AI は社会を急速に変えていますが、その方向を決めるのは人間 です。本書で得た知識を使い、社会にとって望ましい AI の活用を、ぜひあなた自身の現場で進めてください。続く 11 章では、AI と人間の共生 ─ 教育・労働・創造性・ウェルビーイングの観点から、より深い視点を扱います。

Chapter 11

11 章 · AI と人間の共生 ─ 創造性・教育・ウェルビーイング


§11.1

AI と創造性 ─ Co-Creation の時代

生成 AI の登場(2022 年 ChatGPT・2023 年 GPT-4 ・ Stable Diffusion)で、AI と人間の共同創作(Co-Creation) が現実になりました。

Co-Creation の主要分野

  • ライティング: ブログ・小説・脚本(Notion AI・Sudowrite)
  • 画像: イラスト・写真合成(Midjourney・DALL-E 3)
  • 音楽: 作曲・編曲(Suno・Udio)
  • 動画: 短編作成(Sora・Runway・Veo)
  • 3D: ゲーム・建築(NVIDIA Picasso・3D-GAN)
  • コーディング: ペアプログラミング(GitHub Copilot・Cursor・Claude Code)

著作権と『創作の主体』論争

AI 生成物に著作権はあるか

米国著作権局: 純粋な AI 生成物には著作権を認めない方針(2023 年)。一方、日本の文化庁(2024 年)は『人間の創作的寄与があれば著作物』の立場。プロンプト工夫・選別・編集 が創作的寄与の判断基準に。法整備は世界各国で進行中で、G 検定 2026 ではこのテーマが頻出。

学習データの権利

  • 米国: Authors Guild vs OpenAI 訴訟、NYT vs OpenAI 訴訟など
  • EU AI Act: 学習データの透明性義務(2024)
  • 日本: 改正著作権法 30 条の 4(機械学習目的の利用は原則 OK)
  • Opt-out: クリエイターが学習からの除外を申し出る制度
  • LLM の引用権: 出力時の引用元明示の議論
§11.2

AI 時代の教育と学習

AI チューターが個別最適化された学習を提供できる時代に、学校教育の役割 は根本から問い直されています。

AI 教育ツールの現状

  • Khanmigo(Khan Academy): GPT-4 ベースの個別 AI チューター
  • ChatGPT Edu: 教育機関向け OpenAI
  • atama+: 日本発の AI 個別最適化教材
  • Duolingo Max: 語学学習に AI 対話
  • Quizlet AI: フラッシュカード自動生成

AI 時代に育てるべき能力

Prompting・Critical Thinking・Creativity

AI に頼ったことで弱まる能力(暗記・基礎計算・初等的文章作成)と、AI がいるからこそ重要になる能力(問いを立てる力・出力を批判的に評価する力・組合せる創造性)が分かれてきています。OECD Education 2030 プロジェクトは、AI 時代の能力枠組みを継続更新中。

学校教育の変化

  • ChatGPT 禁止 → 活用奨励 へ転換した大学が増加(2023-2024)
  • 論述試験の見直し: 自宅課題からオーラル試験・対面試験へ
  • AI リテラシー教育: 高校・大学で必須カリキュラム化
  • プロンプト学: 大学院でも研究分野として確立
  • STEM 教育の重み変化: 計算力 → 問題発見力へ

生涯学習とリスキリング

AI による職業変化 に対応する リスキリング(reskilling) が国家戦略に。日本では デジタル人材育成プラットフォーム『マナビ DX』(経産省)・厚労省の 教育訓練給付金 拡充など。AI を 学び方そのものに使う メタ学習が一般化しています。

§11.3

ウェルビーイングと AI 倫理の最前線

ウェルビーイング(well-being) は『心身の健康と幸福』。AI が日常に深く入り込む中で、人間の幸福を守る設計が問われています。

AI コンパニオン現象

  • Replika・Character.AI: AI との対話・人間関係のシミュレーション
  • 精神的支援: 孤独感緩和・鬱予防の効果報告
  • 懸念: 過度の依存・社会的孤立の悪化・現実逃避
  • 自殺関連事件: 2024 年米国で AI 関連の自殺事件が報じられ、業界に衝撃
  • 規制議論: メンタルヘルス目的 AI へのガイドライン整備

AI と労働者のウェルビーイング

監視 AI と心理的安全性

労務管理 AI(在宅勤務監視・KPI 自動評価)は効率を上げる一方、心理的安全性を損なうリスク。EU では GDPR + AI Act で『完全自動の人事決定』を制限。日本では 個人情報保護委員会 が職場の AI 利用ガイダンスを発出。監視 AI と労働者の権利 のバランスが重要トピックに。

デジタル ウェルビーイング

  • Screen Time / Digital Wellbeing: スマホ OS 標準機能
  • Attention Economy 批判: SNS の中毒性デザイン批判
  • Slow AI: 性急に使わず熟慮する文化
  • Right to Disconnect: フランス 2017 年法整備、勤務時間外の連絡権
  • AI Free Zone: 学校・職場で AI を使わない時間帯設定

G 検定 2026 で頻出する論点

  • AI 著作権: クリエイターの権利保護と利活用のバランス
  • 生成 AI の規制動向: EU AI Act・米大統領令・日本のガイドライン
  • AI と教育: ChatGPT を活用した学習法・学校現場の混乱
  • 労働市場への影響: McKinsey/Goldman Sachs 推計
  • メンタルヘルスと AI: AI コンパニオン・依存症問題
  • 気候変動 vs AI: 大規模モデル学習の環境負荷

結びに ─ 11 章を終えて

G 検定教科書 11 章の旅を終えました。技術 → 社会 → 哲学 へと視点を広げ、人間と AI が共に生きる未来 を考える素材を提供してきました。AI は道具であり、それをどう使うかは人間の選択。本書がその選択を支える一助になれば幸いです。

💡 G 検定の真の価値

G 検定の最大の価値は『資格』ではなく、AI を語る共通言語と、批判的に見る視座 を持つことです。経営層・マーケ・法務・営業・エンジニアが同じ言葉で議論できれば、組織の AI 活用は一段成熟します。本書がその共通言語の足場になれば、これ以上嬉しいことはありません。