画像処理エンジニア検定 エキスパート 教科書
**画像処理エンジニア検定 エキスパート** は、**CG-ARTS 協会** が主催する、画像処理 ・ コンピュータビジョンの **理論と実装の両面** を測る検定です。**ベーシック(画像処理の基本)** の上位に位置し、フィルタ ・ 周波数解析 ・ パターン認識 ・ 機械学習 ・ 深層学習(CNN ・ Transformer)・ 3 次元視覚など、現代の画像処理に必要な広範な知識を扱います。本教科書は、エキスパートの出題範囲を 10 章で体系的にカバーします。
目次
- 第 1 章 · 画像処理エンジニア検定 ─ 試験の全体像ベーシック / エキスパートの位置付け、出題範囲、対策プランを整理します。
- 第 2 章 · 画像処理の基礎画像のディジタル表現、標本化、量子化、色空間を整理します。
- 第 3 章 · 空間フィルタリング畳み込みの基礎、平滑化 / 鋭敏化 / エッジ検出フィルタを整理します。
- 第 4 章 · 周波数解析フーリエ変換 ・ DCT ・ ウェーブレットを整理します。
- 第 5 章 · 幾何変換と画像復元アフィン変換 ・ ホモグラフィ ・ 補間 ・ 復元(Wiener / TV)を整理します。
- 第 6 章 · 領域処理とモルフォロジセグメンテーション基礎 ・ ラベリング ・ モルフォロジ演算を整理します。
- 第 7 章 · 特徴抽出とパターン認識コーナー / SIFT / HOG / Bag-of-Features と古典的分類器を整理します。
- 第 8 章 · 深層学習による画像認識CNN ・ Vision Transformer ・ 物体検出 ・ セグメンテーションを整理します。
- 第 9 章 · 3 次元視覚と動画処理ステレオ ・ オプティカルフロー ・ SfM ・ NeRF を整理します。
- 第 10 章 · 受験対策と応用領域試験当日のチェックリストと、画像処理の応用分野を整理します。
第 1 章 · 画像処理エンジニア検定 ─ 試験の全体像
検定の位置付けと特徴
画像処理エンジニア検定 は CG-ARTS 協会が主催する、画像処理 ・ コンピュータビジョンの専門検定です。ベーシック(基本) と エキスパート(応用 ・ 実装) の 2 段階があり、エキスパートは画像処理エンジニア / 機械学習エンジニア / 自動運転やロボティクス開発者の 専門性の証明 として位置付けられます。
- 主催: 公益財団法人 CG-ARTS 協会
- 形式: マークシート方式(会場試験)
- 実施: 年 2 回(7 月・11 月頃)
- 問題数 / 時間: エキスパート 80 分 / 計算 ・ 記述含む選択式
- 合格基準: 70 点以上(参考)
- 合格率(参考): 30 〜 40% 前後
- 受験料: 6,800 円(税込・参考)
他検定との比較
- G 検定 / E 資格: AI 全般。画像処理理論は浅い
- 画像処理エンジニア(エキスパート): 古典 CV(フィルタ・周波数・幾何) + DL ベース CV を両方扱う
- 統計検定: 古典統計学。画像は範囲外
- ディジタル技術検定: ハードウェア寄り
出題比重と推奨学習プラン
出題比重(目安)
- 画像処理基礎(約 25%): 標本化 ・ 量子化 ・ コントラスト ・ 濃度変換
- フィルタ ・ 周波数解析(約 20%): 空間フィルタ ・ フーリエ変換 ・ ウェーブレット
- 特徴抽出 ・ パターン認識(約 20%): エッジ ・ コーナー ・ HOG ・ SIFT ・ クラス分類
- 機械学習 ・ 深層学習(約 25%): SVM / NN / CNN / 物体検出 / セグメンテーション
- 3 次元視覚(約 10%): ステレオ ・ オプティカルフロー ・ SfM
100 〜 150 時間プラン
- Week 1 〜 2: 公式テキスト『ディジタル画像処理』第 1 〜 5 章 ─ 基礎
- Week 3 〜 4: 同 第 6 〜 9 章 ─ フィルタ + 周波数 + 復元
- Week 5 〜 6: 同 第 10 〜 14 章 ─ 特徴抽出 + 認識
- Week 7 〜 8: 機械学習 / 深層学習 ─ CNN ・ U-Net ・ YOLO
- Week 9: 3 次元視覚
- Week 10: 過去問演習 + 模擬試験
近年の試験では DL ベースの問題比重が増えていますが、古典的な空間フィルタ ・ 周波数解析 ・ HOG / SIFT も依然として頻出です。『DL だけで OK』にはなっておらず、両軸での理解が合格の鍵です。
第 2 章 · 画像処理の基礎
ディジタル画像の表現
- 画素(pixel): 画像の最小単位
- 標本化(Sampling): 連続画像から画素位置を選ぶ
- 量子化(Quantization): 画素値を有限段階に丸める
- 標本化定理(Nyquist): 信号最高周波数の 2 倍以上で標本化が必要
- ビット深度: 8 bit = 256 階調、16 bit = 65,536 階調
色空間
- RGB: ディスプレイの基本(加法混色)
- CMY/CMYK: 印刷の基本(減法混色)
- YUV / YCbCr: 輝度 + 色差。圧縮や伝送で標準
- HSV / HSL: 色相 + 彩度 + 明度。色抽出に便利
- Lab: 知覚的均等な色空間
人間の視覚は 輝度には敏感、色差には鈍感。YCbCr では輝度(Y)と色差(Cb, Cr)を分離でき、色差成分のみダウンサンプリングしても視覚的に劣化が分かりにくい。これが JPEG の圧縮効率の鍵です。
濃度変換とヒストグラム
- ガンマ補正: 。ディスプレイの非線形特性を補正
- コントラスト伸張: 画素値の範囲を拡大
- ヒストグラム平坦化: 画素分布を一様に近づける(コントラスト改善)
- ヒストグラム特定化(マッチング): 目的の分布に近づける
- 閾値処理(2 値化): Otsu / 適応的 2 値化
第 3 章 · 空間フィルタリング
畳み込みと相関
畳み込み(convolution) は画像にカーネルを適用する基本操作。 という形で、近傍画素の重み付き和を取ります。相関(correlation) は畳み込みのカーネル反転をしない版で、CNN の畳み込み層は実は相関に相当します。
- 境界処理: ゼロパディング / 反射 / 周期 / 拡張
- ストライド: カーネルの移動幅
- パディング: 出力サイズを保つ
- 可分カーネル: 行 × 列の積で表現でき計算量を削減(例: ガウシアン)
平滑化フィルタ ・ ノイズ除去
- 平均フィルタ: 単純平均。ぼけが強い
- ガウシアンフィルタ: 重み付き平均、エッジ保存とのバランス
- メディアンフィルタ: 中央値で塩胡椒ノイズに強い、エッジ保存
- バイラテラルフィルタ: エッジ保存平滑化
- Non-Local Means: 自己相似性を利用、高品質ノイズ除去
ノイズの種類
- ガウシアンノイズ: 通常の電気ノイズ
- 塩胡椒ノイズ(インパルス): 通信エラー / センサ故障
- ポアソンノイズ: 暗所撮影 ・ 微弱信号
- スペックルノイズ: SAR / 超音波画像
鋭敏化 ・ エッジ検出
- Sobel / Prewitt フィルタ: 1 次微分。x / y 方向の勾配
- Laplacian フィルタ: 2 次微分。エッジを 1 つの操作で
- LoG(Laplacian of Gaussian): 平滑化 + Laplacian
- Canny エッジ検出: 平滑化 → 勾配 → 非最大抑制 → ヒステリシス。古典の決定版
- アンシャープマスキング: 元画像 - 平滑化画像 で輪郭強調
第 4 章 · 周波数解析
フーリエ変換
2D フーリエ変換 は画像を周波数成分に分解します。低周波は画像の大局的な構造、高周波は細部 / ノイズに対応。ローパスフィルタ = 平滑化、ハイパスフィルタ = エッジ強調 と理解できます。
- FFT: 高速フーリエ変換()
- 振幅スペクトル: 各周波数の強さ
- 位相スペクトル: 各周波数の位相
- 畳み込み定理: 空間畳み込み = 周波数領域の積
- サンプリング定理: でないとエイリアシング
DCT とウェーブレット
- DCT(離散コサイン変換): 実数版で、JPEG の核(8×8 ブロック DCT)
- ウェーブレット変換: 時間 / 空間と周波数を同時に局在化。JPEG2000 で採用
- 離散ウェーブレット変換(DWT): マルチ解像度解析
- Haar / Daubechies / Mexican Hat: 代表的なウェーブレット
フーリエは『信号全体に均一な周波数情報』を与えるのが基本(時間情報を失う)。ウェーブレットは『この場所のこの周波数』を表現できるため、エッジや突発的変化のある画像 / 信号で強い。MRI ・ 心電図 ・ 地震波解析でも標準的に使われます。
第 5 章 · 幾何変換と画像復元
幾何変換
- アフィン変換: 平行移動 / 回転 / 拡大縮小 / シア。直線・平行関係を保つ
- ホモグラフィ(射影変換): 直線は保つが平行は保たない。3×3 行列
- ホモジニアス座標: で行列表現を統一
- 逆写像: 出力画素ごとに入力位置を逆算 → 補間
補間と画像復元
- 最近傍補間: 速いがブロック状
- バイリニア補間: 4 近傍の重み付き平均
- バイキュービック補間: 16 近傍。滑らかで標準
- Lanczos: より高品質な補間
画像復元
- Wiener フィルタ: ノイズ + ぼけの逆問題
- 全変動(TV)復元: エッジ保存しつつノイズ除去
- 逆畳み込み: 既知ぼけからの復元
- スーパーレゾリューション: 低解像度 → 高解像度。最近は SR-CNN / SwinIR / Real-ESRGAN
第 6 章 · 領域処理とモルフォロジ
領域抽出と連結成分
- 閾値処理: Otsu の手法 / 適応的閾値
- 4 近傍 / 8 近傍: 連結性の定義
- ラベリング: 連結成分に番号付け
- 領域成長法(Region Growing): 種点から類似画素を統合
- Watershed: 地形学的アナロジーで領域分割
モルフォロジ演算
- 膨張(Dilation): 領域を太らせる
- 収縮(Erosion): 領域を細らせる
- オープニング: 収縮 → 膨張(小さなノイズ除去)
- クロージング: 膨張 → 収縮(小さな穴埋め)
- Top-Hat: 元画像 - オープニング(明るい点抽出)
- Black-Hat: クロージング - 元画像(暗い点抽出)
OCR の前処理(文字の途切れを膨張で補修)、医用画像のセグメンテーション後処理(小さな誤検出をオープニングで除去)、産業検査(欠陥検出後の小さなノイズ除去)など、画像処理パイプラインの後段で頻出します。
第 7 章 · 特徴抽出とパターン認識
局所特徴量
- Harris コーナー検出: 自己相関行列の固有値で角を検出
- SIFT: スケール不変 + 回転不変 + 照明不変。古典の代表
- SURF: SIFT の高速版
- ORB: SIFT/SURF より高速で特許制約なし
- HOG(Histogram of Oriented Gradients): 勾配方向のヒストグラム。歩行者検出で有名
- LBP(Local Binary Pattern): 局所 2 値パターン。テクスチャ解析
Bag-of-Features と古典分類器
Bag-of-Features(BoF) は、自然言語処理の Bag-of-Words の画像版。SIFT 等の局所特徴を コードブック(クラスタ中心) に量子化し、ヒストグラムを画像表現として使用。CNN 普及前の画像分類の主流でした。
- SVM: サポートベクターマシン。マージン最大化
- ランダムフォレスト: 決定木のアンサンブル
- AdaBoost: 弱識別器のブースティング(顔検出 Viola-Jones)
- 最近傍法(k-NN): 単純で効果的
第 8 章 · 深層学習による画像認識
CNN の基本構造
- 畳み込み層 + プーリング層 + 全結合層 が基本ブロック
- LeNet(1998): 元祖 CNN
- AlexNet(2012): ImageNet で圧勝、DL ブームの発火点
- VGG(2014): 小さなフィルタを深く重ねる
- ResNet(2015): 残差接続で 100 層以上を実現
- EfficientNet(2019): 解像度 / 深さ / 幅をバランスさせる
- Vision Transformer(ViT)(2020): Transformer を画像に適用
物体検出とセグメンテーション
物体検出
- R-CNN / Fast R-CNN / Faster R-CNN: 領域提案 + 分類
- YOLO(You Only Look Once): リアルタイム検出の代表
- SSD(Single Shot Detector): シングルパス検出
- DETR: Transformer ベース検出
- 評価指標: IoU / mAP
セグメンテーション
- FCN(Fully Convolutional Network): 元祖意味的セグメンテーション
- U-Net: 医用画像で標準。エンコーダ-デコーダ + skip connection
- Mask R-CNN: インスタンスセグメンテーション
- DeepLab: Atrous(膨張)畳み込みで広い受容野
- SAM(Segment Anything): 2023、汎用セグメンテーション基盤モデル
学習テクニックとデータ拡張
- 転移学習(Transfer Learning): ImageNet 事前学習モデルを微調整
- ファインチューニング: 全層 / 後段層のみ更新
- データ拡張: 反転 / 回転 / クロップ / 色調整 / Mixup / CutMix
- Batch Normalization: 学習安定化
- Dropout / Stochastic Depth: 過学習抑制
第 9 章 · 3 次元視覚と動画処理
カメラモデルとキャリブレーション
- ピンホールカメラモデル: 3D → 2D 投影の基本
- 内部パラメータ: 焦点距離 / 主点 / レンズ歪み
- 外部パラメータ: カメラの位置と姿勢
- Zhang のキャリブレーション: チェッカーボードで内部パラメータ推定
ステレオ視と SfM
- ステレオ視: 2 つのカメラの視差から深さを推定
- エピポーラ幾何: 対応点探索を 1 次元に削減
- 視差(disparity): 両画像での同一点のずれ
- SfM(Structure from Motion): 動画 / 連続画像から 3D 復元
- SLAM: 自己位置推定 + 地図作成
- NeRF / 3D Gaussian Splatting: ニューラル 3D 表現の現代手法
オプティカルフローと動画解析
- オプティカルフロー: 連続フレーム間の画素移動
- Lucas-Kanade 法: 局所領域での解析的解法
- Horn-Schunck 法: 全画像の滑らかさ拘束
- FlowNet / RAFT: DL ベースのフロー推定
- 動画分類: 3D CNN / I3D / ViViT
第 10 章 · 受験対策と応用領域
範囲別チェックリスト
- 第 2 章: 標本化定理・色空間(RGB / YCbCr / HSV)・ヒストグラム平坦化
- 第 3 章: ガウシアン / メディアン / Sobel / Laplacian / Canny
- 第 4 章: フーリエ変換・畳み込み定理・DCT(JPEG)・ウェーブレット
- 第 5 章: アフィン変換 / ホモグラフィ / バイキュービック / Wiener
- 第 6 章: モルフォロジ(膨張/収縮/オープニング/クロージング)
- 第 7 章: SIFT / HOG / BoF / SVM / AdaBoost
- 第 8 章: ResNet / U-Net / YOLO / IoU / mAP / Transfer Learning
- 第 9 章: ピンホール / ステレオ / SfM / オプティカルフロー
試験当日のコツ
- 80 分 を全問にバランスよく配分。計算問題は後回し戦略
- 過去問は必須: 出題傾向 ・ 細かい用語の使い回しに慣れる
- 極端な選択肢に警戒: 『常に』『必ず』は誤答が多い
- フィルタ計算は手で 1 度はやる: 3×3 や 5×5 程度の畳み込みは試験中に手計算
応用領域とキャリア
- 自動運転: 車線検出 / 物体検出 / セグメンテーション / 深度推定
- 医用画像: 病変検出 / U-Net セグメンテーション / 3D 再構成
- 産業検査: 不良品検出 / OCR / 寸法計測
- 監視 / 顔認証: 顔検出 / 識別 / 異常検知
- AR/VR: SLAM / ハンドトラッキング / 環境認識
- 生成 AI: Stable Diffusion / Sora
画像処理エンジニア / コンピュータビジョンエンジニア としての専門性証明、自動運転 / ロボティクス / 医用画像など 画像 AI が事業の中核 の企業で評価されます。さらに踏み込むなら本サイトの[E 資格](/certs/e-shikaku)で深層学習の数学側、[AI 実装検定](/certs/ai-implementation)で実装側を補強する道があります。