ホーム›用語集›ViTGlossaryViT☆読み: びてぃー英: Vision Transformer1級コンピュータビジョン定義画像を 16×16 パッチに分割し、Transformer で処理する画像分類モデル。十分な学習データで CNN を超える。関連する用語(コンピュータビジョン)ResNetれずねっとImageNetいめーじねっとU-NetゆーねっとYOLOよろIoUあいおーゆーNMSえぬえむえすセグメンテーションせぐめんてーしょんアンカーボックスあんかーぼっくす指数型分布族しすうがたぶんぷぞく十分統計量じゅうぶんとうけいりょう最尤推定さいゆうすいていフィッシャー情報量ふぃっしゃーじょうほうりょう← 用語集トップへサイト内を検索