2026-04-30·実装·⏱ 約 5 分

Kaggle 始め方 ─ 最初の銅メダルまでの 30 日

世界最大の機械学習コンペサイト Kaggle で実戦経験を積む方法。アカウント作成からテーブルコンペで銅メダルを取るまでの王道 30 日プランを提示。

Kaggle は ML 実戦経験を積む最強の場。世界中の DS と同じ問題に取り組み、リアルタイムで順位がつきます。本記事では 30 日で初メダル を取る現実的なプランを提示。

なぜ Kaggle が良いか

実データ で手を動かせる(教科書の iris ・ MNIST から脱却)
世界の上位の Notebook が公開されており、学習教材として最高
Discord コミュニティ・日本人勢のブログ が豊富
メダル・ランクが履歴書 に書ける(Expert ・ Master ・ Grandmaster)

30 日プラン

Day 1〜3: アカウント作成 + Tutorial

[kaggle.com](https://kaggle.com) でアカウント作成
Titanic コンペ(初心者用)で Submit までの流れを体験
Kaggle Learn(無料コース)で Pandas ・ ML 入門

Day 4〜10: 公開 Notebook を読む

現在開催中のテーブルコンペを 1 つ選び、Most Voted の Notebook を 5〜10 個読む。コードをコピペして自分の環境で動かす。

Day 11〜17: ベースラインを作る

テーブルコンペの定石コード

import pandas as pd
import numpy as np
from sklearn.model_selection import KFold
import lightgbm as lgb

train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')
X, y = train.drop('target', axis=1), train['target']

oof = np.zeros(len(X))
sub = np.zeros(len(test))
kf = KFold(n_splits=5, shuffle=True, random_state=42)

for fold, (tr_idx, val_idx) in enumerate(kf.split(X)):
    X_tr, X_val = X.iloc[tr_idx], X.iloc[val_idx]
    y_tr, y_val = y.iloc[tr_idx], y.iloc[val_idx]
    model = lgb.LGBMRegressor(n_estimators=2000, learning_rate=0.05)
    model.fit(X_tr, y_tr, eval_set=[(X_val, y_val)], callbacks=[lgb.early_stopping(100)])
    oof[val_idx] = model.predict(X_val)
    sub += model.predict(test) / 5

print('CV:', np.sqrt(((y - oof) ** 2).mean()))
pd.DataFrame({'id': test['id'], 'target': sub}).to_csv('submission.csv', index=False)

Day 18〜23: 特徴量エンジニアリング

カテゴリ変数: Target Encoding
集計特徴量: groupby + agg で cross-feature
日付: weekday ・月初/月末・祝日
外部データ: 公開可能な追加データを統合

詳しくは [Pandas Tips](/blog/pandas-tips-for-ml) も参照。

Day 24〜27: ハイパラ調整

[ベイズ最適化](/blog/bayesian-optimization) で Optuna を使い、num_leaves ・ learning_rate ・ min_child_samples を探索。CV スコアが 0.5〜2% は伸びる。

Day 28〜30: アンサンブル + Submit 連発

Stacking や Blending で複数モデルの予測を平均化。LightGBM + XGBoost + CatBoost の単純平均でも 1% 上がる。

シンプル Blending

blend = (lgb_pred + xgb_pred + cat_pred) / 3
# 加重平均にしたい場合
blend = 0.4 * lgb_pred + 0.4 * cat_pred + 0.2 * xgb_pred

メダル獲得のコツ

Public LB に過剰適合しない: CV を信じる
最終 Submit は 2 つ: 安全な選択 + チャレンジ選択
Discussion を読む: 他参加者のヒントが宝の山
Discord でチームを組む: 銀以上を狙うなら

学習リソース

[scikit-learn 入門](/blog/sklearn-introduction)
[Pandas Tips](/blog/pandas-tips-for-ml)
[ベイズ最適化](/blog/bayesian-optimization)
[AI Engineer Roadmap](/roadmap)

まとめ

Kaggle は 理論を実戦に変える最強の道場。30 日真剣にやれば、教科書を 6 ヶ月読むより身につきます。最初の銅メダルが転機です。