Kaggle
概要

2010年にアンソニー・ゴールドブルーム(Anthony J. Goldbloom)氏らが創業した同名企業によるサービスで、同社は2017年に米グーグル(Google)社により買収された。登録利用者数は2026年4月時点で3000万人を超えており、学生から現役のデータサイエンティストや研究者まで幅広い層が利用している。
利用者は企業や研究機関が提供するデータセットに対して課題に取り組み、提出した予測結果が評価指標に基づいてランキングされる。評価は自動的に行われ、スコアに応じて順位が更新される仕組みである。利用者やコンペティションの成績や活動実績に応じて「Novice」「Contributor」「Expert」「Master」「Grandmaster」の段階的なランクが付与され、このランクが実務の採用選考で参照されることもある。
コンペティションでは、主催者が提供するトレーニングデータを使ってモデルを構築し、テストデータに対する予測結果をCSV形式で提出する。リーダーボードで参加者のスコアがリアルタイムに公開され、上位入賞者には賞金が授与される大会も多い。問題の内容は分類や回帰、画像認識、自然言語処理など多岐にわたり、実務に近い課題に対して多様な手法が試される。
コンペティション以外にも、公開データセットの共有・検索機能や、Webブラウザ上でPythonコードを実行できる「Jupyter Notebook」環境(Kaggle Notebooks)が提供されている。他の利用者のNotebookには実行可能なコードや分析手順がまとめて掲載されており、機械学習の手法や実装方法を学ぶための環境としても利用される。並列処理に必要なGPUやTPUを無料で一定時間利用できるため、手元に高性能な計算環境がなくても機械学習の実験が行える。