読み方 : カグル

Kaggle

概要

Kaggleとは、データ分析や機械学習の競技会(コンペティション)を主催するネットサービスの一つ。企業や研究機関が提供するデータセットと課題をもとに、世界中のデータサイエンティストが予測精度を競う競技の場を提供している。
Kaggleのイメージ画像

2010年にアンソニー・ゴールドブルーム(Anthony J. Goldbloom)氏らが創業した同名企業によるサービスで、同社は2017年に米グーグル(Google)社により買収された。登録利用者数は2026年4月時点で3000万人を超えており、学生から現役のデータサイエンティストや研究者まで幅広い層が利用している。

利用者は企業や研究機関が提供するデータセットに対して課題に取り組み、提出した予測結果が評価指標に基づいてランキングされる。評価は自動的に行われ、スコアに応じて順位が更新される仕組みである。利用者やコンペティションの成績や活動実績に応じて「Novice」「Contributor」「Expert」「Master」「Grandmaster」の段階的なランクが付与され、このランクが実務の採用選考で参照されることもある。

コンペティションでは、主催者が提供するトレーニングデータを使ってモデルを構築し、テストデータに対する予測結果をCSV形式で提出する。リーダーボードで参加者のスコアがリアルタイムに公開され、上位入賞者には賞金が授与される大会も多い。問題の内容は分類や回帰画像認識自然言語処理など多岐にわたり、実務に近い課題に対して多様な手法が試される。

コンペティション以外にも、公開データセットの共有・検索機能や、Webブラウザ上でPythonコードを実行できる「Jupyter Notebook」環境(Kaggle Notebooks)が提供されている。他の利用者のNotebookには実行可能なコードや分析手順がまとめて掲載されており、機械学習の手法や実装方法を学ぶための環境としても利用される。並列処理に必要なGPUTPUを無料で一定時間利用できるため、手元に高性能な計算環境がなくても機械学習の実験が行える。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。