オートスケール 【autoscaling】 オートスケーリング
インターネット上のサービスやコンテンツは、突発的に利用者が急増してアクセスが殺到することがある。平均的な利用状況をもとに決めた固定的なサーバ構成の場合、そのようなアクセスの急増に耐えられず極端な性能低下やサービスの停止などに追い込まれることがある。
オートスケールに対応したシステムの場合、普段は最小限の構成でサービスを運用し、急激にアクセス要求が高まるとこれを検知して自動的にシステム規模を拡張して対応する。同じ構成のサーバを複製して負荷分散を行ったり(スケールアウト)、仮想マシン(VM)の場合はCPU時間やメモリ容量など割り当て資源を引き上げる(スケールアップ)。
どの程度負荷が高まったら拡張を実施するかを表す「しきい値」を管理者が設定し、これを超えると自動的にオートスケールが発動する。負荷が下がると追加した資源を解放して自動的に元の構成に戻る。追加した資源に対する利用実績に基づいて応分の料金が後から請求される。
(2021.11.8更新)