SRE 【Site Reliability Engineering】 サイト信頼性エンジニアリング

概要

SRE(Site Reliability Engineering)とは、情報システムの運用手法の一つで、ソフトウェア開発者が運用チームに参加し、運用・管理の効率化や省力化、自動化、あるいは信頼性の向上に資するソフトウェア開発し、導入すること。

従来のシステム運用ソフトウェアの設定や操作に熟達したシステム管理者が中心となり、主に手作業で管理ツールの操作やコマンド入力などをい、システムの状態監視、定期的に必要な操作、トラブル発生時の対処などに取り組んできた。

SREでは運用担当にソフトウェア開発チームを取り込みシステム設定の調整や状態の監視、定型的な管理作業などを自動化するツール開発する。ツールにより運用の効率化、自動化を図り、開発チームは新規のツール開発や既存のツールの改良、不具合の解消に引き続き取り組む。

ソフトウェアによる自動化、省力化の推進を運用業務の一環として取り込むことで、手作業により生じる人為的なミス(ヒューマンエラー)を継続的に削減することができ、システムの種類や規模が拡大しても比例して人員やコストを増やさずに対処できるようになる。

SREは米グーグルGoogle)社が提唱した運用手法で、同社ではSREについて「SREとはソフトウェア技術者に運用チームの設計を依頼したときにできあがるものです」(SRE is what happens when you ask a software engineer to design an operations team.)と説明している。同社のSREチームは全作業量の半分を手動の管理業務の上限と定め、もう半分は運用管理のためのソフトウェア開発に割くこととされている。

(2023.1.13更新)

他の辞典による解説 (外部サイト)

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。
ホーム画面への追加方法
1.ブラウザの 共有ボタンのアイコン 共有ボタンをタップ
2.メニューの「ホーム画面に追加」をタップ
閉じる