こちらの勉強会に急遽潜り込むことができました。
以下、資料たちです。
株式会社メルカリ - SRE 久保達彦 @cubicdaiya
サイボウズ株式会社 運用本部・サービス運用部・SRE 深谷敏邦 @toshi_pp
www.slideshare.net
クックパッド株式会社 インフラストラクチャー部 SRE グループ長 星 北斗 @kani_b
株式会社ミクシィ XFLAG™スタジオ ゲーム開発室 SREグループ 清水 勲 @isaoshimizu
さくらインターネット株式会社 技術本部エンジニア 山田修司 @uzyexe
いずれも規模の大きいシステムに対して柔軟性を持ったインフラを提供する工夫やそれにいたる歴史が語られていて、刺激と気づきと反省を得ることができました。
今の業務を改善をしていく姿勢は勿論ですが、積極的にソフトウェアで解決してレバレッジを効かせていくと、より平和な世界と品質の高いサービス提供の基盤を提供できそうです。
(英語だけど) オライリーの書籍「Site Reiability Engineering」も無料公開されていますし、SRE の普及はより進みそうです。 http://www.publickey1.jp/blog/17/googlesite_reliability_engineering.html
しかし、pagerduty の導入率高いなー。