サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
買ってよかったもの
sre-magazine.net
巻頭言:一人SREsのドキュメンテーション実践 書いた人:しょっさん( @syossan27 ) 一人でSRE活動をやっている中で実践しているドキュメンテーションに関するTipsと、最後に来年開催致しますSRE Kaigiの話を少しいたします。 ECSプロダクトの監視をTerraform Moduleで標準化 書いた人:@rubita_isi ECSプロダクトの監視をTerraform Moduleで標準化した件について、その背景や具体的な内容についてお話しします。 入門 ポストモーテム 書いた人:渡部龍一( @ryuichi_1208 ) ポストモーテムを行う流れとその際に気を付けていることなどについて書きました。 AWS Cost and Usage ReportsをSnowflakeからクエリする 書いた人:@ohsawa0515 AWSコストを分析・可視化するためのAWS Cost
自己紹介 株式会社モニクルで SRE をしている beaverjr です。 この記事では、弊社のプロダクトチームと SRE チームで定期的に行っているプロダクションミーティングについて紹介します。 プロダクションミーティングとは プロダクションミーティングについては、SRE 本に詳しい記載があります。 プロダクションミーティングは、サービスが実際に運用される本番環境の状況と運用に関する情報共有を目的としたミーティングです。 ミーティングの目的 プロダクションミーティングの主な目的は、以下の通りです。 情報共有: チーム間での情報の透明性を保ち、本番環境に関連する重要な情報を共有します。 問題解決: サービスの運用パフォーマンスの詳細について話し合い、それを設計や設定、実装と関連づけて考え、問題解決の方法を議論します。 継続的な改善: 定期的なミーティングによって改善のサイクルを生み出し、サ
この記事は株式会社 X-Tech5 CTOの、ばば(netmarkjp)が書きました。 事業でのコストコントロールは永遠の課題ですね。クラウドサービスのコストコントロールは昨年あたりから特に大きく取り上げられている印象です。 キーワードとしては「コスト削減」や「コスト最適化」がよく使われます。ここではまるっとコストコントロールと呼びます。 わたしはお仕事で色々な会社のSREの実践や体制構築をお手伝いするSREサービスや、SRE/オブザーバビリティの導入・定着支援をしています。 各種クラウドサービスのコストコントロールの機会も多々あるので、その中で得たクラウドサービスのコストコントロールにスムーズに取り組むためのヒントを共有します。 同じ成果なら支出は少ないほうが嬉しい 何をいまさら、という感じかもしれませんが、支出は少ないほうが嬉しいですよね。それはそう。 ただ、この「同じ成果なら」という
既存GoプロジェクトにOpenTelemetryを計装する機会がありました。eBPFによる自動計装ではなく、手動計装を選んだ理由を説明します。 GoアプリケーションへのOpenTelemetry計装手段 Goにおいては、OpenTelemetryの自動計装が公式で用意されていません。公式サイトにAutomaticの章がないことからわかります。おそらく、ランタイムの制約で実行時にアプリケーションの挙動を変えることが難しいのでしょう。 トレースに十分なスパンを含めるために、現状では以下の2つの計装手段があります。既存のGoアプリケーションに導入する手間や影響範囲をイメージいただくために、概要に絞って解説します。 手動計装 eBPFによる自動計装(Work In Progres) 1. 手動計装 まず、OpenTelemetryのSDKをインストールし、セットアップをします。 func main
これを参考にしているのでしょう、バーンレート14.4や6をアラートの閾値としている例をちらほら見かけます。 14.4には暗黙の前提がある しかし、先の表には暗黙の前提があります。SLOの期間が30日と仮定されているのです。 バーンレートの定義上、SLOの全期間でエラーバジェットをちょうど消費し終える速度が「1」です。 表の最下行でバーンレートが1なのは、期間が30日だからです。30日の10%=3日で、10%のエラーバジェットを消費するのですから、バーンレートは1となります。 計算式にすると下記の通りです。 2% * (30d / 1h) = 0.02 * 720 = 14.4 5% * (30d / 6h) = 0.05 * 120 = 6 10% * (30d / 3d) = 0.10 * 10 = 1 先の表と整合していますね。 SLO期間が28日だと13.44になる 一方で同書の2章
巻頭言:Four keysの"Change lead time"をちょっと深堀る 書いた人:しょっさん( @syossan27 ) Four keysの指標の一つ、“Change lead time"について気になるところをちょこっと深堀りしてみました。 SLO期間が28日のとき、アラートの閾値をバーンレート14.4にしてよいのか 書いた人:iwamot さん( @iwamot ) SLOの期間に関わらず、バーンレート14.4をアラートの閾値としている例を見かけます。14.4が常に最適なのか、考えてみましょう。 GoプロジェクトへのOpenTelemetry計装でeBPF自動計装を採用しなかった話 書いた人:sumiren さん( @sumiren_t ) 既存GoプロジェクトにOpenTelemetryを計装する機会がありました。eBPFによる自動計装ではなく手動計装を選んだ理由を説明し
SRE MagazineはSREに関連する記事や、SREに関係する人にスポットを当てたWeb雑誌です
このページを最初にブックマークしてみませんか?
『SRE Magazine』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く