記事へのコメント6

    • 注目コメント
    • 新着コメント
    braitom
    braitom 障害と異常の定義と異常をどう扱うかについての考察。長年見ているシステムの場合はあっなんかおかしいかもって気づけるけど経験則でしかないので確かにどう扱えばいいか悩む。

    2019/02/27 リンク

    その他
    y_uuki
    y_uuki 記事の定義でいう異常はSLOには含めず、通知のないアラートを設定するか、メトリックダッシュボードを用意し、日次か週次でチェックし異常に気づけるようにするというフレームが解の一つとしてあります。

    2019/02/26 リンク

    その他
    do_su_0805
    do_su_0805 このもやもや、僕もある気がする

    2019/02/26 リンク

    その他
    iekusup
    iekusup ほー。

    2019/02/26 リンク

    その他
    igagurimk2
    igagurimk2 想定される障害の規模がSLOを超えないなら、それにつながるような異常に対して処置する必要はない。 そもそも異常が発生しているのは当然というのがエラーバジェットの概念の核。

    2019/02/26 リンク

    その他
    ledsun
    ledsun ハインリッヒの法則みたいに「300件の異常が1件の障害に繋がる」みたいに数的な重み付けのモデル化はできないかな?

    2019/02/26 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    SRE はサービス品質に影響しない程度の異常をどう扱うべきか? - 無印吉澤


      ...    

    ブックマークしたユーザー

    • techtech05212024/02/28 techtech0521
    • laughing2019/02/28 laughing
    • braitom2019/02/27 braitom
    • somathor2019/02/27 somathor
    • jewel122019/02/27 jewel12
    • boxphere2019/02/27 boxphere
    • nishitki2019/02/27 nishitki
    • abe_hn2019/02/26 abe_hn
    • tkscotte2019/02/26 tkscotte
    • m_norii2019/02/26 m_norii
    • y_uuki2019/02/26 y_uuki
    • do_su_08052019/02/26 do_su_0805
    • kuyo2019/02/26 kuyo
    • fumikony2019/02/26 fumikony
    • nyuji2019/02/26 nyuji
    • TaaaaK2019/02/26 TaaaaK
    • iekusup2019/02/26 iekusup
    • igagurimk22019/02/26 igagurimk2
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事