タグ

SREに関するwata88のブックマーク (12)

  • オブザーバビリティ研修実践編

    株式会社サイバーエージェント AI事業部 2024年度エンジニア新卒研修 オブザーバビリティ研修実践編(一部社内向けの内容)

    オブザーバビリティ研修実践編
  • “LLM for SRE“の世界探索 - ゆううきブログ


    ChatGPTSREAIOpsAIOpsObservabilityAIOpsChatGPT*1 Large Language Model: LLM使SRELLMLLM for SRE, LLM4SRELLMSRE
    “LLM for SRE“の世界探索 - ゆううきブログ
    wata88
    wata88 2024/03/21
  • 限られた人数で MIXI のあらゆる公式サイト群を保守・運用する ノウハウとその体制 | MIXI SRE秋祭り 〜 MIXIのもうひとつのSRE 〜

    2023年10月31日に株式会社MIXIで行われた「MIXI SRE秋祭り 〜 MIXIのもうひとつのSRE 〜」での発表資料です。 イベントページ https://mixi.connpass.com/event/299121/ ─────────────── MIXIのSREは、サービスの信頼性に直接関わる負荷やコスト、システムの信頼性などをサービス開発と密接に連携しながら取り組むようなSREと、社内の共通課題やスポットで相談された事業などへの技術支援など、全社的なサービスの信頼性に関わるありとあらゆることに取り組むSREがいます。 イベントでは、後者の全社的なサービスの信頼性に関わるSREから、最近の取り組み事例を紹介させていただき、Q&Aの時間などを通して、ご参加の皆様と共に情報交換ができれば幸いです。 ◎こんな方におすすめ◎ ・SREとしてサイト信頼性だけでなく、企画や事業開発な

    限られた人数で MIXI のあらゆる公式サイト群を保守・運用する ノウハウとその体制 | MIXI SRE秋祭り 〜 MIXIのもうひとつのSRE 〜
    wata88
    wata88 2023/11/01
  • インフラエンジニアはSREではないし、SREとPlatform Engineeringも別物 - inductor's blog


    SRE SRE(Site Reliability Engineering)PE(Platform Engineering) PlatformPlatform Engineering
    インフラエンジニアはSREではないし、SREとPlatform Engineeringも別物 - inductor's blog
    wata88
    wata88 2023/09/09
  • 2022年版 OpenTelemetryを知れば世界が平和に - じゃあ、おうちで学べる

    はじめに OpenTelemetryとは Opentelemetry のコンポーネント Opentelemetry のプロジェクトの仕様とStatus Tracing Metrics Logging(Specification にドキュメントがない) Baggage OpenTelemetry のSpanとTrace OpenTelemetry Collectorとは Collector のメリット OpenTelemetry Collector Architecture とは OpenTelemetry とSDKとパッケージ OpenTelemetry と自動計装 今後のOpentelemetry について 次回予告:OpenTelemetry とOpenTelemetry Collectorを使ったTracingとMetricsをアプリケーションで利用する方法 参照リンク はじめに 最

    2022年版 OpenTelemetryを知れば世界が平和に - じゃあ、おうちで学べる
    wata88
    wata88 2022/07/14
  • 'The human scalability of “DevOps”' by Matt Klein の日本語訳 - Qiita


    EnvoyMatt Klein The human scalability of DevOps  Sure!  Matt Klein (@mattklein123) 201897 /()  "DevOps"  Twitter"DevOps" 
    'The human scalability of “DevOps”' by Matt Klein の日本語訳 - Qiita
  • SLO、SLI、SLA について考える : CRE が現場で学んだこと | Google Cloud 公式ブログ

    前回の『CRE が現場で学んだこと』シリーズでは、システムの可用性を担保するにあたってターゲットとする正確な数値をいかにして割り出すか、ということについてお話ししました。このターゲットをシステムのサービス レベル目標(SLO)と呼びます。 今後、システムが十分な信頼性を保って稼働しているか、またシステムにどんな設計やアーキテクチャの変更が必要かについて議論する際は、システムが継続的に SLO を満たしているという枠の中で語る必要があります。 SLO の適合性は直接測定することが可能です。システムにおいて精査が成功した頻度で計るのです。これをサービス レベル指標(SLI)といいます。システムが過去 1 週間 SLO を満たしつつ稼働していたかどうかを評価する場合に、SLI からサービスの可用率を把握するのです。定められた SLO を下回っているとなれば問題があるということですから、他の場所に

    SLO、SLI、SLA について考える : CRE が現場で学んだこと | Google Cloud 公式ブログ
    wata88
    wata88 2020/08/17
  • 可用性とどう向き合うべきか、それが問題だ : CRE が現場で学んだこと | Google Cloud 公式ブログ


    CRE      
    可用性とどう向き合うべきか、それが問題だ : CRE が現場で学んだこと | Google Cloud 公式ブログ
    wata88
    wata88 2020/08/17
  • SREをはじめる際のポイント:モニタリングとサービスレベルの考え方


    SRESite Reliability EngineeringSRESRESRESRE  SRE@katsuhisa__SRE SRESRE
    SREをはじめる際のポイント:モニタリングとサービスレベルの考え方
  • SRE風のインフラエンジニアにならないために - Work Records

    この記事は、SRE Advent Calendar 2018 - Qiitaの24日目として投稿しています。 SRE風のインフラエンジニア SREとDevOps そもそもDevOpsとは SREでも取り上げられている、DevとOpsの目的の差異 ミクロなDevの目的 ミクロなOpsの目的 Ops側の視点での安定性の考え方を改める システムを高速に更新可能にしておくことで安定性を担保する インフラエンジニアではなくSREとしてどう高速リリースを実現するか プロダクトの高速リリースに効くところを見極める リリースするにあたっての心配事を潰す 開発チームが自律して動ける仕組みやツールを提供する 今の組織でやれていること 開発チーム出身の人がSREチームにジョインしてくれている SREチームに入る新人のエンジニアさんもRails研修などを通して最低限の開発力を持っている SREチームのケツを叩い

    SRE風のインフラエンジニアにならないために - Work Records
  • SpinnakerによるContinuous Delivery | メルカリエンジニアリング


    SRE@deeeet PivotContinuous Delivery Continuous DeliveryPlatformSpinnakerkubernetesk8sDeploySpinnakerDeploy SpinnakerSpinnakerSpinnaker使 kubernetesDeploy k8sDeploy
    SpinnakerによるContinuous Delivery | メルカリエンジニアリング
    wata88
    wata88 2017/08/21
    spinnaker、パワフルすぎて乗りこなすの大変そうな印象がある
  • メルカリ新卒エンジニアはSREもサポートも経験する! BABAROT Hiraku インタビュー|ハイクラス転職・求人情報サイト AMBI(アンビ)


    SRE BABAROT  Hiraku  Web Hub   1  BABAROT BABAROT (@b4b4r07 / id:b4b4r07) 2
    メルカリ新卒エンジニアはSREもサポートも経験する! BABAROT Hiraku インタビュー|ハイクラス転職・求人情報サイト AMBI(アンビ)
  • 1