タグ

運用に関するstealthinuのブックマーク (49)

  • メールサービスの障害および一部メールの消失のお詫びとご報告(第二報)(2017年04月17日)|会員サポート|プロバイダ ASAHIネット

    stealthinu
    stealthinu 2017/05/02
    ASAHIネットほどの大手老舗ISPでサーバ設定変更ミスでメールが一部消失する障害と… よそのことだから勝手な憶測だけどISPの下回りやってる人らはどこも疲弊しつつあるんじゃないのかなあ…
  • 偽名で運用 !? Azureデータセンターの「トリビア」を集めてみた


    140100DCMicrosoft AzureOffice 365OneDriveBingAzure  AzureDC AzureDCMCIOMicrosoft Cloud Infrastructure and OperationsMCIO
    偽名で運用 !? Azureデータセンターの「トリビア」を集めてみた
    stealthinu
    stealthinu 2017/05/01
    Azureのデータセンタってそこまで考えられて運用されてんだな。
  • 実際に運用してみてわかった、大規模Mastodonインスタンスを運用するコツ - pixiv inside


    ImageFluxharukasan3414PawooPawooPawoo1516 pawoo.net Pawoodigpawoo.netAWS
    実際に運用してみてわかった、大規模Mastodonインスタンスを運用するコツ - pixiv inside
    stealthinu
    stealthinu 2017/04/18
    すごいスピード感ある。あと大規模サービス運用の知見があって参考になる。『どんなシステムであろうとアラートを受け取ったら対応する、それが我らインフラエンジニアです』いいね!
  • 利用しているBaaSが終了するときにすべきこと または Parse.com の終了と私たちの取り組み

    [Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails

    利用しているBaaSが終了するときにすべきこと または Parse.com の終了と私たちの取り組み
    stealthinu
    stealthinu 2017/03/06
    すんごい辛みのある話だった… 依存してるバックエンドのサービスが終了するとかほんとつらすぎるわ。
  • 米国東部(バージニア北部、US-EAST-1)リージョンで発生した Amazon S3 サービス障害について


    31US-EAST-1 Amazon Simple Storage Service (S3)  S3  9:37AM PST( 2:37AM)S3S3 S3 2S31Index 
    米国東部(バージニア北部、US-EAST-1)リージョンで発生した Amazon S3 サービス障害について
    stealthinu
    stealthinu 2017/03/03
    なんと… S3の障害はオペミスが原因だったらしい。amazonですらこんなことが起きるのか。
  • サーバーレス・アーキテクチャで構築したシステムの運用はどうやるのか? | iret.media


    20161220MBSMBS444AWS Lambda AWS Lambda使 MBS444 AWS Lambdacloudpack  MBS444
    サーバーレス・アーキテクチャで構築したシステムの運用はどうやるのか? | iret.media
    stealthinu
    stealthinu 2017/02/15
     lambda使S3lambda  

    aws

    lambda


     
  • なぜ「システムが無事に動いている」ことの価値は理解されないのか


    DBODBPDBmDB調INDEX DBDB  
    なぜ「システムが無事に動いている」ことの価値は理解されないのか
    stealthinu
    stealthinu 2017/02/09
    電気や水道のようなインフラ業もなかなか感謝されることない代わりに安定した職であることも保証されるが、こっちの「インフラエンジニア」は感謝されない上に職的にも安定しないのよね。つらい。
  • GitLab.comが操作ミスで本番データベース喪失。5つあったはずのバックアップ手段は役立たず、頼みの綱は6時間前に偶然取ったスナップショット - Publickey


    GitLab.com  調 GitLab.comGitLab.com Database Incident - 2017/01/31GitLab.com Database Incident | GitLab 13116218YPYorick PetersePostgreSQL13121
    GitLab.comが操作ミスで本番データベース喪失。5つあったはずのバックアップ手段は役立たず、頼みの綱は6時間前に偶然取ったスナップショット - Publickey
    stealthinu
    stealthinu 2017/02/02
    聞いてるだけでこっちの胃液も登ってきてしまう案件。しかしまあ偶然スナップショット取っといてほんとよかったな。
  • Cookpad TechConf 2017 提供 Wi-Fi の裏側 - クックパッド開発者ブログ


     id:sora_h   Cookpad TechConf 2017  TechConf  Wi-Fi   TechConf 2017  Wi-Fi  mitamae  https://github.com/cookpad/techconf2017-network  GitHub  TechConf 2017 NOC   IT SRE   ()
    Cookpad TechConf 2017 提供 Wi-Fi の裏側 - クックパッド開発者ブログ
    stealthinu
    stealthinu 2017/01/26
     WiFi  

    net


     
  • 国内企業におけるシステム運用、約3分の1の企業が毎月数回の運用ミスや障害発生。最大の課題は「運用担当のスキル不足」で、二番目の課題は「自動化できてない」など

    国内企業におけるシステム運用、約3分の1の企業が毎月数回の運用ミスや障害発生。最大の課題は「運用担当のスキル不足」で、二番目の課題は「自動化できてない」など 調査会社のIDC Japanは国内企業におけるシステム運用の状況についての調査結果を発表しました。 運用管理担当者の運用のミスや障害になどによるトラブルの発生頻度では、ほぼ毎日トラブルが発生しているのは全体の1.3%、週に数回程度トラブルが発生しているのは7.1%、月に数回程度トラブルが発生しているのは23.6%で、合計して月に数回程度のトラブルが全体の32%の企業で発生しているとのことです。 上記のグラフでは、サーバの台数が100台以上の企業と99台以下の企業のそれぞれの結果が示されており、サーバ台数が100台以上のほうがトラブルの件数が多いことが分かります。 システム運用管理における課題について質問した結果では、もっとも多かった回

    国内企業におけるシステム運用、約3分の1の企業が毎月数回の運用ミスや障害発生。最大の課題は「運用担当のスキル不足」で、二番目の課題は「自動化できてない」など
    stealthinu
    stealthinu 2016/10/28
    うわぁ…『「運用管理担当者のスキルが不足している」32.0%「運用管理の自動化ができていない」30.7%「システムの一元管理ができていない」30.4%』いずこも人手不足と技術力不足…
  • ドメインレジストリが逮捕されてしまったら - tmytのらくがき


     (8:39 AM):   KA.TJ101domain 42 Pending Approbal()   TJ201610112:   Pend
    ドメインレジストリが逮捕されてしまったら - tmytのらくがき
    stealthinu
    stealthinu 2016/10/11
    こりゃどうもならんなw まあ変なレジストリ使うときはそういう可能性も一応考えとけってことか。
  • 10年を超えるレガシーwebサービスの重複ライブラリを削除してコード量を2:3にした話

    Webアプリケーションのコードも歴史的経緯から歪な形へとなっていくもの。 私の担当しているサービスでは同じPEARライブラリが重複を気にせずたくさん入れられ、 一筋縄では解けないほどの複雑なファイル依存関係が出来上がりました。 一度ハマってしまえば二度と抜け出せない底なし沼のような依存関係を解…

    10年を超えるレガシーwebサービスの重複ライブラリを削除してコード量を2:3にした話
    stealthinu
    stealthinu 2016/07/06
    すごい。使ってるライブラリやエントリポイントのログからの調べ方など参考になる。やらずにすむのが一番助かるが。
  • 【社内資料公開】運用手順書を作る時のポイントについて書いてみた | DevelopersIO

    はじめに こんにちは植木和樹@上越妙高オフィスです。日は私がここ10年くらい意識している運用手順書を書くときのポイントについてまとめてみました。 対象読者 開発・構築したシステムを別の人に引き継ぐ予定のある人 他の人が作ったシステムを引き継ぐ担当の人 半年後の自分でも分かる手順書の書き方に困っている人 (この記事を読むのにかかる時間の目安:5分) 1. ドキュメントの冒頭に書くこと まず個々の詳細手順の前に、ドキュメント自体について記載してもらいたいことです。 1.1. ドキュメントに書かれていることを3行で書く ドキュメントの最初には、このドキュメントに何が書かれているのかを100文字くらいで書いておくと良いでしょう。 システムが増えれば増えるほど手順書も増えていくものです。見つけたドキュメントに自分の期待するものが書かれているのか、冒頭数行でわかるようになっているとうれしいです。 1

    【社内資料公開】運用手順書を作る時のポイントについて書いてみた | DevelopersIO
    stealthinu
    stealthinu 2016/07/01
    手順書を書くときに必要なもの、気をつける点がまとまってる。冒頭にこの文書要約を3行でとか、対象スキルと作業環境アカウント情報も書く、というのとか参考になる。
  • 毎週のように依存パッケージを上げ続ける努力 - CARTA TECH BLOG

    皆さんこんにちは。fluctにてfluct SSPという広告配信システムの管理画面を中心にクライアントサイドの開発を行っております、大関です。 依存パッケージの更新、どうしてますか? 今や数多くの言語でパッケージマネージャが提供されており、みなさんも日常的にコミュニティによるパッケージエコシステムを活用していることと思います。 ですが、この依存パッケージの更新については、どのようにしていますか? セキュリティfixなどを除き、以下のようなことになっていることが多いのではないでしょうか? チームの「いい人」が頑張って更新し続ける その人の謎の情熱が消えると更新されなくなってしまう たまに気がついたら頑張る 「いい人」が頑張るタイプの亜種 気が付かなかったら更新されない 更新はリスクなので塩漬けにする プロダクトは定期的に作り直す前提 CIでテストを回し続けているのに更新しないなんて……とモヤ

    毎週のように依存パッケージを上げ続ける努力 - CARTA TECH BLOG
    stealthinu
    stealthinu 2016/06/27
    依存パッケージに追従してってない… あああ…
  • 開発運用現場をいかに変えたか?GMOの豪腕マネージャが語る (1/2)


    414GMO4GMO HosConHosting Conference調GMO7  GMOGMOGMOGMOGMO4GMO   GMO44
    開発運用現場をいかに変えたか?GMOの豪腕マネージャが語る (1/2)
    stealthinu
    stealthinu 2016/04/18
    『基本的には自分のことしか興味がない縦割り、タコツボの組織なので、なにをやっても進まない、決まらない織』『売り上げに貢献しなかったこともあり、新規投資がないという諦め感もただよっていた』あああ…
  • メルカリの大規模システムを安定運用へと導いた『DevOps』とは!? | dots. CONFERENCE SPRING 2016 | THE LANCER


     DevOps SREDevOpsDevOps DevOps   - DevOps    2013
    メルカリの大規模システムを安定運用へと導いた『DevOps』とは!? | dots. CONFERENCE SPRING 2016 | THE LANCER
    stealthinu
    stealthinu 2016/04/08
    メルカリでやった対応内容見てると意外と身近な感じがした。すんごい巨大なシステムになってるんだと思ったんだがまあこんな感じでいけるもんなのか。
  • GitHubが先週木曜日にダウンした原因は、一時的な停電からの連鎖的な障害


    1289GitHubGitHub稿Update on 1/28 service outage GitHub A brief power disruption at our primary data center caused a cascading failure that impacted several services critical to GitHub.com's operation. GitHub.com GitHub
    GitHubが先週木曜日にダウンした原因は、一時的な停電からの連鎖的な障害
    stealthinu
    stealthinu 2016/02/01
    GitHubの障害も電源系とのこと。
  • 「ITインフラ監視実践入門」~門外不出・秘伝のタレだった監視運用ノウハウがオープンになるとき~ - Mana Blog Next


       IT  IT[] (Software Design plus) : /: : 2016/01/16:  (2)     ZabbixNagiosIT  
    「ITインフラ監視実践入門」~門外不出・秘伝のタレだった監視運用ノウハウがオープンになるとき~ - Mana Blog Next
    stealthinu
    stealthinu 2016/01/15
    おおお、これは良いな。最近は増えてきたけどこの辺の情報って基本的にあまり表に出てきにくいから。
  • 2016年 独りで新規WEBサービスを開発・運用した際の知見 - Qiita


    WEBWEB NginxHTTPGoogleDevelopers PageSpeed Insights PageSpeed InsightsWEBGoogleWEB 1. 5 50%  SEOPageS
    2016年 独りで新規WEBサービスを開発・運用した際の知見 - Qiita
    stealthinu
    stealthinu 2016/01/14
    1人でwebサービス開発、運用するtipsとチェックすべき点のまとめ。
  • 年末年始を安心して迎えるためのfail2banのbugfix


    CTO Fail2ban  便使 fail2banbugfix bug  1/1 00:0009:00  timezoneJST  0.9.3update CentOS6EPEL0.9.3 CentOS5EPEL0.8.14bug 19
    stealthinu
    stealthinu 2016/01/04
     fail2ban 1/1 00:0009:00 timezoneJST0.9.3  

    server