タグ

運用に関するstealthinuのブックマーク (49)

  • クラスタのノード欠損を復旧しようとしてクラスタを丸ごと落とした話 - Qiita

    これは、私が若…くはないけどピカピカのAWS1年生だった、数年前のお話です。 何をやらかしたのか やらかし前の状態 番運用しているWebアプリケーションの裏側に、EC2インスタンス3台でクラスタを組んだ某データストア製品を使用していました。データはクラスタ内でレプリケーションされており、1台がダウンしただけならクラスタは稼働を継続できます。2台がダウンするとクラスタ全体が機能しなくなります。 ある日、3台のうち1台で障害が発生してインスタンスへ疎通できない状態になりました。この時点ではクラスタは正常に応答しており、あと1台ダウンしない限りはサービスに影響が出ない状態でした。 まず、ダウンしてしまったインスタンスを再起動して復旧させようとしました。ところがEC2マネジメントコンソールから再起動、停止を選択しても障害中のインスタンスは反応しません。そして私は間違いを犯します。 やらかしたこと

    クラスタのノード欠損を復旧しようとしてクラスタを丸ごと落とした話 - Qiita
    stealthinu
    stealthinu 2020/12/11
    あー、でもこれはわかるな… あと障害出たときに急いで対処しようとして傷口広げるのもあるあるだよね…
  • よくある質問 | 無印良品

    無印良品へのご意見 みなさまのご意見・ご要望をお聞かせください。 回答が必要な場合は「お問い合わせフォーム」にご連絡をお願いします。

    stealthinu
    stealthinu 2020/01/14
    1月中旬が下旬に… これはつらい。ブコメより一時期よりはましになったぽいが。
  • TOMCAT殺害事件 - Qiita


    OOMKiller EC2TomcatOOMKiller調 Java Java8 OOMKillerOut of MemoryLinux OOMKillerTomcat  catalina.out OpenJDK 64-Bit Server VM warning: Setting LargePageSizeInBytes has no
    TOMCAT殺害事件 - Qiita
    stealthinu
    stealthinu 2020/01/10
    tomcatのメモリ管理について色々と勉強になる。自分も以前のプロジェクトでtomcatのメモリのことで結構たいへんだったのを思い出した。
  • 「ただならぬ空気を感じる」年末年始の3日間でシステム更新予定だった無印良品ネットストア、サービス再開できず"2020年1月上旬"と未定に


    Miyahan @miyahancom MSP2 / ex  miyalog.hatenablog.jp Miyahan @miyahancom 3 "20201"  pic.twitter.com/3OmUauoBuH 2020-01-06 15:45:30
    「ただならぬ空気を感じる」年末年始の3日間でシステム更新予定だった無印良品ネットストア、サービス再開できず"2020年1月上旬"と未定に
    stealthinu
    stealthinu 2020/01/07
        


     
  • 稼働中の商用ネットワークでVRRPの切替検証を実施しちゃった話 - Qiita


      @moriya-snj   Advent Calendar 2019 - Qiita15  3  AIPVoIP  VRRPB
    稼働中の商用ネットワークでVRRPの切替検証を実施しちゃった話 - Qiita
    stealthinu
    stealthinu 2019/12/16
     



    server
     
  • AWSのWEBコンソールでミスって本番を消した話と戻すまでの15分間の話 - まぁ、つまらないものですが


     Advent Calendar 2019 - Qiita13 Twitter21?godan 15便   Web     
    AWSのWEBコンソールでミスって本番を消した話と戻すまでの15分間の話 - まぁ、つまらないものですが
    stealthinu
    stealthinu 2019/12/13
    最悪の事態はまぬがれたといえそりゃ待ってる間は死ぬ思いだわな。
  • cron哀歌~typoを笑うものはtypoに泣く~他 - Qiita


     Advent Calendar 201912 https://qiita.com/advent-calendar/2019/yarakashi-production    @NACK      typo "typographical error" http:/
    cron哀歌~typoを笑うものはtypoに泣く~他 - Qiita
    stealthinu
    stealthinu 2019/12/12
    crontab -rネタなんだけど2段になっててちゃんと現在はこう改善したということが書かれていて参考になる。crontab 【ファイル】でその内容に更新できるのね。勉強になった。
  • 50自治体システム障害続報、不具合は米デルのストレージで発生


    20191245020191210IaaSJip-BaseDell TechnologiesDell EMCUnity 500 使使121011 
    50自治体システム障害続報、不具合は米デルのストレージで発生
    stealthinu
    stealthinu 2019/12/10
    日本電子計算のJip-Baseの障害はDellのストレージの特定ファームバージョンでストライピングで?使うときだけ起こる障害だった模様。でもまだ復旧せずと。これはつらい。
  • VSCodeの操作ミスでGCP Cloud Composerの裏側k8sをお掃除した話 - Qiita


    tl;dr vimVSCode Plugin Cloud CodeDelete Cluster GCPIAM    GCPvimzsh2VSCode使 VSCode使 
    VSCodeの操作ミスでGCP Cloud Composerの裏側k8sをお掃除した話 - Qiita
    stealthinu
    stealthinu 2019/12/10
    これcrontabのオプションの-eと-rでもよく言われるような話だな。
  • 50自治体システム障害はIaaSで使うソフトのバグが原因、復旧メド立たず


    12450125IaaSJip-Base420191241056調 IaaS 1123QTnet
    50自治体システム障害はIaaSで使うソフトのバグが原因、復旧メド立たず
    stealthinu
    stealthinu 2019/12/06
    ストレージのファームバグが原因なのにHPEストレージ32768時間障害とは別、ということはどちらも共通で使っているSSDのファームだったりコントローラのファームバグとか??じゃあさらに続発する?
  • 現用ボーダールータを(社長が)ふっとばした話

    アーカイブ2022年8月 (1)2022年2月 (1)2021年11月 (1)2021年9月 (1)2021年5月 (1)2021年3月 (1)2021年1月 (1)2020年12月 (1)2020年11月 (2)2020年10月 (3)2020年9月 (1)2020年8月 (3)2020年7月 (1)2020年6月 (2)2020年5月 (4)2020年4月 (2)2020年3月 (2)2020年2月 (1)2020年1月 (1)2019年12月 (4)2019年11月 (3)2019年10月 (5)2019年9月 (4)2019年8月 (5)2019年7月 (6)2019年6月 (7)2019年5月 (7) はっきり覚えていないのだが、たぶん20年前のことだと思う。S・アール・エスとIフォレストが協業を始め、Sくらインターネットができた直後ぐらいの話だ。 土曜日だったか、日曜日だったか

    現用ボーダールータを(社長が)ふっとばした話
    stealthinu
    stealthinu 2019/12/04
    めっちゃおもしろかった。20年前だとこんな感じだよね。…ってあれを作ってた時期だ… もう20年前…
  • HPEのサーバー向けSAS SSD、稼働32,768時間超えでデータ喪失。復旧も不可

    HPEのサーバー向けSAS SSD、稼働32,768時間超えでデータ喪失。復旧も不可
    stealthinu
    stealthinu 2019/12/04
    なぜに現代のハードで、時(hour)で16bit int境界超えで障害が出るのだ… どういうコードになっているのか見てみたい。
  • 本番環境でやらかしちゃった人 Advent Calendar 2019 - Qiita

    番環境でやらかしちゃった人のアドベントカレンダーです。 例) DB吹き飛ばした 番サーバをデストロイした ネットワーク設定をミスって番サーバにアクセス出来なくなり、サーバが世界から孤立した などなど... 以下の2点については必須項目なので、記述お願いします。 惨劇はなぜおこってしまったのか 二度と惨劇を起こさないためにどうしたのか もう二度とあの惨劇を繰り返さないために、みなで知見を共有しましょう。

    本番環境でやらかしちゃった人 Advent Calendar 2019 - Qiita
    stealthinu
    stealthinu 2019/11/17
    これは期待。/2日目だがもうわくわくが止まらんw
  • ApacheでのLet's Encrypt運用が簡単になりました


    Lets Encrypt 2016   Lets Encrypt  ACME 使 ACME  ACME Client Implementations Lets Encrypt  certbot   Windows Windows  win-acme  letsencrypt-win-simple 使   win-acme 使   mod_md  Apache 
    ApacheでのLet's Encrypt運用が簡単になりました
    stealthinu
    stealthinu 2019/07/18
    mod_mdでLet's Encryptの証明書更新が自動でできるらしい。が、最初何回かリブートしないといけないとか。このあたりもうちょっときれいに運用出来ないのかな。
  • ?n_cid=nbpnxt_fbbn

    「目指せ!インシデント・ゼロ」「ヒヤリハット撲滅!」──。最近このような組織目標を掲げるIT職場が増えている。 情報セキュリティやシステム品質に対する要求レベルがますます高まっている昨今。インシデント・ゼロやヒヤリハット撲滅を掲げたくなる気持ちはよく分かる。情報漏洩や品質低下が企業の信頼を一瞬にして失墜させ、ブランドイメージを大きく下げることを考えると事情は理解できる。 しかし、インシデント・ゼロやヒヤリハットの撲滅といった掛け声は、私の経験ではIT職場にとってむしろ逆効果でしかないように思える。現場では「ミスなく働く振り」が横行し、結果的に社員や関係会社の人たちを疲弊させるだけだ。 インシデント・ゼロ宣言は余計な仕事を生むだけ インシデント・ゼロを掲げたIT職場で働く社員の典型的な行動パターンを見てみよう。よほど風通しが良い組織でなければ、多くの企業では大抵こうなる。IT職場の課長クラス

    ?n_cid=nbpnxt_fbbn
    stealthinu
    stealthinu 2018/08/23
    インシデントを「なくす」ように目標を掲げてしまうと逆にインシデントを隠す、報告しない体質になってしまい逆効果だという指摘。やる内容が人によるダブルチェックだとかで担当のせいにされるから。
  • ひとり情シスとクラウドは相性最悪、大企業のIT部員も納得の理由とは


    IT 10IT1200 ITproxTECH201610IT
    ひとり情シスとクラウドは相性最悪、大企業のIT部員も納得の理由とは
    stealthinu
    stealthinu 2018/04/04
    リプレースならすぐに稟議が通るがクラウド化だと新規になるからなかなか通らない… なるほどそうだよねと納得するけどほにゃ~と脱力する話だ。ほんとアホみたいな話多すぎる。
  • 大規模memcached障害と私 - Qiita


     ex-mixi Advent Calendar 2017 19  @bonnu  200612012363FreakOutGameWith  OBOG  
    大規模memcached障害と私 - Qiita
    stealthinu
    stealthinu 2017/12/19
    『一人だけが対応するよりも二人、三人で役割を分担した方が確実に負担が軽減します。障害対応は基本的に「いかに一人の負担を軽減するか」がキモです(間違いありません)』
  • バウンスメール解析ライブラリSisimaiの出力からバウンスメールの集計と通知を行う


    OSS 19  Null MX Sisimai使SlackSisimai SisimaibounceHammer() (PerlRubyGem)RFC5322 JSONSisimai $ ruby -rsisimai
    stealthinu
    stealthinu 2017/12/19
    『バウンスメールが溜まったメールボックスをウェブメールで確認する運用にはなっていましたがそんな運用が回るわけもなくバウンスメールが放置されている状況がありました』ほとばしるあるある感
  • セキュリティ対策の不都合な真実--5年に一度しか来ないベンダーの正体


       HTML  PDF    PDF My     
    セキュリティ対策の不都合な真実--5年に一度しか来ないベンダーの正体
    stealthinu
    stealthinu 2017/06/27
    これはまさにな指摘。
  • ルーターのコンフィグを git にぶち込んで世代管理してみたはなし - miyalog


      1  GitLab   GitLab 使git 使  IPTFTP5HDD調... $ df -h Filesyste
    ルーターのコンフィグを git にぶち込んで世代管理してみたはなし - miyalog
    stealthinu
    stealthinu 2017/06/09
    後日談が本題w システム屋なのになぜそういう人が力を持っちゃうんでしょうね。はあ。