ヘルプで見つからない情報は、サポートにお問い合わせください。お問い合わせ

2019年4月17日(水)Knowledge Suite障害のご報告

いつもKnowledge Suiteをご利用いただき、誠にありがとうございます。

2019年4月17日(水)より発生したKnowledge Suiteの障害につきまして以下のとおりご報告申し上げます。
ご利用のお客様には多大なるご迷惑をおかけいたしましたことを、深くお詫び申し上げます。


1.障害概要
2019年4月17日(水)の定期メンテナンス作業中に障害が発生いたしました。

2.原因
 Knowledge Suiteの分散ファイルシステムが、2019年4月17日の定期メンテナンスで再起動した後、レスポンスが返ってこない状況となり、Knowledge Suiteの全ての機能が提供できなくなりました。
 同サーバは、過去にも再起動を実施しており、問題無く再起動したところから、今回はリスクは無いと判断し実施しています。
 また、分散ファイルシステムによってファイルを3重化以上で管理しているため、ファイルが消失する事はございません。

 ※「【復旧】2019年4月17日に発生したKnowledge Suite障害につきまして」にてご報告しておりました「2.原因」につきまして、その後の調査で当該設定内容は、以下により今回のメンテナンスの作業ミスによるものではございません。改めて訂正させていただきます。
   ・過去に再起動を実施して問題が発生していない事。
   ・構築当初からの設定である事。


2.発生時期
 サービス完全停止時間 2019年4月17日7時00分 ~ 2019年4月17日21時39分
 障害対応時間 2019年4月17日7時00分 ~ 2019年4月23日2時11分

3.影響範囲
 Knowledge Suite(https://gridy.jp)をご利用いただいている全てのユーザ様において、Knowledge Suiteがご利用できない状況となりました。

4.経緯
4/17(水) 03:40 分散ファイルシステムの再起動を実施
4/17(水) 04:30 分散ファイルシステムの障害を確認
4/17(水) 04:30 調査開始
4/17(水) 05:30 分散ファイルシステムの復旧作業開始
4/17(水) 21:39 機能制限版の公開
4/18(木)  -終日復旧作業-
4/19(金) 10:00 復旧状況の進捗確認及び復旧タイミングの予測
4/20(土)  -終日復旧作業-
4/21(日) 16:12 復旧版(一部機能制限有)Knowledge Suite公開
4/22(月) 11:53 機能制限一部解除(通知メール機能制限解除)
4/22(月) 12:15 機能制限一部解除(ToDoアラーム機能制限解除)
4/22(月) 15:53 機能制限一部解除(GRIDY名刺CRM機能制限解除)
4/22(月) 16:25 機能制限一部解除(ファイルアップロード機能制限解除)
4/22(月) 17:50 機能制限一部解除(メールビーコン機能制限解除)
4/22(月) 21:06 機能制限一部解除(インポート/エクスポート機能制限解除)
4/22(月) 02:04 機能制限一部解除(スケジュールアラーム機能制限解除)
4/22(月) 02:11 機能制限一部解除(Knowledge Suite API機能制限解除)
4/22(月) 02:11 復旧

5.影響範囲
Knowledge Suite(https://gridy.jp)をご利用いただいているすべてのお客様において、Knowledge Suiteがご利用できない状況となりました。また、その後の復旧対応においてKnowledge Suiteの一部機能のご利用を制限させていただいておりました。

6.対応
ファイルサーバのキャッシュの再構築を実施いたしました。ファイルサーバ復旧後、サービスへの負荷を軽減するために実施しておりました機能制限を、順次解除いたしました。

7.今後の取り組み
・ファイルサーバのハードウェア構成の変更により、ファイルサーバのキャッシュ消去を防ぎます。
・分散ファイルシステムを更に冗長化し、サービス停止時間の最小化を実現します。

 

Powered by Zendesk