サーバー、レンタルサーバーを利用することの多いこの界隈では、いつ、どんなメンテナンスがあるか、どんなトラブルが予測されるか把握する必要があります。ここでは、日頃筆者がチェックしている稼働状況情報まとめ系のアプリ、サイト、ツール、SNSをまとめておきます。
目次
ステータスチェック
CloudStatus
AWS、GCP、Azure、Dockerなどのクラウド系のステータスがまとまっていて、Twitterで逐一状況を自動でつぶやいてくれます。Twitterはいくつか運用されているものがあるようなので、好きなものをフォローしておけば情報は入りやすくなります。何か異常がある時、なんか違和感があるときなどはチェックしておくといいかもしれません。
US-CERT
主にセキュリティ系のリスクをかなり早い段階で拾えます。日本のJP-CERT経由で拾うのもいいですが、ちょっと情報が遅いです。IPAも情報網もダメではないですが、海外で流行しているセキュリティ事案が後から日本にやって来ることもあるので早めに察知しておくのは管理者の任務です。
DISA
軍事に近いところでの情報が入ります。主に深刻度の高いセキュリティ事案に関して、一次情報を入手できます。こちらも深刻な情報に早く気付けるのでメール通知などを受けるようにしておくと安心です。
https://disa.mil/About/Fact-Sheets
DownDetecter
多くの方が知っている日本向けの見やすいサービスです。携帯電話系列やゲーム関連のダウン、エラー情報も見れるので便利といえば便利です。一番便利なのは、SNSなどでつぶやかれたユーザーからのダウン情報をまとめて見れる点です。SNSで検索して拾うのも良いですが、まとまっていたほうが収集は楽でしょう。
Digital Attack Map
世界規模に起きているDDoSの情報を探ることができます。非常に見にくいですが、日頃からチェックしていると細かな発見や学びがあります。不正アクセス攻撃試行や、XSSなどが増えている時に確認すると、どこの国経由でのアクセスを排除すればいいかのヒントになります。
https://www.digitalattackmap.com/
USGS
サーバーには直接関係ないですが、世界中のどこで災害が起きているかわかります。たいてい、サーバーを稼働させておけなくなるのは環境要因です。AWSのように人的要因・内部の要因で動かなくなることもありますが、天災の発生と関連づいた障害の場合は、ユーザーへの告知や対応にも差が出てきます。
災害要因で、しばらくサーバーの復帰ができないような状態だった場合は、早めにサーバーを移転させてしまったほうが良いでしょう。数日以内に復帰できる場合は、ユーザー・管理者に告知し、待ってもらうだけで済み、技術者はある意味で責任を災害のせいにできます。内部の事情で動かない場合よりは、サービス面では気が楽でしょう。
情報収集はTwitterが早い

エンジニアの方々ならばそこまで難しくないと思いますが、Twitterで特定のキーワードを検索して、その検索結果をリストで、Googleスプレッドシートで取得し続けるというやり方があります。たいてい、多くのエンジニアはSlackやDiscord、Gitに問題が起きて仕事ができないとTwitterに集まります。
こういう時のシグナルなどを自動で収集できれば異常検知の一つとして活用できます。TwitterAPIとGoogleスプレッドシート、どちらも無料でできますので、外部ツールからの収集だけでなく、リアルタイムの自前取得情報に頼って異常検知をするのも良いでしょう。
まともに稼働してるエンジニアのアカウントは、日本語では300から700アカウント程度ですので、そこまで圧迫されることもありません。エンジニア界隈を賑わせている連中はフォローしても当てにならないのと、現場にいる人間はあまりその関係者であることを公表しない、Twitterでまで仕事の話はしないのでフォロー、リスト収集する相手を間違えないようにしましょう。
コメントを残す