OpenClaw WeChat 連携トラブルシューティング(実務詳細版)
WeChat 連携(通知・一次応答等)はチームの反応速度を劇的に改善しますが、外部 API やネットワークに依存するため、特有の障害が発生します。本ガイドでは、ダウンタイムを最小化するための即時復旧手順を解説します。
1. 障害の分類と即時対策
A. 認証失敗 (Auth Errors)
- 症状: ログに
UnauthorizedやInvalid Tokenが表示され、送信が止まる。 - 原因: API キーの有効期限切れ、環境変数の読み込み失敗。
- 対処:
- 各プロバイダーの管理画面でキーを再発行。
openclaw config setで新しいキーを反映。- プロセスを再起動 (
pm2 restart openclaw)。
B. 通知の遅延 (Delivery Latency)
- 症状: メッセージが数分〜数時間遅れて届く。
- 原因: 1分あたりの送信上限(Rate Limit)超過、キューの目詰まり。
- 対処:
- 優先度の低い通知(例:正常系の完了報告)を一時停止。
- 重要なアラートのみを流す「緊急用チャンネル」へ一時的に切り替え。
C. 宛先の不一致 (Routing Mismatch)
- 症状: 意図しないグループや個人にメッセージが届く。
- 原因: ルーティング定義ファイル(JSON/YAML)の記述ミス。
- 対処:
wechat_mapping.jsonなどの設定ファイルを単一ソース化。- 本番反映前に
dry-runモードで宛先 ID を検証。
2. 二次被害を防ぐための安全設計
連投防止(サーキットブレーカー)
- リスク: ループバグにより、数秒間に数百通のメッセージを送ってしまう。
- 対策:
max_messages_per_minute: 5のようなスロットリング設定を、スキルの初期化引数に必ず含めてください。
通知レベルの定義
- Critical: サーバー停止、セキュリティ警告(即時送信)。
- Info: 定期レポート、正常完了(バッチでまとめて送信)。
3. 定期メンテナンス項目
- 日次: 前日のエラーログ(
grep ERROR)の確認。 - 週次: 宛先リストが最新の組織図と一致しているか確認。
- 月次: テスト環境での「擬似障害テスト」の実施。
4. KPI
- 通知成功率: 99.9% 以上を目標。
- 平均復旧時間 (MTTR): 障害発生から 15分以内の復旧。
次に読むべきガイド
参考
- WeChat Work API: https://work.weixin.qq.com/api/doc/90000/90135/90664
- OpenClaw Message Skill: https://docs.openclaw.ai/skills/message