「SOL12941」の編集履歴(バックアップ)一覧に戻る

SOL12941 - (2012/06/24 (日) 22:41:00) のソース

原文はこちら
http://support.f5.com/kb/en-us/solutions/public/12000/900/sol12941.html


- SOL12941
 AOM搭載機においてchmandプロセスにてメモリリークが発生

- 対象バージョン
 [[BIG-IP]] LTM		10.2.1, 10.2.0, 10.1.0, 9.4.8
 BIG-IP ASM		10.2.1, 10.2.0, 10.1.0, 9.4.8
 BIG-IP GTM		10.2.1, 10.2.0, 10.1.0, 9.4.8
 BIG-IP PSM		10.2.1, 10.2.0, 10.1.0, 9.4.8
 BIG-IP Link Controller	10.2.1, 10.2.0, 10.1.0, 9.4.8
 BIG-IP WebAccelerator	10.2.1, 10.2.0, 10.1.0, 9.4.8
 BIG-IP APM		10.2.1, 10.2.0, 10.1.0
 BIG-IP WOM		10.2.1, 10.2.0, 10.1.0
 BIG-IP Edge Gateway	10.2.1, 10.2.0, 10.1.0

- 説明
 chassis managerデーモン(chmand)は、BIG-IPのAOM搭載機においてメモリリークを発生させます。
 chmandプロセスがRPCでAOMから内部インターフェース設定を収集するときにメモリリークが発生します。
 メモリリークはトラフィックがあるなしに関わらず、AOMを搭載している全てのシステムで発生します。
 
 chmandプロセスは、プラットフォーム識別、デバイス発見、シャーシ監視、シャーシ設定(管理とシリアルインターフェース)に関与しています。
 
 この問題は次の条件の時に発生します。
 
 ・次のBIG-IPプラットフォームのうち1つが稼働している
   1600, 3600, 3900, 6900, 8900, 8950, 11050

- 影響
 パフォーマンスは時間とともに落ちるかもしれません、そしてシステムはメモリが空になることにより反応しなくなるかもしれません。

- 事象
 この問題の結果として、次のような事象に直面するかもしれません。
 
 ・chmandプロセスに割り当てたメモリが時間とともに成長します。
   一般的に、chmandプロセスはリスタートまたは再起動後におよそ50MBのメモリを割り当てられます。
   topコマンドを使うことで、chmandプロセスのメモリ使用量を監視することができます。
   例えば、次のtopコマンドは56日稼働しているBIG-IP1600で実行されました。そして、chmandプロセスが物理メモリの115MBを消費したことを示します。
  
   top -p `pidof chmand` -b -n 1
 
   top - 10:36:57 up 56 days, 21:43,  1 user,  load average: 0.57, 0.46, 0.45
   Tasks:   1 total,   0 running,   1 sleeping,   0 stopped,   0 zombie
   Cpu(s):  4.6%us,  5.7%sy,  0.0%ni, 89.6%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
   Mem:   4056352k total,  4028668k used,    27684k free,    24056k buffers
   Swap:  1048568k total,     7504k used,  1041064k free,   255664k cached
 
   PID    USER      PR  NI  VIRT   RES    SHR   S   %CPU   %MEM    TIME+    COMMAND
   3453   root      15  0   160m   115m   4556  S    0.0    2.9    4:52.83  chmand
 
 ・過度にメモリを割り当てることが原因で、強制的にswapが発生するかもしれません。
   そして、TMMはwatchdogのポーリングの応答に失敗し、再起動を引き起こすかもしれません。
   システムは、以下の例のようなTMMプロセスのハートビートのタイムアウトを示すメッセージを/var/log/ltmに出力するかもしれません。
   
   01140029:5: HA daemon_heartbeat tmm fails action is failover and restart
 
 ・システムはwatchdogのタイムアウトかメモリリークのどちらかが原因で再起動かフェールオーバをする可能性があり、他のシステムデーモンに影響を与えます。

- 状況
 F5製品開発はID 355152をこの問題に割り当てました。この問題が上記対象バージョンに存在することを確認しました。
 この問題を解決するリリースまたはホットフィックスに関しては、以下の表を参照してください。

|Fixのタイプ|Fixしたバージョン|関連記事|
|リリース|10.2.2|SOL2200: Most recent versions of F5 software|
|ホットフィックス|なし|なし|
 
 重要 : AOMファームウェアのバージョン10.1.8かそれ以降は、この解決手段で記述されている問題の解決策の一部を提供しています。
        単純に影響を受けたBIG-IPシステムのAOMバージョンを10.1.8かそれ以降にバージョンアップしてもこの問題は解決しません。
        完全に問題を解決するためにはBIG-IPシステムをBIG-IPバージョン10.2.2にアップグレードしなければなりません。

- 暫定対策
 この問題の暫定対策は、chmandプロセスを再起動することです。
 以下の手順を実行します。
 
 暫定対策の影響 : chmandプロセスを再起動すると、例えばTMMなど主要なBIG-IPシステムデーモンも再起動します。
 この手順をを実行するとトラフィック処理を中断します。
 
 1.BIG-IPのコマンドラインにログインします
 
 2.次のコマンドを実行し、chmandプロセスを再起動します
   bigstart restart chmand

- 補足情報
 ・SOL9403:  Overview of the Always-On Management subsystem
 ・SOL8035: Overview of BIG-IP daemons
 ・SOL9476: The F5 hardware/software compatibility matrix