AOM搭載機においてchmandプロセスにてメモリリークが発生
[[BIG-IP]] LTM 10.2.1, 10.2.0, 10.1.0, 9.4.8
BIG-IP ASM 10.2.1, 10.2.0, 10.1.0, 9.4.8
BIG-IP GTM 10.2.1, 10.2.0, 10.1.0, 9.4.8
BIG-IP PSM 10.2.1, 10.2.0, 10.1.0, 9.4.8
BIG-IP Link Controller 10.2.1, 10.2.0, 10.1.0, 9.4.8
BIG-IP WebAccelerator 10.2.1, 10.2.0, 10.1.0, 9.4.8
BIG-IP APM 10.2.1, 10.2.0, 10.1.0
BIG-IP WOM 10.2.1, 10.2.0, 10.1.0
BIG-IP Edge Gateway 10.2.1, 10.2.0, 10.1.0
chassis managerデーモン(chmand)は、BIG-IPのAOM搭載機においてメモリリークを発生させます。
chmandプロセスがRPCでAOMから内部インターフェース設定を収集するときにメモリリークが発生します。
メモリリークはトラフィックがあるなしに関わらず、AOMを搭載している全てのシステムで発生します。
chmandプロセスは、プラットフォーム識別、デバイス発見、シャーシ監視、シャーシ設定(管理とシリアルインターフェース)に関与しています。
この問題は次の条件の時に発生します。
・次のBIG-IPプラットフォームのうち1つが稼働している
1600, 3600, 3900, 6900, 8900, 8950, 11050
パフォーマンスは時間とともに落ちるかもしれません、そしてシステムはメモリが空になることにより反応しなくなるかもしれません。
この問題の結果として、次のような事象に直面するかもしれません。
・chmandプロセスに割り当てたメモリが時間とともに成長します。
一般的に、chmandプロセスはリスタートまたは再起動後におよそ50MBのメモリを割り当てられます。
topコマンドを使うことで、chmandプロセスのメモリ使用量を監視することができます。
例えば、次のtopコマンドは56日稼働しているBIG-IP1600で実行されました。そして、chmandプロセスが物理メモリの115MBを消費したことを示します。
top -p `pidof chmand` -b -n 1
top - 10:36:57 up 56 days, 21:43, 1 user, load average: 0.57, 0.46, 0.45
Tasks: 1 total, 0 running, 1 sleeping, 0 stopped, 0 zombie
Cpu(s): 4.6%us, 5.7%sy, 0.0%ni, 89.6%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 4056352k total, 4028668k used, 27684k free, 24056k buffers
Swap: 1048568k total, 7504k used, 1041064k free, 255664k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
3453 root 15 0 160m 115m 4556 S 0.0 2.9 4:52.83 chmand
・過度にメモリを割り当てることが原因で、強制的にswapが発生するかもしれません。
そして、TMMはwatchdogのポーリングの応答に失敗し、再起動を引き起こすかもしれません。
システムは、以下の例のようなTMMプロセスのハートビートのタイムアウトを示すメッセージを/var/log/ltmに出力するかもしれません。
01140029:5: HA daemon_heartbeat tmm fails action is failover and restart
・システムはwatchdogのタイムアウトかメモリリークのどちらかが原因で再起動かフェールオーバをする可能性があり、他のシステムデーモンに影響を与えます。
F5製品開発はID 355152をこの問題に割り当てました。この問題が上記対象バージョンに存在することを確認しました。
この問題を解決するリリースまたはホットフィックスに関しては、以下の表を参照してください。
Fixのタイプ |
Fixしたバージョン |
関連記事 |
リリース |
10.2.2 |
SOL2200: Most recent versions of F5 software |
ホットフィックス |
なし |
なし |
重要 : AOMファームウェアのバージョン10.1.8かそれ以降は、この解決手段で記述されている問題の解決策の一部を提供しています。
単純に影響を受けたBIG-IPシステムのAOMバージョンを10.1.8かそれ以降にバージョンアップしてもこの問題は解決しません。
完全に問題を解決するためにはBIG-IPシステムをBIG-IPバージョン10.2.2にアップグレードしなければなりません。
この問題の暫定対策は、chmandプロセスを再起動することです。
以下の手順を実行します。
暫定対策の影響 : chmandプロセスを再起動すると、例えばTMMなど主要なBIG-IPシステムデーモンも再起動します。
この手順をを実行するとトラフィック処理を中断します。
1.BIG-IPのコマンドラインにログインします
2.次のコマンドを実行し、chmandプロセスを再起動します
bigstart restart chmand
・SOL9403: Overview of the Always-On Management subsystem
・SOL8035: Overview of BIG-IP daemons
・SOL9476: The F5 hardware/software compatibility matrix
最終更新:2012年06月24日 22:41