統合システム運用管理 JP1

日立が提供するITシステムの運用管理ミドルウェア群。
たくさんのパッケージがあること、名前が長かったり、変な略記なため、なかなか把握しにくい。。。。
ちなみに、JP1自体何の略かいまだに知らない。。。同社からTP1(分散トランザクションマネージャ)なる似た名前のミドルウェアがあるので混同しないように。
しかし、覚えきれないほどたくさんあるということは、豊富なパッケージでさまざまな構成のシステムにJP1がサポートできるということではないでしょうか。。。

やはり、日本メーカ製品ということで、マニュアルや操作画面が日本語であることが、一番の強みではないでしょか。(サポートサービスも日本人で親切・丁寧でわかりやすい?)
最近運用管理で話題となっている、ITIL(InformationTechnologyInfrastructureLibrary)に対応した製品ラインナップ・機能を充実させてきている(と思われます。そのような説明を聞いたことがある)。

運用管理システムの基本的目的は、
「業務処理を止めるような障害となることを未然に防ぐ」
「障害が発生したらできるだけ早く検知する」
ということではないでしょうか。
そしてさらに、うやむやになりがちな、障害発生から復旧、原因追求、対策といったインシデント管理を、運用管理部門が一環して管理するための手助けとなることが、このようなパッケージには機能が必要と思います。(システム管理者の立場からすると、うやむやにしてもらいたい&と泣きを入れたいところではありますが。)
JP1が、上記の要件に、十分答えられるものであるということ、他の製品を知らないので、JP1はどれだけ優れているかは私の知るところではありません&)

数あるパッケージの中で、私が仕事上取り扱ったものは、以下のとおりです。

<JP1パッケージ一覧>

  • NNM(JP1/Cm2/NNM:ノード監視)
  • IM(JP1/IM::JP1統合監視)
  • AJS2(JP1/AJS2:運用ジョブ管理)
  • NETM/DM(S/W配布&IT資産管理)

NNM(Network Node Manager)

正式名称:「JP1/Cm2/NNM」
管理したいN/Wシステムのノード生死およびリソース状況をグラフィカルに監視できる。
もともとは、HPのOpenVeiw。実際、作りも見た目も(ほとんど)同じで、英語か日本語かの違いだけ(と思われる。OpenView自体はちらっと見た程度なので)。


画面構成は、監視と設定を行うメインウィンドウと、発生した障害をログ出力するウィンドウからなる。
メインウィンドウは、マップ(表示領域)上に監視対象ノードがアイコンで表示され、各ノードアイコン間は、論理・物理的な接続で結線表示される。アイコンの色によってステータスを表している。

前提として、SNMPを必要とし、NNMを導入したサーバを監視マネージャと監視対象ノード間でこのプロトコル通信を行う。

ノード生死とは、Ping(+SNMP)を使って、IPアドレスを持つ(+SNMPサポートされた)サーバおよびN/W機器がダウンしてるか/起動しているかを監視する。

リソース状況の監視は、SNMPを利用しているため、監視内容は監視対象ノードが対応するMIB情報の範囲となる。サーバであればプラットホームにもよるが、CPU使用率(量)、メモリ使用量(率)、N/Wトラフィック量(率)、ディスク(ボリューム、パーティション)使用率(量)を監視できる。
一般家庭のLANで使用されるような廉価なS/WHUBではないが、SNMP対応と表記されたN/W機器であれば、稼働状況やN/Wトラフィック量(率)を、製品固有のMIBを提供していれであれば、MIBファイルをNNMに読み込ませて利用することを明示するような設定を行えば、その情報も監視することもできる。
しかし、これだけでは設定や管理が面倒・不十分ということもあるので、サーバ監視には、サブパッケージとして、以下のものがさらに提供されている。


JP1/Cm2/SSO

正式名称:JP1/Cm2/SNMP System Observer

NNM用システムリソース・プロセス監視モジュール。
NNMだけでは面倒だったリソース監視設定がGUIで簡単にできるようになる。
さらに、NNMだけではできない、サーバのデーモンプロセス(Windowsではサービス。Ver7から可能)の監視をNNM上で監視できるようになる。(設定すると、サーバアイコン内にアイコン表示される)



JP1/Cm2/ESA

正式名称:JP1/Cm2/Extensible SNMP Agent

サーバリソース監視エージェント。
監視対象サーバに導入して、サーバのリソース監視(CPM,MEM,HDDの使用状況)を監視できるようにする。NNMとの通信にSNMPを使用するため、OSのSNMPデーモン・サービスが前提となる。


JP1/Cm2/SSO-APM

正式名称:JP1/Cm2/SNMP System Observer - Agent for Process

たぶん、うちの周りだけではないと思うが、この略称はAPMと呼んでいる。なぜ、"M"がついてるかは不明。。。
JP1/Cm2/ESAのオプションモジュールで、導入の前提としてJP1/Cm2/ESAが必要となる。
いままで、このパッケージの位置付けがバージョンによって異なっていたため、よくわからない存在であった。Ver7Iからようやく当然と思われる位置に落ち着いたみたい。
これを導入することで、サーバのプロセス(デーモン)、サービスを監視することができる。

UNIX系デーモンのプロセス監視は、psコマンドの出力で得られるプロセス名を設定に使う。子プロセスレベルの監視も可能。

Windowsの場合、タスクマネージャで表示されるプロセス名、サービス(Ver7iから)は、サービス名で設定できる。

TOPへ戻る


IM(Integrated Manager)

正式名称:JP1/Integrated Manager

システム監視内容で分けると、サーバログ監視を司る。
が、実際には、JP1に統合という名が付くだけに、JP1統合システム運用管理システムパッケージの基盤部分を担っている。

つまり、機能的役割として

  1. 監視対象サーバのログ監視(S/Wのテキストログ、WindowsだとNTイベントログ)
  2. 導入されたJP1製品のイベント(メッセージ)を一括収集して集中管理
  3. 集中管理するための認証機能

を有する。

この機能を利用するためには、以下のパッケージの導入が必要となる。

  • JP1/IM-CC(JP1監視サーバに導入)
  • JP1/Base(JP1監視サーバおよび監視対象サーバ)
  • JP1/IM-View(JP1監視サーバもしくは監視オペレータが見る監視端末)

ただし、1~3の機能は、JP1の基盤パッケージであるBaseによって実行される。


導入構成として、
JP1監視サーバに、JP1イベントを集中管理するマネージャの役割となるIM-CC(CentralConsole)を導入する。さらに、IM-CCの管理情報をGUI表示させるIM-Viewを導入する。(IM-View導入要件にBaseは不要)
監視対象サーバには、JP1/Baseを導入する。なお、この監視対象サーバには、NNMやAJS(Manager)などJP1製品を導入した運用系サーバも含まれる。

まず、機能1.について、
この点での機能は、Baseが提供する機能のひとつであり、IMとBaseによって実現される。
私もそうだったが、JP1に携わるはじめのころや機能レベルでしか扱わない人(監視オペレータや監視対象サーバの作成者)にとっては、この機能だけのために存在しているとしか思い浮かばないと思う。しかし、JP1運用管理サーバの構築経験をして、はじめてそれ以外で重要な役割も担っている、むしろそちらのほうでの機能に存在価値があるのだということに気づいた。

機能2.について、
前述のNNMや後述のAJS2などのメッセージを、JP1イベント(JP1のメッセージプロトコル)に変換して、IMがJP1製品からの情報を一括収集して運用オペレータが1つのモニタで集中管理できるようになること。これは、各JP1導入サーバに導入したBaseによって実現される。

機能3.は、
AJSにおいて、ある部分のジョブネットを作成・変更できるが、ほかは弄られたくない、運用オペレータレベルのユーザには、実行・再実行のオペレーションはさせるが、ジョブの設定をあやまって変更させないように制限するといった、JP1製品における操作の制限をつけるために、JP1独自で製品間で共通のユーザ認証機能を実現することができる。ただし、AJSやIMのようにBaseを基盤とするパッケージについてのみ対象となり、そうでないパッケージ(NNMやNETMDMなど)はその一元管理の対象外となる。
ちなみに、JP1での操作は、結局サーバ操作に繋がるため、OSユーザとのマッピングを必要とする。

IM-CCにおいて、JP1イベントとして各サーバの運用稼動状況を集中管理することができ、運用オペレータは、そのビューア(IM-View)画面だけを見るだけですむようになるが、これだけだとオペレータが常に画面の監視に拘束されてしまう。そこで、IM-CCでは、特定の重要イベントが発生した場合(単純な例だと、エラーメッセージが発生)、サウンド音を鳴らすプログラムを(作りこんで登録することで)実行したり、さらにはパトランプ(JP1連携製品として既存)と接続して、パトランプの点灯色とブザー音によって、オペレータに注意喚起を促すことまでできる。

TOPへ戻る


AJS2(Automatic Job Management System )

なぜ、2がつくのかは不明。(やはり、1があったのでしょうか)
システムは、さまざまなサービスを提供するサーバが連携して、1つの業務処理が完結する。また、業務処理は、ある日時や何らかのタイミングに実行され終了するといったスケジュール、順序性によって成り立っている。また、各業務サーバでは、いろいろなコマンド(サービス以外のOSコマンドだったり、S/Wのコマンド・スクリプトやユーザプログラムの実行だったり)からなる処理の一連で構成されている。

1つの処理をなす1連のコマンド群(バッチ)を、ジョブとして表し、それを順序性に従って並べたた処理をジョブネットと呼ぶ。
例えば、システムの業後処理は、各サーバのデータファイル・DBのバックアップ、TEMPファイルの削除、サービスの再起動、集計処理などさまざまなコマンド群を適切な順番で決められた時間内に実施される必要がある。
AJSを利用しなければ、各サーバ内でCRONに設定して実行し、他の連携先サーバにファイル・メッセージ・RPCを使ってで処理の実行を通知する作りこみにより、実現することになる。
AJSを利用することで、これらを統一されたルールで作成でき、GUIで構成や実行状況を確認できるようになり、一括管理を容易にしてくれる。

あるジョブが、エラーで終了したという情報は、AJSのGUIインターフェースである、AJS-Viewerによって、視覚的に確認することができるが、常に(定期的に)運用オペレータはこれを注意してみていなければならないが、ジョブの実行ステータスをBaseのイベント変換機能を使って、JP1イベントとしてIM-CCを導入したJP1運菅サーバに、統合的に監視することができるようになる。(IMからさらにパトランプなどを使ってオペレータに通知することが可能となる。)

TOPへ戻る


NETM/DM(???)


TOPへ戻る



最終更新:2007年02月14日 01:14