DRBD調査事項 - 技術メモ

共有ディスクの使用

　あえて共有ディスクを使用するのであれば、heartbeatだけで十分。DRBDは不要

リソースの移動

　heartbeatが勝手にhttpdを再起動してしまう
　←on-fail="restart" となっているため
crmコマンドを用いたPacemakaer のリソース設定方法 « Linux-HA Japan

op start interval="0s" timeout="90s" \    ← リソースの起動時のタイムアウト値の設定
op monitor interval="3s" timeout="20s" \  ← リソースの監視間隔と、タイムアウト値の設定
op stop interval="0s" timeout="100s"      ← リソースの停止時のタイムアウト

SUSE Linux Enterprise High Availability Extension

meta migration-threshold="1" failure-timeout="60s"

P18
resource-failure-stickiness クラスタオプションは、migration-threshold クラスタオプションに替わりました。
P44
リソースに障害が発生すると、自動的に再起動されます。現在のノードで再起動できない場合、または現在のノードでN回失敗した場合は、別なノードへのフェールオーバーを試みます。新しいノードへのマイグレートを行う基準(migration-threshold)となるリソースの失敗数を定義できます。
P45
たとえば、リソース「r1」の場所の制約を設定し、このリソースを「node1」で優先的に実行するように指定したと仮定します。そのノードで実行できなかった場合は、「migration-threshold」を確認して失敗回数と比較します。失敗回数 >= マイグレーションしきい値の場合は、リソースは次の優先実
行先として指定されているノードにマイグレートされます。
デフォルトでは、しきい値に達すると、管理者がリソースの失敗回数を手動でリセットするまで(失敗原因を修正してから)、実行できなかったリソースをそのノードで実行することはできません。
ただし、リソースの失敗タイムアウトオプションを設定することで、失敗回数を失効させることができます。したがって、「migration-threshold=2」と「failure-timeout=60s」を設定すると、2回の失敗の後に新しいノードにマイグレートし、1分後に復帰させられる可能性があります(固着性と制約スコアによる)。
P206
migration-threshold
ノードがこのリソースをホストできなくなるまで、このリソースについてノード上で発生する失敗の回数。デフォルト: none
P207
on-fail

ignore リソースが失敗しなかったのように動作します

block リソースにこれ以上の操作を実行しません

stop リソースを停止して、他の場所でも開始しません

restart リソースを停止して再起動します(別のノード上で)

fence リソースが失敗したノードを停止します(STONITH)

stanby リソースが失敗したノードからすべてのリソースを移動させます

DRBDのレプリケーションタイミング

　書き込む度。リアルタイムレプリケーションであり、ファイルシステムとディスクドライバの中間に位置するDRBDが、書き込み要求があるたびにローカルディスクとピアノードへ書き込み要求を出す。

ignore	リソースが失敗しなかったのように動作します
block	リソースにこれ以上の操作を実行しません
stop	リソースを停止して、他の場所でも開始しません
restart	リソースを停止して再起動します(別のノード上で)
fence	リソースが失敗したノードを停止します(STONITH)
stanby	リソースが失敗したノードからすべてのリソースを移動させます