Debian 5.0 Lenny + kvm part2

前回のCentOSからDebian Lennyへの移行のあと、しばらくは安定して運用できていたのですが、ある日から突然不安定になってしまいました。
状況としては

  • ディスクIO負荷が集中している時
  • 希にGuest側が完全に沈黙
  • Hostのkvmプロセスは動いているが、CPU使用率100%
  • Guestへのpingなどの応答もなし
  • IO負荷が戻っても沈黙したまま、kvmプロセスをkillするしかない
  • 多いときには一日に2〜3回発生

nicやdiskのmodelをvirtioやpcnetなどいろいろ変えてみたが状況は変わらず。IO負荷はGuest、Hostのどちらでも引き金になるようで、RAIDのrebuildが走った日には数分おきにdownしていました。
報告しようにもエラーメッセージもなにもないため、さてどうしよう。といった状態。

Hostごと再インストールか、と思いながらunstable(sid)のkvm85とkernel 2.6.30を入れてみたところ、停止することはなくなった。ただしIO負荷が多い時に応答がつまるのは変わらなかったので要注意。