[vine-users:081122] Re: <ご助言願い>Vine5.2 Server機が不安定

Hajime Satono hsatono @ iodata.jp
2011年 6月 28日 (火) 11:20:49 JST


木村しげかず様

里野@金沢と申します。

超亀レスご容赦下さい、未CloseだったのとVine6βテスト中の方々への
情報となるやもと思い、Closeを兼ねて記載いたします。


On 2011/03/14 22:21,, 木村成一-san wrote:
> 木村しげかず と申します。
> 
> On Sat, 12 Mar 2011 15:18:36 +0900
> Fam<kfe02262 @ nn.iij4u.or.jp>  wrote:
	・
	(中略)
	・
> Vine Linux-5.2 の Synaptic を起動し kernel で検索すると、
> SMP と NOSMP を区別した kernel は見当たらないようです。
> 自分でコンパイルするしか方法はないかも。

スキル不足でこれは出来ませんでした_(_ _;)_


> 引用の順番が逆になりますが……。
>> 以前はCerelonを使っていたのでP4に変更した事が要因かも?
> 
> やはり換装した CPU を元に戻してみるべきではないでしょうか。
> 試してみても、別に、損するわけではないはずですし。

その後の各種UpdateやPatchを当てても症状は改善しませんでした。

ハード的には電源Assy.の交換や同型番NIC(保守パーツ)の交換、
や、あげくの果てには保守用M/Bへの交換や電解コンデンサ類の
全交換も試しましたが症状改善せずという状況でした。

あまりにサーバがフリーズし落ちる頻度(1日数回)が高い為、
リブータ(PING監視でAC100VをON/OFFし強制再起動する機器)を併設導入し、
強制シャットダウンなので精神衛生上悪いですが対処療法を兼ねながら、
障害を切り分けていきました。

すると確実に発生する状況がつかめました。

IntelのNIC Pro1000GT(82541PI)・・ドライバはe1000
に対して、高負荷をかける・・・
例えばLAN内から数GBクラスのファイルをftpで当該サーバに
Uploadするとか、同様にWAN側からUploadしてもらう
と数分程度で確実に落ちる事が解りました。

その際にNICのメインチップ(82541PI)を触ってみると
かなりの発熱がありましたのでポイントクーラの噴射で
冷却しながら再現試験するとなぜか発生しなくなりました。

これは!と思いNICのメインチップにヒートシンク装着、
かつ小型ファンでヒートシンクを強制空冷可能な状況※1に
しましたが、この状況では再び発生します(なぜ?)

#M/B側のNIC付近のチップの発熱に関係していた?

過去の経験からサーバーに蟹は論外なので、別チップの
Intel NIC(82541GI)に差し替えたら、激遅になり、
かつ症状再現(泣)

その後、Intelのサイトからe1000のLinuxドライバの
最新版をGetしてビルドしてVine標準版からリプレイス※2
したところ、心持ち安定(これも不可思議)したのですが
やはり1日に1回程度は落ちておりました。

結局の所※1と※2の対処をした元のNICに戻して
途方に暮れていたのですが、最後にやってみようと
木村様からご教示いただいた「CPUをCeleronに換装する」
を実行した所、最初は起動中に1〜2回フリーズしましたが
何度かリセットしたら起動可能になりました。
(CPU交換がされた事による自動認識中の問題?)

また、Xの起動中にも(すみません覚えてませんが)
何かの警告メッセージが1〜2度出ていたのですが、
使うのをやめて続行or無視して続行的な選択肢を選んで
起動するとその後は問題なく利用できるようになりました。
但し、Pentium4/2.8の際と比べると、Celeron2.4では
Xの動作挙動の私感は目に見えて遅くなったような気がします。

私感として折角早いCPUに換装したのと、CPUの差し替えは
グリスの除去・塗布等、工数かかる事もあり、
出来る限りやりたくなかったのですが、Celeronに戻した後は
NICに高負荷をガンガンかけてもフリーズ再発せず安定しました。
−>Celeronの処理限界がフリーズ要因に届いてない為やも知れません。

今から考えるとPentium4/2.8の際には頻繁に発生するフリーズ以外にも
cronからのメッセージ異常やfail2banやswatchの誤動作、Xのフリーズなど、
いろいろな不可思議な状況が起こっていたと思います。

まとめますと・・・

 1.チップセットi845GVのM/B(Freetech/P8F153GVT)
   http://www.motherboard.cz/mb/freetech/153gvt.htm

 2.82845PIのNIC(Intel)

 3.Pentium4(2.8GHz/Socket478/Northwood)

・・・1〜3の複合環境とVine5.2の組み合わせにおいて、


発生し得る不具合:
 NICへの高負荷発生時にカーネルパニックやフリーズ等の
 現象が発生する事があり得る。

回避対処:
 Celeronへの換装により不具合が収まる可能性がある。


といった感じでしょうか。。

木村しげかず様、ご教示ありがとうございました_(_ _)_

また、上述の情報がVine6のβ開発に何らかのお役に立つようであれば幸いです。


	By Hajime Satono / hsatono @ iodata.jp


vine-users メーリングリストの案内