[JF:20036] Re: Git リポジトリをビルド

Masanori Kobayasi zap03216 @ nifty.ne.jp
2010年 10月 29日 (金) 05:33:14 JST


小林です。濱崎さん、ありがとうございます。

On Thu, 28 Oct 2010 23:33:22 +0700,
Takeshi Hamasaki <hmatrjp @ users.sourceforge.jp> wrote:

> 気になったのは、LANG=ja_JP.eucJP してsgml2txt を実行する前に、
> nkf -j で対象ファイルを JIS コードに変換していることです。
> sourceforge.jp へ移行する前も、このように処理していたんでしょうか?
> 
> 例)SSL-RedHat-HOWTO の場合
> 
> for f in *.html; do \
> 		nkf -j $f > $f.jis; \
> 		mv $f.jis $f; done
> LANG=ja_JP.eucJP sgml2txt -c nippon -f -l ja SSL-RedHat-HOWTO.sgml
> Processing file SSL-RedHat-HOWTO.sgml
> /usr/bin/groff: troff: Segmentation fault

あ、nkf -j は、sgml から変換した後の html ファイルを、一括して
JIS コードに変換している部分です。

確か、html ファイルは、当時文字化けがおこりにくかった等の理由で、
文字コードを JIS (ISO-2022-JP) に統一する決まりが、大昔の JF に
あったような憶えがあります。

プレインテキストのファイルは、当時の Windows 環境でも読みやすい
ように、shift-jis に統一されていました。

> 他の文書の処理にも、それに由来するらしき警告がちらほら……。

sgml2txt で can't break line 等の警告が出るのはよくあること
なので、致命的なエラー以外はなるべく気にしないようにしようかと
思っています。

10年くらい前の LinuxDoc DTD 文書は、おもに groff の
バージョンアップが原因で、なかなかスムーズにテキスト変換
できないです。

-- 
小林雅典


JF メーリングリストの案内