[JF:20036] Re: Git リポジトリをビルド
Masanori Kobayasi
zap03216 @ nifty.ne.jp
2010年 10月 29日 (金) 05:33:14 JST
小林です。濱崎さん、ありがとうございます。
On Thu, 28 Oct 2010 23:33:22 +0700,
Takeshi Hamasaki <hmatrjp @ users.sourceforge.jp> wrote:
> 気になったのは、LANG=ja_JP.eucJP してsgml2txt を実行する前に、
> nkf -j で対象ファイルを JIS コードに変換していることです。
> sourceforge.jp へ移行する前も、このように処理していたんでしょうか?
>
> 例)SSL-RedHat-HOWTO の場合
>
> for f in *.html; do \
> nkf -j $f > $f.jis; \
> mv $f.jis $f; done
> LANG=ja_JP.eucJP sgml2txt -c nippon -f -l ja SSL-RedHat-HOWTO.sgml
> Processing file SSL-RedHat-HOWTO.sgml
> /usr/bin/groff: troff: Segmentation fault
あ、nkf -j は、sgml から変換した後の html ファイルを、一括して
JIS コードに変換している部分です。
確か、html ファイルは、当時文字化けがおこりにくかった等の理由で、
文字コードを JIS (ISO-2022-JP) に統一する決まりが、大昔の JF に
あったような憶えがあります。
プレインテキストのファイルは、当時の Windows 環境でも読みやすい
ように、shift-jis に統一されていました。
> 他の文書の処理にも、それに由来するらしき警告がちらほら……。
sgml2txt で can't break line 等の警告が出るのはよくあること
なので、致命的なエラー以外はなるべく気にしないようにしようかと
思っています。
10年くらい前の LinuxDoc DTD 文書は、おもに groff の
バージョンアップが原因で、なかなかスムーズにテキスト変換
できないです。
--
小林雅典
JF メーリングリストの案内