初版: 2023-09-16
最終更新日:
2023-09-16
○ダウンロード
このプログラムは、Windows・Linux・FreeBSDで動く 各種文字コードに対応した16進ダンププログラムです。 ○はじめに 文字コードはUTF-8が標準となってきていますが、 レガシーな処理系では、EUC-JPやShift JISが使われています。 日本語の文字コードは、2023年においても混沌とした状況です。 xdは、そのような環境で使える16進ダンププログラムです。 ○コンパイル方法 たとえば、 % cc -Wall -o xd xd.c codeconv.c ucs2jis.c のようにします。 ○使いかた % xd ファイル名 とすると、そのファイルをその処理系で使われている文字コードを想定して 16進ダンプします。 ○オプション たとえば、ファイルがShift JISであれば、 % xd -s ファイル名 として文字コードを指定することができます。指定方法には -s Shift JIS -w UTF-8(日本語のみ対応) -e EUC-JP -n 文字コード指定なし(ASCII表示可能文字のみの対応となります) があります。なお、ISO-2022-JPは、 「ESC $ B」と「ESC ( B」 にのみ対応しています。出力文字コードも指定可能で、それぞれ -S Shift JIS -W UTF-8(日本語のみ対応) -E EUC-JP を使います。 ○使用例 % nkf -j hello.txt | xd 0000 1b 24 42 24 33 24 73 24 4b 24 41 24 4f 1b 28 42 .$Bこんにちは.(B 0010 21 0a % nkf -s hello.txt | xd 0000 82 b1 82 f1 82 c9 82 bf 82 cd 21 0a こんにちは!. % nkf -e hello.txt | xd 0000 a4 b3 a4 f3 a4 cb a4 c1 a4 cf 21 0a こんにちは!. % nkf -w hello.txt | xd -w 0000 e3 81 93 e3 82 93 e3 81 ab e3 81 a1 e3 81 af 21 こ ん に ち は ! 0010 0a . ○可搬性 Linux、FreeBSD、Windows10で動きます。 ○バグ ・いわゆる半角カナの対応は不十分です。 ・文字コードの自動判別機能はありません。○ダウンロード
○関連リンク
Copyright (C) 2023 by Dai ISHIJIMA