初版: 2023-09-16
最終更新日:
2023-09-16
○ダウンロード
このプログラムは、Windows・Linux・FreeBSDで動く
各種文字コードに対応した16進ダンププログラムです。
○はじめに
文字コードはUTF-8が標準となってきていますが、
レガシーな処理系では、EUC-JPやShift JISが使われています。
日本語の文字コードは、2023年においても混沌とした状況です。
xdは、そのような環境で使える16進ダンププログラムです。
○コンパイル方法
たとえば、
% cc -Wall -o xd xd.c codeconv.c ucs2jis.c
のようにします。
○使いかた
% xd ファイル名
とすると、そのファイルをその処理系で使われている文字コードを想定して
16進ダンプします。
○オプション
たとえば、ファイルがShift JISであれば、
% xd -s ファイル名
として文字コードを指定することができます。指定方法には
-s Shift JIS
-w UTF-8(日本語のみ対応)
-e EUC-JP
-n 文字コード指定なし(ASCII表示可能文字のみの対応となります)
があります。なお、ISO-2022-JPは、
「ESC $ B」と「ESC ( B」
にのみ対応しています。出力文字コードも指定可能で、それぞれ
-S Shift JIS
-W UTF-8(日本語のみ対応)
-E EUC-JP
を使います。
○使用例
% nkf -j hello.txt | xd
0000 1b 24 42 24 33 24 73 24 4b 24 41 24 4f 1b 28 42 .$Bこんにちは.(B
0010 21 0a
% nkf -s hello.txt | xd
0000 82 b1 82 f1 82 c9 82 bf 82 cd 21 0a こんにちは!.
% nkf -e hello.txt | xd
0000 a4 b3 a4 f3 a4 cb a4 c1 a4 cf 21 0a こんにちは!.
% nkf -w hello.txt | xd -w
0000 e3 81 93 e3 82 93 e3 81 ab e3 81 a1 e3 81 af 21 こ ん に ち は !
0010 0a .
○可搬性
Linux、FreeBSD、Windows10で動きます。
○バグ
・いわゆる半角カナの対応は不十分です。
・文字コードの自動判別機能はありません。
○ダウンロード
○関連リンク
Copyright (C) 2023 by Dai ISHIJIMA