charmapのヘルプ・マニュアル
日本語 英語
charmap --help
man charmap
CHARMAP(5) Linux User Manual CHARMAP(5)
名前
charmap - 文字符号化を定義するための文字シンボル
書式
文字集合記述 (charmap) は使用できる文字集合とその符号化を定義する。サポ
ートされる全ての文字集合は妥当なサブセットとして 共通文字集合 (portable
character set) を持たなければならない。
文法
charmap ファイルは以下のキーワードからなるヘッダーで始まる:
はコードセットの名前を指定する。
は複数バイト文字の一文字あたりの最大バイト数を指定する。複数バイ
ト文字は現在のところサポートされていない。デフォルトは 1 であ る
。
は一文字あたりの最低バイト数を指定する。この値は mb_cur_max 以下
でなければならない。もし指定されなければデフォルトは mb_cur_max
と同じである。
ファイルの残りの部分でエスケープ・キャラクターとして使用する文字
を指定する。これで特殊な意味に解釈される文字をエスケープする。デ
フォルトはバックスラッシュ (\) である。
はファイルの残りの部分でコメント・キャラクターとして使用する文字
を指定する。デフォルトではシャープ (#) である。
charmap の定義そのものは第一カラムにキーワード CHARMAP を置くことで始め
る。
以下の行は文字の符号化を定義するための二つの方法である:
これは一つの文字とその符号化を定義する。
...
この形式は複数の文字を定義する。これは複数バイト文字 (現在は実装
されていない) のみで有用である。
charmap の定義の最後の行は END CHARMAP を置く。
シンボル名
文字の シンボル名 (symbolic name) は 共通文字 集 合(portable character
set) の 文 字 の み を 含 んでいる。この名前はかぎかっこ < > で挟む。
に続く文字はそれ自身として解釈される。例えば <\\\>> の よ
うな文字列は \> というシンボル名をかぎかっこで狭んで表現している。
文字符号化
符号化は以下の三つの形式のどれかで表す:
d<数字>
は 10 進の数値を表す。
x<数字>
は 16 進の数値を表す。
<数字>
は 8 進の数値を表す。
ファイル
/usr/share/i18n/charmaps/*
準拠
POSIX.2.
関連項目
locale(1), localedef(1), localeconv(3), setlocale(3), locale(5)
1994-11-28 CHARMAP(5)
CHARMAP(5) Linux User Manual CHARMAP(5)
NAME
charmap - character symbols to define character encodings
DESCRIPTION
A character set description (charmap) defines a character set of avail-
able characters and their encodings. All supported character sets
should have the portable character set as a proper subset.
Syntax
The charmap file starts with a header, that may consist of the follow-
ing keywords:
is followed by the name of the codeset.
is followed by the max number of bytes for a multibyte-charac-
ter. Multibyte characters are currently not supported. The
default value is 1.
is followed by the min number of bytes for a character. This
value must be less or equal than mb_cur_max. If not specified,
it defaults to mb_cur_max.
is followed by a character that should be used as the escape-
character for the rest of the file to mark characters that
should be interpreted in a special way. It defaults to the
backslash ( \ ).
is followed by a character that will be used as the comment-
character for the rest of the file. It defaults to the number
sign ( # ).
The charmap-definition itself starts with the keyword CHARMAP in column
1.
The following lines may have one of the two following forms to define
the character-encodings:
This form defines exactly one character and its encoding.
...
This form defines a couple of characters. This is only useful
for multibyte-characters, which are currently not implemented.
The last line in a charmap-definition file must contain END CHARMAP.
Symbolic Names
A symbolic name for a character contains only characters of the
portable character set. The name itself is enclosed between angle
brackets. Characters following an are interpreted as
itself; for example, the sequence <\\\>> represents the symbolic name
\> enclosed in angle brackets.
Character Encoding
The encoding may be in each of the following three forms:
d
with a decimal number
x
with a hexadecimal number
with an octal number.
FILES
/usr/share/i18n/charmaps/*
CONFORMING TO
POSIX.2.
SEE ALSO
locale(1), localedef(1), localeconv(3), setlocale(3), locale(5)
COLOPHON
This page is part of release 3.22 of the Linux man-pages project. A
description of the project, and information about reporting bugs, can
be found at http://www.kernel.org/doc/man-pages/.
1994-11-28 CHARMAP(5)