ヌル文字として
char c = '\0'
と書くことがよくある。
じゃあ、
c = '\1'
というのもあるのか。
もちろんある。
このときcの中身を16進数で表すと、0x01になっている。
'\1'があるのなら、'\2','\3','\4',,,,もずっとあるだろう。
否、そうではない。
'\8'
は無いのである。コンパイルエラーを起こす。
'\9'も無い。でも'\10'はある。
なぜ8と9だけ無いのか?
実はこの表現は8進数になっているのである。
'\10'と書いたとき、cは 0x08 になっている。(8進数の10は、10進数・16進数では8になる)
この書き方ができる最大の値は、
'\377'
10進数の 255 = 16進数の FF = 8進数の 377だから。
さらに詳しく見ると、、、
\の後ろに0~7の数字が続く限り、1つの8進数の数値と見なされる。
ただし、377を超えた数値になると、"octal escape sequence out of range"というワーニングが出た。
実行すると、一周して戻ってきた値(400を引いた値)になっているので、ある意味期待通りの動きになっていた。つまり、'\407'とすると、0x07になる。
\の直後に8や9が来ると、"Unknown escape sequence '\8'"というワーニングがでる。
\の直後に0~7が続き、その後8や9が来ると、8(か9)の直前でエスケープシーケンスが途切れる。つまり、'\378'とすると、'\37'と'8'になる。文字列中に書いていれば、2文字に分かれるし、文字として書いていれば、"Multi-character character constant"ワーニングが出る。
また、以下の実験からするに、変数型はsingned charのようだ。
(仕様としてはcharで、処理系がcharをsigned charにしている、ということかも)
printf("%d, %x, %d, %x, %d, %x\n", '\377', '\377', (unsigned char)'\377', (unsigned char)'\377', 0377, 0377);
=>-1, ffffffff, 255, ff, 255, ff
ではここで問題。
printf("%u", '\377');
としたときの出力は?
答え→
42949672958進数があるのなら16進数もあるだろうという話だが、
'\x10'
で16進数になる。つまり、\の直後にxを付けるのである。
最大値は\xFFで、(A~Fは大文字でも小文字でもいい)、あとは8進数とルールはだいたい同じ。
改めて言うが、これはエスケープシーケンスである。
普通に整数型変数に値を入れたいなら、
i = 010; //8進数の10 = 10進数の8
j = 0x10; //16進数の10 = 10進数の16
と書けばいい。
文字や文字列中で使いたいときに出番が来る。
c = '\0'; //ヌル文字
str = "ここでタブをいれて→\11 ここで改行する→\xA 次の行!";
//水平タブのアスキーコードは10進数で9、8進数で11
//改良のアスキーコードは10進数で10、16進数でA
ヌル文字以外出番はやっぱりなさそうだ。今まで知らなかった訳だし。
改行するときに、\nでなく\xAなんて書く人見たこと無いよね。
最初は戸惑うかもしれないけど、
assert('\n' == '\xA'); //ok
assert('\t' == '\11'); //ok
ということなんだな。
ついでに、printfでの表現の指定も書いておこう。
10進数は%d、16進数は%xまたは%X、8進数は%o。
printf("%d, %x, %X, %o%c", 10, 10, 10, 10, '\xA'); //これでちゃんと改行もされる
=> 10, a, A, 12
ところで、2進数はなかったっけ?
PR