「にょろ」とか「から」とか「波線」とか呼ばれる記号文字、波ダッシュ「〜」と全角チルダ「~」について調べたのでメモ。
文字 | Unicode | 名称 |
---|---|---|
〜 | U+301C | 波ダッシュ (WAVE DASH) |
~ | U+FF5E | 全角チルダ (FULLWIDTH TILDE) |
Web ブラウザで表示してみる
Mac OS X Yosemite + Mozilla Firefox 41.0.1 で表示したもののスクリーンショット。
Windows 8.1 + Mozilla Firefox 41.0.2 で表示したもののスクリーンショット。
以前、 Windows XP で調べたときは波ダッシュが「下がって上がる」形状になっていた。いまどきの環境とは逆の波の形状。
⇒ [ヅ] 2つの WAVE DASH ~ (2005-04-30)
どういうことなのか Wikipedia で調べる
この文字の全角 (fullwidth tilde) は「~」であり、UnicodeにおけるコードはU+FF5Eである。この文字は波ダッシュ「〜」(すなわち範囲などを表す「波線」)と字形が似ているが、UnicodeやJIS X 0213では別の文字である。Windows OSでは波ダッシュの代用として全角チルダが使われるので混乱の元となっている。
チルダ - Wikipedia
Unicode 8.0以降の仕様書では、U+301C WAVE DASH(波ダッシュ)に、JIS X 0208の波ダッシュの例示字形と同じ正しい形(“上がって下がる” 形)が示されているが、それ以前のバージョンの仕様書では「JIS punctuation」(The Unicode Standard、Version 2.0より引用、「JIS約物」の意)という注釈を施しておきながら、不適切な形(“下がって上がる” 形)で印刷されていた。
このような間違いが発生した理由は、Unicodeの例示字形を検討するグループにいたメンバーの日本語に対する知識が不十分だったために、縦書きの例示字形を90度回転すればいいと誤って判断してしまったためである。
波ダッシュ - Wikipedia
環境 (Windows XP など) によっては、波ダッシュ「〜」は「?」などに文字化けしてしまうため、 日本ではやむを得ず、波ダッシュ「〜」を使うべきところに全角チルダ「~」を使ってしまうことが多いらしい。
Java でコードポイントを表示してみるサンプルコード
public class Nyoro {
public static void main(String[] args) {
print('〜'); // 波ダッシュ
print('~'); // 全角チルダ
}
private static void print(char c){
int i = (int)c;
String h = Integer.toHexString(i);
System.out.println(c + ":" + i + ":0x" + h);
}
}
実行結果。
〜:12316:0x301c
~:65374:0xff5e
tags: java unicode
Posted by NI-Lab. (@nilab)