「にょろ」とか「から」とか「波線」とか呼ばれる記号文字、波ダッシュ「〜」と全角チルダ「~」について調べたのでメモ。

文字 Unicode 名称
U+301C 波ダッシュ (WAVE DASH)
U+FF5E 全角チルダ (FULLWIDTH TILDE)

Web ブラウザで表示してみる

Mac OS X Yosemite + Mozilla Firefox 41.0.1 で表示したもののスクリーンショット。

波ダッシュ「〜」と全角チルダ「~」 Mac OS X Yosemite + Firefox 41.0.1

Windows 8.1 + Mozilla Firefox 41.0.2 で表示したもののスクリーンショット。

波ダッシュ「〜」と全角チルダ「~」 Windows 8.1 + Firefox 41.0.2

以前、 Windows XP で調べたときは波ダッシュが「下がって上がる」形状になっていた。いまどきの環境とは逆の波の形状。

以前、Windows で調べたときは波ダッシュが「下がって上がる」形状になっていた。
[ヅ] 2つの WAVE DASH ~ (2005-04-30)

どういうことなのか Wikipedia で調べる

この文字の全角 (fullwidth tilde) は「~」であり、UnicodeにおけるコードはU+FF5Eである。この文字は波ダッシュ「〜」(すなわち範囲などを表す「波線」)と字形が似ているが、UnicodeやJIS X 0213では別の文字である。Windows OSでは波ダッシュの代用として全角チルダが使われるので混乱の元となっている。

チルダ - Wikipedia
Unicode 8.0以降の仕様書では、U+301C WAVE DASH(波ダッシュ)に、JIS X 0208の波ダッシュの例示字形と同じ正しい形(“上がって下がる” 形)が示されているが、それ以前のバージョンの仕様書では「JIS punctuation」(The Unicode Standard、Version 2.0より引用、「JIS約物」の意)という注釈を施しておきながら、不適切な形(“下がって上がる” 形)で印刷されていた。

このような間違いが発生した理由は、Unicodeの例示字形を検討するグループにいたメンバーの日本語に対する知識が不十分だったために、縦書きの例示字形を90度回転すればいいと誤って判断してしまったためである。

波ダッシュ - Wikipedia

環境 (Windows XP など) によっては、波ダッシュ「〜」は「?」などに文字化けしてしまうため、 日本ではやむを得ず、波ダッシュ「〜」を使うべきところに全角チルダ「~」を使ってしまうことが多いらしい。

Java でコードポイントを表示してみるサンプルコード


public class Nyoro {
 
  public static void main(String[] args) {
    print('〜'); // 波ダッシュ
    print('~'); // 全角チルダ
  }
 
  private static void print(char c){
    int i = (int)c;
    String h = Integer.toHexString(i);
    System.out.println(c + ":" + i + ":0x" + h);
  }
}

実行結果。


〜:12316:0x301c
~:65374:0xff5e

tags: java unicode

Posted by NI-Lab. (@nilab)