イオン のウェブサイトで公開されているPDFファイル 2013.12.29 / JAPAN お客さまへのお詫びと商品回収のお知らせ[ イオン(株) ] (384KB) [PDF] のテキスト部分をコピー&ペーストしてみたら文字化けする。
⇒ Twitter / nilab: イオンのPDFおかしいな。。。本文をコピペして貼り付けると「 ...
⇒ Twitter / nilab: 「 ...
文字に割り当ててあるコードポイントがおかしいんじゃないかなと思うけど、まぁめんどうなので深入りはしない。
-
Ref.
- nilog: ユニーのPDFは Firefox で見れたけど、イオンのPDFはそこらじゅう文字が抜けてて読めたもんじゃない。 (2014-01-02)
- nilog: @17sai フォントが埋め込みサブセットになっているので、もしかして文字のコードがそれぞれ一般的でないものに割り当てられているのかも (自信ナシ) (2014-01-02)
- nilog: イオンのPDFファイルは、元の文書ファイルが Microsoft Word で作ったファイルで、それを PrimoPDF で変換しているっぽい。 (2014-01-02)
- nilog: イオンのPDFの「イ」が 0x100863 だからコードポイントとしておかしいのでは。「U+100896 is not a valid unicode character.」U+100896 http://t.co/9Kmrjb2K2M (2014-01-02)
tags: pdf
Posted by NI-Lab. (@nilab)