2014年4月15日火曜日

プロパティ日時の謎を解け!

dirコマンド…あ、こっちだと秒が出ないんでした。

ならプロパティの更新日時をコピー&ペー…うぎゃ~!!

Excelに貼り付けたところ、
何やらカーソルが荒ぶっておられるぞ!?

…という現象が仕事中に起こったので、
解明することにしました。

自宅のパソコンにはExcelなんて無いので、
説明にExcelは登場しませんのでご注意ください。

というわけで、
今回のターゲットはこちらです。

プロパティ

Windows 7で、
CentOSのisoイメージのプロパティを表示した画面です。

この中の更新日時の日時部分を範囲選択してコピー&ペーストすると、
何やら表示されている以外の何かも取得しているようなのです。

ということで、
まずはTeraPadに貼り付けてみました。

更新日時

ふむふむ、確かに何かあるようです。

でもこれでは何がなんやら…TeraPadでは識別できない文字のようです。

なので原点に帰って、
メモ帳に貼り付けてみましょう。

更新日時2

見た目はちゃんとしていますが、
カーソルを動かすとTeraPadで"?"となっていた部分でとっかかりを覚えます。

目に見えない何かがあるようです。

とりあえずUTF-8で保存して、
Stirlingでバイナリ解析してみましょう。

更新日時3

ええっと、順番に解析していきましょう。

あ、文字コードの基礎知識が無い人には初心者バイバイな内容なのでご注意ください。

最初の"EF BB BF"はUTF-8のBOMなので無視します。

それでUTF-8の文字コードにそれぞれ当てはめていくと…(めんどうなので略)

不明の文字は"E2 80 8E"と"E2 80 8F"の2種類しかないことが分かります。

この表示されない文字はLRMとRLM、
左書きと右書きを指定するための文字です。

国際化の都合で入れる必要があったのでしょうか?

まあとにかく、
見えない文字の全容は明かされたわけです。

個人的にはこれで手を引くことにします。

気になる人はさらに調べてみると良いかもしれません。

 

参考1:UTF-8コード表
参考2:Unicodeは右横書きと左横書きを器用に使い分ける

0 件のコメント:

コメントを投稿