文字コード戦争

iconvでの文字コード変換

iconvを使用した文字コード変換ではまったので注記

UTF-8<=>Shift-JIS

文字コードをUTF-8とShift-JISで相互変換する場合に特定の文字が処理系で違うコードに変換されるようです。(ソフト依存??)

その他の文字についてはまだ調べてないが、「-」(IMEでは[全]マイナスと表記)をWindows上でUTF-8として入力すると、EF BC 8D(EFBC8D)となる。
しかし、調べてみると、正しくはE2 88 92(E28892)らしく、iconvで「UTF-8->Shift-JIS->UTF-8」の変換を行うと「Shift-JIS->UTF-8」のところで不可逆な変換となりバグってしまう。

とりあえず、IMEからの入力は無理っぽかったので、iconvでE2 88 92のコードに変換してからコピペした。

ほかにもこんな文字があるのかなぁ。。。


名前:
コメント:
最終更新:2007年04月17日 09:48
ツールボックス

下から選んでください:

新しいページを作成する
ヘルプ / FAQ もご覧ください。