iconvでの文字コード変換
iconvを使用した文字コード変換ではまったので注記
UTF-8<=>Shift-JIS
文字コードをUTF-8とShift-JISで相互変換する場合に特定の文字が処理系で違うコードに変換されるようです。(ソフト依存??)
その他の文字についてはまだ調べてないが、「-」(IMEでは[全]マイナスと表記)をWindows上でUTF-8として入力すると、EF BC 8D(EFBC8D)となる。
しかし、調べてみると、正しくはE2 88 92(E28892)らしく、iconvで「UTF-8->Shift-JIS->UTF-8」の変換を行うと「Shift-JIS->UTF-8」のところで不可逆な変換となりバグってしまう。
とりあえず、IMEからの入力は無理っぽかったので、iconvでE2 88 92のコードに変換してからコピペした。
ほかにもこんな文字があるのかなぁ。。。
最終更新:2007年04月17日 09:48