幽霊文字
幽霊文字とは、JIS漢字コードに含まれているにもかかわらず一般の漢和辞典に記載がなく、典拠不明の文字のことである。幽霊漢字とも呼ばれる。
現在では、あらゆる文献を調査しても尚その典拠が不明だった12文字が幽霊文字と呼ばれることが多い。
代表的なものに「妛」や「彁」などがある。
現在では、あらゆる文献を調査しても尚その典拠が不明だった12文字が幽霊文字と呼ばれることが多い。
代表的なものに「妛」や「彁」などがある。
JIS漢字コードとは
- 日本で一般的に用いられる文字を集め一つずつ対応する符号を割り当てた文字集合の規格のこと。
- ざっくり言うと日本語に出てくる漢字・平仮名・英数字記号などをコンピュータで扱えるように番号を振った的なことである。
- あなたのPCやスマホで文字が打てたり読めたりするのもこういった文字コードのおかげである、先人に感謝。
歴史的背景
最初のJIS漢字コードと正体不明な文字
- 1978年に日本で初めての文字コードであるJIS C 6226-1978が制定された。
- コンセプトは「日本で日常使われている漢字を網羅する」こと。漢字表の他に人名や地名の資料からも漢字を集め、当時の漢和辞典であまり扱われていなかった国字(和製漢字)が初めて注目されることになった。
- しかしこの規格、日常的に使われている漢字をコンピュータで扱うことを一番の目的としていたため個別の漢字の由来や正確性はあまり気にされていなかった。
- そして、この規格が実際にコンピュータで使われ始めると読みや使用例が不明な文字の存在について指摘されるようになった。
- ちなみに、このとき初めて「幽霊文字」という呼称が生まれた。
- この当時の幽霊文字の数は60~100個ほどあったとされる(諸説あり)。
JIS漢字コードの改定と調査
- そのような状況を踏まえ、1997年の改定では作成委員会が1978年規格の原案作成時に参照したとされる以下の文献の調査を行い、幽霊文字の正体を暴こうと試みた。
- 標準コード用漢字表(試案): 情報処理学会漢字コード委員会(1971年)
- 国土行政区画総覧: 国土地理協会(1972年)
- 日本生命収容人名漢字: 日本生命(1973年、現存せず)
- 行政情報処理用基本漢字: 行政管理庁(1975年)
- 尚、文献3の「日本生命収容人名漢字」は1978年の原案作成時点で既に存在していなかった。
クソガバ出典のせいで作成委員会は、NTT(電電公社)の電話帳データベースや30以上の古今の辞典も調査するなど徹底的な文献参照が行われた。- ぷーれwikiの読者には言うまでもないだろうが、出典の正確性は非常に重要なのである。決して架空の論文を捏造したり実験データを改竄したりしてはいけない、絶対だぞ。
幽霊文字の正体
- 委員会の調査によって多くの幽霊文字の正体が判明し、1997年にJIS X 0208:1997が制定された。
- 幽霊文字とされてきた文字の多くは地名などで実際に使われていた漢字であった。
- つまり当初のコンセプトの「日本で日常使われている漢字を網羅する」ことを目指しすぎて超ローカルな漢字も規格に含めたらガチのマジでみんなが知らないような字までもが含まれてしまっていたのである。
- しかし、調査を終えても依然として典拠不明なものが12文字あった。これが現在の代表的な幽霊文字である。
現在も幽霊文字とされる漢字
- 以下はあくまでJIS X 0208:1997において典拠不明とされた12個の文字であり、これら以外にも典拠不明の幽霊文字は存在するらしい。この先は君の目で確かめてくれ!
典拠 | 偶然に一致した例 | 参考URL | |
墸 | 対応分析結果になし(典拠不明) | 『集韻』鈔本にあるが誤写か | https://ja.wiktionary.org/wiki/%E5%A2%B8 |
壥 | 対応分析結果になし(典拠不明) 「㕓」の誤写か |
『倭玉篇』にあり | https://ja.wiktionary.org/wiki/%E5%A3%A5 |
妛 | 国土行政区画総覧典拠とあるが発見できず 「𡚴」の誤認か |
『字鏡集』などにあるが誤写か | https://ja.wiktionary.org/wiki/%E5%A6%9B |
彁 | 対応分析結果になし(典拠不明) 「彊」などの誤写か |
同定不能 | https://ja.wiktionary.org/wiki/%E5%BD%81 |
挧 | 国土行政区画総覧典拠とあるが発見できず 「栩」の誤写か |
『中華字海』などにあり | https://ja.wiktionary.org/wiki/%E6%8C%A7 |
暃 | 国土行政区画総覧典拠とあるが発見できず 「杲」などの誤写か |
『法華三大部難字記』にあり | https://ja.wiktionary.org/wiki/%E6%9A%83 |
椦 | 国土行政区画総覧典拠とあるが発見できず 「橳」の誤写か |
『一切経音義 (玄応)』にあり | https://ja.wiktionary.org/wiki/%E6%A4%A6 |
槞 | 国土行政区画総覧典拠とあるが発見できず 「橦」の誤写か |
『宋元以来俗字譜』などにあり | https://ja.wiktionary.org/wiki/%E6%A7%9E |
蟐 | 行政情報処理用基本漢字典拠とあるが用例なし | 『新撰字鏡』にあり | https://ja.wiktionary.org/wiki/%E8%9F%90 |
袮 | 国土行政区画総覧典拠とあるが発見できず 「祢」の誤写か |
『倭玉篇』にあり | https://ja.wiktionary.org/wiki/%E8%A2%AE |
閠 | 国土行政区画総覧典拠とあるが発見できず 「閏」の誤字か |
宋版『広韻』の一部にあるが誤写か | https://ja.wiktionary.org/wiki/%E9%96%A0 |
駲 | 日本生命人名表典拠とあるが原典不在 | 『類聚名義抄』にあり | https://ja.wiktionary.org/wiki/%E9%A7%B2 |
- 「偶然に一致した例」とは歴史的資料を調査した結果、資料側の書き間違いなどで一致した例ということである。
- 読み方が与えられている文字もあるが、便宜上設定したものや誤字の元となった文字の読みを流用しているものであり幽霊文字自体の本当の読みではない、と思う。
- 「彁」という幽霊文字をめぐる記事があったので興味を持った人は読んでみて欲しい。誤読によって幽霊文字が生まれる理由がわかるだろう。
余談
彁を発音するぷーれ氏
風来のシレンRTA TM15分切る編11
風来のシレンRTA TM15分切る編11