最新版は今度こそ完成。ちょっと試す手が無くなって来ました。今度はグッバイが打てない件。ローマ字定義に埋め込むかな…
以下は古い記事です。
左上…単独に打鍵します。
左下…「ょ」を続けて打鍵します。
右上…「ゃ」を続けて打鍵します。
右下…「ゅ」を続けて打鍵します。
下…「っ」に続けて打鍵します。
オリジナルから少しだけ改変してあります。
実装方法
スクリプトによる解析
数少ない数値で性能を評価しきれるものではないが、ある程度の指標として比較のため役に立つので、「月」「花」の系統を中心に、表にまとめてみた。
『みかログ』「配列の評価ツール改良その3」を使用させて頂いた。
文章サンプルは、定番ということで?、
新JIS配列の「羅生門」+「緋のエチュード」、
Wikipedia秀逸な記事、
2ch新JIS配列・月配列 6打鍵目、
第26回財務省の政策評価の在り方に関する懇談会 議事録(財務省)、
飛鳥カナ配列 ☆未来の子供たちへの贈り物☆より 配列評価のためのデータについて考える他、
それぞれについて調べてみた。その結果がこちら
配列解析結果3.pdf
手法の似通った「ミズナラ配列」との差は実に微妙です。今回の解析は句読点を無視しているようで…その影響のほうがずっと大きそうなのでありますが、それをおいて比較しますと、下の表のようになります。
|
定義 |
打鍵数 |
上段使用頻度 |
同指 |
跳躍 |
@: |
Y |
左右 |
小指使用頻度 |
月見草配列 |
清濁別置+外来音定義8 |
100 |
30% |
4.5% |
3.5% |
使う |
使わない |
45:55 |
少 |
ミズナラ配列 |
清濁別置 |
103~105 |
24% |
3.5% |
2.5% |
使わない |
使う |
47:53 |
多 |
上段は月見草では「WEIO」を非常に多く使います。
跳躍はどちらも「VNM」絡みが多いかと思います。(月見草では「WE」→「B」も悪くはないとしています。)
左右は句読点込み。いずれの数値もアバウトです。
構想。
一ないしに二打鍵にかなを配置。
具体的な配列は計算により求める。
打鍵4連接までを(なるべく)評価。
「ゃゅょっ」を一等地に置き、通常あり得ない組み合わせに別のかなを当てる。たとえば「いゃ」→「け」、「っの」→「ね」という具合に。言い換えるなら、「ゃゅょっ」とシフトキー併用ということである。
濁点を設けないとすると記号を含めて80を超えるので、同手シフトも少々使うことになる。
打鍵4連接までとした十分性は、例えば、「右手跳躍、その間に左手二連打」といった場合に跳躍にペナルティーを与える事ができるということである。
必要性は、計算力からの要請である。すなわち、三段最大32鍵を使用するとして、その4連接の組み合わせ数は32^4≒100万。この評価値を1Biteで表すとして1MBである。これを予め全て計算してメモリ上に置くとして、CPUのキャッシュが十分に働く限度である。
必要な基礎データ。
キーの連接評価。基本的には打鍵に要する時間であるが、速く打てても疲れるとか、指が痛むと言ったこともある。(例えば、KUと打つのは、正しく構えていれば時間を要さないが、手に優しいとは思わない。)実測と計算の都合、また主観的な評価を交えて設定する。
かなの連接データ。4連接までをある程度の精度で。kouy氏が公開されている100万字データは貴重なものであるが、検討の結果、4連接のデータとして使うには精度が不十分と判断した。そこで1000万字を目標に収集することとした。
「ですます」調のサンプルとして青空文庫から600万字ほど。さらにもっと丁寧なビジネス文書・手紙文書など100万字を集めた。また「だ。である。」調のサンプルとして、Wikipediaの記事・ニュース記事など収集中である。その他、法律・契約書的な固い文体、またブログ・掲示板などのサンプルもあったほうが良いであろう。…作業中…
…編集中
最終更新:2021年04月03日 08:06