最適化計算によるかな配列『月見草』内検索 / 「正確な10万字と、誤差を含む1800万字どちらが優るか?」で検索した結果

検索 :
  • メニュー
    ...プル 運指の可視化 正確な10万字と、誤差を含む1800万字どちらが優るか? 3-gramの比較検討 「小梅配列」の旧版を解析する 配列の評価基準 Author mentaiko 2021-03-17 Visiter - リンク @wiki @wikiご利用ガイド 他のサービス 無料ホームページ作成 無料ブログ作成 2ch型掲示板レンタル 無料掲示板レンタル お絵かきレンタル 無料ソーシャルプロフ ここを編集
  • 正確な10万字と、誤差を含む1800万字どちらが優るか?
    この項目は141F氏に頂いた講評に対する私の見解です。月見草の「妥当性の検証」としてお読み下さい。 「月見草開発に用いた文章サンプル」で私は「計算によらないと三連接四連接の評価は一部しか出来ないのではないか」という事を数値的な根拠から申し上げました。それがどの程度必要なことかという判断は人それぞれであろうかと思います。いくら考慮してもあちらを立てればこちらが立たずではありますので、「そんなに考慮しても無駄、しなくとも良い配列が出来る」という可能性は勿論あります。ですけれど「月見草」では、それをある程度の精度で、最大限考慮するとしています。 「計算だけで良い配列ができるか」といわれますと「否」ということになります。こういった計算の前提には常に幾ばくかの誤りが含まれているのは勿論です。「妥当性の検証」が必要であって、これには「数値的検証」「試打」「感覚的に」など色々あるかと思い...
  • 3-gramの比較検討
    「正確な10万字と、誤差を含む1800万字どちらが優るのか」の項目では、N-gramの精度について、統計学的な理論を説明しました。今回は具体的に見てみようと思います。 (1)どれだけ大量のデータを集めても、その集め方による偏りはかなりある。 (2)すべての語彙が一様な確率分布をしてはいない。低頻度の語彙が続けて出現することが多々ある。 (3)上の(2)は無視して一様分布とみなしうるとしても、出現頻度には確率的な誤差が生じる。 (4)ご指摘頂いた変換誤差。 (1)~(4)まで全て込みの、出来上がりとしての3-gram上位を実際に比較してみました。 もっと低頻度の長いGRAMでも検討できると良いのですけれど、適当な比較対象が有りません。 141F氏による10万字…10万字サンプルにおける 3-gram 頻 度。 kouy氏による120万字100万字日本語かなn-...
  • 「小梅配列」の旧版を解析する
    計算によって配列を生成するには「数値評価で配列を評価できる」という前提があるのは勿論のことです。141F氏は日本語配列とデータ精度で、このように仰られています。 10万字サンプルという手法の確立とともに生まれた小梅配列 1.2 版は、同手跳躍や同指異鍵などの数値が小梅配列史上最も良好で、まさに「10万字サンプルに最適化された配列」でした。しかし、左手薬指が痛くなったり「さまざま」が打てなかったり「ですます体」に弱かったりと、10万字サンプルに特化したが故に世界の広さを知らない、言わば「世間知らずのお坊ちゃま」でもありました。 跳躍や同指異鍵などの数値指標は 1.3.x 版~1.4.x 版と版を経る毎に悪化の一途をたどりましたが、「10万字の限界」を乗り越えて汎用性を手に入れようと足掻いてきた積み重ねが、現在の蜂蜜小梅配列につながっていきます。10万字サンプルと評価打鍵、その...
  • 月見草開発に用いた文章サンプル
    月見草は1795万字の文章サンプルを元に計算されています。 文字数は濁点は0、捨て仮名も一文字としています。また「、。・ー」及び開き括弧がカウントされています。括弧は「『(をまとめて集計しました。 このサンプルを解析し8回以上出現した仮名の連接を、打鍵列として4連接まで評価対象としています。これは計算に用いたパソコンの限度に他なりません。これがどのような文字列かといいますと、文節をまたいで意味を成さないものも多々ありますが「くだらん」「げりをん」など出現率8回/1800万字となっています。 これでも評価可能な1480万字の内12%程度を切り捨てています。但し、最後の文字が二打鍵の場合はニ打鍵目については評価していますので、打鍵の90%程度は3つ前までを考慮した評価ができています。 これを出現率100万分の1で切り捨てますと、更に10%程を評価の対象外とすることになります...
  • トップページ
    最新版は今度こそ完成。ちょっと試す手が無くなって来ました。今度はグッバイが打てない件。ローマ字定義に埋め込むかな… 以下は古い記事です。 左上…単独に打鍵します。 左下…「ょ」を続けて打鍵します。 右上…「ゃ」を続けて打鍵します。 右下…「ゅ」を続けて打鍵します。 下…「っ」に続けて打鍵します。 オリジナルから少しだけ改変してあります。 実装方法 やまぶきR用定義ファイル月見草v2.yab …誤打鍵が多すぎると言われないよう確定後出力しますが、シフト面が足りず少しだけBSも出力します。 または、Google日本語入力のローマ字カスタマイズromantable.txt入力中の字面が気持ち悪いかも知れません。 スクリプトによる解析 数少ない数値で性能を評価しきれるものではないが、ある程度の指標として比較のため役に立つので、「...
  • スタンダードとすべき日本語入力法は存在しうるのか?
    この命題が真であるためには、少なくとも1~3が真でなければなりません。 1.健常で利手が同じであれば、手の運動性能にそれほど差があるわけでは無い。 2.大多数の人の入力する文章の差は、それほど大きくは無い。 3.思考を文章化し入力する際に快適なリズムに、大きな個人差は無い。 さて、1.2.については程度問題ですから、どう判断するかは人それぞれかと思います。 今回3.について少し考えてみたいと思います。考えてみたいと言いますのは、脳の働きについて解っていることはごく僅かである以上、尤もらしい仮説を提示する以上のことは出来ないからです。 まずヒトの脳には文字中枢というような物は有りません。文字が発明されてからまだ数千年しか経過していませんし、それが一般のものとなってから数百年でしか有りませんので、ヒトはまだ文字に適応するよう進化してはいないのです。 最近の...
  • 配列の評価基準
    「ちょっと、かな配列」の記事、配列の評価基準に関連して、月見草での評価関数について少し解説を致します。 「月見草」では「打鍵四連接」、具体的には「最近の打鍵三つ」を考慮した「今からの打鍵負荷」を唯一の評価基準としています。「花」のように「トータルでの指の負担の平均化」は、計算することも考えましたけれど、結局のところ全く計算していません。そんなことをしなくても、それなりに平均化されますので問題ないと評価したということが一つの理由です。もう一つの理由は同じ指を短期間に集中して使うことが問題で、それは四連接までの評価ならば、かなり避けることになるのでそれで十分、というよりも短期間でのばらつきは総計評価より少なくなる。トータルでの頻度を考慮しても、どのみち文章の傾向でかなり差が出てしまうので、例えば「一日の総打鍵」の中でのバランスはとれない。そのようなことのために他の性能を犠牲にするのはか...
  • プラグイン/ニュース
    ニュース @wikiのwikiモードでは #news(興味のある単語) と入力することで、あるキーワードに関連するニュース一覧を表示することができます 詳しくはこちらをご覧ください。 =>http //atwiki.jp/guide/17_174_ja.html たとえば、#news(wiki)と入力すると以下のように表示されます。 【クリスマス2021】高本彩花|ひなこい - ひなこい攻略Wiki - Gamerch(ゲーマチ) 【カウンターサイド】リセマラ当たりランキング - カウサイ攻略Wiki - Gamerch(ゲーマチ) ウィキペディアを作ったiMacが箱付きで競売に登場。予想落札価格は約96万円!(ギズモード・ジャパン) - Yahoo!ニュース - Yahoo!ニュース 【テイルズオブルミナリア】リセマラ当たりランキング - TOル...
  • 運指の可視化
    とりあえず出来たので公開します。 C言語のプログラムで数値を計算しネットワーク可視化ツールpajekで図にしています。 青四角の大きさ 緑四角の大きさ 線の太さ 打鍵頻度 同鍵連打 連接 同じような図が三枚ありますが一番上から、直接の連接、逆手の一打を挟んだ連接、逆手の二連打以上を挟んだものとなっています。同鍵連打は四倍の面積にしてあります。 余り賢い配列データ取り込みは出来ないので、とりあえず月2-263と月見草のものがあります。 まだ計算間違いなどあるかもしれません。 花配列 月配列2-263 幸花配列 月見草配列 ミズナラ配列v1 新下駄配列に合わせて、一音一拍とした。 「けいならべ」はシンプルな行段配列で、もともと同時打鍵を想定されているわけではありません。 基本設計の大きく異る配列は単純に比較できませんが、敢えてというな...
  • プラグイン/関連ブログ
    関連ブログ @wikiのwikiモードでは #bf(興味のある単語) と入力することで、あるキーワードに関連するブログ一覧を表示することができます 詳しくはこちらをご覧ください。 =>http //atwiki.jp/guide/17_161_ja.html たとえば、#bf(ゲーム)と入力すると以下のように表示されます。 #bf
  • プラグイン/編集履歴
    更新履歴 @wikiのwikiモードでは #recent(数字) と入力することで、wikiのページ更新履歴を表示することができます。 詳しくはこちらをご覧ください。 =>http //atwiki.jp/guide/17_117_ja.html たとえば、#recent(20)と入力すると以下のように表示されます。 取得中です。
  • プラグイン/コメント
    コメントプラグイン @wikiのwikiモードでは #comment() と入力することでコメントフォームを簡単に作成することができます。 詳しくはこちらをご覧ください。 =>http //atwiki.jp/guide/17_60_ja.html たとえば、#comment() と入力すると以下のように表示されます。 名前 コメント
  • プラグイン/アーカイブ
    アーカイブ @wikiのwikiモードでは #archive_log() と入力することで、特定のウェブページを保存しておくことができます。 詳しくはこちらをご覧ください。 =>http //atwiki.jp/guide/25_171_ja.html たとえば、#archive_log()と入力すると以下のように表示されます。 保存したいURLとサイト名を入力して"アーカイブログ"をクリックしてみよう サイト名 URL
  • プラグイン/動画(Youtube)
    動画(youtube) @wikiのwikiモードでは #video(動画のURL) と入力することで、動画を貼り付けることが出来ます。 詳しくはこちらをご覧ください。 =>http //atwiki.jp/guide/17_209_ja.html また動画のURLはYoutubeのURLをご利用ください。 =>http //www.youtube.com/ たとえば、#video(http //youtube.com/watch?v=kTV1CcS53JQ)と入力すると以下のように表示されます。
  • @wiki全体から「正確な10万字と、誤差を含む1800万字どちらが優るか?」で調べる

更新順にページ一覧表示 | 作成順にページ一覧表示 | ページ名順にページ一覧表示 | wiki内検索