atwiki-logo
  • 新規作成
    • 新規ページ作成
    • 新規ページ作成(その他)
      • このページをコピーして新規ページ作成
      • このウィキ内の別ページをコピーして新規ページ作成
      • このページの子ページを作成
    • 新規ウィキ作成
  • 編集
    • ページ編集
    • ページ編集(簡易版)
    • ページ名変更
    • メニュー非表示でページ編集
    • ページの閲覧/編集権限変更
    • ページの編集モード変更
    • このページにファイルをアップロード
    • メニューを編集
    • 右メニューを編集
  • バージョン管理
    • 最新版変更点(差分)
    • 編集履歴(バックアップ)
    • アップロードファイル履歴
    • ページ操作履歴
  • ページ一覧
    • ページ一覧
    • このウィキのタグ一覧
    • このウィキのタグ(更新順)
    • このページの全コメント一覧
    • このウィキの全コメント一覧
    • おまかせページ移動
  • RSS
    • このウィキの更新情報RSS
    • このウィキ新着ページRSS
  • ヘルプ
    • ご利用ガイド
    • Wiki初心者向けガイド(基本操作)
    • このウィキの管理者に連絡
    • 運営会社に連絡(不具合、障害など)
R入門
  • ウィキ募集バナー
  • 目安箱バナー
  • 操作ガイド
  • 新規作成
  • 編集する
  • 全ページ一覧
  • 登録/ログイン
ページ一覧
R入門
  • ウィキ募集バナー
  • 目安箱バナー
  • 操作ガイド
  • 新規作成
  • 編集する
  • 全ページ一覧
  • 登録/ログイン
ページ一覧
R入門
  • 新規作成
  • 編集する
  • 登録/ログイン
  • 管理メニュー
管理メニュー
  • 新規作成
    • 新規ページ作成
    • 新規ページ作成(その他)
      • このページをコピーして新規ページ作成
      • このウィキ内の別ページをコピーして新規ページ作成
      • このページの子ページを作成
    • 新規ウィキ作成
  • 編集
    • ページ編集
    • ページ編集(簡易版)
    • ページ名変更
    • メニュー非表示でページ編集
    • ページの閲覧/編集権限変更
    • ページの編集モード変更
    • このページにファイルをアップロード
    • メニューを編集
    • 右メニューを編集
  • バージョン管理
    • 最新版変更点(差分)
    • 編集履歴(バックアップ)
    • アップロードファイル履歴
    • ページ操作履歴
  • ページ一覧
    • このウィキの全ページ一覧
    • このウィキのタグ一覧
    • このウィキのタグ一覧(更新順)
    • このページの全コメント一覧
    • このウィキの全コメント一覧
    • おまかせページ移動
  • RSS
    • このwikiの更新情報RSS
    • このwikiの新着ページRSS
  • ヘルプ
    • ご利用ガイド
    • Wiki初心者向けガイド(基本操作)
    • このウィキの管理者に連絡
    • 運営会社に連絡する(不具合、障害など)
  • atwiki
  • R入門
  • 統計学

R入門

統計学

最終更新:2023年10月14日 23:58

r-intro

- view
管理者のみ編集可

目次

  • 目次
  • 基本
    • 平均を求める
    • 範囲を求める
    • χ2分布におけるパーセント点
    • χ^2分布におけるp値
  • 正規分布
    • 正規分布の確率密度関数の値を得る
    • 正規分布の分布関数の値を得る
    • 正規分布における分布関数の下側、上側、両側の値を求める
    • 正規分布における-σからσ(-2σから2σ)の確率(面積)を求める
    • 正規分布における下側パーセント点、上側パーセント点、両側パーセント点を求める。
    • 確率変数 X が正規分布 N(μ, σ^2) に従うときの確率 P を求める
    • 正規分布におけるパーセント点を求める
    • 正規分布におけるp値を求める
  • t分布
    • t分布における確率密度関数の値を求める
    • t分布における分布関数の値を求める
    • t分布におけるパーセント点を求める
    • t分布におけるパーセント点を求める
    • t分布におけるp値を求める
  • F分布
    • F分布における分布関数を求める
    • F分布におけるパーセント点を求める
    • F分布におけるパーセント点を求める
    • F分布におけるp値を求める
    • ガンマ関数の値を求める

基本

平均を求める

mean関数を使う。

> x <- c(1, 2, 3, 4, 5, 6, 7)
> mean(x)
[1] 4

範囲を求める

統計学における「範囲」とは、データのとる値の最大値から最小値を引いた差のこと。Rにはこれを直接求める関数は標準で搭載されていないが、それに近い動作をする関数はある。

range関数は、引数に与えたベクトルの最小値と最大値をベクトルで返す。これを利用して範囲を求めることができる。ただしmax関数とmin関数を組み合わせた計算と手順に大差はない。

> d <- c(161, 165, 160, 164, 165, 163, 164, 162, 164, 170)
> range(d)
[1] 160 170
> print(range(d)[2] - range(d)[1])  # 範囲
[1] 10
> print(max(d) - min(d))  # 範囲
[1] 10

χ 2 分布におけるパーセント点

> # 自由度5のχ^2分布における、下側5パーセント点
> qchisq(0.05, 5)
[1] 1.145476
> # 自由度5のχ^2分布における、上側5パーセント点
> qchisq(0.05, 5, lower.tail = FALSE)
[1] 11.0705
> qchisq(1 - 0.05, 5)
[1] 11.0705

χ^2分布におけるp値

> # 自由度5のχ^2分布における、確率変数が12のときの下側p値
> pchisq(12, 5)
[1] 0.9652122
> # 自由度5のχ^2分布における、確率変数が12のときの上側p値
> pchisq(12, 5, lower.tail = FALSE)
[1] 0.03478778

正規分布

正規分布の確率密度関数の値を得る

dnorm関数を使う。よく見かける平均0、標準偏差が1の正規分布に従う、確率密度関数のグラフは以下のとおり。

> x <- seq(-5, 5, 0.1)
> y <- dnorm(x, mean = 0, sd = 1)
> plot(x, y, type = "l")

この正規分布で確率変数(横軸)が0のときの確率密度関数の値(縦軸の値)は、図より0.4程度と推察されるが、それをより正確に求めるにはdnorm関数で次のようにする。

> dnorm(0.0, mean = 0, sd = 1)
[1] 0.3989423

dnorm関数は、meanオプションを省略すると0、sdオプションを省略すると1が指定されたものとして計算をする。よって、この例では次のようにしても同じ。

> dnorm(0.0)
[1] 0.3989423

正規分布の分布関数の値を得る

pnorm関数を使う。平均が0、標準偏差が1の正規分布における-1における分布関数は以下のとおり。

> pnorm(-1, mean = 0, sd = 1)
[1] 0.1586553

この0.1586553…という値は、以下の確率密度関数のグラフにおける、緑色で塗った箇所の面積である。

> x <- seq(-5, 5, 0.1)
> y <- dnorm(x, mean = 0, sd = 1)
> xp <- seq(-5, -1, 0.1)
> yp <- dnorm(xp, mean = 0, sd = 1)
> plot(x, y, type = "l")
> polygon(c(xp, -1), c(yp, 0), col = "green")

この関数を使うと、いわゆる1σ(いちしぐま)の範囲(平均値±標準偏差)の値が出る確率を簡単に求めることができる。分布関数とは、確率変数が指定の値より小さい値をとるときの確率であるため、σ(上記の例では1)における分布関数の値から、-σ(上記の例では-1)における分布関数の値を引けばよい。

> pnorm(1, mean = 0, sd = 1) - pnorm(-1, mean = 0, sd = 1)
[1] 0.6826895

標準正規分布(平均0、標準偏差1)において、平均値±標準偏差の範囲になる確率は0.6826895…(約68%)である。

正規分布における分布関数の下側、上側、両側の値を求める

pnorm関数を使う。以下は、平均10、分散3^2(標準偏差3)の正規分布において、確率変数が15の場合の下側、上側、両側を求めた例。なお、値は下側0.9522、上側0.04779、両側0.09558。

> pnorm(15, mean = 10, sd = 3)
[1] 0.9522096
> pnorm(15, mean = 10, sd = 3, lower.tail = FALSE)
[1] 0.04779035
> 1 - pnorm(15, mean = 10, sd = 3)
[1] 0.04779035
> pnorm(15, mean = 10, sd = 3, lower.tail = FALSE) * 2
[1] 0.0955807
> (1 - pnorm(15, mean = 10, sd = 3)) * 2
[1] 0.0955807

特に何も指定しなければ分布関数の定義のとおりに下側を返す。上側を得るにはlower.tailオプションをFALSEとするか、全体を1から引く。両側は上側を2倍する。

正規分布における-σからσ(-2σから2σ)の確率(面積)を求める

pnorm関数を使う。正規分布における累積分布関数(-∞から指定の確率変数までの定積分)はpnorm関数で得られ、それを使うことで確率(面積)を求めることができる。

正規分布はσは68%、2σは95%とよく言われるが、それを求めてみる。

平均0、標準偏差が1の正規分布について、-∞から-1まで、-∞から1までそれぞれ定積分(確率(面積))を求める。

> pnorm(-1)
[1] 0.1586553
> pnorm(1)
[1] 0.8413447

いわゆるσ=1というのは、確率変数が-1から1までの範囲の定積分(面積)であるから、後者から前者を引けばよい。

> pnorm(1) - pnorm(-1)
[1] 0.6826895

2σが95%も同様に求まる。

> pnorm(2) - pnorm(-2)
[1] 0.9544997

正規分布における下側パーセント点、上側パーセント点、両側パーセント点を求める。

qnorm関数を使う。以下は、平均10、分散3^2(標準偏差3)の正規分布における、下側5パーセント点、上側5パーセント点、両側5パーセント点を求めた例。それぞれ下側5.065、上側14.93、両側15.88である。

> qnorm(0.05, mean = 10, sd = 3)
[1] 5.065439
> qnorm(0.05, mean = 10, sd = 3, lower.tail = FALSE)
[1] 14.93456
> qnorm(1 - 0.05, mean = 10, sd = 3)
[1] 14.93456
> qnorm(0.05 / 2, mean = 10, sd = 3, lower.tail = FALSE)
[1] 15.87989
> qnorm(1 - 0.05 / 2, mean = 10, sd = 3)
[1] 15.87989

5%であれば、0.05と指定する。

何も指定しなければ、下側パーセント点の値を返す。

上側パーセント点はlower.tailオプションをFALSEとするか「1 - 0.05」とする。

両側パーセント点は「0.05 / 2」や「1 - 0.05 / 2」のように2で割るのがポイント。

確率変数 X が正規分布 N(μ, σ^2) に従うときの確率 P を求める

確率変数 X が正規分布 N(13, 4^2) に従うときの、次の確率 P それぞれ求める。

(1) P (7≦X≦19), (2) P (1≦X≦25), (3) P (X≦20)

なお、答えはそれぞれ 0.8663…, 0.9973…, 0.9599… である。

> # (1)
> pnorm(19, 13, 4) - pnorm(7, 13, 4)
[1] 0.8663856
> # (2)
> pnorm(25, 13, 4) - pnorm(1, 13, 4)
[1] 0.9973002
> # (3)
> pnorm(20, 13, 4)
[1] 0.9599408

正規分布におけるパーセント点を求める

> # 平均10、分散3^2(標準偏差3)の正規分布における下側5パーセント点
> qnorm(0.05, 10, 3)
[1] 5.065439
> # 平均10、分散3^2(標準偏差3)の正規分布における上側5パーセント点
> qnorm(0.05, 10, 3, lower.tail = FALSE)
[1] 14.93456
> # 平均10、分散3^2(標準偏差3)の正規分布における両側5パーセント点
> qnorm(0.05 / 2, 10, 3, lower.tail = FALSE)
[1] 15.87989

正規分布におけるp値を求める

> # 平均10、分散3^2(標準偏差3)の正規分布における確率変数が15のときの下側p値
> pnorm(15, 10, 3)
[1] 0.9522096
> # 平均10、分散3^2(標準偏差3)の正規分布における確率変数が15のときの上側p値
> pnorm(15, 10, 3, lower.tail = FALSE)
[1] 0.04779035
> # 平均10、分散3^2(標準偏差3)の正規分布における確率変数が15のときの両側p値
> pnorm(15, 10, 3, lower.tail = FALSE) * 2
[1] 0.0955807

t分布

t分布における確率密度関数の値を求める

dt関数を使う。以下は確率変数が-5~5の範囲において、自由度1と5のt分布における確率密度関数の値を求めてグラフにした例。

> xx <- seq(-5, 5, 0.1)
> plot(xx, dt(xx, 5), type = "l", col = "blue")
> lines(xx, dt(xx, 1), col = "black")
> text(1.5, 0.3, "n=5", col = "blue")
> text(2, 0.2, "n=1")

t分布における分布関数の値を求める

pt関数を使う。以下は自由度5のt分布において、確率変数Xが2における上側(=0.05096974…)、両側(=0.1019395…)の分布関数の値を求めた例。

> pt(2, 5, lower.tail = FALSE)
[1] 0.05096974
> 2 * pt(2, 5, lower.tail = FALSE)
[1] 0.1019395

t分布におけるパーセント点を求める

qt関数を使う。以下は自由度5のt分布において、上側5%点(=2.015048…)、両側5%点(=2.570582…)を求めた例。

> qt(1 - 0.05, 5)
[1] 2.015048
> qt(1 - 0.05 / 2, 5)
[1] 2.570582

t分布におけるパーセント点を求める

> # 自由度5のt分布における上側5パーセント点
> qt(1 - 0.05, 5)
[1] 2.015048
> # 自由度5のt分布における両側5パーセント点
> qt(1 - 0.05 / 2, 5)
[1] 2.570582

t分布におけるp値を求める

> # 自由度5のt分布における、確率変数が2のときの上側p値
> pt(2, 5, lower.tail = FALSE)
[1] 0.05096974
> # 自由度5のt分布における、確率変数が2のときの両側p値
> pt(2, 5, lower.tail = FALSE) * 2
[1] 0.1019395

pt関数はデフォルトでは下側p値を返す。上側p値を得たい場合はlower.tailをFALSEにする。両側p値は上側p値を2倍する。

F分布

F分布における分布関数を求める

pf関数を使う。分子の自由度が5、分母の自由度が8のときに、確率変数Xが0.21の場合の下側(=0.05117798…)、確率変数Xが3.7の場合の上側(=0.04991671…)の分布関数を求める。下側を求めるときはlower.tailオプションをTRUE、上側を求めるときはlower.tailオプションをFALSEにする。

> pf(0.21, 5, 8, lower.tail = TRUE)
[1] 0.05117798
> pf(3.69, 5, 8, lower.tail = FALSE)
[1] 0.04991671

この0.05117798…と0.04991671…は、それぞれF分布を図示した図でいうところの、下側は黄緑色の面積。上側は青色の面積である。

F分布におけるパーセント点を求める

qf関数を使う。以下は、分子の自由度が1、分母の自由度が54の場合の下側1パーセント点(=0.000159…)、上側1パーセント点(=7.128819…)を求めた例。デフォルトでは下側パーセント点を返す。上側パーセント点を求めるには、lower.tailオプションをFALSEとする。

> qf(0.01, 1, 54)
[1] 0.0001585493
> qf(1 - 0.01, 1, 54)
[1] 7.128819
> qf(0.01, 1, 54, lower.tail = FALSE)
[1] 7.128819

F分布におけるパーセント点を求める

> # 自由度5,7のF分布における、下側5パーセント点
> qf(0.05, 5, 7)
[1] 0.2050915
> # 自由度5,7のF分布における、上側5パーセント点
> qf(0.05, 5, 7, lower.tail = FALSE)
[1] 3.971523
> qf(1 - 0.05, 5, 7)
[1] 3.971523

F分布におけるp値を求める

> # 自由度5,7のF分布における、確率変数が2のときの下側p値
> pf(2, 5, 7)
[1] 0.8043268
> # 自由度5,7のF分布における、確率変数が2のときの上側p値
> pf(2, 5, 7, lower.tail = FALSE)
[1] 0.1956732

ガンマ関数の値を求める

gamma関数を使う。有名なガンマ関数の性質であるΓ(n) = (n - 1)!(n≧2,整数)について、

> gamma(1)
[1] 1
> gamma(2:5)
[1]  1  2  6 24

となる。以下も有名な値(Γ(1/2)=√π)。

> gamma(1 / 2)
[1] 1.772454
> sqrt(pi)
[1] 1.772454

名前:
コメント:
「統計学」をウィキ内検索
LINE
シェア
Tweet
添付ファイル
  • dnorm.png
  • dt.png
  • fdist2.png
  • pnorm.png
R入門
記事メニュー

メニュー

  • トップページ
  • Rとは
  • Rを使ってみる
  • 画面出力と入力
  • 変数とオブジェクト
  • ベクトル
  • 演算子と制御構文
  • 数と式
  • 文字と文字列
  • 正規表現
  • 日付と時刻
  • データフレーム
  • tidyverse
  • リスト
  • ファイルの入出力
  • ファイル・ディレクトリ
  • 実行とデバッグ
  • 数学
  • 行列
  • 関数
  • 統計学
  • 統計解析
  • 数値計算
  • 応用
  • 時系列解析
  • 地理空間情報
  • Rの操作
  • データベース
  • パッケージ

  • 環境
  • インターネット
  • 作図
  • 画像

  • 本の計算を再現
  • セイバーメトリクス
  • その他


ここを編集
記事メニュー2

更新履歴

取得中です。

ここを編集
人気記事ランキング
  1. ファイル・ディレクトリ
  2. 入門 統計解析 [医学・自然科学編](東京図書)
もっと見る
最近更新されたページ
  • 1日前

    リスト
  • 19日前

    行列
  • 22日前

    tidyverse
  • 60日前

    インターネット
  • 71日前

    日付と時刻
  • 71日前

    応用
  • 71日前

    文字と文字列
  • 88日前

    変数とオブジェクト
  • 131日前

    その他
  • 132日前

    画像
もっと見る
人気記事ランキング
  1. ファイル・ディレクトリ
  2. 入門 統計解析 [医学・自然科学編](東京図書)
もっと見る
最近更新されたページ
  • 1日前

    リスト
  • 19日前

    行列
  • 22日前

    tidyverse
  • 60日前

    インターネット
  • 71日前

    日付と時刻
  • 71日前

    応用
  • 71日前

    文字と文字列
  • 88日前

    変数とオブジェクト
  • 131日前

    その他
  • 132日前

    画像
もっと見る
ウィキ募集バナー
新規Wikiランキング

最近作成されたWikiのアクセスランキングです。見るだけでなく加筆してみよう!

  1. MadTown GTA (Beta) まとめウィキ
  2. GTA5 MADTOWN(β)まとめウィキ
  3. R.E.P.O. 日本語解説Wiki
  4. シュガードール情報まとめウィキ
  5. SYNDUALITY Echo of Ada 攻略 ウィキ
  6. ガンダムGQuuuuuuX 乃木坂46部@wiki
  7. ドタバタ王子くん攻略サイト
  8. 星飼いの詩@ ウィキ
  9. パズル&コンクエスト(Puzzles&Conquest)攻略Wiki
  10. ありふれた職業で世界最強 リベリオンソウル @ ウィキ
もっと見る
人気Wikiランキング

atwikiでよく見られているWikiのランキングです。新しい情報を発見してみよう!

  1. アニヲタWiki(仮)
  2. ストグラ まとめ @ウィキ
  3. ゲームカタログ@Wiki ~名作からクソゲーまで~
  4. 初音ミク Wiki
  5. 機動戦士ガンダム バトルオペレーション2攻略Wiki 3rd Season
  6. 発車メロディーwiki
  7. MadTown GTA (Beta) まとめウィキ
  8. 検索してはいけない言葉 @ ウィキ
  9. オレカバトル アプリ版 @ ウィキ
  10. Grand Theft Auto V(グランドセフトオート5)GTA5 & GTAオンライン 情報・攻略wiki
もっと見る
全体ページランキング

最近アクセスの多かったページランキングです。話題のページを見に行こう!

  1. anbrella(餡ブレラ) - ストグラ まとめ @ウィキ
  2. アルフォート ウェスカー - ストグラ まとめ @ウィキ
  3. 参加者一覧 - ストグラ まとめ @ウィキ
  4. 栖家幡 華憐 - ストグラ まとめ @ウィキ
  5. キャプテン わきを - ストグラ まとめ @ウィキ
  6. アーモンド サラザール - ストグラ まとめ @ウィキ
  7. ギャング - ストグラ まとめ @ウィキ
  8. 敵情報_第2章 - モンスター烈伝オレカバトル2@wiki
  9. オザワ ハヤマサ - ストグラ まとめ @ウィキ
  10. 刃牙 りえる - ストグラ まとめ @ウィキ
もっと見る

  • このWikiのTOPへ
  • 全ページ一覧
  • アットウィキTOP
  • 利用規約
  • プライバシーポリシー

2019 AtWiki, Inc.