atwiki-logo
  • 新規作成
    • 新規ページ作成
    • 新規ページ作成(その他)
      • このページをコピーして新規ページ作成
      • このウィキ内の別ページをコピーして新規ページ作成
      • このページの子ページを作成
    • 新規ウィキ作成
  • 編集
    • ページ編集
    • ページ編集(簡易版)
    • ページ名変更
    • メニュー非表示でページ編集
    • ページの閲覧/編集権限変更
    • ページの編集モード変更
    • このページにファイルをアップロード
    • メニューを編集
    • 右メニューを編集
  • バージョン管理
    • 最新版変更点(差分)
    • 編集履歴(バックアップ)
    • アップロードファイル履歴
    • ページ操作履歴
  • ページ一覧
    • ページ一覧
    • このウィキのタグ一覧
    • このウィキのタグ(更新順)
    • このページの全コメント一覧
    • このウィキの全コメント一覧
    • おまかせページ移動
  • RSS
    • このウィキの更新情報RSS
    • このウィキ新着ページRSS
  • ヘルプ
    • ご利用ガイド
    • Wiki初心者向けガイド(基本操作)
    • このウィキの管理者に連絡
    • 運営会社に連絡(不具合、障害など)
R入門
  • ウィキ募集バナー
  • 目安箱バナー
  • 操作ガイド
  • 新規作成
  • 編集する
  • 全ページ一覧
  • 登録/ログイン
ページ一覧
R入門
  • ウィキ募集バナー
  • 目安箱バナー
  • 操作ガイド
  • 新規作成
  • 編集する
  • 全ページ一覧
  • 登録/ログイン
ページ一覧
R入門
  • 新規作成
  • 編集する
  • 登録/ログイン
  • 管理メニュー
管理メニュー
  • 新規作成
    • 新規ページ作成
    • 新規ページ作成(その他)
      • このページをコピーして新規ページ作成
      • このウィキ内の別ページをコピーして新規ページ作成
      • このページの子ページを作成
    • 新規ウィキ作成
  • 編集
    • ページ編集
    • ページ編集(簡易版)
    • ページ名変更
    • メニュー非表示でページ編集
    • ページの閲覧/編集権限変更
    • ページの編集モード変更
    • このページにファイルをアップロード
    • メニューを編集
    • 右メニューを編集
  • バージョン管理
    • 最新版変更点(差分)
    • 編集履歴(バックアップ)
    • アップロードファイル履歴
    • ページ操作履歴
  • ページ一覧
    • このウィキの全ページ一覧
    • このウィキのタグ一覧
    • このウィキのタグ一覧(更新順)
    • このページの全コメント一覧
    • このウィキの全コメント一覧
    • おまかせページ移動
  • RSS
    • このwikiの更新情報RSS
    • このwikiの新着ページRSS
  • ヘルプ
    • ご利用ガイド
    • Wiki初心者向けガイド(基本操作)
    • このウィキの管理者に連絡
    • 運営会社に連絡する(不具合、障害など)
  • atwiki
  • R入門
  • 統計学

R入門

統計学

最終更新:2023年10月14日 23:58

r-intro

- view
管理者のみ編集可

目次

  • 目次
  • 基本
    • 平均を求める
    • 範囲を求める
    • χ2分布におけるパーセント点
    • χ^2分布におけるp値
  • 正規分布
    • 正規分布の確率密度関数の値を得る
    • 正規分布の分布関数の値を得る
    • 正規分布における分布関数の下側、上側、両側の値を求める
    • 正規分布における-σからσ(-2σから2σ)の確率(面積)を求める
    • 正規分布における下側パーセント点、上側パーセント点、両側パーセント点を求める。
    • 確率変数 X が正規分布 N(μ, σ^2) に従うときの確率 P を求める
    • 正規分布におけるパーセント点を求める
    • 正規分布におけるp値を求める
  • t分布
    • t分布における確率密度関数の値を求める
    • t分布における分布関数の値を求める
    • t分布におけるパーセント点を求める
    • t分布におけるパーセント点を求める
    • t分布におけるp値を求める
  • F分布
    • F分布における分布関数を求める
    • F分布におけるパーセント点を求める
    • F分布におけるパーセント点を求める
    • F分布におけるp値を求める
    • ガンマ関数の値を求める

基本

平均を求める

mean関数を使う。

> x <- c(1, 2, 3, 4, 5, 6, 7)
> mean(x)
[1] 4

範囲を求める

統計学における「範囲」とは、データのとる値の最大値から最小値を引いた差のこと。Rにはこれを直接求める関数は標準で搭載されていないが、それに近い動作をする関数はある。

range関数は、引数に与えたベクトルの最小値と最大値をベクトルで返す。これを利用して範囲を求めることができる。ただしmax関数とmin関数を組み合わせた計算と手順に大差はない。

> d <- c(161, 165, 160, 164, 165, 163, 164, 162, 164, 170)
> range(d)
[1] 160 170
> print(range(d)[2] - range(d)[1])  # 範囲
[1] 10
> print(max(d) - min(d))  # 範囲
[1] 10

χ 2 分布におけるパーセント点

> # 自由度5のχ^2分布における、下側5パーセント点
> qchisq(0.05, 5)
[1] 1.145476
> # 自由度5のχ^2分布における、上側5パーセント点
> qchisq(0.05, 5, lower.tail = FALSE)
[1] 11.0705
> qchisq(1 - 0.05, 5)
[1] 11.0705

χ^2分布におけるp値

> # 自由度5のχ^2分布における、確率変数が12のときの下側p値
> pchisq(12, 5)
[1] 0.9652122
> # 自由度5のχ^2分布における、確率変数が12のときの上側p値
> pchisq(12, 5, lower.tail = FALSE)
[1] 0.03478778

正規分布

正規分布の確率密度関数の値を得る

dnorm関数を使う。よく見かける平均0、標準偏差が1の正規分布に従う、確率密度関数のグラフは以下のとおり。

> x <- seq(-5, 5, 0.1)
> y <- dnorm(x, mean = 0, sd = 1)
> plot(x, y, type = "l")

この正規分布で確率変数(横軸)が0のときの確率密度関数の値(縦軸の値)は、図より0.4程度と推察されるが、それをより正確に求めるにはdnorm関数で次のようにする。

> dnorm(0.0, mean = 0, sd = 1)
[1] 0.3989423

dnorm関数は、meanオプションを省略すると0、sdオプションを省略すると1が指定されたものとして計算をする。よって、この例では次のようにしても同じ。

> dnorm(0.0)
[1] 0.3989423

正規分布の分布関数の値を得る

pnorm関数を使う。平均が0、標準偏差が1の正規分布における-1における分布関数は以下のとおり。

> pnorm(-1, mean = 0, sd = 1)
[1] 0.1586553

この0.1586553…という値は、以下の確率密度関数のグラフにおける、緑色で塗った箇所の面積である。

> x <- seq(-5, 5, 0.1)
> y <- dnorm(x, mean = 0, sd = 1)
> xp <- seq(-5, -1, 0.1)
> yp <- dnorm(xp, mean = 0, sd = 1)
> plot(x, y, type = "l")
> polygon(c(xp, -1), c(yp, 0), col = "green")

この関数を使うと、いわゆる1σ(いちしぐま)の範囲(平均値±標準偏差)の値が出る確率を簡単に求めることができる。分布関数とは、確率変数が指定の値より小さい値をとるときの確率であるため、σ(上記の例では1)における分布関数の値から、-σ(上記の例では-1)における分布関数の値を引けばよい。

> pnorm(1, mean = 0, sd = 1) - pnorm(-1, mean = 0, sd = 1)
[1] 0.6826895

標準正規分布(平均0、標準偏差1)において、平均値±標準偏差の範囲になる確率は0.6826895…(約68%)である。

正規分布における分布関数の下側、上側、両側の値を求める

pnorm関数を使う。以下は、平均10、分散3^2(標準偏差3)の正規分布において、確率変数が15の場合の下側、上側、両側を求めた例。なお、値は下側0.9522、上側0.04779、両側0.09558。

> pnorm(15, mean = 10, sd = 3)
[1] 0.9522096
> pnorm(15, mean = 10, sd = 3, lower.tail = FALSE)
[1] 0.04779035
> 1 - pnorm(15, mean = 10, sd = 3)
[1] 0.04779035
> pnorm(15, mean = 10, sd = 3, lower.tail = FALSE) * 2
[1] 0.0955807
> (1 - pnorm(15, mean = 10, sd = 3)) * 2
[1] 0.0955807

特に何も指定しなければ分布関数の定義のとおりに下側を返す。上側を得るにはlower.tailオプションをFALSEとするか、全体を1から引く。両側は上側を2倍する。

正規分布における-σからσ(-2σから2σ)の確率(面積)を求める

pnorm関数を使う。正規分布における累積分布関数(-∞から指定の確率変数までの定積分)はpnorm関数で得られ、それを使うことで確率(面積)を求めることができる。

正規分布はσは68%、2σは95%とよく言われるが、それを求めてみる。

平均0、標準偏差が1の正規分布について、-∞から-1まで、-∞から1までそれぞれ定積分(確率(面積))を求める。

> pnorm(-1)
[1] 0.1586553
> pnorm(1)
[1] 0.8413447

いわゆるσ=1というのは、確率変数が-1から1までの範囲の定積分(面積)であるから、後者から前者を引けばよい。

> pnorm(1) - pnorm(-1)
[1] 0.6826895

2σが95%も同様に求まる。

> pnorm(2) - pnorm(-2)
[1] 0.9544997

正規分布における下側パーセント点、上側パーセント点、両側パーセント点を求める。

qnorm関数を使う。以下は、平均10、分散3^2(標準偏差3)の正規分布における、下側5パーセント点、上側5パーセント点、両側5パーセント点を求めた例。それぞれ下側5.065、上側14.93、両側15.88である。

> qnorm(0.05, mean = 10, sd = 3)
[1] 5.065439
> qnorm(0.05, mean = 10, sd = 3, lower.tail = FALSE)
[1] 14.93456
> qnorm(1 - 0.05, mean = 10, sd = 3)
[1] 14.93456
> qnorm(0.05 / 2, mean = 10, sd = 3, lower.tail = FALSE)
[1] 15.87989
> qnorm(1 - 0.05 / 2, mean = 10, sd = 3)
[1] 15.87989

5%であれば、0.05と指定する。

何も指定しなければ、下側パーセント点の値を返す。

上側パーセント点はlower.tailオプションをFALSEとするか「1 - 0.05」とする。

両側パーセント点は「0.05 / 2」や「1 - 0.05 / 2」のように2で割るのがポイント。

確率変数 X が正規分布 N(μ, σ^2) に従うときの確率 P を求める

確率変数 X が正規分布 N(13, 4^2) に従うときの、次の確率 P それぞれ求める。

(1) P (7≦X≦19), (2) P (1≦X≦25), (3) P (X≦20)

なお、答えはそれぞれ 0.8663…, 0.9973…, 0.9599… である。

> # (1)
> pnorm(19, 13, 4) - pnorm(7, 13, 4)
[1] 0.8663856
> # (2)
> pnorm(25, 13, 4) - pnorm(1, 13, 4)
[1] 0.9973002
> # (3)
> pnorm(20, 13, 4)
[1] 0.9599408

正規分布におけるパーセント点を求める

> # 平均10、分散3^2(標準偏差3)の正規分布における下側5パーセント点
> qnorm(0.05, 10, 3)
[1] 5.065439
> # 平均10、分散3^2(標準偏差3)の正規分布における上側5パーセント点
> qnorm(0.05, 10, 3, lower.tail = FALSE)
[1] 14.93456
> # 平均10、分散3^2(標準偏差3)の正規分布における両側5パーセント点
> qnorm(0.05 / 2, 10, 3, lower.tail = FALSE)
[1] 15.87989

正規分布におけるp値を求める

> # 平均10、分散3^2(標準偏差3)の正規分布における確率変数が15のときの下側p値
> pnorm(15, 10, 3)
[1] 0.9522096
> # 平均10、分散3^2(標準偏差3)の正規分布における確率変数が15のときの上側p値
> pnorm(15, 10, 3, lower.tail = FALSE)
[1] 0.04779035
> # 平均10、分散3^2(標準偏差3)の正規分布における確率変数が15のときの両側p値
> pnorm(15, 10, 3, lower.tail = FALSE) * 2
[1] 0.0955807

t分布

t分布における確率密度関数の値を求める

dt関数を使う。以下は確率変数が-5~5の範囲において、自由度1と5のt分布における確率密度関数の値を求めてグラフにした例。

> xx <- seq(-5, 5, 0.1)
> plot(xx, dt(xx, 5), type = "l", col = "blue")
> lines(xx, dt(xx, 1), col = "black")
> text(1.5, 0.3, "n=5", col = "blue")
> text(2, 0.2, "n=1")

t分布における分布関数の値を求める

pt関数を使う。以下は自由度5のt分布において、確率変数Xが2における上側(=0.05096974…)、両側(=0.1019395…)の分布関数の値を求めた例。

> pt(2, 5, lower.tail = FALSE)
[1] 0.05096974
> 2 * pt(2, 5, lower.tail = FALSE)
[1] 0.1019395

t分布におけるパーセント点を求める

qt関数を使う。以下は自由度5のt分布において、上側5%点(=2.015048…)、両側5%点(=2.570582…)を求めた例。

> qt(1 - 0.05, 5)
[1] 2.015048
> qt(1 - 0.05 / 2, 5)
[1] 2.570582

t分布におけるパーセント点を求める

> # 自由度5のt分布における上側5パーセント点
> qt(1 - 0.05, 5)
[1] 2.015048
> # 自由度5のt分布における両側5パーセント点
> qt(1 - 0.05 / 2, 5)
[1] 2.570582

t分布におけるp値を求める

> # 自由度5のt分布における、確率変数が2のときの上側p値
> pt(2, 5, lower.tail = FALSE)
[1] 0.05096974
> # 自由度5のt分布における、確率変数が2のときの両側p値
> pt(2, 5, lower.tail = FALSE) * 2
[1] 0.1019395

pt関数はデフォルトでは下側p値を返す。上側p値を得たい場合はlower.tailをFALSEにする。両側p値は上側p値を2倍する。

F分布

F分布における分布関数を求める

pf関数を使う。分子の自由度が5、分母の自由度が8のときに、確率変数Xが0.21の場合の下側(=0.05117798…)、確率変数Xが3.7の場合の上側(=0.04991671…)の分布関数を求める。下側を求めるときはlower.tailオプションをTRUE、上側を求めるときはlower.tailオプションをFALSEにする。

> pf(0.21, 5, 8, lower.tail = TRUE)
[1] 0.05117798
> pf(3.69, 5, 8, lower.tail = FALSE)
[1] 0.04991671

この0.05117798…と0.04991671…は、それぞれF分布を図示した図でいうところの、下側は黄緑色の面積。上側は青色の面積である。

F分布におけるパーセント点を求める

qf関数を使う。以下は、分子の自由度が1、分母の自由度が54の場合の下側1パーセント点(=0.000159…)、上側1パーセント点(=7.128819…)を求めた例。デフォルトでは下側パーセント点を返す。上側パーセント点を求めるには、lower.tailオプションをFALSEとする。

> qf(0.01, 1, 54)
[1] 0.0001585493
> qf(1 - 0.01, 1, 54)
[1] 7.128819
> qf(0.01, 1, 54, lower.tail = FALSE)
[1] 7.128819

F分布におけるパーセント点を求める

> # 自由度5,7のF分布における、下側5パーセント点
> qf(0.05, 5, 7)
[1] 0.2050915
> # 自由度5,7のF分布における、上側5パーセント点
> qf(0.05, 5, 7, lower.tail = FALSE)
[1] 3.971523
> qf(1 - 0.05, 5, 7)
[1] 3.971523

F分布におけるp値を求める

> # 自由度5,7のF分布における、確率変数が2のときの下側p値
> pf(2, 5, 7)
[1] 0.8043268
> # 自由度5,7のF分布における、確率変数が2のときの上側p値
> pf(2, 5, 7, lower.tail = FALSE)
[1] 0.1956732

ガンマ関数の値を求める

gamma関数を使う。有名なガンマ関数の性質であるΓ(n) = (n - 1)!(n≧2,整数)について、

> gamma(1)
[1] 1
> gamma(2:5)
[1]  1  2  6 24

となる。以下も有名な値(Γ(1/2)=√π)。

> gamma(1 / 2)
[1] 1.772454
> sqrt(pi)
[1] 1.772454

名前:
コメント:
「統計学」をウィキ内検索
LINE
シェア
Tweet
添付ファイル
  • dnorm.png
  • dt.png
  • fdist2.png
  • pnorm.png
R入門
記事メニュー

メニュー

  • トップページ
  • Rとは
  • Rを使ってみる
  • 画面出力と入力
  • 変数とオブジェクト
  • ベクトル
  • 演算子と制御構文
  • 数と式
  • 文字と文字列
  • 正規表現
  • 日付と時刻
  • データフレーム
  • tidyverse
  • リスト
  • ファイルの入出力
  • ファイル・ディレクトリ
  • 実行とデバッグ
  • 数学
  • 行列
  • 関数
  • 統計学
  • 統計解析
  • 数値計算
  • 応用
  • 時系列解析
  • 地理空間情報
  • Rの操作
  • データベース
  • パッケージ

  • 環境
  • インターネット
  • 作図
  • 画像

  • 本の計算を再現
  • セイバーメトリクス
  • その他


ここを編集
記事メニュー2

更新履歴

取得中です。

ここを編集
最近更新されたページ
  • 14日前

    データフレーム
  • 17日前

    リスト
  • 41日前

    行列
  • 44日前

    tidyverse
  • 81日前

    インターネット
  • 93日前

    日付と時刻
  • 93日前

    応用
  • 93日前

    文字と文字列
  • 110日前

    変数とオブジェクト
  • 153日前

    その他
もっと見る
最近更新されたページ
  • 14日前

    データフレーム
  • 17日前

    リスト
  • 41日前

    行列
  • 44日前

    tidyverse
  • 81日前

    インターネット
  • 93日前

    日付と時刻
  • 93日前

    応用
  • 93日前

    文字と文字列
  • 110日前

    変数とオブジェクト
  • 153日前

    その他
もっと見る
ウィキ募集バナー
新規Wikiランキング

最近作成されたWikiのアクセスランキングです。見るだけでなく加筆してみよう!

  1. MadTown GTA (Beta) まとめウィキ
  2. R.E.P.O. 日本語解説Wiki
  3. シュガードール情報まとめウィキ
  4. 機動戦士ガンダム EXTREME VS.2 INFINITEBOOST wiki
  5. SYNDUALITY Echo of Ada 攻略 ウィキ
  6. ソードランページ @ 非公式wiki
  7. 星飼いの詩@ ウィキ
  8. ドラゴンボール Sparking! ZERO 攻略Wiki
  9. GTA5 MADTOWN(β)まとめウィキ
  10. シミュグラ2 @ ウィキ
もっと見る
人気Wikiランキング

atwikiでよく見られているWikiのランキングです。新しい情報を発見してみよう!

  1. アニヲタWiki(仮)
  2. ストグラ まとめ @ウィキ
  3. ゲームカタログ@Wiki ~名作からクソゲーまで~
  4. 初音ミク Wiki
  5. 機動戦士ガンダム バトルオペレーション2攻略Wiki 3rd Season
  6. Grand Theft Auto V(グランドセフトオート5)GTA5 & GTAオンライン 情報・攻略wiki
  7. 発車メロディーwiki
  8. 検索してはいけない言葉 @ ウィキ
  9. MadTown GTA (Beta) まとめウィキ
  10. オレカバトル アプリ版 @ ウィキ
もっと見る
全体ページランキング

最近アクセスの多かったページランキングです。話題のページを見に行こう!

  1. 参加者一覧 - ストグラ まとめ @ウィキ
  2. 魔獣トゲイラ - バトルロイヤルR+α ファンフィクション(二次創作など)総合wiki
  3. 金 - アニヲタWiki(仮)
  4. 868 - ストグラ まとめ @ウィキ
  5. シャア専用ヅダ - アニヲタWiki(仮)
  6. ジロリアンコピペ - ラーメン二郎 wiki
  7. モンスター一覧_第2章 - モンスター烈伝オレカバトル2@wiki
  8. サーヴァント/一覧/クラス別 - Fate/Grand Order @wiki 【FGO】
  9. ロスサントス警察 - ストグラ まとめ @ウィキ
  10. 参加者一覧 - MadTown GTA (Beta) まとめウィキ
もっと見る

  • このWikiのTOPへ
  • 全ページ一覧
  • アットウィキTOP
  • 利用規約
  • プライバシーポリシー

2019 AtWiki, Inc.