同時度数分布と相関係数一つ前との差分 - かずのたしなみ（統計環境Rによる） @Wiki

同時度数分布と相関係数 - (2006/06/09 (金) 19:47:06) の１つ前との変更点

追加された行は緑色になります。

削除された行は赤色になります。

とりあえず東証平均の収益率と同時期の新日鉄の収益率を入力する。（ここではエクセルに入力してあったデータをコピペした） tosho<-scan() 1: 1.9 0.0 -2.1 2.9 0.0 1.1 -0.3 1.6 2.7 1.5 -0.6 0.3 13: 3.3 -0.4 5.3 6.0 -0.1 4.7 1.0 -0.4 -6.1 0.4 0.4 2.9 25: 2.2 -4.9 -3.0 2.3 0.1 -1.3 -1.5 -0.1 -0.5 3.6 6.6 2.7 37: -0.9 0.7 5.0 2.4 0.9 3.1 1.5 2.0 2.4 -0.8 0.6 6.5 49: 6.1 -0.2 12.7 -1.0 -9.9 2.6 -4.1 7.0 1.4 4.6 2.0 4.3 61: Read 60 items shinnittetu<-scan() 1: 9.2 2.3 -6.5 9.0 5.3 -4.3 -3.7 7.0 7.6 1.4 -3.4 0.7 13: 2.8 -1.4 17.6 17.8 5.5 -1.9 1.9 9.0 -10.3 -10.3 -7.7 6.5 25: -0.6 -11.8 3.5 1.9 -5.5 -9.1 -5.7 2.3 -4.9 -0.8 8.0 6.7 37: -2.8 9.3 11.4 3.0 -7.5 2.5 -0.6 1.8 5.1 -2.3 -6.0 10.6 49: 0.0 -5.7 10.6 -0.6 -11.2 -3.8 -5.2 6.2 -4.2 2.1 0.6 4.7 61: Read 60 items コピペして変数に格納したデータをts()で、時系列データにしておく。 tosho<-ts(tosho,frequency=12,start=1980) tosho Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 1980 1.9 0.0 -2.1 2.9 0.0 1.1 -0.3 1.6 2.7 1.5 -0.6 0.3 1981 3.3 -0.4 5.3 6.0 -0.1 4.7 1.0 -0.4 -6.1 0.4 0.4 2.9 1982 2.2 -4.9 -3.0 2.3 0.1 -1.3 -1.5 -0.1 -0.5 3.6 6.6 2.7 1983 -0.9 0.7 5.0 2.4 0.9 3.1 1.5 2.0 2.4 -0.8 0.6 6.5 1984 6.1 -0.2 12.7 -1.0 -9.9 2.6 -4.1 7.0 1.4 4.6 2.0 4.3 shinnittetu<-ts(shinnittetu,frequency=12,start=1980) shinnittetu Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 1980 9.2 2.3 -6.5 9.0 5.3 -4.3 -3.7 7.0 7.6 1.4 -3.4 0.7 1981 2.8 -1.4 17.6 17.8 5.5 -1.9 1.9 9.0 -10.3 -10.3 -7.7 6.5 1982 -0.6 -11.8 3.5 1.9 -5.5 -9.1 -5.7 2.3 -4.9 -0.8 8.0 6.7 1983 -2.8 9.3 11.4 3.0 -7.5 2.5 -0.6 1.8 5.1 -2.3 -6.0 10.6 1984 0.0 -5.7 10.6 -0.6 -11.2 -3.8 -5.2 6.2 -4.2 2.1 0.6 4.7 東証平均と新日鉄のデータについて、データの範囲と大体の分布をみるために、5 数要約 fivenum() ：最小値・下側ヒンジ・中央値・上側ヒンジ・最大値を見る。 fivenum(tosho) [1] -9.90 -0.35 1.25 2.90 12.70 fivenum(shinnittetu) [1] -11.80 -4.25 1.05 5.85 17.80 さて、この２つのデータから同時度数分布を作ろう。まず連続変数をカテゴリー変数に変換するために使用するのは cut 関数である。区切り（－２０～２０、２刻み）を変数breaksにいれて breaks<-seq(-10,14,by=2) breaks2<-seq(-20,20,by=2) cut()を使う。なお。「○○以上□□未満」の場合は right = FALSE にする必要がある。 c_tosho<-cut(tosho,breaks,right=F) c_shinnittetu<-cut(sinnittetu,breaks2,right=F) カテゴリー化できたら、それらをつかってクロス表をつくる。これすなわち同時度数分布となっている。 table(c_tosho,c_shinnittetu) c_shinnittetu c_tosho [-12,-10) [-10,-8) [-8,-6) [-6,-4) [-4,-2) [-2,0) [0,2) [2,4) [-10,-8) 1 0 0 0 0 0 0 0 [-8,-6) 1 0 0 0 0 0 0 0 [-6,-4) 1 0 0 1 0 0 0 0 [-4,-2) 0 0 1 0 0 0 0 1 [-2,0) 0 1 0 3 4 2 0 1 [0,2) 1 0 2 4 0 1 3 1 [2,4) 0 0 0 0 1 2 3 3 [4,6) 0 0 0 0 0 1 0 1 [6,8) 0 0 0 0 0 0 1 0 [8,10) 0 0 0 0 0 0 0 0 [10,12) 0 0 0 0 0 0 0 0 [12,14) 0 0 0 0 0 0 0 0 c_shinnittetu c_tosho [4,6) [6,8) [8,10) [10,12) [12,14) [14,16) [16,18) [-10,-8) 0 0 0 0 0 0 0 [-8,-6) 0 0 0 0 0 0 0 [-6,-4) 0 0 0 0 0 0 0 [-4,-2) 0 0 0 0 0 0 0 [-2,0) 1 0 1 0 0 0 0 [0,2) 1 1 2 0 0 0 0 [2,4) 1 3 1 0 0 0 0 [4,6) 1 0 0 1 0 0 1 [6,8) 0 1 1 1 0 0 1 [8,10) 0 0 0 0 0 0 0 [10,12) 0 0 0 0 0 0 0 [12,14) 0 0 0 1 0 0 0

とりあえず東証平均の収益率と同時期の新日鉄の収益率を入力する。（ここではエクセルに入力してあったデータをコピペした） tosho<-scan() 1: 1.9 0.0 -2.1 2.9 0.0 1.1 -0.3 1.6 2.7 1.5 -0.6 0.3 13: 3.3 -0.4 5.3 6.0 -0.1 4.7 1.0 -0.4 -6.1 0.4 0.4 2.9 25: 2.2 -4.9 -3.0 2.3 0.1 -1.3 -1.5 -0.1 -0.5 3.6 6.6 2.7 37: -0.9 0.7 5.0 2.4 0.9 3.1 1.5 2.0 2.4 -0.8 0.6 6.5 49: 6.1 -0.2 12.7 -1.0 -9.9 2.6 -4.1 7.0 1.4 4.6 2.0 4.3 61: Read 60 items shinnittetu<-scan() 1: 9.2 2.3 -6.5 9.0 5.3 -4.3 -3.7 7.0 7.6 1.4 -3.4 0.7 13: 2.8 -1.4 17.6 17.8 5.5 -1.9 1.9 9.0 -10.3 -10.3 -7.7 6.5 25: -0.6 -11.8 3.5 1.9 -5.5 -9.1 -5.7 2.3 -4.9 -0.8 8.0 6.7 37: -2.8 9.3 11.4 3.0 -7.5 2.5 -0.6 1.8 5.1 -2.3 -6.0 10.6 49: 0.0 -5.7 10.6 -0.6 -11.2 -3.8 -5.2 6.2 -4.2 2.1 0.6 4.7 61: Read 60 items コピペして変数に格納したデータをts()で、時系列データにしておく。 tosho<-ts(tosho,frequency=12,start=1980) tosho Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 1980 1.9 0.0 -2.1 2.9 0.0 1.1 -0.3 1.6 2.7 1.5 -0.6 0.3 1981 3.3 -0.4 5.3 6.0 -0.1 4.7 1.0 -0.4 -6.1 0.4 0.4 2.9 1982 2.2 -4.9 -3.0 2.3 0.1 -1.3 -1.5 -0.1 -0.5 3.6 6.6 2.7 1983 -0.9 0.7 5.0 2.4 0.9 3.1 1.5 2.0 2.4 -0.8 0.6 6.5 1984 6.1 -0.2 12.7 -1.0 -9.9 2.6 -4.1 7.0 1.4 4.6 2.0 4.3 shinnittetu<-ts(shinnittetu,frequency=12,start=1980) shinnittetu Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 1980 9.2 2.3 -6.5 9.0 5.3 -4.3 -3.7 7.0 7.6 1.4 -3.4 0.7 1981 2.8 -1.4 17.6 17.8 5.5 -1.9 1.9 9.0 -10.3 -10.3 -7.7 6.5 1982 -0.6 -11.8 3.5 1.9 -5.5 -9.1 -5.7 2.3 -4.9 -0.8 8.0 6.7 1983 -2.8 9.3 11.4 3.0 -7.5 2.5 -0.6 1.8 5.1 -2.3 -6.0 10.6 1984 0.0 -5.7 10.6 -0.6 -11.2 -3.8 -5.2 6.2 -4.2 2.1 0.6 4.7 東証平均と新日鉄のデータについて、データの範囲と大体の分布をみるために、5 数要約 fivenum() ：最小値・下側ヒンジ・中央値・上側ヒンジ・最大値を見る。 fivenum(tosho) [1] -9.90 -0.35 1.25 2.90 12.70 fivenum(shinnittetu) [1] -11.80 -4.25 1.05 5.85 17.80 さて、この２つのデータから同時度数分布を作ろう。まず連続変数をカテゴリー変数に変換するために使用するのは cut 関数である。区切り（－２０～２０、２刻み）を変数breaksにいれて breaks<-seq(-10,14,by=2) breaks2<-seq(-12,18,by=2) cut()を使う。なお。「○○以上□□未満」の場合は right = FALSE にする必要がある。 c_tosho<-cut(tosho,breaks,right=F) c_shinnittetu<-cut(sinnittetu,breaks2,right=F) カテゴリー化できたら、それらをつかってクロス表をつくる。 table(c_tosho,c_shinnittetu) これすなわち同時度数分布となっている。 c_shinnittetu c_tosho [-12,-10) [-10,-8) [-8,-6) [-6,-4) [-4,-2) [-2,0) [0,2) [2,4) [-10,-8) 1 0 0 0 0 0 0 0 [-8,-6) 1 0 0 0 0 0 0 0 [-6,-4) 1 0 0 1 0 0 0 0 [-4,-2) 0 0 1 0 0 0 0 1 [-2,0) 0 1 0 3 4 2 0 1 [0,2) 1 0 2 4 0 1 3 1 [2,4) 0 0 0 0 1 2 3 3 [4,6) 0 0 0 0 0 1 0 1 [6,8) 0 0 0 0 0 0 1 0 [8,10) 0 0 0 0 0 0 0 0 [10,12) 0 0 0 0 0 0 0 0 [12,14) 0 0 0 0 0 0 0 0 c_shinnittetu c_tosho [4,6) [6,8) [8,10) [10,12) [12,14) [14,16) [16,18) [-10,-8) 0 0 0 0 0 0 0 [-8,-6) 0 0 0 0 0 0 0 [-6,-4) 0 0 0 0 0 0 0 [-4,-2) 0 0 0 0 0 0 0 [-2,0) 1 0 1 0 0 0 0 [0,2) 1 1 2 0 0 0 0 [2,4) 1 3 1 0 0 0 0 [4,6) 1 0 0 1 0 0 1 [6,8) 0 1 1 1 0 0 1 [8,10) 0 0 0 0 0 0 0 [10,12) 0 0 0 0 0 0 0 [12,14) 0 0 0 1 0 0 0

表示オプション

横に並べて表示：

変化行の前後のみ表示：

かずのたしなみ（統計環境Rによる） @Wiki

記事メニュー

メニュー

Ｒというソフト

更新履歴

取得中です。

サイト内検索

カウンタ

人気記事ランキング

同時度数分布と相関係数

最近更新されたページ

人気Wikiランキング

atwikiでよく見られているWikiのランキングです。新しい情報を発見してみよう！

全体ページランキング

最近アクセスの多かったページランキングです。話題のページを見に行こう！