Data Management

メモリの割当て

Stataはデータをメモリに読み込ませるオンメモリ・タイプのソフトウェア。先ずはStataの作業スペースとなるメモリの割当てが必要。
例 500MB割当て
set memory 500m

データ読み込み

  • Stataにデータを読み込む
use : Stataデータセットを読み込む
例 use test_dataset.dta, clear (拡張子.dtaとclearはともに省略可)
clearは、既にStataが読み込んでいるデータを上書きする形で読み込むのに必要なオプションコマンド。
insheet : テキストファイルなどを読み込む
例 insheet using test_dataset.csv (拡張子.csvは省略不可)
  • データを保存する
save : Stataデータセット(.dta)として保存
例 save test_dataset.dta, replace (拡張子.dtaとreplaceはともに省略可能)
replace、ローカルドライブなどに既に保存されているファイルに上書き保存するために必要なオプションコマンド。

  • データをStataから消去する
clear : Stataが読み込んでいるデータを消去する
※データはStataから消去されるだけであって、ローカルドライブなどに保存してあるdtaファイルは消去されない。
※一度clearしてしまうと、データが元の状態に戻らないので注意すること。

データを見る

  • 読み取り専用モードでデータを見る
browse : Stataが読み込んでいるデータを見ることができる。ただし、編集は不可。
応用例 browse if [varlist]==[値or文字列] ※if文で見たいデータを絞り込むことができる。

  • 編集モードでデータを見る
edit : Stataが読み込んでいるデータを編集可能な状態で見ることができる。EXCEL操作と同じ要領で編集可能。

列の操作

  • 新しい列を作る
generate : 新しいデータ項目(列)を作成
例 generate new_var=0 ※すべてのゼロ値で新しい列が作成される。
※データ属性などを作成と同時に設定することが可能。詳しくは、StataのHelpを参照のこと。

  • 新しい列を作る(応用)
egen : generateに多彩な機能が付加されたコマンド
例 egen new_var=cut(varname), at(#, #,..., #) ※#任意の数値でカットポイントを設定し、ランク分けなどが可能。
※egenには他にも多彩な機能があることから、詳しくはStataのHelpを参照のこと。

  • 列を削除する
drop : 単純に列を削除するコマンド
例 drop varlist
※if文で条件設定をすることも可能。

  • 列の内容を置き換える
replace : 既存の列の内容を置き換える。
例 replace varA=0 if varB==. ※varBがnullのときに、varAを0値に置き換える。

  • 列の順番を入れ替える
move : 列の順番を入れ替える。
例 move varZ varA ※varZをvarAの前に移動させる。

行の操作


行列の操作

最終更新:2011年01月10日 16:05