データ分析でよく使われる統計ソフト(?)としてR言語(以下,R)と呼ばれるものがあります。
(正確には統計ソフトではなく,プログラム言語の1つだと思いますが・・・)
Rの魅力はたくさんありますが,お金をかけずに利用できるところが最も魅力的な部分ではないかと思います。
統計ソフトとしては例えば他にはSPSSというソフトが有名で,データさえあれば手軽に分析ができてとても便利ですが,基本機能だけでも35万円近い価格で(アカデミック版でも約15万),残念ながら導入の敷居は少し高い気がします。
(2021年4月現在)
そんな中で,Rの導入はお金をかけることなく行うことができる上に,統計解析の多くの手法を行うことができるのはとても魅力的です。
また,最近は気軽に大学の設備が利用できずに在宅で研究をしなければならなくなった方も増えていることも含めて,今後の需要はますます増えるのではないかと思います。
ちなみに,総務省統計局は小中高の先生が「統計」についての指導を行う際の補助教材としてRとExcelを紹介しています(総務省統計局-統計学習の指導のために-)。
一方,RはSPSSやExcelと異なりボタンをポチポチ押して操作する(GUI)のではなく,スクリプトと呼ばれる命令文を記述して分析を行います(CUI)。そのため,難易度が高いような気がします。
ですが,t検定や分散分析,重回帰分析しか基本的に使わない,というような感じで使用用途が限られている場合は,スクリプトもシンプルに書けるので雰囲気さえつかめれば案外なんとかなるような気もします。
といっても,私自身,統計もRもまだまだ全然わかっていないので勉強中です。
そんなわけで,気ままにRのアウトプットしていきたいなぁと思っておりRの記事をちょくちょく書いていきたいと思います。
想定している読み手は以下のような方です。
- Rは名前だけしか聞いたことないけど,いつか使ってみたいなぁと思っていた方
- 卒論研究とかで簡単な分析したいけど,分析環境がなくて困っている大学生
- 実務に役立てやすそうなプログラミング言語を学びたいと思っている人
直近で予定している内容としては以下のような内容です。
- RおよびRStudioのインストール(今回)
- RStudioの画面構成の説明
- Rにデータを読み込む
- t検定を行う~検定結果から特定の値を取り出す方法
- 分析の自動化
- グラフの作成
- グラフをパワーポイントに載せる方法
- ・・・その他いろいろ。
なお,使用している環境としては,R version 4.0.3 を Rstudio上で実施しておりますが,多分どんなバージョンでも大丈夫な内容だと思います。Rstudioは入れても入れなくても問題ないですが,スクリプトの記述や分析変数の管理,グラフ出力などもしやすくて便利なのでおすすめです。
RおよびRstudioのインストール手順
以下,簡単に紹介します。
面倒な会員登録などは一切ないので特に記載すべきことはないのですが,しいて挙げるとすれば,インストールの順番だけは気を付けた方がいいらしいです。
手順としては,Rのインストール→RStudioのインストールという順番です。
というのも,RStudioは,すでにインストールされているRを組み込んで使うことになるかららしいです。
Rのインストール
Rの公式サイトに紹介されている統計数理研究所のCRANにあるダウンロードボタンから入手できます。自分の使っているPCのOSに従って,windowsかMacかあるいはLinuxを選択します。
基本的には,一般的なアプリケーションのインストールと同じような画面が出てくると思うので,読みながら,特に変更せずにOKを押し続けるとインストールされます。
RStudioのインストール
Rがインストールできたら,そのままRstudioのインストールを行いましょう。
RStudioはRを使うための便利なツールが使いやすくまとめられてくる統合開発環境(IDE)というものです。
RStudioのダウンロードページから,RStudio Desktop(Free)のダウンロードボタンを選択してインストールファイルをダウンロードしたら,さきほど同様指示に従っていけばRStudioもインストールできます。
PC内に以下の2つのアイコンが追加されていたらOKです。
インストールの仕方の説明がすごく適当だし,インストール後の使い方・外観の説明については一切触れておりませんが,どこかのタイミングで触れたいと思います。