lazy diary

統計とその周辺

統計検定1級に合格しました

合格したので感想を。合格した勉強法の1例として参考になれば。
2018年11月下旬に統計検定1級を受験して統計数理と統計応用(理工学を選択)の両方に合格しました。以下、その受験記です。
http://www.toukei-kentei.jp/wp-content/uploads/ToukeiAkari-300x123.png*1



背景

自分のことを少しだけ書きます。
普段は数学を専攻している大学生です。とは言っても大学で統計学を学んだことはなく、2018年3月ごろから趣味で勉強を始めました。2018年5月には統計検定2級に合格しています。良ければその受験記も見て下さい。
統計検定2級に合格しました - lazy diary
さて、「2級に合格したなら次は1級でしょ」ということで受験しました。準1級を飛ばしたのは単純に時期が合わなかったからです。


統計検定1級の概要

年1回11月下旬開催の試験です。試験範囲をチェックしましょう。
www.toukei-kentei.jp
試験内容は統計数理と統計応用の2つに分かれています。
この両方に合格すると統計検定1級合格となります。

・統計数理

試験日の午前に行なわれる90分の筆記試験です。60/100点で合格です。
5つの問題から3問を選んで解きます。確率分布に関わる様々な計算がメインです。
確率密度関数の計算、確率母関数を用いた計算、検定論が頻出です。

・統計応用

試験日の午後に行なわれる90分の筆記試験です。60/100点で合格です。
統計応用は「人文科学」「社会科学」「理工学」「医薬生物学」の中から1つの分野を試験申し込み時に選んで解くことになります。
事前に選んだ分野の5つの問題から3問を選んで解きます。



勉強したこと

勉強期間は3ヵ月くらいです。2ヵ月ほど本で勉強、残りは演習といった感じですかね。

さて、まず参考書選びです。1級に合格したというブログを調べるとちらほら出てくるのでそこにオススメしてある参考書と、あとは公式サイトにある合格者の声にリストアップされている参考書を書店でチェックしました。
www.toukei-kentei.jp
その中で私が選んだのがこちらの本。

・現代数理統計学の基礎 (共立講座 数学の魅力)

現代数理統計学の基礎 (共立講座 数学の魅力)

現代数理統計学の基礎 (共立講座 数学の魅力)

この本が無ければ合格は無かったです。それくらい良い本でした。(※ゴリゴリの数式に慣れていない方は少々難しいかもしれません。)
統計検定1級統計数理の範囲となっているが本には掲載されていない事項の一部を著者がWebページに補足資料として載せています。それくらい統計検定に最適化された本です。この本で統計数理のほとんどの試験範囲を抑えることができます。以下、『現代数理統計学の基礎』の目次です。

第1章 確率
第2章 確率分布と期待値
第3章 代表的な確率分布
第4章 多次元確率変数の分布
第5章 標本分布とその近似
第6章 統計的推定
第7章 統計的仮説検定
第8章 統計的区間推定
第9章 線形回帰モデル
第10章 リスク最適性の理論
第11章 計算統計学の方法
第12章 発展的トピック:確率過程
引用:https://www.kyoritsu-pub.co.jp/bookdetail/9784320111660

第1章から第9章までは十分に理解しておくべきでしょう。試験問題の半分くらいは適切に確率密度関数や期待値、分散などの計算ができるかどうかです。この計算がスムーズにできるかどうかが鍵だと思います。
第10章「リスク最適性の理論」は飛ばしても問題ないと思います。
第11章、第12章についても理解しておくべきでしょう。ただし、マルチンゲールといった試験に出ないであろう内容もあるので試験範囲と照らし合わせて必要に応じていくつか飛ばしても良いと思います。

この本を読むのに1ヵ月と少しかかりました。さっそく過去問に取り組みます。2017年の統計数理の問題を解きました。自己採点をしたら合格ライン上の点数だったと思います。それより時間が足りません。明らかに演習不足なのを実感しましたが、同時に解説を読めば理解できるということも分かったので統計数理の勉強はひとまず終了にしました。



次に統計応用の勉強をします。私は「理工学」分野を選択しました。理由は統計数理とさほど範囲が変わらないからです。過去問を見てもらえば分かると思います。「理工学」以外の分野に明るい場合はそれを選べば良いと思います。特にそういうのがないですという場合は、「理工学」分野を選ぶのが無難だと私は思います。
参考書は次の2冊です。

・多変量解析入門――線形から非線形

多変量解析入門――線形から非線形へ

多変量解析入門――線形から非線形へ

1 はじめに
2 線形回帰モデル
3 非線形回帰モデル
4 ロジスティック回帰モデル
5 モデル評価基準
6 判別分析
7 ベイズ判別
8 サポートベクターマシーン
9 主成分分析
10 クラスター分析
引用:https://www.iwanami.co.jp/book/b265441.html

この本はかなり丁寧に記述されています。統計検定云々は関係なく、多変量解析を学びたい人にはオススメしたい1冊でした。
(※もし「試験日まで時間がない」とか「とにかく近道して受かりたい」といった場合はこの本は飛ばしても問題ないでしょう。これら多変量解析の内容は準1級および1級試験の試験範囲に含まれています。従って試験に出題されてもおかしくないです。実際に過去問を見てみると準1級試験ではこれらの出題事例があります。例えば、2018年準1級試験ではマーク問題(not記述式)として線形判別やSVMが出題されています。一方で1級試験では私の知る限り出題事例が無く、せいぜい線形重回帰くらいだったと思います。)

・日本統計学会公式認定 統計検定1級対応 統計学

日本統計学会公式認定 統計検定1級対応 統計学

日本統計学会公式認定 統計検定1級対応 統計学

  • 作者: 二宮嘉行,大西俊郎,小林景,椎名洋,笛田薫,田中研太郎,岡田謙介,大屋幸輔,廣瀬英雄,折笠秀樹,日本統計学会,竹村彰通,岩崎学
  • 出版社/メーカー: 東京図書
  • 発売日: 2013/04/08
  • メディア: 単行本
  • この商品を含むブログ (5件) を見る

第I部 統計数理
第1章 確率と確率変数
第2章 種々の確率分布
第3章 統計的推定
第4章 仮説検定
第5章 主なデータ解析手法

第II部統計応用
第6章 統計応用共通手法
第7章 人文科学分野キーワード
第8章 社会科学分野キーワード
第9章 理工学分野キーワード
第10章 医学生物学分野キーワード
引用:http://www.tokyo-tosho.co.jp/books/ISBN978-4-489-02150-3.html

次は公式の参考書です。上2冊で学習できていない分散分析や直交表などを補いつつ、これまで学んだ事を一気に復習します。この本は某レビューで酷評されているようですが、私は使い方の問題だと思っていて、この本でイチから学ぼうとすると確かに難しい気がしますが、復習に使うならコンパクトに試験範囲がまとまっているので良い本だと思います。



さて、これで統計応用の範囲も全てチェックしました。
私は時間にゆとりがあったのでこの間にもいくつか別の本をやっていますが、これだけで十分だと思います。後はひたすら演習です。時間をきっちり計って過去問を解きまくりましょう。
試験日まで時間がある人はこのあたりで気づくと思うのですが、年1回しか試験がないので過去問が少ないです。もっと演習をしたいという人にはこれが良いかもしれません。
Exam past papers
王立統計学会(RSS)が実施している試験の過去問です。これも統計検定公式サイトに載っている合格者の声で知りました。このうち「Graduate Diploma」の過去問を解いてみるのが良いと思います。難易度は1級よりやや簡単ですが、問題に慣れるのには十分でしょう。実際に似たような問題が1級試験でも出題されています。



受験当日

受験票に写真を貼ることと、電卓、時計を忘れないようにしましょう。
会場に行きます。最初にアンケートがあるので回答しましょう。
さっそく統計数理の試験開始です。どこかで見たことがある問題を見つけ1問サクッと解答。残り2問は最後がダメでしたがそれ以外は一通り解けたと思います。そしてお昼休憩を挟んで、午後から統計応用の試験です。
計算量が多そうな条件付き正規分布の計算問題はスルーして、とにかく分かる問題を落とさずしっかり得点するという気持ちで解いていきました。

12月半ばにWeb合格発表が行われ無事合格しました。



最後に

統計検定1級を通して、いわゆる古典的な統計は一通り学べたと思っています。今はDeep Learningが流行っていますが、確率関数の操作だったりはそれらを理解するための基本なので、その理解度をチェックする上で統計検定を受験してみてはいかがでしょうか。

*1:統計検定の公式キャラクターらしいです http://www.toukei-kentei.jp/info/toukeiakari/