lazy diary

統計とその周辺

統計検定1級に合格しました

合格したので感想を。合格した勉強法の1例として参考になれば。
2018年11月下旬に統計検定1級を受験して統計数理と統計応用(理工学を選択)の両方に合格しました。以下、その受験記です。
http://www.toukei-kentei.jp/wp-content/uploads/ToukeiAkari-300x123.png*1



背景

自分のことを少しだけ書きます。数学専攻の大学生です。とは言っても大学で統計学の講義を受けたことは無くて、2018年3月ごろから趣味で勉強を始めました。
2018年5月には統計検定2級に合格しました。
統計検定2級に合格しました - lazy diary
さて、「2級に合格したなら次は1級でしょ」ということで受験しました。準1級を飛ばしたのは単純に時期が合わなかったからです。


統計検定1級の概要

年1回11月下旬開催の試験です。試験範囲をチェックしましょう。
www.toukei-kentei.jp
試験内容は統計数理と統計応用の2つに分かれています。
この両方に合格すると統計検定1級合格となります。

・統計数理

試験日の午前に行なわれる90分の筆記試験です。60/100点で合格です。
5つの問題から3問を選んで解きます。確率分布に関わる様々な計算がメインです。
確率密度関数の計算、確率母関数を用いた計算、検定論が頻出です。

・統計応用

試験日の午後に行なわれる90分の筆記試験です。60/100点で合格です。
統計応用は「人文科学」「社会科学」「理工学」「医薬生物学」の中から1つの分野を試験申し込み時に選んで解くことになります。
事前に選んだ分野について5つの問題から3問を選んで解きます。



勉強したこと

さて、まず参考書選びです。1級に合格したというブログを調べるとちらほら出てくるのでそこにオススメしてある参考書と、あとは公式サイトにある合格者の声にリストアップされている参考書を書店でチェックしました。
www.toukei-kentei.jp
この合格者の声がとても充実しているのがありがたいです。その中で私が選んだのがこちらの本。

・現代数理統計学の基礎 (共立講座 数学の魅力)

現代数理統計学の基礎 (共立講座 数学の魅力)

現代数理統計学の基礎 (共立講座 数学の魅力)

この本が無ければ合格は無かったです。それくらい良い本でした。 *2
この本で統計数理のほとんどの試験範囲を抑えることができます。以下、『現代数理統計学の基礎』の目次です。

第1章 確率
第2章 確率分布と期待値
第3章 代表的な確率分布
第4章 多次元確率変数の分布
第5章 標本分布とその近似
第6章 統計的推定
第7章 統計的仮説検定
第8章 統計的区間推定
第9章 線形回帰モデル
第10章 リスク最適性の理論
第11章 計算統計学の方法
第12章 発展的トピック:確率過程
引用:https://www.kyoritsu-pub.co.jp/bookdetail/9784320111660

第1章から第9章までは十分に理解しておくべきでしょう。試験問題の半分くらいは適切に確率密度関数や期待値、分散などの計算ができるかどうかです。この計算がスムーズにできるかどうかが鍵だと思います。
第10章「リスク最適性の理論」は試験範囲の観点では飛ばしても問題ないと思います。
第11章、第12章についても理解しておくべきですが、試験に出ないであろう内容もあるので試験範囲と照らし合わせて必要に応じてという感じで。
※演習問題は統計検定1級より難しいので出来なくてもあまり気にしてなかったです。


面倒くさいと思わず手を動かしてノートに証明をしていきます。一通り読んだ後、さっそく統計数理の過去問に取り組みます。自己採点をしたら合格ライン上の点数だったと思いますが、何より時間が足らなくてあたふたしました。明らかに演習不足なのを実感しましたが、同時に解説を読めば理解できるということも分かったので統計数理の勉強はひとまず終了にしました。




次に統計応用の勉強をします。私は「理工学」分野を選択しました。理由は統計数理とさほど範囲が変わらないからです。過去問を見てもらえば分かると思います。「理工学」以外の分野に明るい場合はそれを選べば良いと思います。特にそういうのがないですという場合は、「理工学」分野を選ぶのが無難だと私は思います。
参考書は次の2冊です。

・多変量解析入門――線形から非線形

多変量解析入門――線形から非線形へ

多変量解析入門――線形から非線形へ

1 はじめに
2 線形回帰モデル
3 非線形回帰モデル
4 ロジスティック回帰モデル
5 モデル評価基準
6 判別分析
7 ベイズ判別
8 サポートベクターマシーン
9 主成分分析
10 クラスター分析
引用:https://www.iwanami.co.jp/book/b265441.html

統計検定云々は関係なく、多変量解析を学びたい人にはオススメしたい1冊でした。 *3

・日本統計学会公式認定 統計検定1級対応 統計学

日本統計学会公式認定 統計検定1級対応 統計学

日本統計学会公式認定 統計検定1級対応 統計学

  • 作者: 二宮嘉行,大西俊郎,小林景,椎名洋,笛田薫,田中研太郎,岡田謙介,大屋幸輔,廣瀬英雄,折笠秀樹,日本統計学会,竹村彰通,岩崎学
  • 出版社/メーカー: 東京図書
  • 発売日: 2013/04/08
  • メディア: 単行本
  • この商品を含むブログ (5件) を見る

第I部 統計数理
第1章 確率と確率変数
第2章 種々の確率分布
第3章 統計的推定
第4章 仮説検定
第5章 主なデータ解析手法

第II部統計応用
第6章 統計応用共通手法
第7章 人文科学分野キーワード
第8章 社会科学分野キーワード
第9章 理工学分野キーワード
第10章 医学生物学分野キーワード
引用:http://www.tokyo-tosho.co.jp/books/ISBN978-4-489-02150-3.html

次は公式の参考書です。上2冊で学習できていない分散分析や直交表などを補いつつ、これまで学んだ事を一気に復習します。*4



さて、これで統計応用の範囲も全てチェックしました。
私は時間にゆとりがあったのでこの間にもいくつか別の本をやっていますが、これだけで十分だと思います。後はひたすら演習です。時間をきっちり計って過去問を解きまくりましょう。
試験日まで時間がある人はこのあたりで気づくと思うのですが、年1回しか試験がないので過去問が少ないです。もっと演習をしたいという人にはこれが良いかもしれません。
https://www.rss.org.uk/RSS/pro_dev/Examinations/key_information/RSS/pro_dev/Examinations_sub/key_information/Exam_past.aspx
これも統計検定公式サイトに載っている合格者の声で知りました。このうち「Graduate Diploma」の過去問を解いてみるのが良いと思います。難易度は1級よりやや簡単ですが、問題に慣れるのには十分でしょう。実際に似たような問題が1級試験でも出題されています。



受験当日

受験票に写真を貼ることと、電卓、時計を忘れないようにしましょう。
会場に行きます。最初にアンケートがあるので回答しましょう。
さっそく統計数理の試験開始です。どこかで見たことがある問題を見つけ1問サクッと解答。残り2問は最後がダメでしたがそれ以外は一通り解けたと思います。そしてお昼休憩を挟んで、午後から統計応用の試験です。
計算量が多そうな条件付き正規分布の計算問題はスルーして、とにかく分かる問題を落とさずしっかり得点するという気持ちで解いていきました。

12月半ばにWeb合格発表が行われ無事合格しました。



最後に

統計検定という名前がついていますが試されていることの半分は「統計の基本的な数式を素早く記述できますか」という点だと思いました。
機械学習等に必要な土台となる数理統計の話を知るためには持って来いだと思います。これくらいゴリゴリの数式に慣れておけばPRMLとかもさほど苦にはならないと思います(ちょっと言い過ぎかもしれない)。


・更新履歴
2018/12/17. 記事作成
2019/07/22. 一部表現を変更

*1:統計検定の公式キャラクターらしいです http://www.toukei-kentei.jp/info/toukeiakari/

*2: 私は数学畑の人なので苦ではなかったのですが、これはいわゆる数式が沢山並んでいる本で、普段あまりこの手の本を手に取らない方は読むのに少々苦労するかもしれません。

*3: もし「試験日まで時間がない」とか「とにかく近道して受かりたい」といった場合はこの本は飛ばしてもさほど問題がないような気がしています。これら多変量解析の内容は準1級および1級試験の試験範囲に含まれています。従って試験に出題されてもおかしくないです。実際に過去問を見てみると準1級試験ではこれらの出題事例があります。例えば、2018年準1級試験ではマーク問題(not記述式)として線形判別やSVMが出題されています。一方で1級試験では私の知る限り出題事例が無く、せいぜい線形重回帰くらいだったと思います。

*4: この本は某レビューで酷評されているようですが、復習として使うならばコンパクトに試験範囲がまとまっているので良い本だと思います。