南山の先生

学部別インデックス

理工学部・データサイエンス学科

白石 高章

職名 教授
専攻分野 統計科学
主要著書・論文 「統計科学の基礎」2012年(日本評論社,単著),273頁.
「多重比較法の理論と数値計算」2018年(共立出版,共著),313頁.
“Pairwise Multiple Comparisons” 2019年(Springerから出版された洋書,共著),112頁.
“Multiple Comparisons for Bernoulli Data” 2022年(Springerから出版された洋書,単著),128頁.
将来的研究分野 多様な統計モデルにおける新しい統計手法の開発。開発した手法を使った医学,薬学,生物学,地球物理学,心理学などのデータ解析への応用。
担当の授業科目 「統計学概論」,「数理統計学」

統計科学によるデータサイエンス

 現在「統計科学」を専門とし,医学,薬学,生物学,地球物理学,心理学などあらゆる分野で使用されている「多重比較法」の研究を行なっている。多重比較法を使用することによって,2つ以上の標本観測値のデータを解析し,それぞれの母集団の違いを発見することができる。例えば,開発された新薬が旧薬より優れているかどうか,癌患者が年齢とともに多くなるかどうか,地震の回数の現在と過去を調査し,頻度が減少傾向にあるかどうかなどを調べることができる。専門分野の「統計科学」はデータサイエンスの大きな部分の1つでもありその教育を南山大学理工学部で行っている。統計科学には,数理統計,応用統計,計算機統計がある。キーワードとなる用語をもとに以下箇条書きにする。

  1. ビッグデータ(巨大な個数の観測値からなるデータもしくは意義のあるデータ)
    情報通信技術が発展し,現在,スマートホーン,カード,カーナビ,監視カメラ,ネットショッピングを通して様々なデータが自動的に蓄積され,ビッグデータとして記憶装置に保存されている。年と共にさらに巨大なデータになっていく。データの活用推進が政府による経済の成長戦略として盛り込まれ,インターネットのウェブページに官公庁がいろいろなデータを公開している。ビッグデータの解析に国や企業が熱い期待をもっている。ビッグデータを活用するためにデータの加工が必要である。その加工とデータ解析に統計科学が使われる。ビッグデータは欠測値のある不完全データであることが多い。統計科学の知識を使って欠測値を補完する。統計科学なくしてビッグデータの解析は不可能である。
  2. データの統計解析
    マーケティング,スポーツ,地震学,医学,薬学,心理学,経営学,経済学,社会学あらゆる分野でデータの統計解析が使われる。
  3. 数理による統計科学理論
    数式による論理により統計科学の理論を学び,新しい統計手法を開発する。
  4. 計算機シミュレーションと統計手法のプログラミング開発
    数学では解決できない事実を,計算機を使ったシミュレーション実験により解明する。データ解析を容易にできるようにするために,計算機によるソフトウエア開発もおこなうことができる。
  5. プロのデータサイエンティストが産業界から引っ張りだこである。
    現在,統計科学を使いこなす「データサイエンティスト」の育成が急務である。