ENGLISH

次世代研究インキュベータ

小地域推定とその応用

小地域推定でデータセットを精緻化させる

――時間と費用を抑えながら、限られた情報の精度を高めるための統計技法を開発する。

研究キーワード:経済統計、ベイズ統計学、小地域推定

母集団に関する包括的なデータの収集は、 いつでも実施できるものではなく、実施にあたっては多大な時間的・経済的コストがかかる。よって「小地域問題」に関するデータの精度を高めることができれば、データ資源を広範に活用することが可能になる。「小地域問題とは、サンプルサイズが小さいために小地域の標本平均などの推定量が非常に不安定になる問題です」と、社会科学研究院准教授で本研究プロジェクトを率いる小林弦矢は話す。  

小林らは、補助情報によって統計的強度を高める小地域推定手法を開発し、このような問題の克服について研究している。

不平等と公衆衛生問題を克服する

小地域推定は、広範囲に応用されている。小林は、「政府が重要な政策決定をする際に用いる公的統計において、小地域問題は発生します。このため、小地域推定技法を用いること効率的な政策決定につながる可能性があります」と指摘する。

 総務省統計局が実施する月次家計調査を例にとると、同調査からは家計の収支に関する最新情報を得ることができる一方、市などの小地域レベルではサンプルサイズが非常に小さく、標本平均などの直接的な推定量は不安定となり、詳細な傾向を把握することが難しい。

 「家計調査は、全国消費実態調査のデータを用いて統計強度を高めることができます。ただ、全国消費実態調査のサンプルサイズは家計調査のそれよりもかなり大きく信頼性も高いのですが、同調査には時間と費用がかかり、5年に一度しか実施されていません」。

 家計調査も全国消費実態調査も地域レベルで集計したデータを収集しており、小林らは、小地域推定に日常的に用いられるFay-Herriot モデルと呼ばれる混合効果モデルの一種を用いることにした。  

しかし、データ形式が異なる場合、より適切な小地域推定モデルを開発する必要がある。例えば近年、小林らは統計局の住宅・土地統計調査を用いて日本の所得マップを改良する取り組みを行った。住宅・土地統計調査のグループ化されたデータ形式や、国勢調査からのデータを考慮して開発した新しい統計モデルを用いたところ、住宅・土地統計調査の所得推定量の不確実性を大幅に削減することができた。

 「小地域推定の応用範囲はデータの安定化に留まりません。小地域推定は情報を追加することもできます。例えば、住宅・土地統計調査モデルでは、データが欠けている地域の所得を 推計することもできます」。  

小林らは最近、混合モデリングのアプローチを用いて、他地域からの情報をモデルの中で活用することで東京および近郊の駅周辺地価の分布を推定した。  

2018年、小林は空間ポアソン回帰モデルを 用いて、1900年代初頭における浄水の利用と死亡率低下の関連を調査する研究に参加し、  公衆衛生に関する議論に貢献している。小林と、東京工業大学及び米国デューク大学の共同研究者は、1930年の東京における死亡率を水道普及率のデータセットと比較し、1921年から1937年にかけて、水道利用が東京における粗死亡率(一定期間の死亡数を単純にその期間の人口で割った死亡率)が改善する要因の41.3%を説明しているとの結果を出している。

 「この論文は、栄養と浄水が死亡率の低下に比較的重要であるとする説を支えるものです」と小林は話す。政界や経済界などから あらゆる専門家がチームに加わって、データセットの精度向上に貢献してくれるようになればと、小林は願っている。

Members

推進責任者
研究者名 役職名 専門分野
小林 弦矢 准教授(社会科学研究院) ベイズ統計学
中核推進者(学内研究グループ構成員)
研究者名 役職名 専門分野
川久保 友超 講師(社会科学研究院) 数理統計学
佐藤 栄作 教授(社会科学研究院) マーケティング・サイエンス
小笠原 浩太 特任助教(社会科学研究院) 計量経済史
医療経済学
佐野 晋平 准教授(社会科学研究院) 教育経済学
労働経済学
長根(齋藤) 裕美 准教授(社会科学研究院) 医療経済学
イノベーション研究
伊藤 翼 特任研究員(グローバルプロミネント研究基幹・社会科学研究院) 数理統計学
山内 雄太 特任研究員(グローバルプロミネント研究基幹・社会科学研究院) ベイズ統計学
湯浅 良太 特任研究員(グローバルプロミネント研究基幹/人文科学研究院) 数理統計学
            

研究内容