駿河台経済新聞

神田駿河台から発信する経済・ビジネス・社会情報

卒論紹介『個人投資家のツイートデータを利用したセンチメント分析』

 飯塚です。このエントリーでは私が卒業論文で執筆した個人投資家のツイートデータを利用したセンチメント分析 ― 個人投資家の感情変化と日経平均株価日次データの関係に関する考察」を一部噛み砕いて紹介します。

——————————————————————

 

  1. はじめに

世の中の人々の抱えている考えや感情の分析といったものは、これまで取得することが非常に困難だった。理由は

・大量のデータを取り扱える分析手法が発達していなかった点

・分析元となるデータを大量に取得することが困難であった点

の大きく二点が挙げられる。

 前者の分析手法に関しては、近年大量のテキストデータを解析できるようになり、また、言葉そのものが持つ感情のポジティブ度合い、ネガティブ度合いを定量化することができるようにもなった。中でも、石島他(2015)、「日次データを用いた市場センチメント・インデックスの構築と株価説明力の分析」(http://sigfin.org/?plugin=attach&refer=SIG-FIN-011-06&openfile=SIG-FIN-011-06.pdf)では、日本経済新聞の記事に含まれるテキストデータをテキストマイニングし、市場センチメント・インデックス(記事テキストに含まれる感情や雰囲気)が、三日後の株価収益率を説明・予測しうることを発見した。

 これらの成果を参考に、本論文では、過去研究では触れられていない個人投資家自身の発信するテキストデータを大量に取得し、それらをテキストマイニングして感情の起伏を探った。また、その起伏と日経平均株価の日次データとを比較し、関係性を考察した。

 

  1. 分析対象・分析手法

 

分析対象となるデータは下記である。

  • データ収集元:Twitter (https://twitter.com/)
  • 対象ユーザー:個人投資家らしきTwitterアカウントのうち「フォロワー数5000人以上」「目視で確実に個人投資を行っていると確認できるアカウント」
  • 対象言語:日本語ツイートのみ
  • 対象期間:日経平均株価日次データとの比較時=2015年8月4日〜2015年11月30日

        曜日データとの比較時=2015年8月2日〜2015年11月30日

  • リツイート:含む
  • @ツイート:含む
  • 取得ツイート数:41,600ツイート(1アカウントあたりの取得限界数3200ツイート×13アカウント)

 

続いて実際の分析であるが、

  • テキストマイニングによりテキストデータに含まれる単語の出現頻度を算出
  • 各単語の感情数値をセンチメント辞書に基づきスコアリング
  • データセットの作成

という順序で実施した。各プロセスで使用したソフトウェア、辞書などは下記である。

Tweet取得:Twimemachine(http://www.twimemachine.com)

テキストマイニング(分かち書き):Tiny Text Miner Windows版(http://mtmr.jp/ttm/)

形態素解析エンジン:mecab-0.98 (http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html)

・センチメント辞書:「単語感情極性対応表」 (http://www.lr.pi.titech.ac.jp/~takamura/pndic_ja.html)

 

  1. データセット

日経平均株価日次データ比較時のデータセット

データカテゴリ

データ名

算出式

日経平均株価

日経平均株価(終値)

日経平均株価

日経平均株価(始値)

日経平均株価

日経平均株価(高値)

日経平均株価

日経平均株価(安値)

日経平均株価

始値終値の差

(翌日始値) – (前日終値)

日経平均株価

高値と安値の差

(高値) – (同日安値)

投資家感情

投資家感情(絶対値)

投資家感情

投資家感情(相対値)

(感情数値) − (全感情データの平均値)

投資家感情

投資家感情(前日差)

(翌日感情数値) – (前日感情数値)

 

※サンプルツイート対象期間:2015/8/4〜2015/11/30

 

曜日ダミーデータ比較時のデータセット

データカテゴリ

データ名

算出方法

投資家感情

投資家感情(絶対値)

投資家感情

投資家感情(相対値)

投資家感情

投資家感情(前日差)

(翌日感情数値) – (前日感情数値)

曜日

月曜日ダミー変数

曜日

火曜日ダミー変数

曜日

水曜日ダミー変数

曜日

木曜日ダミー変数

曜日

金曜日ダミー変数

曜日

土曜日ダミー変数

 

※サンプルツイート対象期間:2015/8/2〜2015/11/30

 

  1. 重回帰分析の結果概要

本論文においては、下記の四種類の関係を探った。

  1. 投資家感情(絶対値)に対する日経平均株価の値動きの影響
  2. 投資家感情(絶対値)に対する前日の日経平均株価の影響
  3. 投資家感情(前日差)に対する曜日ダミー変数の影響
  4. 翌日始値と前日終値の差額に対する個人投資家の感情の影響

 

f:id:SurugaD:20160307103436p:plain

  1. 投資家感情(絶対値)に対する日経平均株価の値動きの影響

10%有意水準において、株価の高値と安値の差は、個人投資家の感情へマイナスに働いていると言える。これは相場の変動に振り回され、不安や恐怖の感情を個人投資家たちが抱いているためであると考えられる。

 

 

f:id:SurugaD:20160307103527p:plain

  2.投資家感情(絶対値)に対する前日の日経平均株価の影響

10%有意水準において、前日株価の終値は、翌日の個人投資家感情へプラスに働いている。これは前日の終値個人投資家たちがチェックしており、それが上がり傾向であれば当然翌日の感情がポジティブに変わるためであると考えられる。

 

 

f:id:SurugaD:20160307103640p:plain

 3.投資家感情(前日差)に対する曜日ダミー変数の影響

1%有意水準において、土曜日であることは個人投資家の感情の前日との差にプラスへ働いていると言える。仮説であるが、土曜日になると市場が閉じており、不安な感情を抱かなくて済むためであると考えることができる。

これまで日経平均株価個人投資家たちの感情に与える影響を分析してきたが、逆に個人投資家たちの感情の総和が日経平均株価に影響を与える可能性についても検証した。

 

f:id:SurugaD:20160307103831p:plain

 4.翌日始値と前日終値の差額に対する個人投資家の感情の影響

投資家の感情数値の前日差は、5%有意水準で、翌日始値と前日終値の差額へプラスに働いている。つまり、投資家の感情が前日から翌日にかけてプラスに推移すれば、翌日始値が前日終値より大きくなるということであり、その逆も然りである。これは個人投資家たちの感情の総和が日経平均株価へ影響を与えうることを示しているが、見せかけの回帰である可能性もあり、個人投資家の感情の動きが確実に先行して影響を与えていると断言するには材料が不足しているとも言える。

——————————————————————

 

以上です。この結論をより強固なものにするには、取得するツイートの対象アカウントをより広くし、ツイートのサンプルを増やすことや、ツイートの対象期間を広げるということが考えられます。これを本論文の課題として、論文の紹介を終わります。

 

  1. 参考

  • 日次データを用いた市場センチメント・インデックスの構築 と株価説明力の分析

石島博、數見拓朗、前田章

(http://sigfin.org/?plugin=attach&refer=SIG-FIN-011-06&openfile=SIG-FIN-011-06.pdf)

 

 

社会調査のための計量テキスト分析―内容分析の継承と発展を目指して

社会調査のための計量テキスト分析―内容分析の継承と発展を目指して

 

 

 

数式を使わないデータマイニング入門 隠れた法則を発見する (光文社新書)

数式を使わないデータマイニング入門 隠れた法則を発見する (光文社新書)

 

 

卒論紹介『国内の大規模イベントと土地価格の関係についての研究』

国内の大規模イベントと土地価格の関係についての研究

田村賢史

 

本論文では、国内で行われる大規模なイベントで地価はどのように変動するのかについて検討した。対象は長野オリンピック愛知万博、横浜華博、つくば万博、日韓W杯前後5年の地価情報である。

 

地価情報・使用するデータ

今回行う調査は、

 内容 日本で行われる大規模なイベントで地価はどのように変動するのか。

 対象 長野オリンピック、愛知・横浜・つくば万博、日韓W杯前後5年の

地価情報からビックイベントと地価の関係について調べる。

                                                                                     

調査では公示価格を使用する。データは標準地・基準地検索システム、国土交通省地価公示都道府県地価調査に載せてあるものを利用した。

 

調査方法

長野オリンピック愛知万博、つくば科学万博、横浜華博、日韓W杯開催会場の5つを調査対象とする。

  • 長野オリンピック   ・・・平成3(1991)年開催決定、平成10(1998)年開催
  • 愛知万博       ・・・平成9(1997)年開催決定、平成17(2005)年開催
  • つくば科学万博    ・・・昭和56(1981)年開催決定、昭和60(1985)年開催
  • 横浜華博       ・・・昭和59(1984)年開催決定、昭和64(1989)年開催
  • 日韓W杯開催会場   ・・・平成8(1996)年開催決定、平成14(2002)年開催

 

対象都市は長野市とする。期間は、平成5~15年のデータを使用する。比較都市は、長野県松本市新潟県長岡市を使用する。

対象都市は長久手市とする。期間は、平成12~22年のデータを使用する。比較都市は岐阜県多治見市と静岡県沼津市のデータを使用する。

  • つくば科学万博

茨城県つくば市を対象都市とする。期間は、昭和55年~平成2年のデータを利用する。比較都市は茨城県土浦市水戸市である。

  • 横浜華博

 神奈川県横浜市を対象都市とする。期間は、昭和59年~平成6年のデータを利用する。比較都市は神奈川県川崎市と埼玉県さいたま市である。

  • 日韓W杯

日韓W杯は、平成14(2002)年に、日本と韓国それぞれ10か所、計20か所で試合が行われた。この中で観客動員数が多かった上位3つである埼玉スタジアム横浜国際総合競技場長居スタジアムがある都市(横浜市さいたま市大阪市東住吉区)をデータとして使用する。

 

集計の仕方は、上記①~⑤の各地点の合計したものに、全地点、住宅地、商業地、工業地ごとの平均とその上昇率(前年比)を出す。相乗平均を出すので正の数にする必要があるため、すべての上昇率にそれぞれ1を足す。

 

対象地と比較値の比較結果

長野市の地価の変動率は、オリンピックが開催される前3年、5年の平均ともに比較年よりも下落率が小幅であった。また全国平均と比べても下落率の落ちは少なかった。

平成3年は、全国的には、バブル崩壊の年であり、また、その数年後に阪神淡路大震災が発生したことから、オリンピックが開催される2年前までは二ケタの割合で地価が下落している。比較都市の松本市も比較的似たような変動率を示している。しかし、長岡市は、平成5年まで地価は上昇していることから、必ずしもすべての市町村が全国平均と同様の動きをしているとは限らない。 

 

平成12年は、全国的には、バブル崩壊による平成不況の10年が一段落したが、地価の下落には歯止めがかかっていなかった。開催地である長久手市も、開催前3,5年前は地価が下落している。比較地域の多治見市と沼津市の下落幅は全国平均、長久手市と比べても大きくなっている。開催後は長久手市の地価は上昇しているが、全国平均と比べても大きな違いは見られない。

 

  • つくば科学万博

対象期間の後半は昭和61年から平成3年にかけてバブル景気であったため、全国的に地価価格は大幅に上昇している。その中でも昭和62年の地価上昇率は58%に達するなど、土地の高騰が際立っている。住宅地、商業地、工業地を比較すると、住宅地の変動率が大きくなっている

つくば市を見ると、万博開催前の3年間の地価の上昇率が全国平均、比較都市よりも高く、20%を超えている。しかし、開催2年後の昭和62年には、比較地域を含めた対象期間の中で唯一地価が下落している。この年は、先に触れたようにバブル最盛期であるため、比較都市も地価は上昇している。よって、万博開催前に地価が上昇した分、その反動で地価下落につながったと考えることもできる。一方で、万博以外に目を向けると、昭和62年11月30日に筑波郡矢田部村、大穂町、豊里町、新治群桜村の3町1村が新設合併して、当時の筑波町から人口11万人を超えるつくば市が誕生している。地価が全国平均以上に上昇した理由としては後者も考えることができる。

 

  • 横浜華博

開催前3、5年は全地点、川崎、さいたまの上昇率はほぼ同じである。開催後3,5年も横浜と全国平均ほぼ変わらず、上昇から下落に反転するタイミングもさほど変わりはない。住宅地、商業地、工業地も同様の動きである。全国平均の61~62年にかけて最も上昇率が高いのは先に触れたように、バブル景気の影響とみられるが、各都市を見ると、最も上昇幅が大きいのが3地点とも昭和63年で全国平均と比べて1年遅くなっており、全国平均よりも大幅に上昇している。  

 

  • 日韓W杯

横浜市さいたま市東住吉区ともに全国平均と比較しても大きな違いはみられなかった。開催年のみ全国平均が若干上昇しているが、対象地域は同程度の割合で下落している。住宅地、商業地、工業地ともに全地点で地価は下落していて、W杯開催前、開催後で目立った違いはみられなかった。

 

 対象地全体の開催前5年、前3年、開催年、開催後3年、5年の上昇率の変動の平均

全体平均(対象地)

全地点

住宅地

商業地

工業地

前5年

0.0212

0.0318

−0.0073

0.0267

前3年

0.0418

0.0449

0.0212

0.0275

開催年

−0.0339

−0.0297

−0.0459

−0.0404

後3年

−0.0420

−0.1186

−0.0486

−0.0744

後5年

−0.0229

−0.0629

−0.0460

−0.0727

 

比較地全体の開催前5年、前3年、開催年、開催後3年、5年の上昇率の変動の平均

全体平均(比較値)

全地点

住宅地

商業地

工業地

前5年

0.0489

0.0676

0.0379

0.0564

前3年

0.0774

0.0910

0.0695

0.0360

開催年

−0.0235

−0.0246

−0.0178

−0.0069

後3年

−0.0089

−0.0050

−0.0122

0.0340

後5年

−0.0202

−0.0109

−0.0293

0.0014

 

対象地全体と比較値全体の比較

最後に対象地全体と比較値全体の平均について見ていく。全地点を比較すると、イベント開催前3、5年ともに比較値地価の方が上昇率は大きかった。イベント開催後も3年は比較値の方が下落率は低くなっていた。住宅地、商業地、工業地についても同様の結果となった。工業地は比較値地価が上昇しているのに対し、イベント開催地は下落が続いたままであった。

 

まとめ・考察

5つのケースについてデータを比較してきたが、対象地域と比較地域との間に大きな違いがみられると思われるケースはなかった。長野オリンピックのみ若干の上昇率の違いがみられたが、比較地域と比較すると際立って上昇しているといえるものではなかった。また、①~⑤のデータ全体を比較しても、むしろ対象地域のほうが上昇率は大きく、下落率は小さいという結果であった。このことから国内の大規模なイベントと地価の相違は見られないといえる。個別のデータでは触れなかったが、地価の上昇率に変動を与える要因として、一つに市町村合併があげられる。市町村合併もしくは隣接する地域を吸収している地域はその次の年度に地価が大きく上昇していることがいくつかの地域で見られた。そこに住む人々の生活に直接の影響を与えるような事象が、土地価格に大きく影響を与えるのではないかと考えられる。

 

 

オリンピック経済幻想論

オリンピック経済幻想論

 

 

 

オリンピックと商業主義 (集英社新書)

オリンピックと商業主義 (集英社新書)

 

 

卒論紹介『都道府県別平均寿命に影響を与える要因について』

都道府県別平均寿命に影響を与える要因についての研究

――都道府県別データを用いた回帰分析による平均寿命についての考察

大西 玲央

 

 本論文では都道府県別平均寿命に影響を与える要因について、都道府県別各種データを用いて分析した。

 

  1. はじめに

都道府県別の平均寿命表1-1を比較すると男性の場合、首位の長野県が80.88年なのに対し最下位の青森県は77.28年であり、その差は3.6年ある。女性の場合、首位の長野県が87.18年なのに対して最下位の青森県85.34年であり、その差は1.84年ある。このように都道府県別に平均寿命を比較してみると都道府県によってばらつきが存在していることがわかる。また同一都道府県の男女の順位を比較すると、例えば沖縄県の場合、男性の平均寿命は79.40年で30位なのに対して女性の平均寿命は87.02年で3位である。同一都道府県であるにも関わらず、男女で平均寿命の順位に差があるのだ。

では、このような都道府県間による平均寿命の差や同一都道府県における男女間の順位の差はなぜ発生するのだろうか。それを発生させる要因は何であろうか。この論文では都道府県平均寿命に影響を与える要因について、都道府県別の各種データを用いて統計的に分析する。そしてその要因を考察し、都道府県間による平均寿命格差や同一都道府県における男女間の順位格差を是正する方法について検討する。

1-1 都道府県別平均寿命

 

 

 

 

(単位:年)

順位

都道府県

平均寿命

都道府県

平均寿命

全 国

79.59

全 国

86.35

 

 

 

 

 

 1

長 野

80.88

長 野

87.18

 2

滋 賀

80.58

島 根

87.07

 3

福 井

80.47

沖 縄

87.02

 4

熊 本

80.29

熊 本

86.98

 5

神奈川

80.25

新 潟

86.96

 6

京 都

80.21

広 島

86.94

 7

奈 良

80.14

福 井

86.94

 8

大 分

80.06

岡 山

86.93

 9

山 形

79.97

大 分

86.91

10

静 岡

79.95

富 山

86.75

11

岐 阜

79.92

石 川

86.75

12

広 島

79.91

滋 賀

86.69

13

千 葉

79.88

山 梨

86.65

14

東 京

79.82

京 都

86.65

15

岡 山

79.77

神奈川

86.63

16

香 川

79.73

宮 崎

86.61

17

愛 知

79.71

奈 良

86.60

18

石 川

79.71

佐 賀

86.58

19

富 山

79.71

愛 媛

86.54

20

宮 崎

79.70

福 岡

86.48

21

三 重

79.68

高 知

86.47

22

宮 城

79.65

東 京

86.39

23

埼 玉

79.62

宮 城

86.39

24

兵 庫

79.59

香 川

86.34

25

山 梨

79.54

北海道

86.30

26

島 根

79.51

長 崎

86.30

27

新 潟

79.47

鹿児島

86.28

28

徳 島

79.44

山 形

86.28

29

群 馬

79.40

岐 阜

86.26

30

沖 縄

79.40

三 重

86.25

31

福 岡

79.30

愛 知

86.22

32

佐 賀

79.28

静 岡

86.22

33

鹿児島

79.21

徳 島

86.21

34

北海道

79.17

千 葉

86.20

35

愛 媛

79.13

兵 庫

86.14

36

茨 城

79.09

鳥 取

86.08

37

和歌山

79.07

山 口

86.07

38

栃 木

79.06

福 島

86.05

39

山 口

79.03

秋 田

85.93

40

鳥 取

79.01

大 阪

85.93

41

大 阪

78.99

群 馬

85.91

42

高 知

78.91

埼 玉

85.88

43

長 崎

78.88

岩 手

85.86

44

福 島

78.84

茨 城

85.83

45

岩 手

78.53

和歌山

85.69

46

秋 田

78.22

栃 木

85.66

47

青 森

77.28

青 森

85.34

 

 

 

 

 

 

 

 

  1. データ

本論文で使用したデータは以下の通りです。平成22年の都道府県別の各種データを用いて分析を行いました。

 

・平均寿命(男性)

・平均寿命(女性)

・平均気温

・県内総生産(1人あたり)

・可住地面積1平方キロメートル当たり人口密度

・魚介類支出金額

・肉類支出金額

・乳卵類支出金額

・野菜・海藻(葉茎菜・根類)支出金額

・野菜・海藻(その他野菜)支出金額

・野菜・海藻(乾物・海藻)支出金額

・果物支出金額

・菓子類支出金額

・調理食品支出金額

・酒類支出金額

・保健医療支出金額

・米支出金額

・パン支出金額

・めん類支出金額

・油脂支出金額

・食用油支出金額

・マーガリン支出金額

・食塩支出金額

・しょうゆ支出金額

・みそ支出金額

・砂糖支出金額

・酢支出金額

・マヨネーズ支出金額

・茶類支出金額

・コーヒー・ココア支出金額

・果物・野菜ジュース支出金額

・炭酸飲料支出金額

乳酸菌飲料支出金額

乳飲料支出金額

・ミネラルウォーター支出金額

・日本そば・うどん(外食)支出金額

・中華そば(外食)支出金額

・すし(外食)支出金額

・中華食(外食)支出金額

・洋食(外食)支出金額

・ハンバーガー支出金額

 

  1. 分析

分析は2章の説明変数を用いて、被説明変数を平均寿命(男性)と平均寿命(女性)に分けてクロスセクション分析を行った。今回の分析では6つのテーマを設けて、平均寿命(男性)と平均寿命(女性)それぞれ分析を行った。まずは6つのテーマについて説明する。

テーマ名

属する説明変数

(3-1)野菜・果物

野菜・海藻(葉茎菜・根類)支出金額、野菜・海藻(その他野菜)支出金額、野菜・海藻(乾物・海藻)支出金額、果物支出金額

(3-2)主食

米支出金額、パン支出金額、めん類支出金額

(3-3)調味料

油脂支出金額、食用油支出金額、マーガリン支出金額、食塩支出金額、しょうゆ支出金額、みそ支出金額、砂糖支出金額、酢支出金額、マヨネーズ支出金額

(3-4)外食

日本そば・うどん(外食)支出金額、中華そば(外食)支出金額、すし(外食)支出金額、中華食(外食)支出金額、洋食(外食)支出金額、ハンバーガー支出金額

(3-5)飲料

酒類支出金額、茶類支出金額、コーヒー・ココア支出金額、果物・野菜ジュース支出金額、炭酸飲料支出金額、乳酸菌飲料支出金額、乳飲料支出金額、ミネラルウォーター支出金額

(3-6)その他食品

魚介類支出金額、肉類支出金額、乳卵類支出金額、菓子類支出金額、調理食品支出金額

 

次に分析方法について説明する。平均寿命(男性)と平均寿命(女性)を被説明変数とし、6つのテーマそれぞれについて男女別で分析を行った。またどのテーマにも属さない保健医療支出金額、平均気温、県内総生産(1人あたり)、可住地面積1平方キロメートル当たり人口密度の説明変数については、すべての分析においてコントロール用に回帰式に組み込むことにした。分析に手順としては以下の通りだ。

 

  • テーマに定めたすべての説明変数を用いて回帰分析
  • 1の回帰式の結果、P値が7以上の説明変数を除外して再度回帰分析を行う。
  • 2の回帰式の結果、P値が5以上の説明変数を除外して再度回帰分析を行う。
  • 3の回帰式の結果、P値が3以上の説明変数を除外して再度回帰分析を行う。

 

これらの手順により説明変数を除外していき、P値が0.3以下になったものの中で有意な結果が示されたものを次章に示す。

 

  1. 結果

 

4-1.男性の結果について

表6-1は男性の平均寿命に関する分析で、有意な結果が示された説明変数についてt値のプラスマイナス、有意水準についてまとめたものである。

 

表4-1

変数名

t値(+or-)

有意水準

変数名

t値(+or-)

有意水準

保健医療支出金額

+

**

炭酸飲料支出金額

-

**

平均気温

+

***

魚介類支出金額

-

**

コーヒー・ココア支出金額

+

***

肉類支出金額

+

**

パン支出金額

+

**

調理食品支出金額

+

**

しょうゆ支出金額

+

**

野菜・海藻(葉茎菜・根類)支出金額

+

*

マーガリン支出金額

+

**

マヨネーズ支出金額

-

*

油脂支出金額

-

**

果物・野菜ジュース支出金額

-

*

食用油支出金額

+

**

乳飲料支出金額

-

*

中華(外食)支出金額

+

**

 

 

 

 

4-2.女性の結果について

表4-2は女性の平均寿命に関する分析で、有意な結果が示された説明変数についてt値のプラスマイナス、有意水準についてまとめたものである。

 

表4-2

変数名

t値(+or-)

有意水準

変数名

t値(+or-)

有意水準

平均気温

+

*~***

果物・野菜ジュース支出金額

-

*

可住地面積1平方キロメートル当たり人口密度

-

*

乳酸飲料支出金額

-

*

コーヒー・ココア支出金額

+

*

めん類支出金額

-

**

魚介類支出金額

-

*

みそ支出金額

+

**

 

 

 

調理食品支出金額

+

**

 

 

 

 

  1. まとめ

男女ともに平均寿命に対してプラスの要因となったのが、平均気温、調理食品支出金額、コーヒー・ココア支出金額であった。男女とも平均気温が高いほど平均寿命が長い結果となった。また、調理食品支出金額に関しては栄養成分がパッケージに表示され、栄養分の摂取のコントロールが容易に出来るためか男女ともにプラスの要因となった。コーヒー・ココア支出金額も男女ともに平均寿命に対してプラスの要因であることが示されたのは非常に興味深い。

次に男女ともに平均寿命に対してマイナスの要因となったのが、魚介類支出金額と果物・野菜ジュース支出金額であった。果物・野菜ジュース支出金額に関しては、マイナスに働くとの結果が示されたことは予想外であった。

こんどは、男女の平均寿命に関する回帰分析結果についての相違点を見ていきたい。まず特筆すべき点としてあげられるのは保健医療支出金額である。男性の場合には6つのテーマすべてで平均寿命に対してプラスに働くという有意な結果が得られた。それに対して女性の場合には有意な結果は得られなかった。そして男性の場合、肉類支出金額が平均寿命に対してプラスの要因として働くことは興味深い。

 

 

 

長生きしたけりゃふくらはぎをもみなさい (健康プレミアムシリーズ)

長生きしたけりゃふくらはぎをもみなさい (健康プレミアムシリーズ)

 

 

 

 

卒論紹介『都道府県別平均通勤時間が出生率に与える影響について 』

こんにちは、いしつかです。今回は卒業論文のテーマとして、都道府県別の平均通勤時間と出生率についての分析と考察を紹介したいと思います。

 

1. はじめに

 日本の出生率は近年減少傾向にあります。出生率の低下は少子化の進行に直接的に影響し、社会経済に問題を発生させます。人口構造の変化によって生じる少子高齢化社会は、若年労働力人口の減少、一人あたり社会保障負担の増大といった、経済的負担を増大させ、その経済的負担が婚姻率・出生率の低下に繋がり、更に少子化の進行に拍車をかけているのです。

 

図1:日本の出生数・出生率の推移

f:id:SurugaD:20160223195558p:plain

 

 

図2は、2010年の都道府県ごとの平均通勤時間のヒストグラムです。年齢層が高くなると、同性間の差は収束していきますが、男女間では通勤時間に大きな差が生じることがわかります。男女年齢層別の通勤時間に着目してみると、年をとり、結婚や出産を機に住居を移し、通勤時間を変化させていることも考えられます。

 

今回の分析では、一概に都道府県全人口の通勤時間を変数に用いるのではなく、出生率に関わる15~24歳、25~34歳、35~44歳の男女と、計6つの層に分け、男女年齢層別の比較を行いました。

 

図2:2010年の都道府県ごとの平均通勤時間のヒストグラム(上段男性、下段女性、左から15~24歳、25~34歳、35~44歳)

f:id:SurugaD:20160223195615p:plain

 

 

2. データ

使用データの一覧以下の通りです。2000年、2005年、2010年の都道府県別のデータを使用、これらの年に該当するデータがない場合は、得られたデータのうち最も年の近いデータを使用しています。加えて今回の分析ではダミー変数として、東京ダミーと沖縄ダミーを用いています。

 

合計特殊出生率

・普通出生率

・夫の平均初婚年齢

・妻の平均初婚年齢

・15~24歳男性平均通勤時間

・25~34歳男性平均通勤時間

・35~44歳男性平均通勤時間

・15~24歳女性平均通勤時間

・25~34歳女性平均通勤時間

・35~44歳女性平均通勤時間

・婚姻率

・人口密度

・単独世帯割合

第三次産業就業者の割合

・昼夜間人口比率

・普通離婚率

・乳児死亡率

・幼稚園数

・小学校数

保育所

・一人当たり県民所得

・産科産婦人科医数

・15歳以上正規雇用率(男女別)

・待機児童数

・刑法犯認知件数

・育児休暇取得率(男女別)

 

 

3. 分析と考察

平均通勤時間6パターンと、設定した5つの回帰式を、P値が0.8を超える説明変数を除いて再度分析、P値が0.6を超えるもの・・・と繰り返し、最終的にP値が0.2を下回ったところで分析をやめ、約80通りの分析を行いました。今回は以下の2つの回帰分析についての結果と、一番赤池情報量基準(AIC)の値の低い式の結果を紹介します。

 

3-1. 合計特殊出生率を被説明変数とした回帰分析

 

3-2. 夫・妻の平均初婚年齢を被説明変数とした回帰分析

 

 

3-1. 合計特殊出生率を被説明変数とした回帰分析

 

分析の結果、15~24歳女性、25~34歳男性、35~44歳男性の平均通勤時間は合計特殊出生率に優位に負の影響を与えるという結果が得られました。

 

最も有意な結果が得られたのは、25~34歳男性の平均通勤時間でした。この年齢層は平均初婚年齢に近い層であるため、出生率に大きく関わる層ともいえ、彼らの通勤時間の長さが、全体の出生率の低下に関与していると考えることができます。

 

その他の変数については、15歳以上正規雇用率、幼稚園数、保育所数、産科産婦人科医数は、合計特殊出生率に正の影響を与え、第三次産業就業者の割合、一人当たり県民所得は負の影響を与えるという結果となりました。

 

表1: 25~34歳男性平均通勤時間を説明変数に用いた時の分析結果

変数名

係数

t値

P値

25~34歳男性平均通勤時間

-0.231

-3.02

0.00

15歳以上男性正規雇用

0.294

3.99

0.00

第三次産業就業者の割合

-0.328

-4.83

0.00

対人口産科産婦人科医数

0.140

2.73

0.00

一人当たり県民所得

-0.372

-5.06

0.00

対人口幼稚園数

0.130

2.73

0.00

対人口保育所

0.139

2.23

0.02

沖縄ダミー

2.958

8.07

0.00

R2: 0.74, AIC: 1.64

 

3-2. 夫・妻の平均初婚年齢を被説明変数とした回帰分析

 

平均初婚年齢は出生率に影響を与えることから、設定した説明変数が平均初婚年齢を高め、その結果出生率の低下の要因になっていることも考えられます。そのため、夫・妻の平均初婚年齢を被説明変数として回帰分析を行いました。

 

分析の結果、35~44歳女性の平均通勤時間のみ、妻の平均初婚年齢に正の影響を与えるという結果となりました。しかし、妻の平均初婚年齢の都道府県平均が27.6歳(2005年)であることを考慮すると、この変数が初婚年齢の上昇に影響を与えているということは考え難いです。平均初婚年齢が低いほど、平均通勤時間も短くなるという、逆の因果も考慮できる、つまりは同年代の未婚の女性が多い地域ほど平均通勤時間も長くなる傾向にあるということも考えられます。したがって、女性の平均通勤時間長さが平均初婚年齢を高めている原因となっているとは、必ずしも言い切れないことに注意が必要です。

 

その他の変数については、一人当たり県民所得、単独世帯割合は、夫・妻の平均初婚年齢に正の影響を与え、15歳以上正規雇用率、小学校数、普通離婚率、幼稚園数は負の影響を与えるという結果となりました。

 

表2: 15~24歳男性平均通勤時間を説明変数に用いた時の分析結果(平均通勤時間のP値が0.2を超えていたため除外されてしまっています)

変数名

係数

t値

P値

15歳以上男性正規雇用

-0.271

-3.31

0.00

第三次産業就業者の割合

-0.373

-3.54

0.00

対人口小学校数

-0.177

-2.09

0.03

昼夜人口比率

-0.669

-7.80

0.00

普通離婚率

-0.327

-4.82

0.00

一人当たり県民所得

0.383

3.42

0.00

単独世帯割合

0.463

4.38

0.00

人口密度

0.365

4.57

0.00

対人口幼稚園数

-0.273

-5.50

0.00

東京ダミー

2.395

3.67

0.00

沖縄ダミー

2.145

5.29

0.00

R2: 0.78, AIC: 1.50

 

         

 

 

4. まとめ

結論として、男女ごとに対象の年齢層は異なるが、平均通勤時間は出生率に与える負の影響を与えていると考えられます。現在、少子化や晩婚化を解決させる様々な政策が、国や地域で実施されていますが、出生率を回復させるための政策の一つとして、平均通勤時間の長い地域を改善する政策を行うことで、日本の少子化の進行の流れを変化させる要因としてはたらくのではないでしょうか。

 

 

 

 

 

参考文献

戸田淳仁(2007)、『出生率の実証分析-景気や家族政策との関係を中心に』

小崎敏男(2010)、『若者を取り巻く労働市場の変化と出生率の変化』

みずほ情報総研株式会社(2005)『地域経済及び社会保障における地域差についての統計的分析』 

多田智和・杉下昌弘(2010)『全国及び47都道府県毎の生活時間相互の関係の傾向分析(参考比較:少子化指標、経済指標)』

伊達雄高・清水谷諭(2004)『日本の出生率低下の要因分析:実証研究のサーベイと政策的含意の検討』

宇南山卓(2011)『結婚・出産と就業の両立可能性と保育所の整備』

 

データ出典

総務省統計局『国勢調査

総務省統計局『社会生活基本調査』

厚生労働省『人口動態調査』

文部科学省『学校基本調査』

厚生労働省社会福祉施設等調査』

内閣府『県民経済計算』

厚生労働省『医師・歯科医師・薬剤師調査』

総務省統計局『就業構造基本調査』

総務省統計局『社会生活統計指標』

警察庁『犯罪統計』

 

 

少子社会日本―もうひとつの格差のゆくえ (岩波新書)

少子社会日本―もうひとつの格差のゆくえ (岩波新書)

 

 

 

保育園義務教育化

保育園義務教育化

 

 

卒論紹介『群馬県のふるさと納税における特典制度の影響と成功要因分析』

こんにちは。今回のブログでは、私(杉木)の卒業論文を紹介します。

テーマは、群馬県ふるさと納税における特典制度の影響と成功要因分析」です。

 

1.はじめに

そもそもふるさと納税とはどんな制度なのでしょうか?

これは、「生まれ育ったふるさとに貢献できる」、「自分の意思で応援したい自治体を選ぶことができる」納税制度として2008年度に創設された制度です。この制度が作られた背景には、都会一極集中と地方過疎という今の日本社会の現状があります。多くの人が地方で生まれながらも進学や就職を機に都会へ移り、その場所で納税を行う結果、都会の税収は増える一方で、ふるさとの税収は減ってしまいます。この地方と都市の税収格差という課題を解決するためにふるさと納税が創設されました。

 

2.全国の成功事例

次に、寄付金額が全国ランキング上位の、以下3市町村の成功例を調査しました。

この3自治体の特典の内容を見てみるとどれも中身が充実しています。そして3自治体ともに、特典を導入してから飛躍的に寄付件数・金額が伸びていました。ここから、ふるさと納税制度の寄付件数・金額の増加は特典制度の充実と相関関係があるのではないかという仮説が立ちました。

 

3.データ詳細

仮説を立証するための回帰分析で扱うデータについて説明していきます。データは以下の8種類です。

【表1 データ詳細】

変数名

単位

出典

ふるさと納税の寄付件数

(Donation Number)

ふるさとチョイスホームページ

 

ふるさと納税の寄付金額

(Amount of Money)

ふるさとチョイスホームページ

 

③人口(Population)

群馬県統計情報提供システムホームページ

④特典制度の有無

(Thanks Gift)

1:あり

0:なし

ふるさとチョイスホームページ

⑤クレジット決済の有無

(Credit Pay)

1:あり

0:なし

ふるさとチョイスホームページ

⑥特典が豪華

(High-return)

1:極めて豪華

0:それ以外

ふるさとチョイスホームページ

⑦特典が豪華でない

(Low-return)

1:豪華でない

0:それ以外

ふるさとチョイスホームページ

⑧特典制度導入経過年数(Passed years)

各市町村役場に問い合わせ

 

特筆すべきデータと

 

して、⑥⑦の特典の豪華さについて説明します。

【図1 各市町村の納税特典の豪華さ】

 f:id:SurugaD:20160223194452p:plain

 

4.回帰分析結果

次に、3のデータを回帰分析した結果を述べます。

①寄付件数

寄付件数と最も強い相関を示したのは、「特典の豪華さ」です。「特典が豪華でない」ことと「特典導入経過年数」は寄付件数と相関関係はないことが読み取れます。また、人口が多いとかえって寄付件数は少なくなるという結果も出ました。これは、寄付者は繁華街よりも田舎を選ぶ傾向があるのではと考えられるでしょう。

 

②寄付金額

寄付金額の増減は、「特典の有無」よりも「クレジット決済の有無」と「特典の豪華さ」と強い相関関係あるということが読み取れました。「クレジット決済」は、寄付者側が、寄付金額が多くなるほど手続きがより簡単なクレジット決済ができる市町村を選ぶ、または寄付金額が多い自治体ほどふるさと納税に力を入れているだろうと考えられます。

 

回帰分析の結果によって、①②ともに特典の豪華さが最も重要な要素と分かりました。

 

5.考察

では、特典の豪華さとは一体どんな要素が含まれるのでしょうか?群馬県内の市町村の特典例を見ていきます。

 

<寄付伸び率の高い県内3市町村の例>

榛東村(しんとうむら)

伊香保温泉の旅館金券

②だるま等の県の名産である工芸品

③果物(りんご、イチゴ)

④肉(手作りハム、上州牛サーロイン)

⑤その他コシヒカリ米や白子海苔セット等の特産品 

 

中之条町(なかのじょうまち)

四万温泉で使える半額相当の感謝券

特産品のセット

100万円以上の高額寄付者に対して、「1日町長就任権」特典 

 

草津(くさつ)

  • 半額相当の感謝券(飲食店・宿泊施設)
  • 草津温泉入浴券
  • スキー場リフト券

 

<寄付の少ない県内3市町村の例>

  • 高山村

5,000円以上の寄付で以下の2つの特典を贈呈している。

村内の店で利用できる「お礼券(金券)」

高山村の農産物等(お米・野菜・果物・加工品・他)の特産品 

 

一万円以上寄付した人には、以下の2つの特典がもらえます。特典の種類は一種類のみ。

  • 邑楽町産のブランド米5キログラムと、地場産品詰め合わせセットをプレゼント
  • 町の広報誌を1年間無料でお届け

 

うどんの詰め合わせ、または、またはうどんと日本酒の詰め合わせ

上記の2種類で、寄付金額は5000円から特典贈呈

 

これらの特典を見てみると、特典の豪華さは「還元率の高さ」と「利用上の制限がない」という共通点があると考えられます。

 

6.課題とまとめ

 4の分析結果から、寄付件数・金額増加のためには、特典の有無よりも「中身の豪華さ」が重要ということが分かりました。そして特典の豪華さとは、「還元率の高さ」と「利用上の制限がない」ということが明らかになりました。

 特典制度の運用については課題も多々ありますが、ふるさと納税の今後の発展のために、群馬県や全国の自治体でより戦略的に活用されるべきでしょう。

 

<参考資料>

総務省(2015),「よくわかる!ふるさと納税」,総務省ふるさと納税ポータルサイト(http://www.soumu.go.jp/main_sosiki/jichi_zeisei/czaisei/czaisei_seido/080430_2_kojin.html)

 <参考文献>

・黒田成彦(2015)『平戸市はなぜ、ふるさと納税で日本一になれたのか?』(KADOKAWA)

 

平戸市はなぜ、ふるさと納税で日本一になれたのか?

平戸市はなぜ、ふるさと納税で日本一になれたのか?

 

 

・宝島社(2014)『ふるさと納税完全ランキング』(宝島社)

 

ふるさと納税 完全ランキング2016 (TJMOOK)

ふるさと納税 完全ランキング2016 (TJMOOK)

 

 

増田寛也(2014)『地方消滅ー東京一極集中が招く人工急減』(中公新書