推薦します

地域偏差を解明するデータを一瞬に

一橋大学経済研究所教授 佐藤正広

 都道府県統計書は、1883(明治16)年に当時の内務省が様式を定めたところから始まり、第二次大戦前後の一時期を除いて、全国の都道府県で今日に至るまで刊行が続けられている総括統計書である。内容的には、土地、気象と言った地理的なものに始まり、人口、教育、経済、社会政策、金融、財政、行政、司法など非常に広範囲にわたる数値情報を含む。
 こうした内容を持つ都道府県統計書は、これまでにも経済史をはじめとする各研究分野で基礎資料として用いられてきた。ただ、その利用に当たっては、実は非常に大きな労力が伴うのが普通である。この統計書は単年度かつ単一の都道府県についての統計集であるため、あるデータ、例えば人口についてその年次的変化を追おうと思えば、膨大な統計書の山を前に、一冊ずつ頁をめくって必要な表をコピーする、あるいはマイクロフィルムリーダーに向かって延々と必要な表を探し続けなくてはならない。これは実に気の遠くなるような作業である。私もそうした作業をしてきたひとりである。
 このたび「都道府県統計書データベース」がオンラインで公開されるという。このデータベースには、8000冊もの統計書に掲載された統計データが、表単位で画像化されて収録されている。利用者は、適切なキーワードを入力することで、必要な表を瞬時にして一覧リストとして入手し、ダウンロードできる。例えば、新潟県で年次を定めずに「米」と検索すれば、明治時代から今日に至るまでの「米」に関する統計表がすべて列挙される。また、対象地域を全国あるいは一定の地方にして、特定年次について「賃銭」を検索すれば、これらに関する地域的偏差を解明する基礎になるデータが一瞬にして得られるという仕組みである。
 このデータベースの出現によって、従来労力の面でほとんど不可能であったような研究が、可能になっていく、そのような期待を抱いている。

推薦します

解き放たれたシジフォス
—『オンライン版 都道府県統計書データベース(PSO)』の衝撃—

成蹊大学経済学部教授 松本貴典

 私は今まで最もマイクロフィルム版『府県統計書』を利用してきた研究者の一人であろうと思う。100年前の全国流通地図を共同研究で造ったとき、近代日本の県民所得推計を行ったとき、『府県統計書』は基礎中の基礎資料であった。だから、マイクロフィルムを1枚1枚プリントアウトすることは避けては通れない作業であったのだが、作業中は「シジフォスの労働」という言葉が頭から離れなかった。前者を発表した本のあとがきに「プリントアウトを積み上げると150cmほどにもなった」とある。試みにこれを枚数換算すると17,000枚ほどになり、B4用紙に印刷したこれを重量換算すれば100kgを超える。出力時間を1枚あたり短く見積もっても90秒とすると、150cmまで積み上げるためには425時間の時間を使ったことになる。17日と17時間である。そんなにも長い間、シジフォスが岩を運び上げるその隣で、私はMF・リーダーのボタンを押し続けていたというのか。しかし、イノベーションの登場はいつも突然である。しかも、その効果は圧倒的に強力である。われわれはもうシジフォスの労働から解き放たれる。あのような作業はもう過去のものになるのだ。
 雄松堂が今回リリースする『オンライン版 都道府県統計書データベース(PSO)』が研究者にもたらす最大の福音は、サーチ時間の劇的短縮である。このデータベースには、メタ・データが細やかに作り込まれてあって——つまりすべての表のタイトルがインデックスされていて——見たい統計は即座に検索できる。検索結果をクリックすれば、もうモニターに目的の統計が画像(.JPG)として鮮明に表示されている。詳細は避けるが、その鮮明さは、オフセット印刷のレベルなど軽く超えた、高精細印刷に相当する。ということは、クロスセクションであろうが、タイムシリーズであろうが、パネルデータであろうが、データセットを組み上げるのに、今までのように何ヶ月単位、何年単位で考える必要などもうなくなり、所要時間は何日にまで劇的に短縮できるであろう。ならば、PSOの使用によって必然的に生じるのは、研究内容が「忍耐」で評価されるのではなく、「コンテンツ」そのもので評価されるという一大変化であるはずである。
 経済史研究にも「ビッグデータ」の波は到来する。PSOは、地域経済のダイナミズムを明らかにする扉を開き、新たな研究のフロンティアを指し示す鍵である。産業史、物価史、人口動態史、とにかくPSOのメタ・データごとに、研究者は新しい研究ができるのである。PSOは豊饒を約束する。お薦めする。