国会議事録をデータマイニングする

ブックマーク

記事をマイページに保存
できます。
無料会員登録はこちら
はこちら

印刷ページの表示はログインが必要です。

無料会員登録はこちら

はこちら

縮小
国会議事録をデータマイニングする

大学の教え子が経営する会社と一緒に「国会の議事録をデータマイニング」するプロジェクトを動かそうとしています。

「データマイニングって?」と思われる方も多いと思います。

 データマイニングとは、Wikipediaによると「明示されておらず、今まで知られていなかったが、役立つ可能性があり、かつ自明でない情報をデータから抽出すること」です。つまり、大量のデータから有用な情報を抽出する技術体系のことを指します。

 このデータマイニング技術を用いて、国会で行われている議論から有意義な情報を導き出せないか、挑戦しようというわけです。

 国会の議事録は、じつはきちんとインターネット上で「国会会議録検索システム(国会図書館運営/http://kokkai.ndl.go.jp/)」として公開されています。が、ほとんど読んでいる人はいないようです。要訳もなく、全ての文書を読む必要がある議事録だけでは、やはり国会の議論を多くの方に伝えることは難しいでしょう。

 これまでデータ源としてあまり活用されてこなかった国会議事録ですが、「データマイニング」により分析することによって、国会での各議員の発言傾向や、政策の審議状況などを、評価することが可能になるのです。

「偽」を含む発言の分析
 
 では、「データマイニング」によって、どんなことができるのかをお見せしたいと思います。

 まだまだ動き出したばかりですので、政策に直接関係するような分析はできていませんが、一つの例示として日本漢字能力検定協会が「2007年の漢字」に選んだ「偽」という文字に関連し、2007年に国会議員の発言がどのようにされたかを見てみます。

 国会議事録内での発言内容のうち、「偽」を含む発言を抽出して、各国会議員の発言回数や発言内に含まれる単語の分析を行ってみました。「偽」という漢字は単独では意味を持ちません。では、国会でどんな「偽」を含む言葉が使われたかを見てみましょう。

 国会のサイトから抽出した2007年の国会議事録を、複合自動作成テキストマイニング技術で抽出し、当該単語を含む発言件数順にランキングを取ってみると、
1位 虚偽/221件
2位 偽装請負/ 149件
3位 偽装/100件
などのようになっています。


 ちなみに、漢字検定協会のサイトhttp://www.kanken.or.jp/kanji/kanji2007/kanji.htmlでは、
食肉、野菜、菓子、ファーストフードなど、産地や素材、賞味期限の「偽」
年金記録、政治活動費、米艦への給油量など、政治の「偽」
伝統ある土産品や、老舗料亭など老舗にも「偽」
耐震強度偽装、スポーツ選手、英会話学校にも「偽」
中国には「偽」の遊園地開業
などと書かかれています。

「偽」へのこだわりは野党が強い

 国会での「偽」に関する個別の発言回数を見てみましょう。


 2007年に国会で行われた発言回数は96,795件(審議中に発言して発言を終了すると1件とカウント。つまり、1回の審議で議員は数十回発言することになる)。このうち「偽」という文字を含む発言は858件ありました。

 政党別発言数では、自民党44%、民主党36%、公明党8%であるのに対し、「偽」という文字を含む発言では、民主党46%、自民党25%、共産党11%という順になりました。「偽」へのこだわりは野党が高いという傾向がご理解いただけます。やはり与党を批判する勢力としての野党の位置づけがあるようです。

 また、「偽」を含む発言の多い議員で見ると、川内博史議員(民主党/38件)、冬柴鐵三議員(公明党/24件)、高山智司議員(民主党/22件)の順となりました。以下のランキングを見ていると、民主党でも問題の追及が厳しい論客の議員が「偽」という文字を使っているようです。

 このように国会の議事録をマイニングすれば、議事録を読まなくとも、何がどのような頻度で議論されているかが分かります。また何より「どの議員が何に関心を持って、国会でどのような活動をしているか」を多くの方に見ていただけるようにもなります。 


 正直なところ、国会議員の中には、国会活動を軽視し、地元で選挙活動を重点的にやっている議員が選挙で勝ち、国会活動をまじめに行っている議員が選挙で苦戦してしまう現状もあります。

 これでは「国会活動ってなんだろう」と思ってしまいます。このような国会での国会議員の活動を掘り下げ(マイニング)して多くの方々に見えるようにすれば、政治の健全化につながるのでは考えています。

藤末健三●ふじすえ けんぞう
民主党参議院議員。1964年熊本県生まれ。東京工業大学卒業後、通産省(現・経産省)に入省。マサチューセッツ工科大学大学院、ハーバード大学大学院を修了。99年、東京工業大学で博士号取得。東京大学講師、助教授を経て04年参院選初当選。

ブックマーク

記事をマイページに保存
できます。
無料会員登録はこちら
はこちら

印刷ページの表示はログインが必要です。

無料会員登録はこちら

はこちら

関連記事
トピックボードAD
政治・経済の人気記事