ヘミングウェイが偉大な作家である数学的根拠 古典文学やベストセラーを統計を通して分析

著者フォロー
ブックマーク

記事をマイページに保存
できます。
無料会員登録はこちら
はこちら

印刷ページの表示はログインが必要です。

無料会員登録はこちら

はこちら

縮小

もちろんそれだけでは何も分析していないのと対して変わらない。考慮しなければならないのはたとえば、はたして本当に副詞の使用は個人的な好みを超えて作品のクオリティに直結しているのだろうか?

本書ではそれを分析するために、最良の20世紀文学についてのリストを集め、その登場頻度を客観的に優れた本の定義として用い、「最良の作品群」と「それ以外」の群で副詞の使用頻度を比較している。その結果は──1万語に対して副詞が0〜49語の本のうち、67%が当時の批評家によって「優れた」作品と認定されており、割合としては確かにトップとなった。150語以上副詞を含む本で、批評家の「優れた」作品認定を受けたのはたったの16%だ。

「そうなんだ。じゃあ副詞は小説にはいらないんや!」と思いそうになるが、50語以下であっても33%は優れた認定を受けていないわけで、絶対唯一の指標でもなんでもない。せいぜい「副詞を抑えた方が評価が高まる傾向にある」というぐらいだろう。

とはいえ、ここから興味深い事例もみえてくる。カート・ヴォネガットの長編のうち、最も評価の高い3冊『猫のゆりかご』『スローターハウス5』『チャンピオンたちの朝食』はヴォネガットの全作品中副詞を使わない小説の1、2、3位であるなどなど。副詞1つとってもみえてくるものは多い。

ファン・フィクションを分析対象にする

こうした分析で難しいのは分析対象のテキストデータを出版社なり作家なりと交渉して手に入れなければいけない(著作権が切れていてフリーで入手できるか)ので数があまり揃えられないところにあるが、本書の場合ネット上でダウンロードできるファンフィクションのテキストデータを用いているのがおもしろい(日本でいえば「小説家になろう」や「カクヨム」から引っ張ってくるようなもの。扱い方を間違えると容易く炎上するので、注意が必要だが……)。

『数字が明かす小説の秘密 スティーヴン・キング、J・K・ローリングからナボコフまで』(書影をクリックすると、アマゾンのサイトにジャンプします)

副詞の分析でも、プロ作家とアマチュア作家(FanFictionからとってきたもの)を対比させており、ファンフィクション作家の中央値は1万語あたり154語の副詞使用率で、プロ作家のサンプルと比べるとかなり高い割合である。多くの作家や教師によって副詞は良くないとされているので、これ自体はそう意外な話ではないが、やはりデータの裏付けがあるのは強い。

本記事ではおもに副詞の使用頻度に絞って紹介を行ったが、本書ではこの後にも男女間の使用単語の差、単語の使用頻度などから個人の指紋を見つけ出せるのか問題、句読点・感嘆符の使用頻度と作品のクオリティの相関など、文章表現上参考になりそうな話題が連続していくので、客観的なデータに裏打ちされた文章技法の本として読んでも勉強になるだろう。

こうした文章の分析は、特別な研究者やプログラマしかできないのかといえばそうではない。オープンソースの形態素解析ライブラリ(たとえばRubyのMecab/Natto)が存在しているし、本書に出てくる分析例の多くは、プログラムに習熟していなくても簡単にできるレベルのものである。僕も時間が出来たら青空文庫収録の作品などを利用して書いてみようと思う。

冬木 糸一 HONZ

著者をフォローすると、最新記事をメールでお知らせします。右上のボタンからフォローください。

1989年生。フィクション、ノンフィクション何でもありのブログ「基本読書」運営中。 根っからのSF好きで雑誌のSFマガジンとSFマガジンcakes版」でreviewを書いています。

 

この著者の記事一覧はこちら
ブックマーク

記事をマイページに保存
できます。
無料会員登録はこちら
はこちら

印刷ページの表示はログインが必要です。

無料会員登録はこちら

はこちら

関連記事
トピックボードAD
ライフの人気記事