ヘミングウェイが偉大な作家である数学的根拠 古典文学やベストセラーを統計を通して分析
小説を評する、分析するといえば基本的には一人の人間が精読することによってそこで用いられている技法や、他の作品との関連、歴史的な意義などをあぶり出していく行為のことである。
だが、それだけではなく、統計を通して語句の使用頻度、プロットの盛り上がり、書き出しについてなどを分析する手法も現在では発展してきた。本書『数字が明かす小説の秘密』は、そんな後者のアプローチを古典文学からベストセラーまで幅広く応用した1冊だ。
かつては作家の文章における使用単語の頻度などを調べたい場合、地道に人間が数え上げていくほかなかったが、近年はプログラムを組んでテキストデータを流し込めば、お手軽かつ精確に同様の分析を行うことができる。
著者らも自然言語ツールキットを用いて、文章を品詞ごとに分解した調査を行っている。この分野に関して、類書として邦訳本だけでもすでに『ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム』や『遠読――〈世界文学システム〉への挑戦』などが存在するが、本書の特徴といえるのは主に作家ごとの文体に絞って分析を行っているところだろう(とはいえ、ベストセラーコードとはだいぶ内容が被ってはいるんだけど)。
ヘミングウェイの副詞の使用頻度は少ないのか?
たとえば、ヘミングウェイは切り詰められた文体がその特徴とされているが、実際にそれが文章を分析することで数字として現れてくるのだろうか。それについて本書では、まず形容詞や動詞を就職する副詞の使用頻度をランク付けすることで、ヘミングウェイの文章の特徴をあぶり出していく。
なぜなら副詞とは、(スティーブン・)キングが「副詞は君の友達じゃない」とディスり、『ファイトクラブ』の著者であるチャック・パラニュークも「sleepily(眠たげに)とかirritably(苛立たしげに)とかsadly(悲しげに)みたいな、バカげた副詞はやめてくれ」と書く悪の存在だからだ。
つまり副詞は──ここでいう副詞とは主に-lyで終わる単語という意味だが──少なくとも作家の一部からは嫌われている要素になる。それでは、実際彼らの副詞の使用頻度はどうなっているのだろうか。
1万語ずつの-ly型副詞の使用回数を著名な作家15人ごとに(少ない順から)ランク付けすると、スティーヴン・キングは105語で8位、J・K・ローリング140語で14位、マーク・トウェインは81語で2位、アーネスト・ヘミングウェイは80語で1位だ。仮に-ly型の副詞を使うのが根本的に文章にマズイ効果をもたらすなら、ヘミングウェイは確かに偉大な作家である。
無料会員登録はこちら
ログインはこちら