ベストセラー書籍に「黄金の法則」はあるのか 「売れる文章」を見極める驚異のアルゴリズム

拡大
縮小

具体的なコードの内容に入る前に、彼らがどのような分析をしたか簡単に説明をしよう。まず、ニューヨーク・タイムズ紙のベストセラーリストから、ヒットした小説を500冊チョイスし、売れ行きが芳しくない小説4500冊と合わせて分析し、テキストの特徴を抽出する。観点は、Iやhimといった単語が使われる頻度や、単語の持つ意味(ポジティブかネガティブか)の振り分け、扱われるトピックの分類など。

この「テキスト・マイニング」と続けて行われたのが「機械学習」だ。これはテキスト・マイニングによって得た特徴を入力して、ベストセラーになるかどうかを予測するプロセスである。これらの解析の中にはコンピューターへ強い負荷が掛かるものもあり、著者らは1000台のコンピューターを用意し一度に1000冊処理する体制を整えたが、それでも4年の歳月を要したそうだ。

では、この惜しみない労力の結果を見ていこう。

ヒットした小説に共通するのは?

はじめは、文章中に含まれるトピック。アメリカでヒットした小説は、「弁護士と法律」「家庭の時間」「愛」「チームスポーツ」といった、日常生活に即したトピックを盛り込んでいる。興味深いのは、ベストセラー作家は、トピックを3つか4つ程度しか入れないのに対し、売れない作家は情報をやたらと詰め込む傾向があることだ。要するに、話があっちこっち飛ぶ作品はウケが悪い。

また、このトピックの条件をクリアしている例として挙げられているのが、『フィフティ・シェイズ・オブ・グレイ』だ。「ひどいポルノ小説だ」として作家や評論家からこき下ろされた大ベストセラーだが、実は大衆の心を巧みにつかむ三幕構成となっており、登場人物(と読者)感情の浮沈をグラフ化すると、あの『ダヴィンチ・コード』とほぼ一緒の波形を描くというのだから驚きである。ベストセラーは物語の基本をしっかり踏襲しているというわけだ。加えて著者らは、売れる作品のプロットラインを7つに分類している。

分析はさらに微に入り細をうがっていく。たとえば、ベストセラーは、冒頭の一文から惹き込んでくる。本文中で例示されているスティーヴン・キング『シャイニング』(深町眞理子訳、文藝春秋)を引用してみる。

“Jack Torrance thought: Officious little prick.
(鼻持ちならん気取り屋のげす野郎め、というのがジャック・トランスのまず感じたことだった。)”

たった6語で、二人の人間の対立をリズミカルに示唆している。なにより、人物の声がすっと入ってくる。売れる小説は、全般的に、余計な言葉を挟まず、I’dやyou’reといった縮約形も駆使して、短く簡潔に書かれている。これは、私も訓練しているが、小説のみならず、人に読ませる文章を書くうえで欠かせない技術である。

次ページ売れる小説の主人公たるもの
関連記事
トピックボードAD
ライフの人気記事
トレンドライブラリーAD
連載一覧
連載一覧はこちら
人気の動画
日本の「パワー半導体」に一石投じる新会社の誕生
日本の「パワー半導体」に一石投じる新会社の誕生
TSUTAYAも大量閉店、CCCに起きている地殻変動
TSUTAYAも大量閉店、CCCに起きている地殻変動
【田内学×後藤達也】新興国化する日本、プロの「新NISA」観
【田内学×後藤達也】新興国化する日本、プロの「新NISA」観
【浪人で人生変わった】30歳から東大受験・浪人で逆転合格!その壮絶半生から得た学び
【浪人で人生変わった】30歳から東大受験・浪人で逆転合格!その壮絶半生から得た学び
アクセスランキング
  • 1時間
  • 24時間
  • 週間
  • 月間
  • シェア
会員記事アクセスランキング
  • 1時間
  • 24時間
  • 週間
  • 月間
トレンドウォッチAD
東洋経済education×ICT