超新星｢東大発ベンチャー｣に漫画界が見る光明 革新的な｢自動翻訳｣で世界同時配信に挑む

1/3 PAGES

2/3 PAGES

ただ、漫画翻訳の市場はニッチだ。漫画やアニメが「クールジャパン」と称されて久しいが、海外の漫画市場をすべて合算したところで日本の3割に満たない1400億円ほど（2017年の経産省による委託調査。アメコミなども含む）。なぜこの領域での事業化に目をつけたのか。

『週刊東洋経済』8月17日発売号の特集は「すごいベンチャー100 2020年最新版」です。書影をクリックするとアマゾンのサイトにジャンプします。紙版はこちら、電子版はこちら

理由の1つが、石渡氏の幼少期の体験にある。日本人と中国人のハーフである石渡氏は、夏休みなどで中国の祖父母のもとへ遊びに行ったとき、地元の子どもが日本の漫画やアニメに親しんでいることを知った。テレビでは日中戦争時の日本兵を”鬼畜”として描く「反日ドラマ」が流れているが、その一方で子どもたちは日本の漫画キャラクターを通じて、日本に親しみを持ってくれている。

「漫画ってすごいな、と。漫画で国際交流をすれば、世界はちょっと平和になるんじゃないかと考えた」。これが、のちに漫画の自動翻訳に挑むうえでのモチベーションになった。

コマに何の絵が描かれているかも一緒に把握

もう1つの理由は、画像認識と機械学習の高い技術にチャレンジしたいという思いがあったことだ。漫画に使われるフォントは多様で、吹き出しの外に文字が書き込まれていることもある。さらに冒頭の例もしかり、セリフはときに独特な口語表現で記され、文法的な省略や、擬態語・擬音語も多い。

「例えば、漫画のあるコマに『アンパンマンだ！』と書かれた吹き出しがあるとする。この文字列だけ認識しても、アンパンマンが自ら名乗っているのか（I am）、バイキンマンがアンパンマンに呼びかけているのか（You are）、アンパンマンの登場に、群衆が声をあげているのか（He is）判別することはできない。自然な訳文を作るには、前後のコマや、同じコマに何の絵が描かれているかを把握する必要がある」（石渡氏）

マントラの独自性は、機械学習を行ううえで「教科書」の役割を担う学習データが漫画の翻訳に特化している点にある。漫画の日本語版と外国語翻訳版のテキストを画像データとして大量に読みこませることで、数百種類のフォント、約4000種類の文字を認識することを可能にした。

結果、グーグルの提供する画像認識システムで認識の精度が20%だった文字列を、60%の精度で認識することに成功。この精度は、読み込ませるデータの量が増えるほど高まる。こうして作られた学習データを自動抽出することによって、漫画として自然な翻訳ができる。

次ページが続きます：
【「海賊版」対策としても有効】