東洋経済オンラインとは
ライフ

想像以上に仕事が変わるAIボイスレコーダー PLAUD NOTEの実力と活用法

10分で読める
2/6 PAGES
3/6 PAGES
4/6 PAGES

ChatGPTの開発元であるOpenAIが開発しているWhisperは、実に121もの言語を文字起こしする。当然、フランス語ならフランス語。英語なら英語で文字が起こされるが、この”文字起こし文”をAIが処理した結果は、任意の言語でレポートしてもらうことができる。

外国語の録音を日本語でレポートさせることも

規定値では録音言語のまま要約が作成されるが”再要約”させる際に、出力言語を切り替えることが可能だ。例えば、9月に行われたiPhoneなど年末のApple製品を発表するイベントを録音させまとめさせてみた。

その一部を画面キャプチャーでお見せするが、あらかじめ決まったプレゼンテーションのように、論理的な構造が明確な音声データに関しては、実に的確なレポートをしてくれることがわかるだろう。このまま記事にできるわけではないが、記事を書くうえでの大きな助けにはなる。

(画像:筆者作成)

ここでは発表会について録音してレポートをさせたわけだが、当然ながらほとんどのカンファレンスにおけるプレゼンテーションは、同様に要点をまとめて順序立てて説明されているため、今回の製品とは相性が極めていい。

実用面でもとても便利なのだが、筆者の場合、英語以外のヨーロッパ言語をほとんど理解できないため、フランスやベルギー、あるいはロシアなどの国で行われたインタビューや、何らかのテレビ番組のナレーションなどを録音し、その内容について把握するためにも使っている。

実はこの製品、ハードウェアとして販売されているが、ウェブ版のインターフェースを用いて任意のオーディオファイルをアップロードして分析させることもできるため、元のオーディオデータさえあれば、どんな音声データであったとしても、要約やアクションアイテムの分析などを取り出すことができる。

次ページが続きます

5/6 PAGES
6/6 PAGES

こちらの記事もおすすめ

あなたにおすすめ

ライフ

人気記事 HOT

※過去1週間以内の記事が対象