ポッドキャスト風に男女2人が軽妙トークを展開するグーグルAI「NotebookLM/音声概要」がついに日本語にも対応、その自然な会話力に震えた!

著者フォロー
ブックマーク

記事をマイページに保存
できます。
無料会員登録はこちら
はこちら

印刷ページの表示はログインが必要です。

無料会員登録はこちら

はこちら

縮小

音声概要はまだ実験的な段階だ。機能的には驚きを与えるに十分なものだが、難点もある。

まず設定の自由度は高くない。音声のホスト役は男女の固定された音声と喋り方に固定されており、会話の長さや資料のうちどのテーマに言及するのかなどをユーザーが調整することはできない。男女のどちらがホストで、どちらが専門家の役目を果たすかもランダムで、生成するたびに主題とするテーマの説明方法も変化する。

しかしノートブックLMのプロダクトリーダーであるライサ・マーティン氏は「最初は驚きから始まるが、すぐに、自分で生成する会話内容をカスタマイズしたくなるもの」とブログに記しており、今後は会話を自由に調整するためカスタマイズ機能を順次リリースしていくという。

対話への参加も可能に

根本的な機能アップも並行して進められている。日本語にはまだ未対応だが、英語版では「インタラクティブ音声モード」が登場し、ユーザーが音声概要の再生中にマイク入力でホストに質問し、対話に「参加」できるようになった

その場でAIホストの解説役にパネラーとして質問し、回答や新しい議論の種にできるわけだ。「音声で理解しながら即座に疑問をぶつけて解消する」という双方向の学習形態とも言えるが、視点を変えると社内教育プログラムなどの開発に使える、という見方もできる。「音声概要」の進化は、まだ始まったばかりといえそうだ。

文書の整理を得意とするAIや、人間に近い抑揚でテキストを音声化するAIは数多く開発されている。例えば静止画に音声を与えることで、人間が表情を変えながら話をする動画を生成できる「Hedra」という生成AIサービスがある。プロンプト指示だけで高品位な動画が得られる点で注目されている。

こうしたAIの進化によって、ポッドキャストはもちろん、YouTube投稿動画や広告動画などのあり方も大きく変わっていくことになりそうだ

本田 雅一 ITジャーナリスト

著者をフォローすると、最新記事をメールでお知らせします。右上のボタンからフォローください。

ほんだ まさかず / Masakazu Honda

IT、モバイル、オーディオ&ビジュアル、コンテンツビジネス、ネットワークサービス、インターネットカルチャー。テクノロジーとインターネットで結ばれたデジタルライフスタイル、および関連する技術や企業、市場動向について、知識欲の湧く分野全般をカバーするコラムニスト。Impress Watchがサービスインした電子雑誌『MAGon』を通じ、「本田雅一のモバイル通信リターンズ」を創刊。著書に『iCloudとクラウドメディアの夜明け』(ソフトバンク)、『これからスマートフォンが起こすこと。』(東洋経済新報社)。

この著者の記事一覧はこちら
ブックマーク

記事をマイページに保存
できます。
無料会員登録はこちら
はこちら

印刷ページの表示はログインが必要です。

無料会員登録はこちら

はこちら

関連記事
トピックボードAD
ビジネスの人気記事