ポッドキャスト風に男女2人が軽妙トークを展開するグーグルAI「NotebookLM/音声概要」がついに日本語にも対応、その自然な会話力に震えた!
音声概要はまだ実験的な段階だ。機能的には驚きを与えるに十分なものだが、難点もある。
まず設定の自由度は高くない。音声のホスト役は男女の固定された音声と喋り方に固定されており、会話の長さや資料のうちどのテーマに言及するのかなどをユーザーが調整することはできない。男女のどちらがホストで、どちらが専門家の役目を果たすかもランダムで、生成するたびに主題とするテーマの説明方法も変化する。
しかしノートブックLMのプロダクトリーダーであるライサ・マーティン氏は「最初は驚きから始まるが、すぐに、自分で生成する会話内容をカスタマイズしたくなるもの」とブログに記しており、今後は会話を自由に調整するためカスタマイズ機能を順次リリースしていくという。
対話への参加も可能に
根本的な機能アップも並行して進められている。日本語にはまだ未対応だが、英語版では「インタラクティブ音声モード」が登場し、ユーザーが音声概要の再生中にマイク入力でホストに質問し、対話に「参加」できるようになった。
その場でAIホストの解説役にパネラーとして質問し、回答や新しい議論の種にできるわけだ。「音声で理解しながら即座に疑問をぶつけて解消する」という双方向の学習形態とも言えるが、視点を変えると社内教育プログラムなどの開発に使える、という見方もできる。「音声概要」の進化は、まだ始まったばかりといえそうだ。
文書の整理を得意とするAIや、人間に近い抑揚でテキストを音声化するAIは数多く開発されている。例えば静止画に音声を与えることで、人間が表情を変えながら話をする動画を生成できる「Hedra」という生成AIサービスがある。プロンプト指示だけで高品位な動画が得られる点で注目されている。
こうしたAIの進化によって、ポッドキャストはもちろん、YouTube投稿動画や広告動画などのあり方も大きく変わっていくことになりそうだ。
記事をマイページに保存
できます。
無料会員登録はこちら
ログインはこちら
印刷ページの表示はログインが必要です。
無料会員登録はこちら
ログインはこちら
無料会員登録はこちら
ログインはこちら