日本語バージョンのために900億円も注ぎ込んだ!アリババが"本気"で作ったAIボイスレコーダーが示す、未来の働き方

著者フォロー
ブックマーク

記事をマイページに保存
できます。
無料会員登録はこちら
はこちら

印刷ページの表示はログインが必要です。

無料会員登録はこちら

はこちら

縮小

AIボイスレコーダーは音声認識モデルがすべての音声を文字起こしし、続いてLLM(大規模言語モデル)が、きちんと設計されたテンプレートをもとに文脈を読み解きながら議事録などの形に構造化するという手順を踏む。この“二段構え”こそが、AIボイスレコーダーが単なる生成AIツールより実務向きである理由だ。

AIボイスレコーダーによる会議評価エージェント
ユニークな機能として、会議評価エージェントがある。参加者の積極性や専門性がAIに評価される。会議の録音資料がなかったため、取材インタビューを評価してもらったところ「技術理解が浅い」とのお叱りを受けた(筆者撮影)

リアルタイム翻訳機能は専門的な会議や商談に使うには物足りないが、日常会話などのちょっとしたコミュニケーションには十分使えるレベルにある。

これだけの精度と利便性を備えた製品だけに、企業利用を考えた場合に最大の懸念となるのが情報漏洩だ。録音したデータは1度サーバーに送られてから処理されるため、そこで情報が盗み見られるのではというのが気になる点だ。

DingTalk A1はシンガポールのアリババクラウド・サーバーでAI処理を行う。データの保存・処理サーバーを中国国外(シンガポール)に置くことで、中国国家情報法の適用リスクを回避していると担当者はコメントしている。

また運営会社がデータを勝手に閲覧できないことを証明する「ISO/IEC 27018(パブリッククラウドにおける個人情報保護)」および「SOC 2 Type II / SOC 3」(監査法人による厳格なレポート)を取得済みで、技術的に安全を担保している。企業側がこれ以上の証明を行うことは難しく、後は消費者がどう判断するかに任せられている。

ボイスレコーダーはAIエージェント駆動のカギ

DingTalk A1は優秀なAIボイスレコーダーと評価できる。ただ、IT企業のアリババがなぜデバイスに、しかもこれほどのリソースを注ぎ込んでいるのだろうか。実はこの背景は日本側の情報だけ見ていてはよくわからない。

このAIボイスレコーダーは、アプリ「ディントーク」から利用する仕組みになっている。DingTalkとは15年にローンチした、ビジネスチャット。チャット、ビデオ会議、ドキュメント生成、稟議申請、勤怠管理、クラウドディスクなどの機能を搭載しており、例えるならば「SlackとZOOMをくっつけたワークステーション」とでもいうべきか。

ちなみにディントークのディンとは「釘」の中国語発音で、すぐ返事が欲しい時にはこの機能を使うと、目立つ強烈な通知が送れる。通知方法も複数の種類があるが、AIが強面の男性の声で連絡をよこせと電話をかけるという、ユニークすぎる機能まであるという。スピードが求められるアリババならではだろうか。

ディントークを中国で導入している企業、学校などの組織は2600万に達し、ユーザー数は7億人を超える。テンセントのビジネス・ウィーチャット、バイトダンスのLark(ラーク、中国名は飛書)を抑えて中国トップシェアを誇る。

次ページアリババが構想する未来の会社?
関連記事
トピックボードAD
ビジネスの人気記事