最近では、写真の検索が可能になりつつあります。
グーグルが提供する「Google フォト」というアプリでは、保存された写真について、いくつかの写真に写っている人物が同一人物か否かを識別します。そして、人物ごとのアルバムを作ってくれます。
これはかなり正確な識別であり、幼児が成長しても、同一の人物であると識別します(なお、類似のサービスを、マイクロソフトも提供しています)。
つい最近までは、人物以外の基準による識別は、不十分でした。ところが、最近、その能力が目に見えて向上しています。
テキスト検索のように自由な検索はできませんが、適切な検索語を入れると、その関連の写真を引き出します。
これで識別された写真をアルバムに入れるのは簡単な操作でできるので、写真の内容ごとにアルバムを作ることができます。こうして、素早く目的の写真を見いだすことができるようになりました。
ところで、こうした操作をしていると、画像に関連したデータをグーグルに提供していることになります。以下では、このことの意味を考えたいと思います。
グーグルが大量の学習データを得る
Google フォトは、写真に写っている人物を識別し、個人別のアルバムを作ってくれますが、その人の名前までは知りません。それは、利用者が入力するしかありません。
利用者としては、名前を入力しておくと何かと便利なので、入力します。
すると、Googleは、写真の人物の名前を知ることができるわけです。こうしてGoogleは、今や世界中の何億人という人物について、名前と顔を関連付けられるようになっているのです。
これには、いくつかの問題があります。
第1に、こうした方法で大量のデータを収集できる企業は、世界でごくわずかしかないということです。現在では、グーグルとマイクロソフト、それにフェイスブック程度ではないでしょうか?
また、中国の電子マネーであるアリペイは、顔認証による決済サービスを提供しているので、それを通じて顔の情報を入手することができます。
しかし、それ以外の企業は、こうしたことができません。
ところで、AIの能力を向上させるには機械学習が必要であり、そのためには大量のデータが必要です。そのデータを得ることができる企業がごく少数のものに限られてしまうということは、高度の画像認識能力を開発でき、それを活用できる企業が、ごく少数の企業に限られてしまうことを意味します。
われわれは、この状況をどう考えるべきでしょうか? 日本の企業は、このことの意味を真剣に考える必要があります。
無料会員登録はこちら
ログインはこちら