生成AIの「無断学習」を規制するうえでの論点 強く規制することにはデメリットも
また、労働の義務がなく自由な思索に集中できたために、古代ギリシャの哲学者が革新的な思想を生み出せた歴史や、資産家に保護されることによって、ルネサンス期の文化人が活躍できた歴史などが示すように、「自由な時間」は人間が創造性や独創性を発揮させ、新たな発見や発明、芸術的な表現を創出する源泉となります。
ここからは、生成AIに関して巻き起こっている議論を掘り下げたいと思います。
生成AIは学習データを無断で使用していいのか?
生成AIと呼ばれているAIのほとんどは、学習のために膨大なデータを必要とします。もっとも、これは生成AIに限った話ではなく、われわれが普段何気なく使っているサービスの背後にある、生成を目的としないAIでも同じことです。
これは、現在の人工知能技術の主流で生成AIの基盤技術となっている機械学習・ディープラーニングの本質的な性質が、「膨大なデータから学習することで、とてつもない性能を発揮できる」ことに起因します。これらのAIを運用しているのは、Google、Amazon、Meta、Appleのように、インターネット上で多くのデータを収集している企業、あるいはWebのクローリングによってデータを収集しているOpenAI社や大学のような組織です。
われわれはこれらのサービスを日常的に、背後にあるAIの学習データを意識することなく利用していますが、ほとんどの場合、学習のもとになるデータは、普通にインターネットを使用している一般ユーザーが生み出した文章や画像です。つまり、これらのデータは、生み出したユーザーが著作権者として権利を持つ著作物です。
しかし、インターネット上になんらかのコンテンツを投稿したことがある人で、Googleなどからデータの使用許可の要請を受け取った人はまずいないでしょう。基本的にほとんどの場合、これらの著作物を許可なくAIの学習に使うこと自体は合法です。
これまでは、そのことで被害を受けたという意識を抱く人は少数でしたが、生成AIブームによって、このようなデータを用いた学習が注目を集め議論となっています。文章の執筆を生業とする作家や翻訳者もそうですが、特にイラストなどの創作活動を行う業界でこのことが問題視されています。
無料会員登録はこちら
ログインはこちら