朝日新聞、読売新聞の報道による。
ウェブメディアが生成AIを使って作成した記事が、他の新聞記事からの盗用だったとして、公開が取り消された。
8月18日から23日に公開した49本の記事を取り消した。
これらはAIを使って作成したすべての記事らしい。
このうち、15本は、25文字以上連続して同一の記述が認められたという。
そのほかの記事にも、類似性が認められた。
明らかな盗用・剽窃と解釈し、ウェブメディア自身が謝罪し、取り消しを行なった。
生成AIの問題は当初から指摘されてきたが、今回、典型的な問題が実際に顕在化したと言える。
生成AIは、独自に取材し、記事を構成し記述しているわけではない。
ウェブ上に存在する膨大な文字情報から、関連した言葉をピックアップして、意味が通じるようにつなげているだけだ。
出来上がった文章を見ても、どこからこの情報を取り込んだのかは分からない。
いろんなところに存在する情報がごちゃ混ぜになっているので、特定できないのだ。
ところが、特定の希少性の高い情報となると、情報源は限られる。
今回は、元記事がスクープに近いもので、同じ内容が他のメディアから公開されていたために、関係者はすぐに盗用だと分かった。
著作権は、表現を保護するもので、そこに表現されている情報や考え方まで保護するものではない。
だから、同じ内容でも別の表現で表せば、著作権侵害にはならない。
今回の生成AIの記事は、元記事をまるまるコピペしたものではない。
元記事の言葉を使って別の記事を構成したもの。
なので、厳密には著作権の侵害には当たらない。
ただ、元記事の盗用・剽窃ということになると、言い訳ができない。
ウェブメディア側も、外部から指摘されて初めて気づいたようだ。
生成AIがどこから情報を取り込んでいるか分からないために、作成者も罪の意識が薄い。
それだけに、AIを利用するには慎重な対応が必要だということが分かる。
生成AIは便利なツールだということが分かってきて、ビジネスのいろんな場面で利用が始まっている。
だが、気づかぬうちに他者の権利侵害をしてしまい、そのことが後のトラブルに発展するリスクが新たに生じてきた。
生成AIは産業革命やIT革命に匹敵する大変革をもたらすと大げさに喧伝される。
しかし、考えてみると、AIは大したことをしていない。
言葉の表面的な意味は理解しているようだが、その背景の本質の意味までは理解できない。
AIの吐き出す文章は、その表記は完成度が高く、不自然なところがない。
そのために、その内容にまで信頼を寄せてしまいがちになるが、これは、ヒトがそう錯覚しているだけで、その内容の適否は何の保証もない。
今後は、AIの作成した文章が世の中にあふれるようになる。
その時、薄っぺらな情報ばかりが氾濫し、本質にかかわる情報はますますアクセスしにくくなるだろう。
インターネットが始まった時、「これで、世の中のあらゆることをネット上で知ることができるようになる」と言われたものだ。
だが、実際はそうではないことを私たちは知っている。
薄っぺらい情報ばかりが世の中に氾濫し、本質的な情報、本当に価値のある情報は、ますます手の届かないところにしまい込まれていった。
最近の私たちは、疑問に思うことがあると、自分で考える前にネットで検索する癖がついてしまった。
自分が疑問に思う程度のことは、既に同じことを思った人がたくさん存在しているはずなので、その答えをネット上で探せばいい。
生成AIは、これをより便利にできるようになったに過ぎないのではないか。