2023年10月09日

生成AIによる盗用記事

 朝日新聞、読売新聞の報道による。
 ウェブメディアが生成AIを使って作成した記事が、他の新聞記事からの盗用だったとして、公開が取り消された。
 8月18日から23日に公開した49本の記事を取り消した。
 これらはAIを使って作成したすべての記事らしい。
 このうち、15本は、25文字以上連続して同一の記述が認められたという。
 そのほかの記事にも、類似性が認められた。
 明らかな盗用・剽窃と解釈し、ウェブメディア自身が謝罪し、取り消しを行なった。

 生成AIの問題は当初から指摘されてきたが、今回、典型的な問題が実際に顕在化したと言える。
 生成AIは、独自に取材し、記事を構成し記述しているわけではない。
 ウェブ上に存在する膨大な文字情報から、関連した言葉をピックアップして、意味が通じるようにつなげているだけだ。
 出来上がった文章を見ても、どこからこの情報を取り込んだのかは分からない。
 いろんなところに存在する情報がごちゃ混ぜになっているので、特定できないのだ。
 ところが、特定の希少性の高い情報となると、情報源は限られる。
 今回は、元記事がスクープに近いもので、同じ内容が他のメディアから公開されていたために、関係者はすぐに盗用だと分かった。
 
 著作権は、表現を保護するもので、そこに表現されている情報や考え方まで保護するものではない。
 だから、同じ内容でも別の表現で表せば、著作権侵害にはならない。
 今回の生成AIの記事は、元記事をまるまるコピペしたものではない。
 元記事の言葉を使って別の記事を構成したもの。
 なので、厳密には著作権の侵害には当たらない。
 ただ、元記事の盗用・剽窃ということになると、言い訳ができない。

 ウェブメディア側も、外部から指摘されて初めて気づいたようだ。
 生成AIがどこから情報を取り込んでいるか分からないために、作成者も罪の意識が薄い。
 それだけに、AIを利用するには慎重な対応が必要だということが分かる。
 生成AIは便利なツールだということが分かってきて、ビジネスのいろんな場面で利用が始まっている。
 だが、気づかぬうちに他者の権利侵害をしてしまい、そのことが後のトラブルに発展するリスクが新たに生じてきた。

 生成AIは産業革命やIT革命に匹敵する大変革をもたらすと大げさに喧伝される。
 しかし、考えてみると、AIは大したことをしていない。
 言葉の表面的な意味は理解しているようだが、その背景の本質の意味までは理解できない。
 AIの吐き出す文章は、その表記は完成度が高く、不自然なところがない。
 そのために、その内容にまで信頼を寄せてしまいがちになるが、これは、ヒトがそう錯覚しているだけで、その内容の適否は何の保証もない。
 今後は、AIの作成した文章が世の中にあふれるようになる。
 その時、薄っぺらな情報ばかりが氾濫し、本質にかかわる情報はますますアクセスしにくくなるだろう。
 
 インターネットが始まった時、「これで、世の中のあらゆることをネット上で知ることができるようになる」と言われたものだ。
 だが、実際はそうではないことを私たちは知っている。
 薄っぺらい情報ばかりが世の中に氾濫し、本質的な情報、本当に価値のある情報は、ますます手の届かないところにしまい込まれていった。

 最近の私たちは、疑問に思うことがあると、自分で考える前にネットで検索する癖がついてしまった。
 自分が疑問に思う程度のことは、既に同じことを思った人がたくさん存在しているはずなので、その答えをネット上で探せばいい。
 生成AIは、これをより便利にできるようになったに過ぎないのではないか。
 
 
posted by 平野喜久 at 09:54| 愛知 ☔| Comment(0) | TrackBack(0) | 世事雑感 | このブログの読者になる | 更新情報をチェックする