生成AIに使用されるデータセットに含まれるもの及び、
収集方法などに関する問題の事例集
※アノテーション(タグ付け作業)等の問題についてはこちらをご参照ください。
※生成AI関連の訴訟・法的対応事例についてはこちらをご参照ください。
※🔒:会員限定記事、🔐:有料記事
収集方法などに関する問題の事例集
※アノテーション(タグ付け作業)等の問題についてはこちらをご参照ください。
※生成AI関連の訴訟・法的対応事例についてはこちらをご参照ください。
※🔒:会員限定記事、🔐:有料記事
2026年
| 日付 | 出来事 | 発信元 |
|---|---|---|
| 5/29 | 生成AIの裏で大規模なプライバシー侵害 設計段階から違法性 | AMNESTY |
| 4/25 | 米メタ、社員のパソコン操作データを強制収集 AI開発に利用 | 日本経済新聞🔒 |
| 4/7 | AppleがAIトレーニングのために数百万本のYouTube動画をスクレイピングしたとして複数のYouTubeチャンネルから訴えられる | GIGAZINE |
| 3/3 | Metaのスマートグラスの背後にいる「データアノテイター」はユーザーのプライベートな映像や写真をすべて見ることができる | GIGAZINE |
| 2/28 | アンソロピック「プロジェクト・パナマ」事件―7つの視点からの考察 | AFPBB |
| 2/5 | 「Chrome」のAI搭載拡張機能、半数がユーザーデータを収集 | ZDNET |
| 2/2 | アンソロピック「プロジェクト・パナマ」事件―7つの視点からの考察 | note |
| 1/30 | Amazonから報告されるAIトレーニングデータ内の児童性的虐待コンテンツの数は「異例の多さ」で情報源が分からないとの指摘 | GIGAZINE |
| 1/26 | ChatGPTがイーロン・マスクの百科事典サイト「Grokipedia」の情報を引用しているとの報道 | GIGAZINE |
| 1/20 | NVIDIAが海賊版サイト「Anna’s Archive」から500TBのデータ提供を受ける約束をしていたことが判明 | GIGAZINE |
| 1/19 | 何百件もの著作権侵害報告を「意図的に無視した」としてMetaが訴えられる | GIGAZINE |
| 1/16 | Microsoft・Meta・Amazon・Perplexity・Mistral AIがWikipediaの有料プログラムパートナーとして公式に発表 | GIGAZINE |
| 1/13 | 複数のAIで『ハリー・ポッター』などの書籍を7割から9割出力可能であることが実証される | GIGAZINE |
| 1/10 | 生成AIは「ハリー・ポッター」を丸暗記している:スタンフォード大らが暴いた商用LLMの“記憶”と著作権の危機 | XenoSpectrum |
2025年
2024年
2023年
2022年
| 日付 | 出来事 | 発信元 |
|---|---|---|
| 12/20 | データ泥棒にご用心! 大人気のアバター作成AIアプリの落とし穴 | ARTnewsJAPAN |
| 9/22 | 画像生成AIユーザーがAI学習用データセットから「自分の医療記録の写真」を発見してしまう | GIGAZINE |
| 8/31 | 23億枚もの画像で構成された画像生成AI「Stable Diffusion」のデータセットのうち1200万枚がどこから入手した画像かを調査した結果が公開される | GIGAZINE |
2018年
| 日付 | 出来事 | 発信元 |
|---|---|---|
| 11/15 | 病院患者160万人の医療データが今やGoogleに握られていると権利団体が警鐘を鳴らす | GIGAZINE |