AI画像生成・生成系AI 問題まとめwiki

データセット・スクレイピング関連の事例一覧

最終更新：2025年07月17日 16:14

burger

- view

メンバー限定登録/ログイン

■データセット・スクレイピング関連

生成AIに使用されるデータセットに含まれるもの及び、
収集方法などに関する問題の事例集
※🔒：会員限定記事、🔐：有料記事

2025年

日付	出来事
7/14	ChatGPTの結果がLLMスパムに汚染され始めた（海外SEO情報ブログ）
6/30	GoogleのAI「Gemini」のトレーニング業務などを担うScale AIで未審査のフリーランサーによるあまりにも粗悪な仕事が横行していたことが判明（GIGAZINE）
1/23	米リンクトインを集団訴訟で提訴、個人情報をAI開発に無断提供（ロイター）
1/11	OpenAIのクローラーボットが3Dスキャンデータ販売サイトをほぼDDoS攻撃な徹底スクレイピングでダウンさせていた（GIGAZINE）

2024年

日付	出来事
12/23	伊、オープンAIに罰金チャットGPTがデータ保護規則違反（ロイター）
9/2	Stable Diffusionにも使われるデータセット「LAION-5B」に児童性的虐待コンテンツが見つかり開発元がリンクを削除した「Re-LAION-5B」をリリース（GIGAZINE）
8/8	XがEUのユーザーデータを使用して同意なくGrokをトレーニングしたとして告訴される（GIGAZINE）
8/6	Meta 顔認識技術による個人情報収集問題でテキサス州と単一州では過去最多の約2,100億円で和解（Ledge.ai）
6/17	生成AI検索エンジンのPerplexityはクローラーを防ぐ「robots.txt」を無視してウェブサイトから情報を抜き出している（GIGAZINE）
6/11	画像生成AIのStable Diffusionなどに使われるデータセット「LAION-5B」に同意のない子どもの写真が含まれており身元まで特定可能（GIGAZINE）
4/7	事件・事故の犠牲者の顔写真、生成AIが無断使用…遺族「使うのやめて」・識者「尊厳にかかわる」（読売新聞）
3/26	水遊び、内科検診…園児の裸画像、ポルノ流用横行、AI用データにも（毎日新聞🔐）
3/21	生成AI、児童ポルノ画像を学習か…専門家「被害者の人権侵害恐れ」（読売新聞）
3/21	生成AIが違法画像学習か、データ収集先に画像投稿サイトやネット掲示板…フィルターすり抜けも（読売新聞）
3/12	画像生成AI・Midjourneyが「Stable Diffusion開発元のBOTによるプロンプトと画像の大量収集」を検知して当該アカウントを永久BAN（GIGAZINE）
1/16	生成AIが潜在的に抱える「モデル崩壊」問題が早くも顕在化し始めた（日経クロストレンド）
1/13	人気の画像生成AIモデルが子どもの虐待画像でトレーニングされていたことが判明（Ledge.ai）
1/6	画像生成AIの訓練に「児童ポルノ」が使用されていたことが発覚（Forbes JAPAN）
1/5	6歳児を含む1万6000人の作家リストが流出。AIの訓練に使用したとしてMidjourneyに非難が殺到（ARTnewsJAPAN）

2023年

日付	出来事
12/25	「見ず知らずの他人がChatGPTに搭載されている大規模言語モデルから自分のメールアドレスを入手していた」という報告（GIGAZINE）
12/21	画像生成AI「Stable Diffusion」などに使われた50億枚超の画像セット「LAION-5B」に1008枚の児童ポルノ画像が入っていることが判明し削除へ（GIGAZINE）生成AIの学習データに児童虐待画像米大学研究者が指摘（日本経済新聞）
12/15	DropboxユーザーのデータをOpenAIと共有する機能がデフォルトで有効になっているとの指摘で大炎上、実際はAI機能利用者のみ（GIGAZINE）
12/14	メタのAI画像生成ツール、唯一の欠点はユーザーがソースとなる画像を提供（Forbes JAPAN）
12/11	AI企業は人間が作ったデータを使い果たした。彼らは今、AIを使ってより多くのものを作ろうとしている（AINOW）
12/9	「ChatGPT」から個人情報含む学習データの抽出に成功 Google DeepMind研究者ら（CNET※）
9/23	結婚相談所の会員データベースからプロフィールを取ってくるやつ出来た！！（x.com）
8/17	OpenAI、著作権保護作品をChatGPTの訓練に使っていることを隠蔽か。バイトダンスのAI研究チームが指摘（BUSINESS INSIDER）
7/18	検索エンジン「Brave Search」がウェブ上の著作権コンテンツを収集してAI学習用に有料販売しているという指摘（GIGAZINE）
7/15	Meta・OpenAI・Google AI学習データをめぐり次々と集団訴訟に（Ledge.ai）
5/16	うお、マクドナルド行けた。スクレイピングし放題じゃねぇか・・ #ChatGPT（x.com）
5/15	画像生成AIに「普通のおじさん」を作らせました→そっくりすぎる「本人」が登場し「自分でも自分に見える」と驚愕する珍事が発生（BuzzFeed）
4/27	画像生成AIによる作品の無許可使用を主張した写真家が逆に損害賠償を請求される（GIGAZINE）
4/21	ユーザーの同意なしに訓練した可能性のあるChatGPTの「OpenAI」が厳格なプライバシー法を重視するEUで法的な問題に直面、「規則の準拠は不可能に近い」と専門家（GIGAZINE）
3/29	「企業の機密データをChatGPTに勝手に入力したことがある」という社会人が大量発生しておりセキュリティ上の懸念が高まっているとサイバーセキュリティ企業が指摘（GIGAZINE）
3/27	ChatGPTのAPIをハッキングしたら80以上の「秘密のプラグイン」を発見したという報告（GIGAZINE）
1/18	画像生成AI「Stable Diffusion」開発元のStability AIがかつてGoogleを和解に持ち込ませたこともあるストックフォトサイトのGetty Imagesに訴えられる（GIGAZINE）

2022年

日付	出来事
12/20	データ泥棒にご用心！大人気のアバター作成AIアプリの落とし穴（ARTnewsJAPAN）
9/22	画像生成AIユーザーがAI学習用データセットから「自分の医療記録の写真」を発見してしまう（GIGAZINE）

タグ：

事例集

「データセット・スクレイピング関連の事例一覧」をウィキ内検索

人気タグ「」関連ページ

人気記事ランキング

最近更新されたページ

新規Wikiランキング

最近作成されたWikiのアクセスランキングです。見るだけでなく加筆してみよう！

人気Wikiランキング

atwikiでよく見られているWikiのランキングです。新しい情報を発見してみよう！

全体ページランキング

最近アクセスの多かったページランキングです。話題のページを見に行こう！

データセット・スクレイピング関連の事例一覧

■データセット・スクレイピング関連

2025年

2024年

2023年

2022年

メニュー

基礎知識

主な出来事・事例

法律・政治・規制・調査

被害対策

現状を変えるために

関連リンク

日本語

英語

その他言語

更新履歴