■データセット・スクレイピング関連
生成AIに使用されるデータセットに含まれるもの及び、
収集方法などに関する問題の事例集
※🔒:会員限定記事、🔐:有料記事
収集方法などに関する問題の事例集
※🔒:会員限定記事、🔐:有料記事
2025年
日付 | 出来事 |
---|---|
7/25 | トランプ大統領が「AI企業がトレーニングに使った著作権のある全コンテンツに料金を支払うのは現実的ではない」と主張(GIGAZINE) |
7/14 | ChatGPTの結果がLLMスパムに汚染され始めた(海外SEO情報ブログ) |
6/30 | GoogleのAI「Gemini」のトレーニング業務などを担うScale AIで未審査のフリーランサーによるあまりにも粗悪な仕事が横行していたことが判明(GIGAZINE) |
5/27 | AIトレーニングについてコンテンツ作者に使用許可を求めるなら「国のAI産業が一夜で消滅してしまう」と元Meta幹部のニック・クレッグが語る(GIGAZINE) |
5/15 | 「AI企業がトレーニングに使った著作物の公開を義務づける修正案」をイギリス貴族院が可決、無断使用OKとの政府方針を拒否(GIGAZINE) |
5/12 | AI企業が著作権で保護された素材を使用してAIを訓練することについて懸念を表明していた著作権局長をトランプ政権が解任(GIGAZINE) |
4/7 | イギリス政府による「権利者がオプトアウトしない限りAI企業が許可なしでコンテンツをAIモデルトレーニングに利用することを認める」という提案をOpenAIとGoogleが拒否(GIGAZINE) |
3/14 | GoogleがAI開発で「フェアユースとテキストおよびデータマイニングの例外」が重要だと発表、OpenAIに続いてホワイトハウスのAI行動計画に対する提案を発表(GIGAZINE) |
1/23 | 米リンクトインを集団訴訟で提訴、個人情報をAI開発に無断提供(ロイター) |
1/15 | Metaのマーク・ザッカーバーグCEOがAI「Llama」の開発チームに対し著作権で保護された作品の無断使用を許可したと訴訟で追及される(GIGAZINE) |
1/11 | OpenAIのクローラーボットが3Dスキャンデータ販売サイトをほぼDDoS攻撃な徹底スクレイピングでダウンさせていた(GIGAZINE) |
2024年
2023年
2022年
日付 | 出来事 |
---|---|
12/20 | データ泥棒にご用心! 大人気のアバター作成AIアプリの落とし穴(ARTnewsJAPAN) |
9/22 | 画像生成AIユーザーがAI学習用データセットから「自分の医療記録の写真」を発見してしまう(GIGAZINE) |