atwiki-logo
  • 新規作成
    • 新規ページ作成
    • 新規ページ作成(その他)
      • このページをコピーして新規ページ作成
      • このウィキ内の別ページをコピーして新規ページ作成
      • このページの子ページを作成
    • 新規ウィキ作成
  • 編集
    • ページ編集
    • ページ編集(簡易版)
    • ページ名変更
    • メニュー非表示でページ編集
    • ページの閲覧/編集権限変更
    • ページの編集モード変更
    • このページにファイルをアップロード
    • メニューを編集
    • 右メニューを編集
  • バージョン管理
    • 最新版変更点(差分)
    • 編集履歴(バックアップ)
    • アップロードファイル履歴
    • ページ操作履歴
  • ページ一覧
    • ページ一覧
    • このウィキのタグ一覧
    • このウィキのタグ(更新順)
    • このページの全コメント一覧
    • このウィキの全コメント一覧
    • おまかせページ移動
  • RSS
    • このウィキの更新情報RSS
    • このウィキ新着ページRSS
  • ヘルプ
    • ご利用ガイド
    • Wiki初心者向けガイド(基本操作)
    • このウィキの管理者に連絡
    • 運営会社に連絡(不具合、障害など)
genai @ ウィキ
  • ウィキ募集バナー
  • 目安箱バナー
  • 操作ガイド
  • 新規作成
  • 編集する
  • 全ページ一覧
  • 登録/ログイン
ページ一覧
genai @ ウィキ
  • ウィキ募集バナー
  • 目安箱バナー
  • 操作ガイド
  • 新規作成
  • 編集する
  • 全ページ一覧
  • 登録/ログイン
ページ一覧
genai @ ウィキ
  • 新規作成
  • 編集する
  • 登録/ログイン
  • 管理メニュー
管理メニュー
  • 新規作成
    • 新規ページ作成
    • 新規ページ作成(その他)
      • このページをコピーして新規ページ作成
      • このウィキ内の別ページをコピーして新規ページ作成
      • このページの子ページを作成
    • 新規ウィキ作成
  • 編集
    • ページ編集
    • ページ編集(簡易版)
    • ページ名変更
    • メニュー非表示でページ編集
    • ページの閲覧/編集権限変更
    • ページの編集モード変更
    • このページにファイルをアップロード
    • メニューを編集
    • 右メニューを編集
  • バージョン管理
    • 最新版変更点(差分)
    • 編集履歴(バックアップ)
    • アップロードファイル履歴
    • ページ操作履歴
  • ページ一覧
    • このウィキの全ページ一覧
    • このウィキのタグ一覧
    • このウィキのタグ一覧(更新順)
    • このページの全コメント一覧
    • このウィキの全コメント一覧
    • おまかせページ移動
  • RSS
    • このwikiの更新情報RSS
    • このwikiの新着ページRSS
  • ヘルプ
    • ご利用ガイド
    • Wiki初心者向けガイド(基本操作)
    • このウィキの管理者に連絡
    • 運営会社に連絡する(不具合、障害など)
  • atwiki
  • genai @ ウィキ
  • 埋め込みモデル

genai @ ウィキ

埋め込みモデル

最終更新:2024年11月20日 23:57

genai

- view
だれでも歓迎! 編集
埋め込みモデル(エンベディングモデル)は、データを数値ベクトルに変換し、機械学習モデルが処理しやすい形式にする技術です。以下に、代表的な埋め込みモデルの種類と、それぞれの有名な具体的なモデル名を5つずつ挙げます。

1. 単語埋め込みモデル(Word Embeddings)

Word2Vec: Googleが開発したモデルで、単語の意味的な類似性をベクトル空間上で表現します。
GloVe: Stanford大学が開発したモデルで、共起行列を利用して単語の埋め込みを学習します。
FastText: Facebookが開発したモデルで、サブワード情報を考慮することで未知の単語にも対応可能です。
ELMo: 文脈に依存した単語の埋め込みを提供し、文の意味をより深く捉えます。
BERT: 双方向のトランスフォーマーモデルで、文脈を考慮した単語の埋め込みを生成します。
2. 文埋め込みモデル(Sentence Embeddings)

Universal Sentence Encoder: Googleが提供するモデルで、文全体をベクトル化し、文の類似性計算などに利用されます。
Sentence-BERT: BERTを基盤にしたモデルで、文の意味的な類似性を高精度に捉えます。
InferSent: Facebookが開発したモデルで、高品質な文の埋め込みを提供します。
LASER: Facebookが提供する多言語対応の文埋め込みモデルで、93言語に対応しています。
SBERT-WK: BERTの層ごとの情報を活用して文の埋め込みを生成するモデルです。
3. 文書埋め込みモデル(Document Embeddings)

Doc2Vec: Word2Vecの拡張版で、文書全体の埋め込みを学習します。
Paragraph Vector: 文書の意味を捉えるためのモデルで、Doc2Vecとも呼ばれます。
Latent Semantic Analysis (LSA): 文書と単語の共起情報を利用して、潜在的な意味構造を抽出します。
Latent Dirichlet Allocation (LDA): トピックモデルの一種で、文書中のトピック分布を学習します。
BERTSUM: BERTをベースにした文書要約モデルで、文書全体の埋め込みを生成します。
4. 画像埋め込みモデル(Image Embeddings)

VGG: 深層畳み込みニューラルネットワークを用いたモデルで、画像の特徴を抽出します。
ResNet: 残差学習を導入したモデルで、深いネットワークでも効果的に学習可能です。
Inception: Googleが開発したモデルで、異なるサイズの畳み込みフィルタを組み合わせて特徴を抽出します。
EfficientNet: モデルサイズと精度のバランスを最適化したモデルで、高い性能を持ちます。
DenseNet: 各層が前のすべての層からの入力を受け取る構造で、特徴の再利用を促進します。
5. 音声埋め込みモデル(Audio Embeddings)

OpenL3: 音声や音楽の特徴を抽出するモデルで、音声分類や音楽情報検索に利用されます。
VGGish: Googleが提供するモデルで、音声データの特徴抽出に特化しています。
YAMNet: VGGishをベースにしたモデルで、音声イベントの分類に使用されます。
DeepSpeech: Mozillaが開発した音声認識モデルで、音声の埋め込みを生成します。
wav2vec: Facebookが開発したモデルで、音声信号から直接特徴を学習します。
6. 多言語対応埋め込みモデル

MUSE: Facebookが開発した多言語埋め込みモデルで、異なる言語間の単語の対応関係を学習します。
LASER: Facebookが提供するモデルで、93言語に対応した文の埋め込みを生成します。
mBERT: BERTの多言語版で、複数の言語に対応した埋め込みを提供します。
XLM-R: Facebookが開発した多言語対応のトランスフォーマーモデルで、高性能な埋め込みを生成します。
LaBSE: Googleが提供する多言語対応の文埋め込みモデルで、112言語に対応しています。
7. 日本語対応の埋め込みモデル

cl-nagoya/sup-simcse-ja-large: 名古屋大学が提供する日本語の文埋め込みモデルで、高精度な類似度計算が可能です。
pkshatech/GLuCoSE-base-ja: 日本語の文書検索や類似度計算に特化したモデルです。
intfloat/multilingual-e5-large: 多言語対応の埋め込みモデルで、日本語にも対応しています。
openai/text-embedding-ada-002: OpenAI

タグ:

+ タグ編集
  • タグ:
タグの更新に失敗しました
エラーが発生しました。ページを更新してください。
ページを更新
「埋め込みモデル」をウィキ内検索
LINE
シェア
Tweet
genai @ ウィキ
記事メニュー

メニュー

トップページ





アノテーションとフェーズ
数理と言語

リンク

  • @wiki
  • @wikiご利用ガイド




ここを編集
記事メニュー2

更新履歴

取得中です。


ここを編集
人気記事ランキング
  1. データアノテーションとフェーズ
もっと見る
最近更新されたページ
  • 117日前

    2025HWトレンド
  • 153日前

    G検定向け(単語)
  • 176日前

    G検定向け、難しい言い回しの設問になれる
  • 176日前

    G検定向け 計算方式の違い
  • 176日前

    G検定向け 機械学習とディープラーニングの違い
  • 176日前

    オンプレミス生成AI導入:顧客の真の課題解決に導く、バイアスフリーな最適解の探求
  • 176日前

    G検定 用語①
  • 181日前

    TOPページ
  • 182日前

    生成AIビジネス活用における用語定義の明確化:誤解を招く「ビジネス」という言葉の再定義
  • 182日前

    データアノテーション:AI活用における必要性と判断基準
もっと見る
人気記事ランキング
  1. データアノテーションとフェーズ
もっと見る
最近更新されたページ
  • 117日前

    2025HWトレンド
  • 153日前

    G検定向け(単語)
  • 176日前

    G検定向け、難しい言い回しの設問になれる
  • 176日前

    G検定向け 計算方式の違い
  • 176日前

    G検定向け 機械学習とディープラーニングの違い
  • 176日前

    オンプレミス生成AI導入:顧客の真の課題解決に導く、バイアスフリーな最適解の探求
  • 176日前

    G検定 用語①
  • 181日前

    TOPページ
  • 182日前

    生成AIビジネス活用における用語定義の明確化:誤解を招く「ビジネス」という言葉の再定義
  • 182日前

    データアノテーション:AI活用における必要性と判断基準
もっと見る
ウィキ募集バナー
新規Wikiランキング

最近作成されたWikiのアクセスランキングです。見るだけでなく加筆してみよう!

  1. R.E.P.O. 日本語解説Wiki
  2. シュガードール情報まとめウィキ
  3. SYNDUALITY Echo of Ada 攻略 ウィキ
  4. ガンダムGQuuuuuuX 乃木坂46部@wiki
  5. ドタバタ王子くん攻略サイト
  6. ありふれた職業で世界最強 リベリオンソウル @ ウィキ
  7. パズル&コンクエスト(Puzzles&Conquest)攻略Wiki
  8. 機動戦士ガンダム EXTREME VS.2 INFINITEBOOST wiki
  9. Merge Cooking 攻略 @ ウィキ
  10. アサシンクリードシャドウズ@ ウィキ
もっと見る
人気Wikiランキング

atwikiでよく見られているWikiのランキングです。新しい情報を発見してみよう!

  1. アニヲタWiki(仮)
  2. ストグラ まとめ @ウィキ
  3. ゲームカタログ@Wiki ~名作からクソゲーまで~
  4. 初音ミク Wiki
  5. 検索してはいけない言葉 @ ウィキ
  6. 機動戦士ガンダム バトルオペレーション2攻略Wiki 3rd Season
  7. 発車メロディーwiki
  8. Grand Theft Auto V(グランドセフトオート5)GTA5 & GTAオンライン 情報・攻略wiki
  9. 鬼レンチャンWiki
  10. 英傑大戦wiki
もっと見る
全体ページランキング

最近アクセスの多かったページランキングです。話題のページを見に行こう!

  1. 魔獣トゲイラ - バトルロイヤルR+α ファンフィクション(二次創作など)総合wiki
  2. 参加者一覧 - ストグラ まとめ @ウィキ
  3. 参加者一覧 - MadTown GTA (Beta) まとめウィキ
  4. ニャアン(GQuuuuuuX) - アニヲタWiki(仮)
  5. 意味が違っている実は言ってない台詞(架空人物) - アニヲタWiki(仮)
  6. 間違って覚えられている実は言ってない台詞(架空人物) - アニヲタWiki(仮)
  7. MOZU - ストグラ まとめ @ウィキ
  8. 没作品 - アニヲタWiki(仮)
  9. ロスサントス救急救命隊 - ストグラ まとめ @ウィキ
  10. ロスサントス警察 - ストグラ まとめ @ウィキ
もっと見る

  • このWikiのTOPへ
  • 全ページ一覧
  • アットウィキTOP
  • 利用規約
  • プライバシーポリシー

2019 AtWiki, Inc.