atwiki-logo
  • 新規作成
    • 新規ページ作成
    • 新規ページ作成(その他)
      • このページをコピーして新規ページ作成
      • このウィキ内の別ページをコピーして新規ページ作成
      • このページの子ページを作成
    • 新規ウィキ作成
  • 編集
    • ページ編集
    • ページ編集(簡易版)
    • ページ名変更
    • メニュー非表示でページ編集
    • ページの閲覧/編集権限変更
    • ページの編集モード変更
    • このページにファイルをアップロード
    • メニューを編集
    • 右メニューを編集
  • バージョン管理
    • 最新版変更点(差分)
    • 編集履歴(バックアップ)
    • アップロードファイル履歴
    • ページ操作履歴
  • ページ一覧
    • ページ一覧
    • このウィキのタグ一覧
    • このウィキのタグ(更新順)
    • このページの全コメント一覧
    • このウィキの全コメント一覧
    • おまかせページ移動
  • RSS
    • このウィキの更新情報RSS
    • このウィキ新着ページRSS
  • ヘルプ
    • ご利用ガイド
    • Wiki初心者向けガイド(基本操作)
    • このウィキの管理者に連絡
    • 運営会社に連絡(不具合、障害など)
ページ検索 メニュー
genai @ ウィキ
  • ウィキ募集バナー
  • 目安箱バナー
  • 操作ガイド
  • 新規作成
  • 編集する
  • 全ページ一覧
  • 登録/ログイン
ページ一覧
genai @ ウィキ
  • ウィキ募集バナー
  • 目安箱バナー
  • 操作ガイド
  • 新規作成
  • 編集する
  • 全ページ一覧
  • 登録/ログイン
ページ一覧
genai @ ウィキ
ページ検索 メニュー
  • 新規作成
  • 編集する
  • 登録/ログイン
  • 管理メニュー
管理メニュー
  • 新規作成
    • 新規ページ作成
    • 新規ページ作成(その他)
      • このページをコピーして新規ページ作成
      • このウィキ内の別ページをコピーして新規ページ作成
      • このページの子ページを作成
    • 新規ウィキ作成
  • 編集
    • ページ編集
    • ページ編集(簡易版)
    • ページ名変更
    • メニュー非表示でページ編集
    • ページの閲覧/編集権限変更
    • ページの編集モード変更
    • このページにファイルをアップロード
    • メニューを編集
    • 右メニューを編集
  • バージョン管理
    • 最新版変更点(差分)
    • 編集履歴(バックアップ)
    • アップロードファイル履歴
    • ページ操作履歴
  • ページ一覧
    • このウィキの全ページ一覧
    • このウィキのタグ一覧
    • このウィキのタグ一覧(更新順)
    • このページの全コメント一覧
    • このウィキの全コメント一覧
    • おまかせページ移動
  • RSS
    • このwikiの更新情報RSS
    • このwikiの新着ページRSS
  • ヘルプ
    • ご利用ガイド
    • Wiki初心者向けガイド(基本操作)
    • このウィキの管理者に連絡
    • 運営会社に連絡する(不具合、障害など)
  • atwiki
  • genai @ ウィキ
  • RAG_1

genai @ ウィキ

RAG_1

最終更新:2024年11月24日 17:07

genai

- view
だれでも歓迎! 編集
現実的なRAGの実装とモデル・アルゴリズム

RAGを実装する際は、以下の要素を考慮してモデルやアルゴリズムを選択します。

  • データの種類と量: テキスト、画像、音声など、扱うデータの種類と量に応じて、適切な検索モデルやLLMを選択する必要があります。
  • 検索の要件: リアルタイム性、精度、網羅性など、検索に求められる要件に応じて、検索エンジンやアルゴリズムを選択する必要があります。
  • 生成の要件: 回答の長さ、複雑さ、スタイルなど、生成される回答に求められる要件に応じて、適切なLLMを選択する必要があります。
  • 計算資源: オンプレミス環境では利用可能な計算資源に限りがあるため、リソース効率の良いモデルを選択する必要があります。クラウド環境では、必要に応じて計算資源を拡張できますが、コストも考慮する必要があります。
  • プライバシーとセキュリティ: 個人情報や機密情報を扱う場合は、プライバシー保護機能やセキュリティ対策が施されたモデルやサービスを選択する必要があります。

具体的なモデル・アルゴリズムと使用例

検索部分

Elasticsearch:
説明: オープンソースの全文検索エンジンで、オンプレミスやクラウド(AWS、GCP、Azureなど)で広く利用されています。大量のドキュメントを高速に検索でき、RAGの検索部分に最適です。
使用例: 社内文書検索、製品マニュアル検索、FAQシステムなど。
アルゴリズム: BM25(ランキングアルゴリズム)、ベクトル検索(類似度検索)

OpenSearch:
説明: Elasticsearchのフォークで、同様にオープンソースの全文検索エンジンです。AWSがマネージドサービスを提供しており、クラウド環境での利用に適しています。
使用例: ログ分析、セキュリティ情報イベント管理(SIEM)など。
アルゴリズム: BM25、ベクトル検索

FAISS (Facebook AI Similarity Search):
説明: Facebook AIが開発したベクトル検索ライブラリで、高次元ベクトル空間における類似度検索を高速に行うことができます。埋め込み表現を用いたセマンティック検索に利用されます。
使用例: 画像検索、音声検索、推薦システムなど。
アルゴリズム: k-meansクラスタリング、Product Quantizationなど

Azure Cognitive Search:
説明: Microsoft Azureが提供するクラウドベースの検索サービスで、AIを活用した高度な検索機能を提供します。セマンティック検索やナレッジグラフを活用した検索も可能です。
使用例: 企業内検索、Eコマースサイトの商品検索、顧客サポートチャットボットなど。
アルゴリズム: BM25、セマンティック検索、ナレッジグラフ検索

Google Vertex AI Search (旧称 Cloud Search):
説明: Google Cloudが提供するエンタープライズ向けの検索サービスで、大規模なデータセットに対する高速かつ高精度な検索が可能です。
使用例: 大規模ドキュメント検索、企業内情報検索、ウェブ検索など。
アルゴリズム: BM25、セマンティック検索、ランキング学習

pgvector (PostgreSQL Extension):
説明: PostgreSQLの拡張機能で、ベクトルデータの格納と検索を可能にします。PostgreSQLをベースとしたシステムに容易にベクトル検索機能を組み込むことができます。
使用例: メタデータ検索、小規模な類似画像検索など。
アルゴリズム: 近似最近傍探索 (ANN)

埋め込み表現生成モデル

Sentence Transformers:
説明: 事前学習済みの様々なTransformerモデルを提供し、文や段落の埋め込み表現を生成できます。セマンティック検索の精度向上に貢献します。Hugging Face Transformersライブラリを通じて簡単に利用できます。
使用例: セマンティック検索、テキスト分類、クラスタリングなど。
モデル例: all-mpnet-base-v2, all-MiniLM-L6-v2など

Instructor Embeddings:
説明: テキストの埋め込み表現を生成する際に、タスクに特化した指示を与えることができるモデルです。これにより、よりタスクに適した埋め込み表現を得ることができます。
使用例: 特定のドメインやタスクに特化したセマンティック検索。
モデル例: hkunlp/instructor-large, hkunlp/instructor-xlなど

OpenAI Embeddings API / Azure OpenAI Embeddings:
説明: OpenAIやAzure OpenAIが提供するAPIで、テキストの埋め込み表現を生成できます。様々なモデルが提供されており、用途に応じて選択できます。
使用例: セマンティック検索、推薦システム、異常検知など。
モデル例: text-embedding-ada-002など

LLM (Large Language Model) 部分
Hugging Face Transformers:
説明: 様々な事前学習済みTransformerモデルを提供しており、テキスト生成、質問応答、翻訳など、様々なタスクに利用できます。PyTorchやTensorFlowなどのフレームワークと連携し、オンプレミスやクラウドで柔軟に利用できます。
使用例: テキスト生成、要約、チャットボット、機械翻訳など。
モデル例: Llama 2, Mistral, Falconなど

LLaMA (Meta AI), Mistral AI models, Falcon (Technology Innovation Institute):
説明: オープンソースで利用可能な高性能なLLMです。商用利用可能なライセンスで提供されており、自社の環境で自由にカスタマイズできます。
使用例: テキスト生成、チャットボット、コード生成など。

OpenAI API / Azure OpenAI Service:
説明: OpenAIやAzure OpenAIが提供するAPIで、GPT-3.5, GPT-4などの高性能なLLMを利用できます。クラウドベースで利用できるため、大規模な計算資源を必要とせず、手軽にLLMを活用できます。
使用例: テキスト生成、チャットボット、要約、コード生成など。
モデル例: GPT-3.5 Turbo, GPT-4, GPT-4 Turbo with Visionなど

Google Gemini API / Google Vertex AI PaLM API:
説明: Google Cloudが提供するAPIで、Gemini ProやPaLM 2などの高性能なLLMを利用できます。テキスト生成、チャット、コード生成など、幅広いタスクに対応しています。
使用例: テキスト生成、チャットボット、要約、コード生成、マルチモーダルタスクなど。
モデル例: Gemini Pro, Gemini Pro Vision, PaLM 2 for Text, PaLM 2 for Chatなど

Anthropic Claude API:
説明: Anthropic社が提供するAPIで、ClaudeシリーズのLLMを利用できます。安全性と信頼性に重点を置いたLLMであり、企業での利用に適しています。
使用例: テキスト生成、チャットボット、要約、質疑応答など。
モデル例: Claude 2, Claude Instantなど

RAGの実装例

社内FAQチャットボット: 社内FAQドキュメントをElasticsearchやAzure Cognitive Searchで検索し、LLM (Hugging Face TransformersのモデルやOpenAI API) で回答を生成します。
製品サポートシステム: 製品マニュアルやトラブルシューティングガイドをElasticsearchで検索し、LLM (OpenAI APIやGoogle Gemini API) でユーザーの質問に回答します。
法律情報検索システム: 法律文書や判例をOpenSearchやAzure Cognitive Searchで検索し、LLM (Hugging Face TransformersのモデルやAnthropic Claude API) で関連情報を要約したり、質問に回答したりします。
画像付き商品説明チャットボット: 商品画像からベクトル情報を抽出しFAISSで類似画像を検索、商品説明テキストをElasticsearchで検索し、LLM (Google Gemini Pro Vision API) で画像とテキストを組み合わせた回答を生成します。

タグ:

+ タグ編集
  • タグ:
タグの更新に失敗しました
エラーが発生しました。ページを更新してください。
ページを更新
「RAG_1」をウィキ内検索
LINE
シェア
Tweet
genai @ ウィキ
記事メニュー

メニュー

トップページ





アノテーションとフェーズ
数理と言語

リンク

  • @wiki
  • @wikiご利用ガイド




ここを編集
記事メニュー2

更新履歴

取得中です。


ここを編集
人気記事ランキング
  1. リランキングモデル
  2. NPU
もっと見る
最近更新されたページ
  • 166日前

    2025HWトレンド
  • 202日前

    G検定向け(単語)
  • 225日前

    G検定向け、難しい言い回しの設問になれる
  • 225日前

    G検定向け 計算方式の違い
  • 225日前

    G検定向け 機械学習とディープラーニングの違い
  • 225日前

    オンプレミス生成AI導入:顧客の真の課題解決に導く、バイアスフリーな最適解の探求
  • 225日前

    G検定 用語①
  • 230日前

    TOPページ
  • 231日前

    生成AIビジネス活用における用語定義の明確化:誤解を招く「ビジネス」という言葉の再定義
  • 231日前

    データアノテーション:AI活用における必要性と判断基準
もっと見る
人気記事ランキング
  1. リランキングモデル
  2. NPU
もっと見る
最近更新されたページ
  • 166日前

    2025HWトレンド
  • 202日前

    G検定向け(単語)
  • 225日前

    G検定向け、難しい言い回しの設問になれる
  • 225日前

    G検定向け 計算方式の違い
  • 225日前

    G検定向け 機械学習とディープラーニングの違い
  • 225日前

    オンプレミス生成AI導入:顧客の真の課題解決に導く、バイアスフリーな最適解の探求
  • 225日前

    G検定 用語①
  • 230日前

    TOPページ
  • 231日前

    生成AIビジネス活用における用語定義の明確化:誤解を招く「ビジネス」という言葉の再定義
  • 231日前

    データアノテーション:AI活用における必要性と判断基準
もっと見る
ウィキ募集バナー
新規Wikiランキング

最近作成されたWikiのアクセスランキングです。見るだけでなく加筆してみよう!

  1. 鹿乃つの氏 周辺注意喚起@ウィキ
  2. 機動戦士ガンダム EXTREME VS.2 INFINITEBOOST wiki
  3. MadTown GTA (Beta) まとめウィキ
  4. R.E.P.O. 日本語解説Wiki
  5. シュガードール情報まとめウィキ
  6. ソードランページ @ 非公式wiki
  7. AviUtl2のWiki
  8. Dark War Survival攻略
  9. シミュグラ2Wiki(Simulation Of Grand2)GTARP
  10. 星飼いの詩@ ウィキ
もっと見る
人気Wikiランキング

atwikiでよく見られているWikiのランキングです。新しい情報を発見してみよう!

  1. アニヲタWiki(仮)
  2. ストグラ まとめ @ウィキ
  3. ゲームカタログ@Wiki ~名作からクソゲーまで~
  4. 初音ミク Wiki
  5. 発車メロディーwiki
  6. 検索してはいけない言葉 @ ウィキ
  7. Grand Theft Auto V(グランドセフトオート5)GTA5 & GTAオンライン 情報・攻略wiki
  8. 機動戦士ガンダム バトルオペレーション2攻略Wiki 3rd Season
  9. パタポン2 ドンチャカ♪@うぃき
  10. オレカバトル アプリ版 @ ウィキ
もっと見る
全体ページランキング

最近アクセスの多かったページランキングです。話題のページを見に行こう!

  1. 参加者一覧 - ストグラ まとめ @ウィキ
  2. 暦家 - ストグラ まとめ @ウィキ
  3. 魔獣トゲイラ - バトルロイヤルR+α ファンフィクション(二次創作など)総合wiki
  4. 機体一覧 - 機動戦士ガンダム EXTREME VS.2 INFINITEBOOST wiki
  5. 猗窩座(鬼滅の刃) - アニヲタWiki(仮)
  6. マイティーストライクフリーダムガンダム - 機動戦士ガンダム EXTREME VS.2 INFINITEBOOST wiki
  7. Trickster - ストグラ まとめ @ウィキ
  8. MOZU - ストグラ まとめ @ウィキ
  9. 暦 あずみ - ストグラ まとめ @ウィキ
  10. ガヴァイ アッカンマン - ストグラ まとめ @ウィキ
もっと見る

  • このWikiのTOPへ
  • 全ページ一覧
  • アットウィキTOP
  • 利用規約
  • プライバシーポリシー

2019 AtWiki, Inc.