RAG(検索拡張生成)

概要

RAG(ラグ、英: Retrieval-Augmented Generation、検索拡張生成)とは、大規模言語モデル(LLM)による文章生成に外部データベースからの情報検索機能を組み合わせることで、より正確で信頼性の高いテキスト生成を実現する人工知能技術である。2020年にFacebookの研究チームによって提案されたこの手法は、生成AIの重要な課題であるハルシネーション(幻覚)の軽減と、最新情報への対応を可能にする技術として注目されている。

RAGは、従来の大規模言語モデルが学習時のデータに依存していた制約を克服し、リアルタイムで外部の知識ベースにアクセスすることで、動的かつ正確な情報提供を実現する。この技術は、企業の社内情報システム、カスタマーサポート、医療情報検索など、幅広い分野で実用化が進んでいる。

定義

RAGは、Retrieval(検索)、Augmented(拡張)、Generation(生成)の3つの要素から構成される技術的概念である。学術的には、事前に訓練された言語モデルの生成プロセスに、外部知識ベースからの動的な情報検索を統合することで、モデルの出力精度と信頼性を向上させる手法として定義される。

従来のファインチューニングやプロンプトエンジニアリングとは異なり、RAGはモデル自体のパラメータを変更することなく、外部データソースとの連携によって機能を拡張する点が特徴的である。この手法により、言語モデルは学習データの範囲を超えた最新情報や専門知識にアクセスできるようになる。

RAGの技術的定義において重要な要素は、検索システムと生成モデルの統合アーキテクチャである。検索システムは通常、ベクトルデータベースや全文検索エンジンを使用し、生成モデルは検索結果を文脈として活用して回答を生成する。この統合により、静的な学習データに依存しない動的な知識活用が可能となる。

上部へスクロール