ひとことで言うと
Retrieval-Augmented Generation の略。AIが外部の知識を検索して回答に使う仕組み。
RAG(Retrieval-Augmented Generation、検索拡張生成)は、AI が回答を作る前に外部の知識を検索し、その内容を踏まえて答えを生成する仕組みです。モデルが学習していない最新情報や社内資料を扱え、根拠に基づいた回答で誤り(ハルシネーション)を減らせる点が重要です。
典型的には、社内文書を Embedding でベクトル化してベクトルDBに保存し、質問に近い文書を検索して、その抜粋とともに LLM へ渡します。これにより「自社FAQに答えるチャットボット」などを、モデルを再学習させずに実現できます。追加学習で知識を覚え込ませる Fine-tuning とは異なり、知識を外部に置いて都度参照する点が RAG の特徴です。