
Sign up to save your podcasts
Or


RAG, o Generación Aumentada por Recuperación, es una técnica que mejora los modelos de lenguaje grandes (LLM) al proporcionarles acceso a una base de conocimientos especializada y actualizable. En lugar de depender únicamente del conocimiento estático almacenado en los pesos del modelo, RAG recupera información precisa de documentos externos que pueden no haber sido parte del conjunto de datos de entrenamiento del LLM. Esto se logra mediante un módulo RAG que primero identifica la información relevante de una base de datos de vectores en función de la consulta del usuario y luego la integra en el prompt que se le da al LLM. El resultado es una respuesta más precisa y contextualizada que aprovecha tanto el conocimiento general del LLM como la información específica del dominio de la base de conocimientos. RAG se utiliza en funciones como la navegación web en chatbots y es especialmente útil cuando se trabaja con grandes cantidades de documentos o información especializada que no caben en la ventana de contexto de un LLM.
By La Azotea3.9
1414 ratings
RAG, o Generación Aumentada por Recuperación, es una técnica que mejora los modelos de lenguaje grandes (LLM) al proporcionarles acceso a una base de conocimientos especializada y actualizable. En lugar de depender únicamente del conocimiento estático almacenado en los pesos del modelo, RAG recupera información precisa de documentos externos que pueden no haber sido parte del conjunto de datos de entrenamiento del LLM. Esto se logra mediante un módulo RAG que primero identifica la información relevante de una base de datos de vectores en función de la consulta del usuario y luego la integra en el prompt que se le da al LLM. El resultado es una respuesta más precisa y contextualizada que aprovecha tanto el conocimiento general del LLM como la información específica del dominio de la base de conocimientos. RAG se utiliza en funciones como la navegación web en chatbots y es especialmente útil cuando se trabaja con grandes cantidades de documentos o información especializada que no caben en la ventana de contexto de un LLM.

428 Listeners

56 Listeners

184 Listeners

53 Listeners

36 Listeners

15 Listeners

56 Listeners

4 Listeners

231 Listeners

57 Listeners

2 Listeners

9 Listeners

10 Listeners