Google ha anunciado una nueva característica en la API de Gemini: la introducción de la herramienta File Search (Búsqueda de Archivos). Esta funcionalidad está diseñada para simplificar la implementación de la Generación Aumentada por Recuperación (RAG), permitiendo crear aplicaciones de IA más precisas y asequibles.
¿Qué es 'File Search' y Su Propuesta de Valor?
File Search es un sistema RAG completamente administrado que facilita la conexión de Gemini con datos propios (documentos, archivos, etc.) de manera nativa dentro de la API.
- Integración Directa: El sistema gestiona automáticamente el almacenamiento de archivos, la división en fragmentos (chunking), la generación de embeddings y la inyección del contexto recuperado en los prompts. Esta funcionalidad opera dentro de la API
generateContent. - Búsqueda Vectorial: Utiliza el modelo Gemini Embedding para la búsqueda vectorial. Esto asegura que la recuperación de información se base en el significado semántico de la consulta del usuario, recuperando los documentos más relevantes.
- Citas Automáticas: Las respuestas generadas por el modelo incluyen citas que indican qué secciones de los documentos se utilizaron como fuente, facilitando la verificación.
Estructura de Costos Optimizada
Google ha implementado un modelo de costos que favorece la accesibilidad:
- El almacenamiento y la generación de embeddings en tiempo de consulta son ahora gratuitos.
- El único costo asociado es de $0.15 por cada millón de tokens para la indexación inicial de los archivos.
Aplicaciones Típicas de RAG
Los desarrolladores pueden utilizar File Search para construir soluciones como:
- Bots de Soporte que acceden a la base de conocimiento de una organización.
- Asistentes de Conocimiento para acelerar procesos de decisión y prototipado.
- Plataformas de Contenido dedicadas a resumir y comparar documentos extensos.
En resumen: File Search en la Gemini API reduce las barreras técnicas y económicas del RAG, facilitando a los desarrolladores la creación de aplicaciones de IA que utilizan datos propios para generar respuestas verificables y contextuales.
File Search: Detalles Técnicos
1. El Contenedor de Datos: File Search Store
- Almacén Persistente: A diferencia de la Files API tradicional (donde los archivos temporales se borran a las 48 horas), la data importada en un
File Search Store(Almacén de Búsqueda de Archivos) se guarda indefinidamente hasta que el desarrollador decida eliminarla. Este store es el contenedor persistente para los embeddings. - Organización: Puedes crear múltiples
File Search Storespor proyecto (el límite sugerido es mantener cada store por debajo de 20 GB para optimizar la latencia de recuperación). Estos stores te permiten organizar tu base de conocimiento por temas, equipos o aplicaciones. - Límites de Documentos: El tamaño máximo por archivo que puedes subir es de 100 MB.
2. El Corazón de la Búsqueda: Vector Search y Modelos
- Embeddings de Vanguardia: El sistema utiliza el modelo Gemini Embedding (como
gemini-embedding-001) para generar las representaciones vectoriales de tu data. Esto asegura que la búsqueda se base en el significado semántico y el contexto, no solo en la coincidencia de palabras clave. - Modelos Compatibles: Actualmente, File Search está disponible para el grounding (conexión a la data) con los modelos Gemini 2.5 Pro y Gemini 2.5 Flash, aprovechando su capacidad para manejar contexto extenso y tareas de razonamiento.
- Búsqueda Rápida (Low-Latency): Google ha diseñado el sistema para garantizar tiempos de respuesta rápidos y fiables, incluso con grandes conjuntos de documentos, lo cual es crucial para la experiencia de usuario en aplicaciones de respuesta en tiempo real.
3. Formatos y Metadatos
- Amplio Soporte de Formatos: Además de los formatos comunes como PDF, DOCX y TXT, File Search admite una amplia gama de formatos, incluyendo JSON y múltiples archivos de lenguajes de programación (como
.py,.js, etc.). Esto permite usar bases de código o datos estructurados como fuente de conocimiento. - Filtros de Metadatos: La API permite utilizar filtros de metadatos para refinar la búsqueda, como buscar solo fragmentos (
chunks) dentro de un rango de años o de un género específico. Esto proporciona un control avanzado sobre la información que se recupera.
Costes asociados
Modelo de Costos de File Search
El modelo de precios implementado por Google es un factor clave en la accesibilidad de esta herramienta, ya que reduce el costo operativo continuo para ejecutar aplicaciones RAG.
- Indexación Inicial (Indexing): La tarifa es de $0.15 por 1 millón de tokens. Esta es una tarifa única por procesar la data; una vez que un documento está indexado, el costo queda cubierto.
- Almacenamiento de Archivos: El almacenamiento de los File Search Stores es Gratuito. Esto significa que no hay costos continuos por mantener la base de conocimiento indexada.
- Generación de Embeddings en Tiempo de Consulta: Esta operación es también Gratuita. Este es un punto importante, ya que elimina el costo de la inferencia del embedding (la parte más costosa de un sistema RAG autogestionado) al momento de que el usuario realiza una consulta.
Este enfoque concentra el gasto en la indexación inicial de los documentos, minimizando los costos de operación a largo plazo.
Este enfoque reduce drásticamente el costo operativo continuo para ejecutar aplicaciones RAG, ya que el grueso del gasto se concentra en la única vez que se indexa el documento.
Anuncio oficial: Introducing the File Search Tool in Gemini API