La fundamentación con Parallel en Vertex AI es una oferta independiente (como se define en tu Google Cloud acuerdo) que conecta los modelos de Gemini con los datos web públicos que proporciona la API de búsqueda de Parallel Web Systems. Este servicio le da a Gemini acceso a información en vivo de miles de millones de páginas web para garantizar respuestas más actualizadas y objetivas.
Ten en cuenta lo siguiente: Para que uses Parallel Google Cloud debe enviar ciertos Datos del cliente a la Oferta independiente de Parallel para su procesamiento. El uso del servicio de Parallel se rige por las Condiciones de Uso independientes de Parallel y la Política de Uso Aceptable de Parallel.
Casos de uso
La fundamentación con Parallel es adecuada para casos de uso como los siguientes:
- Usar datos web para completar o enriquecer información
- Agentes de varios saltos que requieren búsquedas web más profundas para preguntas más complejas
- Crear una API que integre datos de búsqueda web
- Asistentes para empleados que permiten a los usuarios finales hacer preguntas y crear informes complejos con la información web más reciente
- Aplicaciones para el consumidor, como comercio minorista y viajes, que permiten al usuario tomar decisiones de compra fundamentadas.
- Agentes automatizados que se ejecutan de forma autónoma para realizar tareas automatizadas, como análisis de noticias y verificaciones de KYC
- Agentes verticales (agentes de ventas, agentes de codificación, agentes de finanzas) que obtienen el contexto más actualizado de la Web
Ejemplo
¿Quién ganó el Gran Premio de F1 de Las Vegas 2025?
| Sin fundamentación | Con fundamentación |
|---|---|
| El Gran Premio de Las Vegas 2025 aún no se llevó a cabo. La carrera está programada para el fin de semana del 20 al 22 de noviembre de 2025. Por lo tanto, aún no se conoce al ganador. | El ganador del Gran Premio de F1 de Las Vegas 2025 fue Max Verstappen de Red Bull Racing. La carrera se llevó a cabo el 22 de noviembre de 2025. Fuentes: domain1.com, domain2.com, ... |
Modelos compatibles
Los siguientes modelos admiten la fundamentación con la búsqueda web de Parallel:
- Gemini 2.5 Flash (
gemini-2.5-flash) - Gemini 2.5 Flash-Lite (
gemini-2.5-flash-lite) - Gemini 2.5 Pro (
gemini-2.5-pro) - Gemini 3.1 Pro (
gemini-3.1-pro-preview) - Gemini 3 Flash Lite (
gemini-3-flash-lite-preview)
Antes de comenzar
Para usar la fundamentación con Parallel, debes obtener una clave de API de l sitio web de Parallel. Esta clave de API se usa en tu solicitud a Gemini.
Fundamenta las respuestas de Gemini con Parallel
Solicita respuestas fundamentadas de Gemini con la API de REST de la siguiente manera. Para obtener el mejor rendimiento, te recomendamos que uses la configuración predeterminada para los parámetros opcionales, a menos que necesites valores no predeterminados.
REST
Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:
- LOCATION: La región para procesar la solicitud. Para usar el extremo global, excluye la ubicación del nombre del extremo y configura la ubicación del recurso como `global`.
- PROJECT_ID: Es el ID del Google Cloud proyecto.
- MODEL_ID: Es el ID del modelo que se usará.
- TEXT: Es la instrucción de texto que se enviará al modelo.
- API_KEY: Es tu clave de API para la búsqueda web de Parallel.
- EXCLUDE_DOMAINS: Es la lista de dominios que se excluirán de las fuentes de fundamentación (opcional) . Si se especifica, se excluyen las fuentes de estos dominios. Los valores aceptables son dominios (www.example.com) o extensiones de dominio que comienzan con un punto ( .gov, .edu, .co.uk). Puedes especificar hasta 10 dominios.
- INCLUDE_DOMAINS: Es la lista de dominios que se incluirán en las fuentes de fundamentación (opcional). Si se especifica, se incluyen las fuentes de estos dominios. Los valores aceptables son dominios (www.example.com) o extensiones de dominio que comienzan con un punto ( .gov, .edu, .co.uk). Puedes especificar hasta 10 dominios.
- MAX_CHARS_PER_RESULT: Es la cantidad máxima de caracteres que se incluirán en cada extracto de resultado de la búsqueda (opcional). Si no se especifica, el valor predeterminado
es
30000. El rango permitido es[1000, 100000]. - MAX_CHARS_TOTAL: Es la cantidad máxima total de caracteres de todos los extractos de resultados de la búsqueda (opcional). Si no se especifica, el valor predeterminado es
100000. El rango permitido es[1000, 1000000]. - MAX_RESULTS: Es la cantidad máxima de resultados de la búsqueda que se usarán para la fundamentación (opcional). Si no se especifica, el valor predeterminado es
10. El rango permitido es[1, 20].
Método HTTP y URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent
Cuerpo JSON de la solicitud:
{
"contents": [{
"role": "user",
"parts": [{
"text": "TEXT"
}]
}],
"tools": [{
"parallelAiSearch": {
"api_key": "API_KEY",
"customConfigs": {
"source_policy": {
"exclude_domains": ["EXCLUDE_DOMAINS"],
"include_domains": ["INCLUDE_DOMAINS"],
},
"excerpts": {
"max_chars_per_result": MAX_CHARS_PER_RESULT,
"max_chars_total": MAX_CHARS_TOTAL
},
"max_results": MAX_RESULTS
}
}
}],
"model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}
Para enviar tu solicitud, expande una de estas opciones:
Deberías recibir una respuesta JSON similar a la que se muestra a continuación:
Quota
La cuota predeterminada es de 200 instrucciones por minuto. Si necesitas aumentar los límites de frecuencia, comunícate con support@parallel.ai y con tu equipo de cuentas de Google con tu caso de uso y tus requisitos.
Facturación
El uso de la fundamentación con Parallel genera los siguientes cargos:
- Consumo de tokens de Gemini: Tokens de instrucciones, tokens de pensamiento y tokens de salida. Para obtener más información, consulta Precios.
- Fundamentación de Gemini con tus datos: Para obtener más información, consulta Precios.
- Los tokens de entrada que proporciona Parallel no tienen cargos adicionales.
- Precios por el uso de la API de búsqueda de Parallel: Para obtener más información, consulta la página de precios de Parallel.