Fundamentación con la búsqueda web de Parallel

Parallel Web Systems ofrece una API de búsqueda que proporciona acceso a datos web disponibles públicamente y optimizados para su uso por modelos de lenguaje grandes para la fundamentación. En esta página, se explica cómo fundamentar las respuestas de Gemini con Parallel.

La fundamentación con Parallel en Vertex AI es una oferta independiente (como se define en tu Google Cloud acuerdo) que conecta los modelos de Gemini con los datos web públicos que proporciona la API de búsqueda de Parallel Web Systems. Este servicio le da a Gemini acceso a información en vivo de miles de millones de páginas web para garantizar respuestas más actualizadas y objetivas.

Ten en cuenta lo siguiente: Para que uses Parallel Google Cloud debe enviar ciertos Datos del cliente a la Oferta independiente de Parallel para su procesamiento. El uso del servicio de Parallel se rige por las Condiciones de Uso independientes de Parallel y la Política de Uso Aceptable de Parallel.

Casos de uso

La fundamentación con Parallel es adecuada para casos de uso como los siguientes:

Usar datos web para completar o enriquecer información
Agentes de varios saltos que requieren búsquedas web más profundas para preguntas más complejas
Crear una API que integre datos de búsqueda web
Asistentes para empleados que permiten a los usuarios finales hacer preguntas y crear informes complejos con la información web más reciente
Aplicaciones para el consumidor, como comercio minorista y viajes, que permiten al usuario tomar decisiones de compra fundamentadas.
Agentes automatizados que se ejecutan de forma autónoma para realizar tareas automatizadas, como análisis de noticias y verificaciones de KYC
Agentes verticales (agentes de ventas, agentes de codificación, agentes de finanzas) que obtienen el contexto más actualizado de la Web

Ejemplo

¿Quién ganó el Gran Premio de F1 de Las Vegas 2025?

Sin fundamentación	Con fundamentación
El Gran Premio de Las Vegas 2025 aún no se llevó a cabo. La carrera está programada para el fin de semana del 20 al 22 de noviembre de 2025. Por lo tanto, aún no se conoce al ganador.	El ganador del Gran Premio de F1 de Las Vegas 2025 fue Max Verstappen de Red Bull Racing. La carrera se llevó a cabo el 22 de noviembre de 2025. Fuentes: domain1.com, domain2.com, ...

Modelos compatibles

Los siguientes modelos admiten la fundamentación con la búsqueda web de Parallel:

Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 3.1 Pro (gemini-3.1-pro-preview)
Gemini 3 Flash Lite (gemini-3-flash-lite-preview)

Antes de comenzar

Para usar la fundamentación con Parallel, debes obtener una clave de API de l sitio web de Parallel. Esta clave de API se usa en tu solicitud a Gemini.

Fundamenta las respuestas de Gemini con Parallel

Solicita respuestas fundamentadas de Gemini con la API de REST de la siguiente manera. Para obtener el mejor rendimiento, te recomendamos que uses la configuración predeterminada para los parámetros opcionales, a menos que necesites valores no predeterminados.

REST

Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

LOCATION: La región para procesar la solicitud. Para usar el extremo global, excluye la ubicación del nombre del extremo y configura la ubicación del recurso como `global`.
PROJECT_ID: Es el ID del Google Cloud proyecto.
MODEL_ID: Es el ID del modelo que se usará.
TEXT: Es la instrucción de texto que se enviará al modelo.
API_KEY: Es tu clave de API para la búsqueda web de Parallel.
EXCLUDE_DOMAINS: Es la lista de dominios que se excluirán de las fuentes de fundamentación (opcional) . Si se especifica, se excluyen las fuentes de estos dominios. Los valores aceptables son dominios (www.example.com) o extensiones de dominio que comienzan con un punto ( .gov, .edu, .co.uk). Puedes especificar hasta 10 dominios.
INCLUDE_DOMAINS: Es la lista de dominios que se incluirán en las fuentes de fundamentación (opcional). Si se especifica, se incluyen las fuentes de estos dominios. Los valores aceptables son dominios (www.example.com) o extensiones de dominio que comienzan con un punto ( .gov, .edu, .co.uk). Puedes especificar hasta 10 dominios.
MAX_CHARS_PER_RESULT: Es la cantidad máxima de caracteres que se incluirán en cada extracto de resultado de la búsqueda (opcional). Si no se especifica, el valor predeterminado es 30000. El rango permitido es [1000, 100000].
MAX_CHARS_TOTAL: Es la cantidad máxima total de caracteres de todos los extractos de resultados de la búsqueda (opcional). Si no se especifica, el valor predeterminado es 100000. El rango permitido es [1000, 1000000].
MAX_RESULTS: Es la cantidad máxima de resultados de la búsqueda que se usarán para la fundamentación (opcional). Si no se especifica, el valor predeterminado es 10. El rango permitido es [1, 20].

Método HTTP y URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

Cuerpo JSON de la solicitud:

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "TEXT"
    }]
  }],
  "tools": [{
    "parallelAiSearch": {
        "api_key": "API_KEY",
        "customConfigs": {
            "source_policy": {
                "exclude_domains": ["EXCLUDE_DOMAINS"],
                "include_domains": ["INCLUDE_DOMAINS"],
            },
            "excerpts": {
                "max_chars_per_result": MAX_CHARS_PER_RESULT,
                "max_chars_total": MAX_CHARS_TOTAL
            },
            "max_results": MAX_RESULTS
        }
    }
}],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

Para enviar tu solicitud, expande una de estas opciones:

curl (Linux, macOS o Cloud Shell)

Nota: Con el siguiente comando, se supone que accediste a gcloud CLI con tu cuenta de usuario a través de la ejecución de gcloud init o gcloud auth login , o a través del uso de Cloud Shell, que accede de forma automática a gcloud CLI . Para comprobar la cuenta activa actual, ejecuta gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent"

PowerShell (Windows)

Nota: El siguiente comando supone que accediste a gcloud CLI con tu cuenta de usuario a través de la ejecución de gcloud init o gcloud auth login . Para comprobar la cuenta activa actual, ejecuta gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent" | Select-Object -Expand Content

Deberías recibir una respuesta JSON similar a la que se muestra a continuación:

Respuesta

{
  "candidates": [
    {
      "content": {
        "role": "model",
        "parts": [
          {
            "text": "The most recent Super Bowl was Super Bowl LIX (59), which was played in 2025. The winner of Super Bowl LIX was the **Philadelphia Eagles**, who defeated the Kansas City Chiefs with a score of 40-22."
          }
        ]
      },
      "finishReason": "STOP",
      "groundingMetadata": {
        "webSearchQueries": [
          "who won the last super bowl"
        ],
        "groundingChunks": [
          {
            "web": {
              "uri": "https://...",
              "title": "Super Bowl LIX",
              "domain": "domain.com"
            }
          },
          {
            "web": {
              "uri": "https://...",
              "title": "Super Bowl LIX Results",
              "domain": "domain.com"
            }
          }
        ],
        "groundingSupports": [
          {
            "segment": {
              "endIndex": 77,
              "text": "The most recent Super Bowl was Super Bowl LIX (59), which was played in 2025."
            },
            "groundingChunkIndices": [
              0,
              1
            ]
          },
          {
            "segment": {
              "startIndex": 78,
              "endIndex": 198,
              "text": "The winner of Super Bowl LIX was the **Philadelphia Eagles**, who defeated the Kansas City Chiefs with a score of 40-22."
            },
            "groundingChunkIndices": [
              0
            ]
          },
        ]
      }
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 33,
    "candidatesTokenCount": 106,
    "totalTokenCount": 284,
    "billablePromptUsage": {
      "textCount": 142
    },
    "trafficType": "ON_DEMAND",
    "promptTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 33
      }
    ],
    "candidatesTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 106
      }
    ],
    "toolUsePromptTokensDetails": [
      {
        "modality": "TEXT",
        "tokenCount": 39
      }
    ],
    "toolUsePromptTokenCount": 39,
    "thoughtsTokenCount": 106
  },
  "modelVersion": "MODEL_VERSION",
  "createTime": "CREATE_TIME",
  "responseId": "RESPONSE_ID"
}

Quota

La cuota predeterminada es de 200 instrucciones por minuto. Si necesitas aumentar los límites de frecuencia, comunícate con support@parallel.ai y con tu equipo de cuentas de Google con tu caso de uso y tus requisitos.

Facturación

El uso de la fundamentación con Parallel genera los siguientes cargos:

Consumo de tokens de Gemini: Tokens de instrucciones, tokens de pensamiento y tokens de salida. Para obtener más información, consulta Precios.
Fundamentación de Gemini con tus datos: Para obtener más información, consulta Precios.
- Los tokens de entrada que proporciona Parallel no tienen cargos adicionales.
Precios por el uso de la API de búsqueda de Parallel: Para obtener más información, consulta la página de precios de Parallel.