Configurer les services Cloud Run

Cette page présente les options de configuration des services Cloud Run. Ces configurations sont listées dans l'ordre dans lequel elles apparaissent dans la console Google Cloud lorsque vous déployez un nouveau service.

Configurer les paramètres au niveau du service

Configurez les paramètres au niveau du service, tels que les paramètres de facturation et de scaling.

Facturation

Utilisez les paramètres de facturation pour contrôler la façon dont vous êtes facturé : à la requête et uniquement lorsque l'instance traite une requête, ou pour l'intégralité du cycle de vie de l'instance.

Scaling de service

Vous pouvez définir votre service sur l'autoscaling ou le scaling manuel, selon le niveau de contrôle dont vous avez besoin sur le comportement de scaling.

Lorsque vous utilisez l'autoscaling, chaque révision Cloud Run est automatiquement mise à l'échelle au nombre d'instances nécessaires pour traiter toutes les requêtes entrantes, tous les événements ou l'intégralité de l'utilisation de processeur. Vous pouvez contrôler le nombre d'instances que votre service Cloud Run crée pour répondre aux requêtes en définissant le nombre maximal d'instances et le nombre minimal d'instances. Vous pouvez éviter les démarrages à froid de votre application et en réduire la latence en définissant un nombre minimal d'instances. Définir un nombre maximal d'instances peut contribuer à réduire les coûts et à éviter des niveaux de requêtes anormalement élevés.

Le scaling manuel vous permet de définir un nombre d'instances spécifique, indépendamment du trafic ou de l'utilisation, et sans avoir à redéployer. Par défaut, Cloud Run effectue automatiquement un scaling horizontal jusqu'à un nombre maximal d'instances spécifié ou par défaut. Toutefois, pour certains cas d'utilisation, vous pouvez définir un nombre spécifique d'instances.

Conteneurs : paramètre

Personnalisez votre service en configurant la capacité, le GPU, les vérifications de l'état, les délais d'attente et l'environnement d'exécution.

Capacité

Vous pouvez contrôler la quantité de mémoire et de processeur qu'un service peut utiliser.

GPU

Si vous devez héberger des charges de travail d'IA, telles que des modèles d'inférence et d'entraînement de modèles, vous pouvez configurer des services Cloud Run avec ou sans GPU.

Vérifications d'état

Cloud Run vous permet de configurer deux types de tests de vérification de l'état#39;état. L'une des vérifications détermine quand les conteneurs sont prêts à accepter le trafic, et l'autre détermine s'il faut redémarrer le conteneur. En savoir plus sur les vérifications de l'état des conteneurs

Délais avant expiration

Vous pouvez définir un délai avant expiration des requêtes Cloud Run qui spécifie le délai au cours duquel une réponse doit être renvoyée.

Simultanéité maximale

Vous pouvez configurer le nombre maximal de requêtes simultanées par instance. Vous pouvez l'augmenter jusqu'à 1 000.

Environnement d'exécution

Cloud Run comporte deux environnements d'exécution. Découvrez les différences entre les deux environnements d'exécution.

Conteneurs : variables et secrets

Configurez des variables d'environnement et des secrets pour gérer votre service de manière sécurisée.

Variables d'environnement

Vous pouvez créer des paires clé/valeur à utiliser avec votre service Cloud Run. Pour en savoir plus, consultez Configurer des variables d'environnement pour les services.

Secrets

Vous pouvez utiliser Secret Manager avec Cloud Run pour stocker en toute sécurité des clés API, des mots de passe et d'autres informations sensibles. Pour en savoir plus, consultez Configurer des secrets.

Conteneurs : installations de volumes

Les montages de volumes Cloud Run vous permettent d'accéder aux données partagées stockées dans un système de fichiers local, tel que le contenu d'un bucket de stockage ou d'un serveur de fichiers, depuis votre conteneur. Vous pouvez installer un bucket Cloud Storage, un partage NFS comme une instance Filestore ou un système de fichiers en mémoire fourni par Cloud Run.

Mise en réseau : répartition du trafic

Chaque fois que vous déployez ou redéployez un service, une révision du service Cloud Run sous-jacent est automatiquement créée. Pour en savoir plus, consultez Affinité de session et répartition du trafic.

Sécurité : identité du service

L'identité du service Cloud Run est le compte de service utilisé comme compte authentifié pour accéder aux APIGoogle Cloud à partir de votre conteneur d'instances Cloud Run. Nous vous recommandons de créer un compte de service et de déterminer l'ensemble minimal d'autorisations dont il a besoin pour accéder à des ressources Google Cloudspécifiques.

Postdéploiement

Une fois votre service déployé, vous pouvez continuer à le configurer pour répondre à vos besoins.

Étiquettes

Les libellés Cloud Run sont des paires clé/valeur que vous pouvez appliquer aux services, aux révisions et aux fonctions Cloud Run. Les libellés vous aident à organiser vos ressources Cloud Run et à gérer vos coûts à grande échelle avec la précision dont vous avez besoin.

Les libellés que vous avez définis précédemment pour vos fonctions Cloud Run à l'aide des commandes gcloud functions ou de l'API Cloud Functions v2 sont propagés à Cloud Run lorsque vous déployez vos fonctions dans Cloud Run.

Recommandations

Consultez Optimiser avec l'outil de recommandation pour découvrir les optimisations fournies par l'outil de recommandation sur Cloud Run.

Services de tags

Les tags sont des paires clé/valeur que vous pouvez appliquer à vos ressources pour un contrôle d'accès précis à l'aide de la console Cloud Run.

Les administrateurs de tags créent des tags pour les ressources dans Google Cloud au niveau de l'organisation ou du projet. Les tags permettent d'autoriser ou de refuser des règles de manière conditionnelle selon qu'une ressource possède un tag spécifique ou non. Pour en savoir plus, consultez Services de tag.