Skip to main content

Classification des Data Centers (Tiers)

Classification des Data Centers : Les Tiers

Lorsqu'une organisation choisit d'héberger ses infrastructures informatiques critiques, notamment celles supportant des systèmes d'IA, dans un centre de données (data center), la fiabilité et la résilience de cette infrastructure physique sont des préoccupations majeures. L'Uptime Institute, une organisation de conseil et de certification, a développé un système de classification standardisé, connu sous le nom de "Tier Standard", pour évaluer et comparer le niveau de disponibilité et de redondance des data centers.

Introduction : Standardisation de la fiabilité

Le système de classification en Tiers (Tier I, Tier II, Tier III, Tier IV) fournit un langage commun pour décrire la capacité d'un data center à résister aux pannes et à permettre des opérations de maintenance sans interruption de service. Chaque niveau de Tier représente une amélioration progressive de la redondance des systèmes critiques, principalement l'alimentation électrique et le refroidissement.

Objectif de la classification

L'objectif principal est de permettre aux entreprises de :

  • Évaluer le niveau de risque associé à l'hébergement dans un data center particulier.
  • Comparer objectivement les offres de différents fournisseurs de data centers.
  • Aligner le choix du data center avec les exigences de disponibilité de leurs applications et services (un système critique nécessitant une disponibilité quasi-constante ne sera pas hébergé dans un data center de Tier I).

Présentation simplifiée des 4 niveaux de Tier

  1. Tier I : Infrastructure Basique (Basic Site Infrastructure)

    • Redondance : Aucune redondance des composants critiques. Un seul chemin non redondant pour l'alimentation électrique et le refroidissement.
    • Maintenance : Toute maintenance planifiée (ou non planifiée) sur les systèmes d'alimentation ou de refroidissement entraîne une interruption complète des services IT hébergés.
    • Disponibilité attendue (indicative) : Environ 99.671% (soit jusqu'à 28.8 heures d'indisponibilité par an).
    • Utilisation : Petites entreprises avec des besoins de disponibilité non critiques, ou pour des environnements de développement/test.
  2. Tier II : Infrastructure à Composants Redondants (Redundant Site Infrastructure Capacity Components)

    • Redondance : Ajoute une redondance (N+1) sur certains composants clés de l'infrastructure (par exemple, modules UPS, groupes froids, générateurs). Cependant, il n'y a toujours qu'un seul chemin de distribution pour l'alimentation et le refroidissement.
    • Maintenance : La maintenance planifiée des chemins de distribution ou d'autres composants non redondants entraîne toujours une interruption des services IT. Cependant, une panne d'un composant redondant (comme un module UPS) ne devrait pas causer d'interruption.
    • Disponibilité attendue (indicative) : Environ 99.741% (soit jusqu'à 22 heures d'indisponibilité par an).
    • Utilisation : Entreprises avec des besoins de disponibilité légèrement supérieurs, où des interruptions planifiées pour maintenance sont acceptables.
  3. Tier III : Infrastructure Maintenable Simultanément (Concurrently Maintainable Site Infrastructure)

    • Redondance : Plusieurs chemins de distribution indépendants pour l'alimentation et le refroidissement (redondance N+1 minimum sur tous les composants et chemins). Un seul chemin est actif en temps normal, mais l'autre peut prendre le relais.
    • Maintenance : Toute maintenance planifiée (remplacement de composant, travaux sur un chemin de distribution) peut être effectuée sans interrompre les services IT. Le système peut basculer sur les composants/chemins redondants pendant la maintenance.
    • Tolérance aux pannes : Non conçu pour résister à une panne majeure non planifiée sur un chemin actif sans interruption (bien que la redondance N+1 puisse parfois le permettre).
    • Disponibilité attendue (indicative) : Environ 99.982% (soit jusqu'à 1.6 heures d'indisponibilité par an).
    • Utilisation : La plupart des entreprises avec des applications critiques qui nécessitent une haute disponibilité et ne peuvent pas se permettre des interruptions pour maintenance.
  4. Tier IV : Infrastructure Tolérante aux Pannes (Fault Tolerant Site Infrastructure)

    • Redondance : Niveau de redondance le plus élevé. Plusieurs chemins actifs et indépendants pour l'alimentation et le refroidissement (typiquement 2N ou 2N+1, signifiant deux systèmes complets et redondants). Chaque composant est doublement alimenté et refroidi.
    • Maintenance : Maintenable simultanément comme le Tier III.
    • Tolérance aux pannes : Le système peut supporter une panne majeure non planifiée sur un composant critique ou un chemin de distribution (par exemple, un incendie localisé, une coupure d'un des systèmes d'alimentation) sans aucun impact sur les services IT. Le système est conçu pour continuer à fonctionner même si un événement grave se produit.
    • Disponibilité attendue (indicative) : Environ 99.995% (soit jusqu'à 26.3 minutes d'indisponibilité par an).
    • Utilisation : Organisations avec des exigences de disponibilité extrêmement élevées, où toute interruption est inacceptable (grandes institutions financières, plateformes de commerce électronique critiques, services d'urgence, systèmes d'IA vitaux).

Lien avec la sécurité physique et la Disponibilité

  • La classification en Tiers est directement liée à la Disponibilité des systèmes hébergés. Un data center de Tier supérieur offre une meilleure protection contre les interruptions dues à des pannes ou à des opérations de maintenance sur l'infrastructure physique (alimentation, refroidissement).
  • Bien que la classification ne couvre pas explicitement tous les aspects de la sécurité physique (comme le contrôle d'accès ou la protection anti-intrusion), les data centers cherchant une certification de Tier élevé investissent généralement aussi dans des mesures de sécurité physique robustes pour protéger leur infrastructure et garantir le niveau de disponibilité promis.

Conclusion

Le choix du Tier d'un data center est une décision stratégique qui doit être alignée sur les objectifs de disponibilité (SLA - Service Level Agreement) et la criticité des applications et des données hébergées. Pour des systèmes d'IA critiques, dont la performance et la disponibilité sont essentielles, opter pour un data center de Tier III ou Tier IV est souvent une nécessité pour minimiser les risques d'interruption dus à des problèmes d'infrastructure physique.

Certification vs Conception

Il est important de noter la différence entre un data center "conçu selon les normes Tier X" et un data center "certifié Tier X" par l'Uptime Institute. La certification offre une validation indépendante de la conformité aux exigences du Tier.

Exemples de Fournisseurs et Types de Mesures Mises en Avant

  1. Amazon Web Services (AWS)

    • AWS exploite de nombreux data centers dans le monde. Ils mettent l'accent sur une sécurité physique en couches.
    • Mesures typiques promues :
      • Contrôle d'accès biométrique, surveillance 24/7, personnel de sécurité.
      • Périmètres sécurisés avec clôtures, barrières.
      • Systèmes de détection d'intrusion.
      • Redondance électrique et de refroidissement, systèmes de suppression d'incendie avancés.
  2. Google Cloud Platform (GCP)

    • Google conçoit et construit ses propres data centers avec un fort accent sur la sécurité et l'efficacité.
    • Mesures typiques promues :
      • Sécurité physique multicouche : périmètre, sécurité du bâtiment, sécurité de l'étage du data center, sécurité de la salle des serveurs.
      • Contrôle d'accès biométrique, surveillance vidéo, gardes de sécurité.
      • Destruction sécurisée des supports de données en fin de vie.
      • Systèmes de détection et de suppression d'incendie, contrôle climatique.
  3. Microsoft Azure

    • Microsoft dispose d'un vaste réseau mondial de data centers pour ses services Azure.
    • Mesures typiques promues :
      • Défense en profondeur avec plusieurs couches de sécurité physique : périmètre, bâtiment, salle des serveurs, racks.
      • Contrôles d'accès stricts avec authentification à plusieurs facteurs, y compris la biométrie.
      • Surveillance vidéo continue, personnel de sécurité 24/7.
      • Alimentation et refroidissement redondants, systèmes de suppression d'incendie.
  4. Equinix

    • Equinix est l'un des plus grands opérateurs mondiaux de data centers de colocation (où les entreprises louent de l'espace pour leurs propres serveurs).
    • Mesures typiques promues :
      • Systèmes de sécurité à plusieurs niveaux : personnel de sécurité sur site, sas de sécurité (mantraps), surveillance vidéo, contrôle d'accès biométrique.
      • Systèmes d'alimentation et de refroidissement redondants (souvent certifiés Tier III ou IV).
      • Détection et suppression d'incendie avancées.
  5. Digital Realty

    • Un autre acteur majeur de la colocation de data centers, avec un portefeuille mondial.
    • Mesures typiques promues :
      • Protocoles de sécurité stricts avec plusieurs couches de contrôle d'accès (badges, biométrie).
      • Surveillance 24/7/365 par du personnel de sécurité et des systèmes CCTV.
      • Infrastructure résiliente pour l'alimentation et le refroidissement.
      • Conformité à diverses normes de sécurité.

Testez vos connaissances !

Quel est l'objectif principal de la classification des data centers en Tiers (Tier Standard) de l'Uptime Institute ?
Quel niveau de Tier représente une infrastructure basique sans redondance des composants critiques, où toute maintenance entraîne une interruption ?
Quelle est la principale différence entre un data center Tier II et un Tier I ?
Un data center classé Tier III est dit 'Maintenable Simultanément'. Qu'est-ce que cela signifie ?
Quel niveau de Tier offre le plus haut niveau de redondance et de tolérance aux pannes, capable de supporter une panne majeure non planifiée sans impact sur les services IT ?
Quelle caractéristique différencie principalement un data center Tier IV d'un Tier III ?
La classification en Tiers est le plus directement liée à quelle caractéristique d'un service hébergé ?
Pour héberger un système d'IA critique nécessitant une disponibilité quasi-constante, quel(s) niveau(x) de Tier serai(en)t le(s) plus approprié(s) ?
Vrai ou Faux : La certification 'Tier X' par l'Uptime Institute est équivalente à une conception 'selon les normes Tier X'.
Quelles mesures de sécurité physique sont typiquement mises en avant par les grands fournisseurs de data centers comme AWS, Google Cloud, Azure ou Equinix ? (Plusieurs réponses possibles)