Amélioration d’un Système d’Informations existant : mesurer/collecter

 

Nous continuons notre série sur la reprise d’un système d’informations existant. Une introduction de la méthode est disponible dans un précédent article. La première étape est de mesurer, de collecter des informations. C’est une étape essentielle évidemment. Nous allons voir quelques éléments pour ne pas la louper. Des éléments concrets seront pris pour exemple.

Quelles informations collecter/mesurer?

En fait, toute information pouvant être mesurée, collectée et stockée devrait l’être. L’important est de mesurer correctement les informations puis de les stocker de la meilleure manière possible afin de pouvoir l’analyser dans un second temps. Je vais prendre quelques exemples afin d’illustrer le propos. Ce ne sont que des exemples pratiques, que j’ai personnellement vécu et qui m’ont été utiles. Certaines informations sont collectées mais non encore utilisées. Il est fort probable qu’une partie des informations collectées ne sera jamais utilisée. Il suffira de les purger lorsque cela s’avérera indispensable. Certaines données peuvent sembler inutiles aujourd’hui mais seront probablement pertinentes dans quelques semaines. Je vous le montrerai dans un cas précis.

De l’importance des mesures

Est-il utile de préciser que la qualité des mesures est très importante? Oui, oui, elle l’est. Cela peut sembler évident pour certains mais ça ne l’est pas pour tout le monde. C’est pourtant l’un des fondements de la science : s’assurer que les données sur lesquelles se base l’étude sont les plus parfaites possibles, les plus larges, les plus représentatives afin de ne pas introduire un biais dans la théorie. Une erreur est toujours possible, même pour les meilleurs. Je rappelle cette histoire incroyable des neutrinos qui avaient été mesurés comme plus rapide que la lumière. Une « découverte » incroyable qui remettait en cause une théorie bien établie et très reconnue, posée par Einstein lui-même. Lors de cette annonce, les responsables scientifiques ont pris toutes les précautions possibles tant dans les mesures que de la communication. Quelques mois plus tard, il a été détecté que les mesures étaient erronées. La « découverte » n’en était finalement pas une. Le responsable de l’équipe de recherche a du démissionner, alors que l’équipe de recherche avait pris toutes ses précautions dans la communication en indiquant clairement qu’ils avaient des « mesures bizarres », qu’ils ne faisaient aucune « sur interprétation » de celles-ci et qu’ils recommandaient aux journalistes de ne pas utiliser le mot « découverte ». Ils ne l’ont pas utilisé et ont écrit leur article avec beaucoup de conditionnel. Pourtant, le responsable a du démissionner… Ce responsable est une personne de grande expérience, reconnue par ses pairs. Il avait échoué dans ce qui est considéré comme une base : la mesure. La mesure est essentielle. Si la mesure n’est pas exacte, toutes les déductions basées sur celles-ci seront erronées. Autant ne pas faire de déduction. En réalité, autant ne pas faire de mesure. Une mesure peut ne pas être exacte mais ce fait doit être connu et totalement intégré. La mesure peut avoir un taux d’erreur négligeable (c’est à dire n’avoir aucun impact sur le résultat final).

Du stockage et de la restitution

Le stockage et la restitution des mesures sont parfois essentiels. Certains stockages conviennent parfaitement à des types de données mais ne sont pas utilisables dans un autre cas. Contrairement à la croyance répandue, il n’y a pas « une base de données pour tous les gouverner ». Pendant très longtemps, les bases de données relationnelles ont dominé outrageusement le marché du stockage des données. Depuis quelques années, d’autres moteurs de stockage de données arrivent et répondent à des besoins spécifiques:

  • les bases de données numériques: parfaites pour stocker un grand volume de données numériques et réaliser des calculs sur celles-ci. C’est le cas par exemple de RRDTool, de Whisper ou de OpenTSDB.
  • les bases de données orientées document: parfaites pour stocker des documents, les indexer et faire des recherches.
  • parfois, il n’est pas nécessaire de disposer d’un outil complexe, un simple fichier CSV et un tableur fonctionnent parfaitement.

Il faut identifier le bon outil pour la bonne utilisation. Les nouveaux moteurs de stockage de données ne vont pas remplacer les moteurs existants dans tous les cas. MariaDB, Oracle, Postgres etc ont encore de très beaux jours devant eux.

Un exemple : la supervision / le monitoring

La supervision/le monitoring sont vitaux pour un SI. La différence entre les deux n’est pas essentielle pour cet article donc j’utiliserai indifféremment l’un ou l’autre. Dans mon passé, je déployais régulièrement des solutions de supervision. Régulièrement, les administrateurs (qui n’avaient pas forcément demandé le déploiement d’un outil de ce genre) s’inquiétaient et considéraient cette mise en place comme du flicage de leur activité. Pourtant, cet outil devait les aider tant à réagir qu’à anticiper. C’est là que le bât blesse: une solution de supervision est souvent mise en place comme un outil réactif et non comme un outil d’analyse, d’anticipation et de réflexion. Ceci est très dommageable pour les utilisateurs. Nous allons voir des cas d’utilisation très simples qui permettent de démontrer l’apport fonctionnel d’un outil de supervision.

Tout d’abord, il faut mesurer les éléments standards:

  1. occupation des partitions
  2. occupation des disques physiques
  3. occupation de la mémoire vive et du swap
  4. taux d’occupation des CPUs
  5. charge du serveur
  6. bande passante consommée sur les cartes réseaux des éléments essentiels (routeurs, pare-feux, switches principaux)

Ensuite, il faut aussi penser aux facteurs environnementaux:

  1. température à différents points clés de la salle serveur
  2. taux d’hygrométrie à différents points clés de la salle serveur
  3. temps de fonctionnement sur batterie disponible pour chaque onduleur en cas de coupure électrique
  4. électricité consommée par chaque serveur

D’autres éléments peuvent être intéressants:

  1. nombre de machines virtuelles ou de conteneurs en cours d’exécution sur un serveur physique
  2. nombre de paquets IPs entrant/sortants/filtrés/rejetés pour les pare-feux

Ces éléments pris de manière unitaire ne sont pas significatifs. Par contre, organisés par groupe (« cluster LAN », « cluster R&D », …) et observés sur plusieurs mois/années, ils donnent des informations précieuses:

  1. mon SI est-il surchargé ou au contraire sous-utilisé?
  2. mon SI connaît-il des saisons? Peuvent-elles être identifiées?
  3. est-il dimensionné pour encaisser le plus gros pic d’activité?
  4. quelle partie est la plus pauvre?
  5. en cas de coupure électrique, combien de temps ai-je avant de devoir tout arrêter? Dois-je prévoir un scénario d’arrêt des serveurs les moins importants pour économiser la batterie de mes onduleurs? Quelle durée avant extinction?
  6. quels sont les serveurs qui consomment le plus? Quand? Pourquoi?

Là est l’intelligence. Là est l’analyse. Là est votre valeur ajoutée. Il vous faut collecter toutes les données pour faire vos analyses. Collecter, collecter. Si vous n’en avez pas l’utilité, vous pourrez purger les données.

Un exemple : l’inventaire

L’inventaire est aussi essentiel. Il permet de connaître son SI, d’une façon différente de l’outil de supervision. Grâce aux informations collectées par l’inventaire, on peut ressortir énormément d’informations pertinentes. L’inventaire est magique car il permet d’échanger avec des acteurs externes au SI. Notamment avec un type de population non informatique, qui n’a aucun lien hiérarchique avec vous mais qui peut (qui devrait!) vous demander des comptes: les comptables. Ces personnes sont très étonnantes et ont une caractéristique très particulière: si « ça » ne rentre pas dans la case, « ça » n’existe pas. Ils n’ont pas conscience que les cases peuvent évoluer ou ne pas correspondre à la réalité, au terrain. C’est une population avec laquelle j’ai énormément de mal à dialoguer. De ce fait, j’ai appris à utiliser leur propre langue pour pouvoir échanger le plus sereinement du monde avec eux. Par exemple, ils utilisent des termes comme « numéro d’inventaire » ou « valeur d’amortissement ». Il est mieux de disposer de ses informations pour pouvoir échanger avec eux, dans leur langue (n’essayer pas de changer de langue avec eux, impossible, vous ne rentreriez plus dans la case), de disposer de toutes ces informations pour éviter qu’ils vous embrouillent, de pouvoir répondre à toutes les questions, de pouvoir remplir toutes les cases avec des mots qui rentrent précisément dans la taille prévue pour cette case. (oui, je parodie le comptable dans le cas le plus extrême mais j’ai une excellente raison : j’ai parmi mes proches des comptables qui se comportent comme décrits auparavant <soupir>).

Certaines informations permettent aussi d’échanger avec le support. Si vous appelez le support pour une panne, les premières questions concernent toujours les éléments permettant d’identifier l’équipement en panne le plus précisément possible. Sans ses informations et si la personne en face est de mauvaise humeur, vous ne pourrez pas déclarer l’incident, vous ne pourrez pas recevoir la pièce nécessaire rapidement.

Les informations à collecter sont :

  1. le nom de l’équipement
  2. son modèle, son constructeur, sa référence constructeur, le numéro de série
  3. le numéro d’inventaire
  4. la date d’achat
  5. la durée de garantie et la date de fin de garantie
  6. la valeur d’achat
  7. la valeur d’amortissement
  8. la localisation géographique
  9. des informations sur les composants internes (CPU, mémoire, disques, cartes réseaux …)
  10. quelques éléments de configuration (nom, adresse IP, …)
  11. le type d’équipement (serveurs, SAN, switch, …)
  12. l’utilisation de l’équipement (PROD/R&D/LAN/…)

Ces éléments ne sont pas exhaustifs. J’ai indiqué ici les principaux mais d’autres peuvent vous être utiles. Il est important de remplir le maximum de champ possible, le plus automatiquement possible. Des « agents » existent pour les outils d’inventaire et permettent de récolter beaucoup d’éléments. Il reste à saisir les éléments non récupérables mais les plus importantes: garantie, numéro d’inventaire, date d’achat, valeur d’achat, …

Il arrive qu’il n’y ai rien. Du tout. Vous devrez alors tout saisir. Cela peut être long. Il est aussi important de « reconstruire le passé ». C’est à dire de retrouver les informations non saisies mais devant être saisies. Ceci doit être fait pour tous les équipements en exploitation. Est ce que cette saisie est chiante? Oui. Est ce que reconstruire le passé est complexe? Oui. Est ce que s’assurer que toutes les informations pertinentes sont présentes est amusant? Non, vous rêvez. Est ce qu’elle est essentielle, vous sortira d’une situation catastrophique un jour? Oui. À vous de voir.

Une fois la saisie faite, vous pourrez récupérer des informations pertinentes et très intéressantes qui vont vous en apprendre énormément sur le passé, lorsque vous n’étiez pas là. Et c’est à ce moment que vous pourrez étonner votre responsable en lui fournissant des informations précises, chiffrées, qu’il ne connaît pas (ou qu’il connaît de manière très imprécise ou avec une vision différente) :

  • le budget annuel, année après année
  • le budget annuel par type d’équipements
  • le budget annuel par type d’utilisation
  • les éléments qui ne sont plus sous garantie et qu’il faut remplacer très rapidement
  • les éléments qui ne seront plus sous garantie l’année prochaine et qu’il faudra remplacer
  • les éléments obsolètes depuis plusieurs années et pour lesquels il faut mettre un cierge pour éviter qu’ils ne plantent avant leur remplacement qui va forcément mettre énormément de temps car l’OS est ancien et les applications non compatibles avec les nouvelles versions de cet OS (cas vécu? non…)

Encore une fois, avec ces informations vous prenez de la valeur. Votre analyse va être pertinente et efficace. Vous pourrez vous baser sur des chiffres précis pour convaincre. Ce sont les prochaines étapes de la méthode.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *