Blog

Un nouvel outil pour localiser la source de vos problèmes de performance

Chaque administrateur informatique sait que les utilisateurs se plaignent généralement de deux choses : c’est lent, ou ça ne fonctionne pas. Lorsqu’un service est interrompu, c’est fréquemment en raison d’une panne et il est souvent facile de trouver le problème. Mais par où commencer quand les utilisateurs se plaignent des mauvaises performances d’un service? Et quels sont les outils susceptibles de nous aider? Dans ce type de situation, les outils de surveillance des performances sont exactement ce dont nous avons besoin.

Les limites des anciennes façons de faire

Comme les problèmes de connectivité sont récurrents chez nos clients, nous cherchions depuis un moment déjà des solutions en vue d’accroître la visibilité que nous avons sur la performance du réseau. Lorsqu’un client nous appelait pour que nous localisions la source de problèmes de performance, il arrivait souvent que nous devions le référer à son fournisseur Internet. Le diagnostic se faisait fréquemment par élimination. Lorsqu’il était confirmé que notre infrastructure et nos services fonctionnaient bien et qu’aucun problème n’avait été détecté de notre côté, le problème se situait probablement sur le réseau local du client ou dans le réseau du fournisseur de service. Devant une telle situation, le client ne se sentait parfois pas complètement pris en charge et pouvait penser que nous tentions de lui cacher quelque chose en pointant dans une autre direction. Bien entendu, ce n’était absolument pas le cas; c’est que jusqu’à aujourd’hui, les outils de surveillance réseau n’offraient pas la possibilité de surveiller facilement la connectivité de bout en bout entre notre infrastructure et le réseau de nos clients, particulièrement lorsque le service passait par Internet.

Les possibilités d’un nouvel outil de diagnostic

Pour régler ce type de problème et nous permettre d’accroître notre visibilité, nous avons étudié des dizaines d’outils provenant de partout sur la planète… et c’est finalement au Québec que nous avons trouvé la solution. Obkio, une entreprise de Montréal, développe en effet depuis février 2018 une solution conçue pour la surveillance de la performance de réseaux et d’applications web. Son fondateur, Jean-François Lévesque, n’en est pas à sa première entreprise : il est l’un des trois cofondateurs et ancien CTO (chief technology officer) de Fibrenoire, un fournisseur Internet et de réseaux privés qui a connu une croissance fulgurante avant d’être vendu à Vidéotron en 2016.

Une identification précise de la source du problème

La solution d’Obkio consiste à déployer des agents physiques ou logiciels à des endroits stratégiques du réseau comme des centres de données, sites distants, clients externes ou clouds publics ou privés.

Une fois les agents déployés, ils échangent du trafic entre eux par intervalles de 500 ms. Bien que cela puisse sembler beaucoup, il s’agit d’un très petit volume de trafic générant seulement quelques kbps par session. Les mesures réalisées lors de la surveillance des sessions fournissent les données brutes essentielles à l’analyse de la performance. Elles permettent de mesurer différents paramètres de fonctionnement basés sur des métriques réseau tels que la latence, la gigue, la perte de paquets, la qualité de service et l’expérience client via le MOS (mean opinion score). Des tests de vitesse peuvent également être exécutés régulièrement pour vérifier si les vitesses disponibles coïncident bien avec celles qui devraient être offertes par les fournisseurs de services.

L’application comprend un tableau de bord qui permet aux usagers d’avoir accès en temps réel à l’état de santé de la performance du réseau. Elle offre en un coup d’œil une visibilité sur les données analysées et permet d’explorer en direct et en profondeur les graphiques des performances mis à jour toutes les 500 ms. Comme l’application est aussi offerte en version mobile, on peut accéder à l’outil peu importe où l’on se trouve lorsqu’un incident survient. Il est de plus possible de fixer les seuils responsables du déclenchement des alarmes et des notifications. Ces dernières permettent aux usagers d’être avertis au moment même où la dégradation du service commence à se faire sentir, sans nécessairement que celui-ci soit complètement interrompu. Et comme l’outil garde un historique des performances et des incidents, il permet de poser des diagnostics même après la résolution d’un incident.

Encore plus d’efficacité à identifier et résoudre les problèmes

Depuis la mise en place de cette solution, la visibilité que nous avons du réseau a considérablement augmenté. Nous disposons maintenant d’un outil qui nous permet de déterminer plus facilement si un problème est causé par le réseau, et si c’est le cas de savoir s’il se situe sur le LAN du client ou sur le réseau de son fournisseur de service. Lorsque le problème se trouve du côté de ce dernier, cela permet dans bien des cas d’ouvrir un billet et de mieux comprendre le fonctionnement de l’engrenage; le problème est reconnu et résolu plus rapidement. Nous gagnons ainsi un temps précieux lors des diagnostics et évitons que chacun se lance la balle pour trouver le responsable du problème.

Pour plus d’information concernant Obkio, veuillez contacter votre représentant.

< Back