de Fredy Künzler
Temps de lecture: 5 minutes
Comment un fournisseur d’accès Internet gère son trafic de données
D’où proviennent en fait les données qu’un client Internet moyen obtient avec sa connexion haut débit ? Pour un fournisseur d’accès à Internet, il est nécessaire d’analyser en permanence les sources de données. Ce n’est toutefois pas le trafic d’un seul client qui est intéressant, mais la consommation agrégée de l’ensemble de la clientèle. De cette manière, la protection des données et de la vie privée du client est garantie (voir FAQ).
Dans sa structure, Internet est un réseau de réseaux. Les différents réseaux sont constitués des infrastructures respectives des fournisseurs d’accès, appelés systèmes autonomes (SA). Chaque système autonome possède un numéro unique au monde, appelé numéro AS ou ASN. Init7, par exemple, a le numéro AS 13030.
Les systèmes autonomes sont reliés entre eux par des interconnexions, c’est-à-dire des connexions Ethernet simples, généralement établies dans des télébureaux ou des centres de calcul. On appelle ces connexions « peering » – les capacités les plus utilisées aujourd’hui sont conçues pour 10 ou 100 gigabits/s ; on parle de PNI (Private Network Interconnect). Un autre type de peering s’effectue par le biais d’Internet Exchanges. Il s’agit de plates-formes de commutation où chaque réseau participant dispose d’un ou de plusieurs ports Ethernet. Le contrôle des peerings se fait via le protocole de routage BGP4 (Border Gateway Protocol Version 4).
Pour fournir la bande passante, un fournisseur d’accès a besoin de capacités supplémentaires en plus des peerings. Une interconnexion directe avec tous les autres AS n’est pas réalisable, car il existe aujourd’hui dans le monde plus de 100000 ASN connectés sur Internet. En tant que fournisseur, il faut donc inévitablement se limiter aux partenaires de peering. Pour les clients, il est pertinent d’être connecté à tous les ASN possibles. Pour y parvenir, un ou plusieurs contrats de livraison sont conclus pour le transit IP. Dans ce cas, un transporteur disposant d’un réseau plus important transporte les données des clients depuis et vers les systèmes autonomes qui ne sont pas directement reliés par peering.
Mais comment choisir les partenaires de peering pertinents ? En fait, seuls quelques dizaines ou centaines de systèmes autonomes sont réellement pertinents du point de vue du volume de données échangées. Environ 80% du volume de données acheté par un fournisseur de services Internet moyen provient d’une dizaine de systèmes autonomes seulement. Sans surprise, les « Big 5 », parfois appelés « GAFAM », en font partie : Google, Amazon, Facebook (Meta), Apple et Microsoft. Les fournisseurs de CDN (Content Delivery Networks) Akamai, Cloudflare et Fastly, ainsi que Netflix et Twitch (Amazon IVS) sont également importants. En Suisse, le fournisseur de télévision Zattoo joue également un rôle important. En Europe, les fournisseurs de centres de données et de cloud tels que OVH (France), Eweka (Pays-Bas) ou Hetzner (Allemagne) jouent en outre un rôle important. En ce qui concerne les plateformes de jeux, il convient de mentionner par exemple Steam (Valve Corporation). Pour le trafic sortant, les ISP (Internet Service Provider) accompagnant le marché et provenant du même pays ou de la même région linguistique ont en général des volumes plus importants. En Suisse, il s’agit principalement de Swisscom, Sunrise, Quickline et Salt.
Pour agréger et analyser le volume réel des données, les données NetFlow ou SFlow des routeurs sont évaluées. Ces données de flux se basent sur un instantané, dans lequel chaque millième paquet de données transmis par un routeur, par exemple, est enregistré. Les adresses IP source et cible ainsi que la taille du paquet sont alors enregistrées. Ces échantillons de flux sont ensuite transmis à un collecteur de flux et analysés. L’échantillon d’un paquet de données pour 1000 donne une mesure assez précise du volume réel des données. Imaginons par exemple les flux vidéo de YouTube, où des millions de paquets de données sont transmis de la même source vers la même destination.
Il existe différents outils pour l’analyse des échantillons de flux – chez Init7, nous utilisons le logiciel open source Akvorado. Ce qui est particulièrement impressionnant avec ce programme, c’est la possibilité de créer des diagrammes de Sankey, qui permettent par exemple de représenter graphiquement les 15 premières sources de trafic sur une période donnée.
L’architecte de réseau d’un fournisseur essaie, dans la mesure du possible, de faire passer le trafic de ces sources (et destinations) par des peerings PNI. C’est dans l’intérêt des deux parties, car le fournisseur de contenu s’efforce lui aussi d’optimiser son trafic. Outre une qualité optimale, un PNI offre en outre les coûts les plus bas par rapport au peering public ou au transit IP. Le peering demande toutefois du temps et de l’argent : il faut se rendre à des événements du secteur tels que le European Peering Forum ou le Global Peering Forum pour négocier directement avec d’autres coordinateurs de peering. Il ne faut pas non plus sous-estimer le temps nécessaire à la configuration et à l’exploitation des outils nécessaires : Outre Akvorado, le programme open source « Peering Manager » permet d’automatiser et de gérer la configuration des routeurs, du moins en partie.
Chez Init7, nous essayons depuis bien plus de 20 ans de router notre trafic de la manière la plus optimale possible et nous y consacrons des efforts non négligeables – ce qui se traduit par la qualité de notre backbone. D’autres fournisseurs s’épargnent cet effort et se contentent d’acheter de la capacité aux opérateurs, généralement au prix le plus bas, car les acheteurs n’ont souvent pas les connaissances techniques nécessaires pour juger de la qualité.
Init7 exploite donc PNI plusieurs dizaines d’autres réseaux, dont bien entendu les grands fournisseurs de contenus comme Google, Amazon, Facebook (Meta), Apple et Microsoft. Presque toujours, ces capacités sont conçues avec une bande passante de 100 Gbit/s et sont en outre provisionnées de manière redondante à différents endroits, de sorte qu’en cas de panne, un chemin alternatif est disponible. A cela s’ajoutent environ 30 échanges Internet auxquels Init7 est connecté. Ces informations sont documentées dans la PeeringDB, une base de données gérée par la communauté de peering, qui répertorie les informations pertinentes sur les pairs existants et potentiels. Le trafic géré par Init7 via IP Transit ne représente que deux à trois pour cent du volume total, car notre objectif est de déterminer autant que possible la qualité de nos connexions Internet au profit de nos clients.
La capacité d’interconnexion doit donc être mesurée en permanence et adaptée si nécessaire. Si cela n’est pas fait, des surréservations peuvent se produire. Ce phénomène, appelé overbooking, se produit à deux endroits : D’une part, au niveau des connexions à haut débit, où trop de clients sont connectés à la capacité disponible – comme nous l’avons décrit dans l’article de blog « Overbooking – comment les fournisseurs d’accès répartissent la bande passante ». L’autre point est l’interconnexion. Si la capacité de peering disponible est épuisée en prime time (par exemple le dimanche soir à 20h30) et qu’aucune mise à niveau n’est effectuée, cela devient visible pour le client final. Lors du streaming de Netflix, YouTube ou Zattoo, l’utilisateur voit alors une « bouillie de pixels » au lieu de la qualité HD. Dans ce contexte, une source de données peut fonctionner correctement alors qu’une autre est surchargée. Pour la plupart des utilisateurs finaux, il n’est pas évident de savoir où se situe réellement le problème de surréservation.
Certains fournisseurs d’accès, généralement de grande taille, n’adaptent volontairement pas leurs capacités surchargées aux besoins – ceci pour des raisons monétaires. Ils demandent de l’argent aux sources de trafic – ce qui est problématique du point de vue du droit des cartels. Nous avons déjà décrit il y a quelque temps le fonctionnement de ces cartels dans notre blog « To peer or not to peer – Kartelle im Internet ».