di Fredy Künzler
Durata della lettura: 4 minuti
Come un Internet provider controlla il proprio traffico dati
Da dove provengono i dati che un cliente medio di Internet ottiene con la sua connessione a banda larga? Per un fornitore di servizi Internet è necessario analizzare costantemente le fonti di dati. Tuttavia, non è il traffico di un singolo cliente che interessa, ma il consumo aggregato dell’intera base clienti. Questo garantisce la protezione dei dati e la privacy del cliente (vedi FAQ).
Internet è strutturato come una rete di reti. Le singole reti sono costituite dalle rispettive infrastrutture dei provider, denominate sistemi autonomi (AS). Ogni sistema autonomo ha un numero unico globale, il cosiddetto numero AS o ASN. Init7, ad esempio, ha il numero AS 13030.
I sistemi autonomi sono collegati tra loro tramite interconnessioni, che sono semplici connessioni Ethernet che di solito vengono stabilite in centri di communicazione o centri dati. Queste connessioni sono chiamate “peering” – le capacità più comunemente utilizzate oggi sono progettate per 10 o 100 Gbit/s; questo è noto come PNI (Private Network Interconnect). Un altro tipo di peering avviene attraverso gli Internet Exchange. Si tratta di piattaforme di commutazione in cui ogni rete partecipante dispone di una o più connessioni Ethernet. Il peering è controllato dal protocollo di routing BGP4 (Border Gateway Protocol Version 4).
Oltre ai peerings, un provider necessita di capacità aggiuntiva per fornire la larghezza di banda. L’interconnessione diretta con tutti gli altri AS non è fattibile, poiché attualmente esistono oltre 100.000 ASN in tutto il mondo collegati a Internet. Pertanto, in qualità di provider, è inevitabile limitarsi ai partner di peering. Per i clienti è importante essere collegati al maggior numero possibile di ASN. A tal fine, vengono stipulati uno o più contratti di fornitura per il transito IP. Un vettore con una rete più ampia trasporta i dati del cliente da e verso i sistemi autonomi che non sono direttamente collegati tramite peering.
Ma come si selezionano i partner di peering rilevanti? In realtà, solo poche decine o centinaia di sistemi autonomi sono realmente rilevanti in termini di volume di dati scambiati. Circa l’80% del volume di dati acquistato da un fornitore medio di servizi Internet proviene solo da una decina di sistemi autonomi. Non sorprende che tra questi vi siano i “Big 5”, talvolta indicati come “GAFAM”: Google, Amazon, Facebook (Meta), Apple e Microsoft. Importanti sono anche i fornitori di CDN (Content Delivery Networks) Akamai, Cloudflare e Fastly, nonché Netflix e Twitch (Amazon IVS). In Svizzera è rilevante anche il provider televisivo Zattoo. In Europa, anche i fornitori di data center e cloud come OVH (Francia), Eweka (Paesi Bassi) e Hetzner (Germania) svolgono un ruolo fondamentale. Nel caso delle piattaforme di gioco, va sottolineato Steam (Valve Corporation). Per quanto riguarda il traffico in uscita, gli ISP (Internet Service Provider) dello stesso Paese o della stessa regione linguistica hanno generalmente volumi maggiori. In Svizzera, si tratta principalmente di Swisscom, Sunrise, Quickline e Salt.
I dati NetFlow o SFlow provenienti dai router vengono analizzati per aggregare e analizzare il volume di dati effettivo. Questi dati di flusso si basano su un’istantanea in cui, ad esempio, viene registrato ogni millesimo pacchetto di dati trasmesso da un router. Vengono salvati l’indirizzo IP di origine e di destinazione e la dimensione del pacchetto. Questi campioni di flusso vengono poi inoltrati a un collettore di flussi e analizzati. Il campione di un pacchetto di dati ogni 1000 fornisce una misura abbastanza precisa del volume di dati effettivo. Si pensi, ad esempio, ai flussi video di YouTube, dove milioni di pacchetti di dati vengono trasmessi dalla stessa fonte alla stessa destinazione.
Esistono diversi strumenti per l’analisi dei campioni di flusso; noi di Init7 utilizziamo il software open source Akvorado. Una caratteristica particolarmente interessante di questo programma è la possibilità di creare diagrammi di Sankey, che possono essere utilizzati per visualizzare per esempio graficamente le 15 principali fonti di traffico in un determinato periodo.
L’architetto di rete di un provider cerca di instradare il traffico da queste fonti (e destinazioni) attraverso peerings PNI, ove possibile. Ciò è nell’interesse di entrambe le parti, poiché anche il fornitore di contenuti cerca di ottimizzare il proprio traffico. Oltre a ottimizzare la qualità, un PNI offre anche i costi più bassi rispetto al peering pubblico o al transito IP. Tuttavia, il peering richiede tempo e denaro: recarsi a eventi di settore come l’European Peering Forum o il Global Peering Forum per negoziare direttamente con altri coordinatori di peering. Non va inoltre sottovalutato il tempo necessario per configurare e utilizzare gli strumenti necessari: Oltre ad Akvorado, il programma open source “Peering Manager” può essere utilizzato per automatizzare e gestire almeno in parte la configurazione dei router.
Noi di Init7 cerchiamo di instradare il nostro traffico nel modo più ottimale possibile da oltre 20 anni e ci impegniamo a fondo in questo senso, il che si riflette nella qualità della nostra backbone. Altri provider si risparmiano questo sforzo e si limitano ad acquistare capacità dai carrier, di solito al prezzo più conveniente, poiché gli acquirenti spesso non hanno le competenze necessarie per valutare la qualità.
Init7 opera quindi su PNI su diverse decine di altre reti, tra cui, ovviamente, i principali fornitori di contenuti come Google, Amazon, Facebook (Meta), Apple e Microsoft. Queste capacità sono quasi sempre progettate con una larghezza di banda di 100 Gbit/s e sono anche ridondate in diverse località, in modo che sia disponibile un percorso alternativo in caso di guasto. Sono inoltre circa 30 gli Internet-Exchanges a cui Init7 è collegato. Queste informazioni sono documentate nel PeeringDB, un database gestito dalla comunità di peering che elenca le informazioni rilevanti sui peer esistenti e potenziali. Il traffico gestito da Init7 tramite IP Transit rappresenta solo il 2-3% circa del volume totale, in quanto il nostro obiettivo è quello di determinare autonomamente la qualità delle nostre connessioni Internet, per quanto possibile, a beneficio dei nostri clienti.
La capacità di interconnessione deve quindi essere costantemente misurata e regolata se necessario. Se ciò non avviene, può verificarsi un overbooking. Il cosiddetto overbooking si verifica in due casi: In primo luogo, nelle connessioni a banda larga, dove troppi clienti vengono assegnati alla capacità disponibile, come abbiamo descritto nel post “Overbooking: come i provider si dividono la larghezza di banda”. L’altro problema è l’interconnessione. Se la capacità di peering disponibile si esaurisce in prima serata la domenica sera alle 20.30 e non vengono effettuati aggiornamenti, ciò sarà visibile al cliente finale. Durante lo streaming di Netflix, YouTube o Zattoo, l’utente vede “poltiglia di pixel” invece di qualità HD. Una fonte di dati può funzionare perfettamente mentre un’altra è sovraccarica. Il problema dell’overbooking non è evidente alla maggior parte dei clienti finali.
Alcuni provider, di solito quelli più grandi, non adeguano deliberatamente le loro capacità sovraccariche alla domanda, per motivi finanziari. Chiedono denaro alle fonti di traffico, il che è problematico ai sensi della legge sui cartelli. Abbiamo descritto come funzionano questi cartelli qualche tempo fa nel nostro blog “To peer or not to peer – Kartelle im Internet”.