Kuinka koko internet katosi yhdessä yössä
Lyhyesti
Cloudflaren konfigurointivirhe 18. marraskuuta aiheutti ketjureaktion, joka tilapäisesti häiritsi tärkeimpiä palveluita, kuten X:ää, ChatGPT, Spotify ja Uber maailmanlaajuisesti.
Kuvittele tämä: heräät, nappaat puhelimesi ja napautat tavanomaisia kuvakkeita. X ei lataudu. ChatGPT ei vastaa kysymykseesi. YouTube ei näytä videotasi. Jopa Downdetector, sivusto, jota normaalisti käytät tarkistaaksesi, onko jotain rikki, on… rikki.
Muutaman tunnin ajan 18. marraskuuta se oli todellisuutta miljoonille ihmisille ympäri maailmaa. merkittävä käyttökatkos Cloudflaressa, yksi modernin internetin taustalla olevista keskeisistä infrastruktuuriyrityksistä, sulki tai heikensi laajan valikoiman palveluita, mukaan lukien X:n, ChatGPT, Spotify, Uber, Canva, League of Legends ja paljon muuta.
Tuntui kuin "koko internet" olisi kadonnut. Käytännössä se oli jotain sekä pienempää että pelottavampaa: yhden yrityksen järjestelmien yksittäinen vika, joka levisi valtavaan osaan verkkoa.
Mikä Cloudflaressa oikeasti meni pieleen
Ongelmat alkoivat tiistaiaamuna (18. marraskuuta) Yhdysvaltain aikaa. Noin kello 6.20 ET Cloudflare havaitsi epätavallisen liikenteen piikin yhden järjestelmänsä läpi. Vain muutamaa minuuttia myöhemmin Cloudflareen perustuvat verkkosivustot alkoi antaa "sisäinen palvelinvirhe" -virhettä sivuja ja aikakatkaisu käyttäjille ympäri maailmaa.
Kun Downdetectoriin ja sosiaaliseen mediaan kasaantui katkosraportteja, Cloudflare ilmoitti olevansa "tietoinen ja tutkivansa" ongelmaa, joka vaikuttaa useisiin asiakkaisiin. Insinöörit lopulta tunnistivat syyllisen ja esittivät korjauksen, ja liikenne palasi vähitellen normaaliksi noin kolme tuntia häiriön alkamisen jälkeen.
Yritys korosti yhtä keskeistä asiaa: kyberhyökkäyksestä ei ollut merkkejä. Kyseessä ei ollut palvelunestohyökkäys, kiristysohjelmahyökkäys tai valtion toimijan hyökkäys. oli sisäinen tekninen vikaKäyttäjille syy ei kuitenkaan ollut tärkeä. Heidän kokemuksensa oli yksinkertainen: internet lakkasi toimimasta.
Mitä Cloudflare tekee (ja miksi et ole koskaan kuullut siitä)
Useimmat ihmiset eivät koskaan käy cloudflare.com tarkoituksella, mutta he ovat tekemisissä sen verkoston kanssa joka päivä. Cloudflare sijaitsee keskellä internet-"polkua" sinun ja käyttämiesi verkkosivustojen välillä. Yksinkertaisesti sanottuna Cloudflare:
- Nopeuttaa sivustoja tallentamalla sisältöä välimuistiin ja reitittämällä liikennettä tehokkaasti (sisällönjakeluverkko eli CDN);
- Suojaa heitä palvelunestohyökkäyksiltä ja haitallisilta botteilta;
- Seuloo liikennettä ja päättää, mikä näyttää turvalliselta ja mikä ei.
Yhtiö kertoo hoitavansa liikennettä mm. noin viidennes kaikista verkkosivustoista maailmanlaajuisesti. Se käsittelee myös valtavan määrän HTTP-pyyntöjä joka sekunti, toimien hiljaa verkon valtavien osien liikenteenpoistajana ja liikennepoliisina.
Tuo mittakaava on loistava, kun kaikki toimii. Kun se ei toimi, koko internet voi yhtäkkiä tuntua haavoittuvalta.
Pieni tiedosto, joka aiheutti kaatumisen
Cloudflaren jälkipuinti kertoo yllättävän arkipäiväisen tarinan. Sen botin ja uhkien hallintajärjestelmän käyttämä määritystiedosto (pohjimmiltaan joukko sääntöjä) luotiin automaattisesti. Ajan myötä tuo tiedosto kasvoi suuremmaksi kuin insinöörit odottivat.
Jossain vaiheessa se ylitti kovan rajan ohjelmistossa, joka käsittelee useiden Cloudflare-palveluiden liikennettä. Koodissa olevan piilevän virheen vuoksi järjestelmä ei kaatunut ongelmitta. Sen sijaan ylisuuri tiedosto aiheutti kaatumisen ydinliikenteen käsittelykomponentissa.
Siitä eteenpäin asiat eskaloituivat:
- Bottien hallintatoiminto yritti ottaa käyttöön uuden, liian suuren kokoonpanon;
- Prosessi kaatui toistuvasti tiedoston hylkäämisen sijaan;
- Tuo kaatuminen levisi useisiin palveluihin, jotka olivat riippuvaisia samasta ohjelmistosta;
- Kun yhä useammat solmut vikaantuivat, suuri osa Cloudflaren verkosta alkoi palauttaa virheitä verkkosivujen sijaan.
Cloudflaren teknologiajohtaja Dane Knecht kutsui katkosta "hyväksymättömäksi" ja sanoi yrityksen "pettäneen" asiakkaansa ja laajemman internetin, lupaamalla muutoksia, jotta yksittäinen kokoonpanovirhe ei voi aiheuttaa samanlaista ketjureaktiota uudelleen.
Pahenevatko sähkökatkot vai ovatko ne vain kovempia?
Jos sinusta tuntuu, että näitä tapauksia tapahtuu useammin, et ole ainoa. Tämä Cloudflaren katkos tapahtui vain viikkoja sen jälkeen, kun suuri Amazon Web Services -ongelma pysäytti tuhansien verkkosivustojen ja sovellusten toiminnan Snapchatista ja Redditistä sisäisiin työkaluihin, joihin yritykset ovat päivittäin riippuvaisia.
Verkonvalvontayritykset ovat seuranneet laajamittaisia häiriöitä internetissä vuosien ajan. Heidän datansa viittaa johonkin hienovaraiseen seikkaan:
- Suurten sähkökatkosten määrä vuosittain ei ole räjähdysmäisessä kasvussa;
- Mutta jokaisen katkoksen vaikutus kasvaa, koska yhä useammat palvelut ovat riippuvaisia samoista keskitetyistä palveluntarjoajista.
Kaksikymmentä vuotta sitten, jos työnantajasi sähköpostipalvelin kaatui, se pilasi päiväsi, mutta vain yrityksesi. Nykyään, kun Cloudflarella tai AWS:llä on huono aamu, miljoonat ihmiset ja yritykset tuntevat sen heti.
Tämän lisäksi ihmiset nyt tiedottavat jokaisesta häiriöstä X:ssä, Redditissä ja TikTokissa. Häiriöt, jotka aiemmin saattoivat edetä hiljaisesti "huolto-ongelmina", näyttävät ja tuntuvat nyt globaaleilta kriiseiltä.
Vähemmän palveluntarjoajia, suurempia riskejä
Cloudflaren katkos sopii toistuvaan kaavaan, jonka olemme nähneet AWS:n, Azuren ja muiden suurten infrastruktuuritoimijoiden kanssa:
- Pieni sisäinen muutos (kokoonpanon säätö, ohjelmistopäivitys, väärin toimiva skripti) on vuorovaikutuksessa jonkin järjestelmän piilevän oletuksen kanssa;
- Virheiden käsittely ei huomaa sitä tarpeeksi ajoissa;
- Automatisoidut järjestelmät pahentavat ongelmaa sen sijaan, että ne hillitsisivät sitä;
- Tapaus leviää suureen määrään asiakkaita, jotka kaikki ovat riippuvaisia samasta alustasta.
Olemme optimoineet internetin nopeuden, kustannusten ja globaalin mittakaavan suhteen. Helpoin tapa saavuttaa nämä on käyttää kourallista massiivisia palveluntarjoajia, joilla on datakeskuksia kaikkialla ja maailmanluokan suunnittelutiimejä.
Kompromissi on keskittyminen. Kun paikallisella internet-palveluntarjoajalla on ongelma, koko kaupunki menee verkosta pois. Kun Cloudflare epäonnistuu, näyttää siltä kuin koko internet olisi kadonnut.
Mitä teknologiajohtajat sanovat romahduksesta
Vaikka Elon Musk ei kommentoinut suoraan Cloudflare-bugia, hän on toistuvasti varoittanut ylikeskitetystä digitaalisesta infrastruktuurista, erityisesti X:n oman resilienssin ja sen siirtymisen kohti itse isännöityjä järjestelmiä osalta. Vuosina 2023–2025 hän usein huomautti, että yhden palveluntarjoajan varaan luottaminen internetin suurten osien ylläpidossa on "yksittäisen vikaantumispisteen ongelma", ja hän on kritisoinut tätä AWS:ää, Applea, Googlea, Cloudflare-tyyppisiä kerroksia ja jopa mobiilioperaattoreita.
Cloudflaren oma teknologiajohtaja antoi voimakkaimman ja selkeimmän reaktion katkokseen. Knecht pyysi julkisesti anteeksi ja sanoi tapauksen olevan "hyväksymätön", koska niin monet organisaatiot ja käyttäjät ovat riippuvaisia Cloudflaren infrastruktuurista. Hän korosti myös, että syynä ei ollut hyökkäys, vaan määritysvirhe, joka laukaisi ketjureaktion, minkä hän kuvaili ensisijaiseksi tavoitteeksi estää se tulevaisuudessa.
Amazon Web Servicesin pääevankelista Jeff Barr ei käsitellyt Cloudflaren käyttökatkosta, mutta hän keskustelee usein AWS-katkoksista ja maailmanlaajuisten vikojen taustalla oleva yleinen kaava. Hänen pitkäaikainen viestinsä: mitä enemmän järjestelmä on yhteydessä toisiinsa ja mitä automatisoidumpia prosessit ovat, sitä suurempi on kaskadoituneiden virheiden riski.
Ja viimein Cloudflaren toimitusjohtaja Matthew Prince puhui. Hän on puhunut vuosia internetin herkästä arkkitehtuurista, erityisesti niistä osista, joita kukaan ei huomaa ennen kuin ne rikkoutuvat. Hän väittää usein, että verkon ydinterveys riippuu sen sietokyvystä, ei täydellisyydestä.
Hän on toistuvasti tehnyt teemoja, kuten:
- Suurimmat uhat ovat sisäiset virheelliset kokoonpanot, eivät hyökkääjät;
- Redundanssi on paistettava jokaiseen kerrokseen;
- Internetiä pitää koossa "järkyttävä määrä teippiä".
Hän ei antanut pitkää julkista lausuntoa tämän sähkökatkon alkuvaiheessa, mutta hänen aiempien haastattelujensa teemat pätevät suoraan.
Vastuun kieltäminen
Mukaisesti Luottamusprojektin ohjeetHuomaa, että tällä sivulla annettuja tietoja ei ole tarkoitettu eikä niitä tule tulkita oikeudellisiksi, verotukselliseksi, sijoitus-, rahoitus- tai minkään muun muodon neuvoiksi. On tärkeää sijoittaa vain sen verran, mitä sinulla on varaa menettää, ja pyytää riippumatonta talousneuvontaa, jos sinulla on epäilyksiä. Lisätietoja saat käyttöehdoista sekä myöntäjän tai mainostajan tarjoamista ohje- ja tukisivuista. MetaversePost on sitoutunut tarkkaan, puolueettomaan raportointiin, mutta markkinaolosuhteet voivat muuttua ilman erillistä ilmoitusta.
Author
Alisa, omistautunut toimittaja MPost, erikoistunut kryptoon, tekoälyyn, sijoituksiin ja laajaan maailmaan Web3. Hän tarkkailee tarkasti nousevia trendejä ja teknologioita, ja hän tarjoaa kattavan kattavuuden tiedottaakseen ja saadakseen lukijat mukaan digitaalisen rahoituksen jatkuvasti kehittyvään maisemaan.
lisää artikkeleita
Alisa, omistautunut toimittaja MPost, erikoistunut kryptoon, tekoälyyn, sijoituksiin ja laajaan maailmaan Web3. Hän tarkkailee tarkasti nousevia trendejä ja teknologioita, ja hän tarjoaa kattavan kattavuuden tiedottaakseen ja saadakseen lukijat mukaan digitaalisen rahoituksen jatkuvasti kehittyvään maisemaan.



