Siti web

L'interruzione del rack ha un impatto limitato

HomeGen - Azure VM 101

HomeGen - Azure VM 101
Anonim

Rackspace interruzione di ieri - un problema ricorrente quest'anno per il provider di data center ospitato - che ha eliminato numerosi siti di alto profilo tra cui il popolare blog TechCrunch. Nessuna rete è impenetrabile alle interruzioni, ma un'azienda come Rackspace deve fornire un servizio coerente e affidabile.

Il blog ufficiale di Rackspace spiega "Il 18 dicembre 2009 tra le 15:37 e le 16:12 CST, Rackspace ha sperimentato la connettività di rete i problemi." La cronologia non giustifica il fatto che il timestamp sul rapporto TechCrunch sul sito del Washington Post dica 12:17 pm. Supponendo che il timestamp di TechCrunch sia il fuso orario del Pacifico, significherebbe che l'interruzione è iniziata più come alle 2pm centrale, o forse anche prima.

Oltre a TechCrunch, un certo numero di altri servizi e blog sono stati influenzati dall'interruzione di Rackspace, inclusi 37signals, Brizzly, blog di Robert Scoble, siti ospitati da Laughing Squid, Tumblr e Mashable.

[Ulteriori letture: i migliori NAS per lo streaming multimediale e il backup]

Il blog Rackspace descrive la causa principale: "I problemi un problema con un router utilizzato per il peering e la connettività backbone situati all'esterno del data center in una struttura di peering, che gestisce circa il 20% del traffico di Dallas di Rackspace. "

Il post del blog continua a spiegare che l'errore di configurazione del router faceva parte di test finale per l'integrazione del data center tra le strutture di Chicago e Dallas, e che non avrebbe dovuto influire sul funzionamento durante il normale orario lavorativo. "L'integrazione della rete delle strutture era prevista durante la finestra di manutenzione mensile al di fuori del normale orario lavorativo, e l'incidente di oggi si è verificato durante i preparativi finali."

L'interruzione ha lasciato molti clienti Rackspace dicendo "Ehi! Chi ha spento il cloud? "

Mentre un'interruzione dei data center che ha conseguenze su siti popolari e noti è un occhio nero per il cloud computing in generale, la portata dell'impatto di questa interruzione è stata relativamente piccola. Come sottolineato da questo blog, "Rackspace è una piccola patata, ora è un sacchetto di patate a crescita rapida, ma ancora dinky e l'altra cattura: Rackspace è più sull'hosting che sul cloud."

Per i clienti che si affidano a Rackspace per ospitare i loro server, in particolare i server Web, possono sembrare molto simili a Internet quando il data center di Rackspace non era disponibile. Tuttavia, i servizi di cloud computing come Amazon EC2 e Microsoft Azure e chiavi di accesso di Internet come Google e Amazon non sono stati influenzati dall'interruzione di Rackspace.

Gli errori si verificano, ma i clienti di Rackspace hanno il diritto di mettere in discussione le interruzioni ripetute e il servizio interruzioni. Almeno un cliente di Rackspace è turbato da un problema correlato alla notifica dei clienti di problemi di rete come questa interruzione.

I server ospitati dal cliente sono stati interessati dall'interruzione di Rackspace e sono stati scoperti dai reclami dei clienti che il suo sito non era disponibile per due ore. In un commento, il cliente ha dichiarato: "Paghiamo anche Rackspace in più per un servizio di monitoraggio costante che dovrebbe immediatamente notificarmi tramite e-mail o telefonata se il nostro server diventa inaccessibile in qualsiasi momento.Sono stato ALTAMENTE disturbato per scoprire che Rackspace in realtà è SOPPRESSO queste notifiche vengono inviate ai loro clienti per qualche strana ragione. "

Il commento non offre alcuna prova a sostegno dell'indicazione che Rackspace abbia intenzionalmente trattenuto la notifica, e non ho ricevuto alcun feedback da Rackspace per confermare o negare l'accusa. Se risultasse vero, danneggerebbe la credibilità e la reputazione del servizio clienti di Rackspace.

La linea di fondo, tuttavia, è che Rackspace ha determinato la causa del problema e risolto in tempi relativamente brevi e ha fornito aggiornamenti di stato sul blog per mantenere i clienti informati. Persino brevi interruzioni sembrano devastanti per coloro che ne sono affetti, ma succederanno, e quando lo fanno è più o meno come li vuoi gestire.

Tony Bradley tweets come @PCSecurityNews, e può essere contattato nella sua pagina Facebook.