Siti web

Interruzione di Gmail causata da server sovraccaricati

Opening Keynote (Cloud Next '19)

Opening Keynote (Cloud Next '19)
Anonim

Un'interruzione mondiale di Gmail di Google online Il sistema di posta elettronica di martedì è stato causato da un ingorgo sui suoi server, secondo il blog ufficiale di Gmail di Google.

Il problema era che alcune modifiche recenti miravano a migliorare il flusso del traffico sui router di richiesta, i server progettati per indirizzare le interrogazioni Web al server Gmail appropriato, sovraccarico il sistema dopo che alcuni dipendenti hanno disconnesso alcuni server Gmail per eseguire gli aggiornamenti di routine.

"Come ora sappiamo, abbiamo leggermente sottostimato il carico che alcune modifiche recenti hanno posto sui router di richiesta", Ben Treynor, affidabilità del sito Czar ha scritto sul blog di Gmail. "Verso le 12:30 del Pacifico, alcuni router della richiesta sono diventati sovraccarichi e in effetti hanno detto al resto del sistema che" smettetela di inviarci traffico, siamo troppo lenti! ". Questo ha trasferito il carico sui router di richiesta rimanenti, causando anche alcuni di loro sono sovraccaricati e in pochi minuti quasi tutti i router di richiesta sono stati sovraccaricati. "

[Ulteriori letture: I migliori servizi di streaming TV]

Il sovraccarico ha portato persone in tutto il mondo a non essere in grado di accedi a Gmail per circa 100 minuti, ha detto Treynor, anche se ha notato che l'accesso IMAP / POP e l'elaborazione della posta continuavano a funzionare normalmente.

Gli ingegneri di Gmail sono stati avvisati del problema in pochi secondi dai guasti e dopo aver scoperto quale fosse il problema, ha portato router di richieste aggiuntive online. Ora, Gmail è più del 99,9% disponibile per gli utenti, ha detto.

"Abbiamo dedicato tutta la nostra attenzione per garantire che questo tipo di evento non si ripeta più", ha scritto.

Una correzione per l'azienda l'intenzione è di garantire che i router di richiesta funzionino meglio rallentandoli quando vengono sovraccaricati anziché rifiutare di accettare il traffico. Treynor ha affermato che i router delle richieste devono avere un isolamento di errore sufficiente in modo che un problema in un data center non influisca sui server di un altro data center.

L'azienda lavorerà nelle prossime settimane per apportare queste modifiche e migliorare ulteriormente l'affidabilità, ha detto.