Il disastro OVH del 10 marzo ha insegnato qualcosa? Oppure, passata l’emergenza, si dimenticherà tutto e la lezione sarà stata inutile?
A distanza di quasi un mese dall’incendio di Strasburgo al data center OVH, che ha completamente distrutto il building SBG2 e danneggiato in parte lo stabile SBG1, si sta lentamente tornando alla normalità.
La quasi totalità dei servizi è infatti stata ripristinata. Anche se non necessariamente su OVH e non sempre in forma indolore.
Il disastro nel disastro: i dati perduti definitivamente oltre al prolungato black-out
In particolare in quei (purtroppo non pochi) casi in cui i dati principali che erano suddivisi insieme alle copie di back-up su server danneggiati dall’incendio (es. dati principali su SBG1 e copie su server dell’area compromessa di SBG2) sono andati completamente perduti.
In queste circostanze – come ha spiegato il datacenter designer & network engineer Giorgio Barinetti a NL – qualora il cliente finale non si fosse dotato in autonomia di copie di back-up, non è stato possibile recuperare il contenuto.
Piano di Recupero del Disastro
Quantomeno, la tragica vicenda OVH ha concesso a molti l’opportunità di scoprire che il Disaster Recovery è l’insieme delle misure tecnologiche e logistico/organizzative atte a ripristinare sistemi, dati e infrastrutture necessarie all’erogazione di servizi di business a fronte di gravi emergenze che ne intacchino la regolare attività.
Disaster Recovery Plan (DRP)
Il Disaster Recovery Plan (DRP), in italiano il Piano di Recupero del Disastro, è il documento che esplicita tali misure, compreso all’interno del più ampio piano di continuità operativa (BCP).
Il caso Newradio
Una società italiana di gestione di flussi streaming che si è distinta nella gestione d’emergenza, ripristinando la quasi totalità dei propri servizi domiciliati sui server OVH in meno di 48 ore, è Newradio. Il CEO dell’azienda, Roberto Brandolini, era stato da noi intervistato nei giorni successivi al disastro.
Oggi con lui facciamo il punto sulle contromisure che il caso ha suggerito di adottare.
La lezione del disastro OVH
(Newslinet) – Nei giorni del disastro si è parlato molto di strategie di back-up, di ridondanza dei server e di affidabilità delle infrastrutture dei data center. Alla luce di quanto accaduto, avete aggiornato il vostro Disaster recovery plan?
(Roberto Brandolini) – Newradio ha avuto un danno su solo il 20% dei dati (che sono andati persi completamente). Ciò perché il rimanente 80% era stato copiato in sicurezza su un’altra macchina, in un altro datacenter. Alla luce dell’accaduto abbiamo deciso di cambiare completamente la nostra strategia di backup dei dati aziendali e dei nostri clienti. Il tutto al fine di riuscire ad organizzare un piano di Disaster Recovery funzionale. E senza sorprese.
Le contromisure
(NL) – Nel dettaglio, quali sono state le contromisure adottate?
(R.B.) – Abbiamo cercato di rendere le cose molto semplici ed efficaci. Intanto, abbiamo creato un file system distribuito di numerosi terabyte ridondato su 3 datacenter (due in Europa ed uno in California). Su questo file system (che in sostanza è come un enorme hard disk online distribuito su 3 punti diversi del mondo) viene effettuata ogni notte (ed in alcuni casi più volte al giorno) una copia di backup di tutti i dati necessari alla ricostruzione totale della maggioranza dei nostri servizi. Questo ci permetterà, in ogni momento, in caso di danni ad un server fisico o cloud, di poterlo ricostruire in tempi brevi. Senza la perdita di dati sensibili.
Disaster Recovery Plan
(NL) – Come è stato aggiornato il Disaster recovery plan di Newradio?
(R.B.) – In pratica abbiamo realizzato in modo distribuito e più completo quello che già era presente prima dell’incendio, ma limitato solo ad alcuni servizi e senza ridondanza. Cerchiamo ogni giorno di trovare delle soluzioni che possano rendere i nostri servizi sempre più sicuri per i nostri clienti. Sicuramente l’incendio del datacenter di Strasburgo è servito ulteriormente a sensibilizzare i nostri tecnici e ad invitarli ad accelerare tutte le operazioni di sicurezza che erano in cantiere, ma che non erano ancora state rese operative in modo definitivo.
Beneficiari
(NL) – Entrando nello specifico, chi potrà beneficiare del backup di sicurezza dei servizi Newradio?
(R.B.) – Tutti i clienti dei servizi di streaming Audio e Video in modalità Live, quelli di Easy Radio (autoDJ), Easy TV (autoDJ Video, il cui backup anche in questo caso interviene anche sui contenuti) ed Easy VOD (contenuti video on demand, il cui il backup crea una copia anche dei contenuti). L’aggiornamento pone al sicuro anche gli utilizzatori di PLAY5 (che purtroppo nella sventura dell’incendio di Strasburgo è stata la falla di dati più pesante da ricostruire), delle nostre app e infine gli utenti di MB Studio Cloud (se hanno sottoscritto l’opzione di backup automatico). (E.G. per NL)