wand zuckerberg

Nel corso di quest'anno Facebook non si è dimostrato particolarmente affidabile rispetto al passato in fatto di disponibilità online. La piattaforma è stata irraggiungibile più volte e per diversi periodi di tempo – arrivando in un'occasione a far registrare un down di più di 24 ore – ma finora nessuno dall'interno della società aveva mai fornito al pubblico una spiegazione troppo dettagliata del perché. A colmare la lacuna ci ha pensato il numero uno del gruppo in persona Mark Zuckerberg, che nel corso di un incontro con i suoi dipendenti si è addentrato nelle motivazioni tecniche alla base dei down degli scorsi mesi.

In realtà il racconto di Zuckerberg non era destinato al grande pubblico: la trascrizione è stata pubblicata da The Verge e proviene dai file audio che la stessa testata ha ottenuto e iniziato a pubblicare qualche giorno fa, e che documentano il CEO di Facebook durante uno degli incontri a porte chiuse con gli impiegati dell'azienda. In questo frangente, Zuckerberg ha risposto in particolare alla domanda di un dipendente preoccupato per la tenuta dell'infrastruttura tecnologica del gruppo.

Zuckerberg ha ammesso che quest'anno i siti del gruppo Facebook si sono trovati offline per più tempo rispetto agli ultimi anni messi insieme, attribuendo la responsabilità dei disguidi a ragioni diverse. "Non siamo più al punto in cui la nostra infrastruttura consiste di una semplice, singola entità" ha commentato Zuckerberg; "la complessità del sistema è in crescita costante, e problemi che prima avrebbero provocato inconvenienti trascurabili ora possono portare a conseguenze più gravi".

Il viceresponsabile dello sviluppo Santosh Janardhan ha poi aggiunto che alcuni dei problemi sono derivati da operazioni di test, durante le quali il gruppo mette sotto stress le proprie infrastrutture per verificarne il funzionamento durante i carichi di lavoro più pesanti e avere un'idea più chiara di come espanderle. Durante questi test il gruppo ha inavvertitamente "spinto i sistemi leggermente oltre le loro capacità, e questi hanno risposto in un modo difficile da anticipare". In una occasione nella fattispecie questo è accaduto in uno dei datacenter dove il gruppo stocca "i video, le foto, gli allegati di Messenger, gli adesivi e molto altro. Il che ha portato a una serie di errori a cascata" che hanno presumibilmente mandato in tilt l'intero sito.

Quello della complessità del sistema è un aspetto sul quale Zuckerberg e Janardhan hanno insistito per tentare di spiegare i problemi verificatisi in questi mesi. Le dimensioni e la sofisticazione dell'infrastruttura del resto "sono inediti in tutto il pianeta", ha commentato Janardhan: questo ha fatto in modo che perfino gli strumenti ideati dal gruppo per individuare e neutralizzare i problemi riscontrati abbiano fallito nel loro compito, contribuendo a prolungare i peridodi di down anziché accorciarli. Per il futuro il gruppo si concentrerà su due aspetti: da una parte realizzare nuovi strumenti per identificare, intercettare e risolvere più tempestivamente ed efficacemente i problemi; dall'altra fare in modo che quando i problemi si verificano, abbiano effetti meno catastrofici. Prima di arrivarci però servirà ancora del tempo.