O site ficou fora do ar 11/03/09 entre a 1h e 11:20 (atualizado 17:05)

A queda de hoje foi mais grave do que a que ocorreu na segunda-feira, mas foi pelo mesmo motivo. Foi um problema de Hardware de responsabilidade do Data Center onde encontra-se nossos servidores. Segundo nos foi informado o problema já foi resolvido, mas estamos esperando instabilidades neste serviço nos próximos dias.

Infelizmente, foi necessário restaurar um backup realizado no dia 10/03 as 6h. Isso quer dizer que todas as informações inseridas no site superlogica.com e licitamais.com.br realizadas no dia 10/03 foram perdidas. As informações deste dia, serão manualmente recuperadas sempre que possível.

A empresa LocaWebIDC, onde estão nossos servidores, trabalha conosco há mais de 8 anos, e desde então, nunca deixou de oferecer solução para os problemas que encontramos juntos, por isso, continuamos acreditando em sua capacidade de nos atender.

O esquema de backup também será aperfeiçoado para evitar futuras perdas. Acrescentaremos nos próximos dias um servidor replicado.

Como sempre foi dito em nosso blog, hardwares não são a prova de falhas e ter um backup faz toda a diferença. Desta vez atingiu a Superlógica! Felizmente nossos backups estavam em dias e a perda foi pequena. E você? Como estão seus backups?

Status 11/03/09 17:05:
Sofremos uma nova queda no início da tarde para realizar tarefas corretivas de emergência. Pequenas quedas como esta devem ocorrer ao longo da semana por este mesmo motivo. Quase todos os serviços já foram restabelecido.

LICITAMAIS: Algumas perguntas do Licitamais Resposta não puderam ser recuperadas, o que não acreditamos interferir no resultado da promoção. No entanto, os pontos puderam ser computados e serão somados no momento da apuração do ganhador do Notebook Dell. Qualque dúvida sobre esse assunto envie um e-mail para atendimento@licitamais.com.br.

CONDOR: As mais de 6.000 listas discussão dos condomínios ainda não foram, devido ao volume de informações que precisa ser recriada. Devemos concluir esta tarefa gradativamente até sexta-feira, se sua lista não estiver disponível e tiver uma necessidade extraordinária, por favor abra um chamado.

Até lá também estará pronto o servidor de replica para conseguirmos retomarmos as atividades em menos tempo e com perda zero, quando houver uma falha de hardware grave como esta.

Pedimos desculpas pelo transtorno causado.

Status 11/03/09 17:49:
Recebemos este e-mail da equipe Locaweb:

Um disco defeituoso no storage vem causando estes problemas no seu Cloud durante estes dias.

Detectamos este problema hoje as 01:00am e vamos realizar a troca do disco, porém vem afetando alguns Cloud faz um tempo.

Melhoramos nossa monitoria para que estes problemas, quando ocorram, sejam prontamente detectadas e resolvidas.

O Cloud possui redundância dos discos, porém, eventualmente podem ocorrer corrompimento de dados em que a maioria dos casos um fsck do ext3 resolve o problema, não por um problema no storage, mas também pode ocorrer por um reboot forçado, algum travamento do kernel, disco cheio, etc.

Em qualquer sistema informatizado, esta chance de perda de dados sempre existe. O máximo que podemos fazer é diminuir suas chances de ocorrer e medidas para caso ocorram, os dados não sejam perdidos.

O Cloud é uma estrutura confiável porém não se deve esquecer de uma política de backup para caso ocorra algum desastre, seus dados possam ser recuperados sem problemas.

Hoje mesmo será corrigido o problema no storage.

Qualquer dúvida entre em contato,
Atenciosamente.

Deixe um comentário