Backups

Backups

Documentação mínima de backup: padrao.sarava.org/backup

  • Desapego
  • Backup
  • Restore
  • Teste! / Integridade.
  • Mídia – Suporte e leitores
  • Periodicidade
  • Lembretes
  • Relatórios
  • Emergência
  • Nuvem
  • Quais informaçoes?
  • Organizar as pastas já no meu computador pra auxiliar no backup?
  • Dado, metadado.
  • Interface gráfica e/ou automatizada?
  • Criptografia e o perigo da perda da senha.
  • Espelho.
  • Redundância.
  • Backup de infos coletivas.
  • Parte técnica do backup: saber copiar, renomear pastas.

Passos da oficina de hoje

  • Conceitos de backup
  • Metologia de backup/Softwares.
  • Backup é uma questão de Memória, inclusive coletiva.
  • Exemplo: o CMI é uma memória dos movimentos da última década.
  • O que é backup: é uma palavra inglesa. salvaguarda de dados, cópia de proteção.
  • É justamente uma cópia que lhe permite “dormir bem”.
  • Para fazer um backup não precisa de muita coisa. Tem que pensar o que pode dar errado.
  • Costumeiramente não pensamos que algo pode dar errado com os nossos dados e informações.
  • A preocupação do backup é também uma preocupação da memória histórica. O backup é também uma questão política.
    • “O backup da história oral é contar pra próxima geração os conteúdos a serem backupzados”
  • Suporte: somos escravos de um suporte, sempre.
  • O que compensa economicamente pra gente é o HD (custo/benefício = $1 dolar/gbyte).
  • Não adianta fazer um backup e o restore demorar muito. Mas tem que ver a necessidade de resgate dos dados.
  • Conectores
    • USB 1 transfere 1,5 a 12MB por segundo
    • USB 2 transfere 35 a 60MB por segundo
    • USB 3 transfere 5.0 Gbit/s por segundo
    • FireWire 400
    • FireWire 800
    • Firewire não é recomendado para servidores por ser a maior brecha de segurança em hardware, pois ele usa o sistema bypass de acesso direto a memoria do seu sistema permitindo que um dispositivo seja conectado no servidor e copie os dados na memória.

O que backupear

  • “Se eu perder aquelas informações, o que será mais difícil reencontrar.”
  • Filmes, por exemplo, você consegue facilmente de novo por torrent e outros serviços p2p. Então, para que, se você consegue de novo?
    • Mídias – qual a importancia? seus amigos tem os mesmos filmes e músicas? Focar nos que sao mais importantes para você, os que você usa constantemente, ect.
    • Básico: analisar suas informacoes e ver o que seria importante nao perder.

Procedimento (Maneira mais simples de fazer um backup)

  • Seja organizada/o – organize os seus backups por data e categoria. Assim você acessará determinada cópia mais facilmente.
  • Tendo em vista o que você irá fazer um backup, escolha a midia onde esse backup será armazenado.
  • Cria uma pasta no lugar que ficará o seu backup, nomear a pasta com a data do backup e copiar os arquivos para ela.
  • Dado = objetivo
  • Metadado = data, nome da pasta, copiado de onde?, (informacoes de contexto do objeto)
  • Nunca confie em arquivos como “arquivo.antigo”,“arquivo.old”. Backup é uma mensagem pro futuro.
  • Dica de padrão: use “ano_mes_dia” porque isso facilita resgatar dados quando for ordenar os arquivos e subpastas de um diretório.
  • Se o HD recebe mais dados de mais de um computador, informe isso também no metadado do backup.
  • Se você quer achar o backup é preciso pensar em como chegar até ele, por isso tem que pensar como organizar: por dia, computador origem, etc.
  • Compactar backups? – Se você tem um HD externo com sistema de arquivo que nao é nativo do sistema operacional, o arquivo copiado para esse hd externo pode perder os atributos extendidos: permissoes, metadados, etc.
  • Se o seu HD externo usa o mesmo sistema de arquivos do seu computador uma simples cópia dos arquivos servira como backup, pois nao perdera as caracteristicas desses arquivos.

TAR

O Tar é confundido com um compactador, mas na verdade ele é um concatenador de arquivos. Ao descompactar, o tar preserva os atributos (permissão, etc) dos arquivos. Num filesystem diferente (fat, ntfs) o tar será custoso.

TAR nao comprimi apenas junta os arquivos, mas ele pode ser utilizado com um compressor como gzip.

TAR mantem as permissoes dos arquivos backapeados

Segurança no backup

  • É necessário pensar no tempo de restore, isto é, o tempo que levará para você recuperar as informações através do seu backup. Por isso é preciso pensar na viabilidade do seu backup offsite (backup externo).
  • Se o backup conter informações sigilosas proteja-o com senhas ou ferramentas de criptografia. Assim, você dificulta o acesso a essas informações em caso de roubo ou perda do equipamento.
  • O importante é transformar o backup em uma prática, algo que você faça de forma pratica, rapida regularmente.
  • Quanto isso irá te custar em tempo e esforcos.
  • Agendar backups em horários em que as máquinas estejam ligadas mas nao utilizando muitos recursos.
  • Backup Local – Se você tem uma rede local uma forma de se fazer backups é trocar eles entre as máquinas que estao na Rede.
  • Sendo automático ou nao é importante você ter acesso as informacoes desse backup. Sistema de backups que nao gera relatorios nao pode ser considerado seguro.
  • Ele nao pode ter falso positivo, afirmando backups que nao foram feitos como feitos e nao mostrando os erros.
  • Servidores → Faça o backup e peca para os dois servidores enviarem relatorio informando como foi o backup
  • Além do relatorio você precisa testar os backups de tempos e tempos.
  • HD criptografado = informação mista
  • HD descriptografado = informação pública
  • O importante é você ter um HD com espaço muito maior ao que você necessita para o seu backup, nao utilizar o maximo do HD.
  • Vale a pena vc montar um LVM um Raid para fazer seu backup se ele for muito grande.
  • Valor dolar x Giga
  • Diferença entre espelho e backup?
  • Espelho é uma cópia de uma informaçao que você deixa online. Funciona muit bem para coisas públicas como um backup. Ex. Site do CMI.

Softwares

  • Backupninja – tem no repositorio do ubuntu/debian/fedora. Criado pelo pessoal do riseup.
  • site: labs.riseup.net/code/projects/show/back...
  • auxilia na coordenação de diversos backups através de um sistema de plugins que utilizam outras técnicas/ferramentas de backup
  • wget – faz cópia de arquivos em rede, como funções avançadas, como suporte a reinício de cópia, continua de onde parou
  • httrack – tira cópias estáticas de sites, arrumando os links entre páginas
  • duplicity – permiti backups remotos, criptografados, assinado digitalmente, versões dos arquivos
  • rdiff -
  • rsync – simples e muito poderoso, programa de sincronizacao de pastas locais ou remotas.
  • comando: rsync /caminho pasta a ser backapeada /caminho pasta que ira armazenar o backup
  • unison -
  • git -
  • Covençao:
  • padrao.sarava.org/backup/conventions

Estratégia de Backups

Uma estratégia bastante interessante para servidores é fazer um backup local, pois diminui o tempo gasto com backup, e depois enviar remotamente para outro lugar. Se for necessário parar algum serviço para backup, fazer localmente diminui tempo de parada do serviço e não fica dependente da qualidade da transmissão.

Para uma outra oficina será necessário:

  • Mapear os tipos de arquivos e serviços que precisam de backup;
  • As estratégias recomentadas para cada necessidade mapeada;

Parte prática finalmente!

Rsync com hardlinks!

  • Link Simbólico → atalho para um arquivo que aponta para um outro arquivo.
  • Hardlink → Mesmo arquivo, com o mesmo conteúdo que aparece varias vezes na árvore do sistema.

Espaço físico no sistema de arquivos que pode ser apontado de várias formas
através de Hardlinks. A ligaçao é estabelecida em qual nivel? Se é visivel é
link simbólico se nao é visivel é hard link. Copiar arquivos utilizando o
metedo de hardlinks

Usaremos dois comandos. Primeiro o cp:

  • cp → copia arquivos

Sintaxe:

cp nome-do-arquivo-de-origem nome-do-arquivo-de-destino

Supondo que ata.txt é um arquivo de texto e que você copiar para um arquivo, existente ou não, de nome 20121006_ata.txt e que ambos se encontram na pasta atual, use o comando

cp ata.txt 20121006_ata.txt

Supondo: pasta /home e pasta /media/usb/home

cp -r /home /media/usb/home/20121006/ # como usuario comum
cp -a /home /media/usb/home/20121006/ # como root ou usando o sudo

Descritivo das opções:

  • -r → recursivo
  • -a → mantem os atributos

Veja mais opções do comando cp digitando ‘cp —help’ ou ‘man cp’

Agora vem a brincadeira!

cp -alf /media/usb/home/20121006/ /media/usb/home/20121007/
  • l → cria os hardlinks
  • f → força a cópia mesmo se o destino já existe

Agora vamos sincronizar!!!

rsync -av --delete /home/ /media/usb/home/20121007/

Backups podem ser incrementais na transmissao ou nos dados. No caso do rsync com hardlinks, é incremental nas duas coisas :)

  • rsync → sincroniza caminhos

Em resumo:

1. Copia full
2. Copia na pasta de hardlink
3. Sincronizar

Esse processo faz uma copia deduplicada e depois ele duplica caso necessário.

Já o duplicity criptografa e automaticamente pode enviar para um servidor remoto. O problema é que se o servidor remoto estiver offline, a copia não é feita. É por isso que é utiliza duplicity

Dúvidas

Com qual periodicidade é saudável realizar seus backups?

Isso depende de cada situação, aplicações de missão crítica como transferências bancárias, tem backup em tempo real, também chamado de backup online.

No dia-a-dia pode ser que um backup semanal seja suficiente, mas cabe a cada um pensar quanto tempo demoraria para se recuperar/restaurar de uma perda de dados. Por exemplo, se alguém está num momento crítico de entrega de dissertação ou tese, um backup diário é o mínimo a ser feito, porque escrevar uma página de um documento acadêmico/científico é bastante trabalhoso.