Backups¶
Documentação mínima de backup: padrao.sarava.org/backup
- Desapego
- Backup
- Restore
- Teste! / Integridade.
- Mídia – Suporte e leitores
- Periodicidade
- Lembretes
- Relatórios
- Emergência
- Nuvem
- Quais informaçoes?
- Organizar as pastas já no meu computador pra auxiliar no backup?
- Dado, metadado.
- Interface gráfica e/ou automatizada?
- Criptografia e o perigo da perda da senha.
- Espelho.
- Redundância.
- Backup de infos coletivas.
- Parte técnica do backup: saber copiar, renomear pastas.
Passos da oficina de hoje¶
- Conceitos de backup
- Metologia de backup/Softwares.
- Backup é uma questão de Memória, inclusive coletiva.
- Exemplo: o CMI é uma memória dos movimentos da última década.
- O que é backup: é uma palavra inglesa. salvaguarda de dados, cópia de proteção.
- É justamente uma cópia que lhe permite “dormir bem”.
- Para fazer um backup não precisa de muita coisa. Tem que pensar o que pode dar errado.
- Costumeiramente não pensamos que algo pode dar errado com os nossos dados e informações.
- A preocupação do backup é também uma preocupação da memória histórica. O backup é também uma questão política.
- “O backup da história oral é contar pra próxima geração os conteúdos a serem backupzados”
- Suporte: somos escravos de um suporte, sempre.
- LTO: pt.wikipedia.org/wiki/Linear_Tape-Open
- Fita magnética: pt.wikipedia.org/wiki/Fita_magn%C3%A9tica
- O que compensa economicamente pra gente é o HD (custo/benefício = $1 dolar/gbyte).
- Não adianta fazer um backup e o restore demorar muito. Mas tem que ver a necessidade de resgate dos dados.
- Conectores
- USB 1 transfere 1,5 a 12MB por segundo
- USB 2 transfere 35 a 60MB por segundo
- USB 3 transfere 5.0 Gbit/s por segundo
- FireWire 400
- FireWire 800
- Firewire não é recomendado para servidores por ser a maior brecha de segurança em hardware, pois ele usa o sistema bypass de acesso direto a memoria do seu sistema permitindo que um dispositivo seja conectado no servidor e copie os dados na memória.
O que backupear¶
- “Se eu perder aquelas informações, o que será mais difícil reencontrar.”
- Filmes, por exemplo, você consegue facilmente de novo por torrent e outros serviços p2p. Então, para que, se você consegue de novo?
- Mídias – qual a importancia? seus amigos tem os mesmos filmes e músicas? Focar nos que sao mais importantes para você, os que você usa constantemente, ect.
- Básico: analisar suas informacoes e ver o que seria importante nao perder.
Procedimento (Maneira mais simples de fazer um backup)¶
- Seja organizada/o – organize os seus backups por data e categoria. Assim você acessará determinada cópia mais facilmente.
- Tendo em vista o que você irá fazer um backup, escolha a midia onde esse backup será armazenado.
- Cria uma pasta no lugar que ficará o seu backup, nomear a pasta com a data do backup e copiar os arquivos para ela.
- Dado = objetivo
- Metadado = data, nome da pasta, copiado de onde?, (informacoes de contexto do objeto)
- Nunca confie em arquivos como “arquivo.antigo”,“arquivo.old”. Backup é uma mensagem pro futuro.
- Dica de padrão: use “ano_mes_dia” porque isso facilita resgatar dados quando for ordenar os arquivos e subpastas de um diretório.
- Se o HD recebe mais dados de mais de um computador, informe isso também no metadado do backup.
- Se você quer achar o backup é preciso pensar em como chegar até ele, por isso tem que pensar como organizar: por dia, computador origem, etc.
- Compactar backups? – Se você tem um HD externo com sistema de arquivo que nao é nativo do sistema operacional, o arquivo copiado para esse hd externo pode perder os atributos extendidos: permissoes, metadados, etc.
- Se o seu HD externo usa o mesmo sistema de arquivos do seu computador uma simples cópia dos arquivos servira como backup, pois nao perdera as caracteristicas desses arquivos.
TAR¶
O Tar é confundido com um compactador, mas na verdade ele é um concatenador de arquivos. Ao descompactar, o tar preserva os atributos (permissão, etc) dos arquivos. Num filesystem diferente (fat, ntfs) o tar será custoso.
TAR nao comprimi apenas junta os arquivos, mas ele pode ser utilizado com um compressor como gzip.
TAR mantem as permissoes dos arquivos backapeados
Segurança no backup¶
- É necessário pensar no tempo de restore, isto é, o tempo que levará para você recuperar as informações através do seu backup. Por isso é preciso pensar na viabilidade do seu backup offsite (backup externo).
- Se o backup conter informações sigilosas proteja-o com senhas ou ferramentas de criptografia. Assim, você dificulta o acesso a essas informações em caso de roubo ou perda do equipamento.
- O importante é transformar o backup em uma prática, algo que você faça de forma pratica, rapida regularmente.
- Quanto isso irá te custar em tempo e esforcos.
- Agendar backups em horários em que as máquinas estejam ligadas mas nao utilizando muitos recursos.
- Backup Local – Se você tem uma rede local uma forma de se fazer backups é trocar eles entre as máquinas que estao na Rede.
- Sendo automático ou nao é importante você ter acesso as informacoes desse backup. Sistema de backups que nao gera relatorios nao pode ser considerado seguro.
- Ele nao pode ter falso positivo, afirmando backups que nao foram feitos como feitos e nao mostrando os erros.
- Servidores → Faça o backup e peca para os dois servidores enviarem relatorio informando como foi o backup
- Além do relatorio você precisa testar os backups de tempos e tempos.
- HD criptografado = informação mista
- HD descriptografado = informação pública
- O importante é você ter um HD com espaço muito maior ao que você necessita para o seu backup, nao utilizar o maximo do HD.
- Vale a pena vc montar um LVM um Raid para fazer seu backup se ele for muito grande.
- Valor dolar x Giga
- Diferença entre espelho e backup?
- Espelho é uma cópia de uma informaçao que você deixa online. Funciona muit bem para coisas públicas como um backup. Ex. Site do CMI.
Softwares¶
- Backupninja – tem no repositorio do ubuntu/debian/fedora. Criado pelo pessoal do riseup.
- site: labs.riseup.net/code/projects/show/back...
- auxilia na coordenação de diversos backups através de um sistema de plugins que utilizam outras técnicas/ferramentas de backup
- wget – faz cópia de arquivos em rede, como funções avançadas, como suporte a reinício de cópia, continua de onde parou
- httrack – tira cópias estáticas de sites, arrumando os links entre páginas
- duplicity – permiti backups remotos, criptografados, assinado digitalmente, versões dos arquivos
- rdiff -
- rsync – simples e muito poderoso, programa de sincronizacao de pastas locais ou remotas.
- comando: rsync /caminho pasta a ser backapeada /caminho pasta que ira armazenar o backup
- unison -
- git -
- Covençao:
- padrao.sarava.org/backup/conventions
Estratégia de Backups¶
Uma estratégia bastante interessante para servidores é fazer um backup local, pois diminui o tempo gasto com backup, e depois enviar remotamente para outro lugar. Se for necessário parar algum serviço para backup, fazer localmente diminui tempo de parada do serviço e não fica dependente da qualidade da transmissão.
Para uma outra oficina será necessário:
- Mapear os tipos de arquivos e serviços que precisam de backup;
- As estratégias recomentadas para cada necessidade mapeada;
Parte prática finalmente!¶
Rsync com hardlinks!
- Link Simbólico → atalho para um arquivo que aponta para um outro arquivo.
- Hardlink → Mesmo arquivo, com o mesmo conteúdo que aparece varias vezes na árvore do sistema.
Espaço físico no sistema de arquivos que pode ser apontado de várias formas
através de Hardlinks. A ligaçao é estabelecida em qual nivel? Se é visivel é
link simbólico se nao é visivel é hard link. Copiar arquivos utilizando o
metedo de hardlinks
Usaremos dois comandos. Primeiro o cp:
- cp → copia arquivos
Sintaxe:
cp nome-do-arquivo-de-origem nome-do-arquivo-de-destino
Supondo que ata.txt é um arquivo de texto e que você copiar para um arquivo, existente ou não, de nome 20121006_ata.txt e que ambos se encontram na pasta atual, use o comando
cp ata.txt 20121006_ata.txt
Supondo: pasta /home e pasta /media/usb/home
cp -r /home /media/usb/home/20121006/ # como usuario comum
cp -a /home /media/usb/home/20121006/ # como root ou usando o sudo
Descritivo das opções:
- -r → recursivo
- -a → mantem os atributos
Veja mais opções do comando cp digitando ‘cp —help’ ou ‘man cp’
Agora vem a brincadeira!
cp -alf /media/usb/home/20121006/ /media/usb/home/20121007/
- l → cria os hardlinks
- f → força a cópia mesmo se o destino já existe
Agora vamos sincronizar!!!
rsync -av --delete /home/ /media/usb/home/20121007/
Backups podem ser incrementais na transmissao ou nos dados. No caso do rsync com hardlinks, é incremental nas duas coisas :)
- rsync → sincroniza caminhos
Em resumo:
1. Copia full
2. Copia na pasta de hardlink
3. Sincronizar
Esse processo faz uma copia deduplicada e depois ele duplica caso necessário.
Já o duplicity criptografa e automaticamente pode enviar para um servidor remoto. O problema é que se o servidor remoto estiver offline, a copia não é feita. É por isso que é utiliza duplicity
Dúvidas¶
Com qual periodicidade é saudável realizar seus backups?¶
Isso depende de cada situação, aplicações de missão crítica como transferências bancárias, tem backup em tempo real, também chamado de backup online.
No dia-a-dia pode ser que um backup semanal seja suficiente, mas cabe a cada um pensar quanto tempo demoraria para se recuperar/restaurar de uma perda de dados. Por exemplo, se alguém está num momento crítico de entrega de dissertação ou tese, um backup diário é o mínimo a ser feito, porque escrevar uma página de um documento acadêmico/científico é bastante trabalhoso.