Empresas de qualquer porte precisam de sistemas de Tecnologia da Informação (TI) para manter funcionando setores como os de produção, atendimento, logística, financeiro, processos administrativos e demais operações baseadas em dados.
A paralisação desses recursos, seja por uma falha interna ou por conta de ataques cibernéticos, pode gerar grandes impactos quando prolongada. É para isso que as corporações devem medir os indicadores RTO e RPO.
Esses parâmetros ajudam a estabelecer uma rotina de backups em função de uma análise dos riscos aos quais a empresa está exposta, além do tempo máximo que suas operações podem permanecer pausadas. Por isso, veja neste texto o que cada uma dessas métricas medem e como elas podem ajudar times de TI e corporações!
O que é RTO?
RTO é uma sigla que corresponde a Recovery Time Objective ou objetivo de tempo de recuperação, em português. O indicador mede o período máximo em que um sistema ou uma informação pode ficar indisponível após uma falha sem causar danos significativos para o negócio, também conhecido como downtime.
Além disso, mede o intervalo necessário para restaurar os dados e a operação normal dos sistemas.
O que é RPO?
RPO significa Recovery Point Objective, objetivo de ponto de recuperação, em português. Esse indicador temporal está relacionado à quantidade de dados que a empresa toleraria em caso de falhas de operação dentro do período mais relevante de produção, por exemplo, durante o expediente.
Dessa forma, o RPO define a janela de perda aceitável do ponto em que um evento crítico ocorre até o último processo de backup anterior realizado com sucesso.
O RPO acaba medindo, então, a frequência com que o setor realiza as cópias de segurança. Se foram configuradas tarefas de backup a cada uma hora, a sua janela aceitável de perda de dados sem causar muito prejuízo para a empresa será de uma hora.
Quais as diferenças?
Como dito anteriormente, tanto o RTO quanto o RPO são medidos em unidades de tempo. O RTO, metrifica a quantidade de tempo decorrido entre a falha do aplicativo e a disponibilidade total, incluindo a recuperação dos sistemas. Já o RPO é medido pela unidade de tempo entre a perda de dados e o backup anterior.
Isso significa que a diferença prática entre os dois está em seu foco principal. O RPO diz respeito ao ciclo e a recorrência dos backups, ajudando a perceber o gap de informações advindo da rotina programada.
O RTO, por sua vez, busca estabelecer o intervalo necessário para a retomada completa das atividades da empresa após um incidente, ajudando a criar os limites para o processo de recuperação quando as adversidades ocorrerem de fato e o prazo máximo para minimizar os prejuízos.
Assista ao vídeo a seguir, produzido pela Datasafer, e confira como as duas métricas se diferenciam:
Objetivos para o plano de continuidade
As métricas de RTO e RPO são baseadas no detalhamento de riscos e servem a propósitos diferentes, sendo que em um cenário hipotético ideal, os seus valores seriam muito próximos de zero.
A ideia é encontrar o espaço seguro de tempo até a recuperação das atividades e operações da empresa, o retorno da disponibilidade de sistemas, e evitar perdas irreparáveis de informação.
Por isso, o RTO tem como finalidade a diminuição dos custos de indisponibilidade dos sistemas, ajudando a garantir também os menores danos por meio de respostas ágeis e eficientes.
Já o RPO se preocupa com a quantidade de dados perdidos após um incidente. Além do desgaste já causado pelos sistemas indisponíveis, o indicador pode significar aborrecimentos ainda maiores e irreversíveis, como a perda severa de dados para o negócio.
Sendo assim, é preciso assegurar que sua margem cubra o suficiente para que não haja prejuízos tão significativos. Para a definição do RPO, é importante realizar uma análise de impacto em caso de desastres.
A ideia é que, em conjunto, os indicadores possam ajudar a basear o trabalho dos setores de TI e contribuam para a melhora da continuidade do negócio, gerando menos tempo de indisponibilidade ou a perda de informações menos essenciais.
Benefícios dos indicadores
Uma das principais contribuições da definição dos indicadores RPO e RTO é a colaboração com dados para o planejamento do gerenciamento de crise. Isso porque é fundamental estabelecer planos de ação viáveis e precisos, que considerem de fato os riscos.
Nesse mesmo sentido, as métricas ajudam a determinar prazos realmente executáveis e dar mais subsídios para o trabalho de recuperação de TI, já que são ajustadas antecipadamente e baseadas nos prejuízos máximos que podem ocorrer.
A análise do cenário e o prognóstico de perdas são aspectos já citados que também mostram a relevância dos indicadores. Isso porque, assim, a empresa consegue saber com o que está lidando e o tamanho dos danos aos quais está exposta e, em consequência, garante mais lisura ao processo de recuperação.
Práticas para garantir o RTO e RPO
Agora que você já sabe o que representam e como funcionam as métricas de RTO e RPO, confira dicas para garantir esses indicadores!
1. Automação
Como o RPO requer que o administrador realize os backups de dados nos intervalos definidos, é importante contar com agentes de backup que operem como serviço no sistema operacional, com agendamento automático e flexível.
Além disso, é bem comum operar o backup em horário fora do expediente para não onerar a rede da empresa.
2. Frequência de backup
Um parâmetro melhor de RPO pode ser estabelecido com maior frequência das rotinas de backup, contando com maior número de Pontos de Recuperação.
Um aspecto para ser observado é a criticidade das aplicações e até mesmo requisitos legais. Como exemplo, pode-se citar os backups de dados de cartórios e tabelionatos, que devem ser realizados a cada 30 minutos, conforme Provimento n° 74 do Conselho Nacional de Justiça.
3. Definição de tempo
A definição do tempo para o RPO é mais fácil de calcular e tem mais garantias do que o RTO, já que os RPOs dependem mais da automação e da definição da frequência de backup.
O RTO depende de outras variáveis além do software, como equipe disponível para iniciar o procedimento de restauração, banda para download dos arquivos em nuvem e tempo para validar os dados.
Para a redução do cálculo de RTO, recomenda-se realizar também o armazenamento de cópias de segurança na rede local. Já para a diminuição do RPO, é importante que o agente de backup tenha capacidade de realizar a compactação dos dados na origem, diminuindo a necessidade de banda para upload dos arquivos.
4. Recuperação granular de dados
Por exemplo, um advogado de um escritório exclui acidentalmente uma mensagem da sua caixa de e-mail no Microsoft Exchange. Como esse é um aplicativo definido como crítico para a empresa, o sistema é eleito pela TI para realizar backup incremental de forma contínua.
Para a diminuição dos parâmetros, a ferramenta de backup deve realizar a cópia do delta das modificações, além da seleção das caixas de e-mails prioritárias dos usuários. A restauração neste caso pode ser feita pela mensagem específica, reduzindo em muito o RTO, sem a necessidade de restaurar a base completa do Exchange.
5. Gerenciamento das tarefas de backup
É possível monitorar continuamente suas tarefas de backup com sistemas de geração de alertas e de logs em caso de falhas. Assim, em caso de incidente, você terá condições de realizar a execução de cópias de segurança de forma manual e corrigir os erros apresentados.
6. Replicação das cópias de backup
Ao replicar as cópias de backup em mais de um destino, você contará com uma garantia maior de ter os dados disponíveis quando precisar.
No caso de um cenário híbrido, você poderá configurar armazenamento: nuvem privada + nuvem pública + backup local (on premise). Assim, é possível aumentar a probabilidade de contar sempre com um ponto de recuperação íntegro, garantindo o seu RPO.
A replicação aumenta a segurança por contar com redundância das cópias em mídias diferentes e em outras regiões.
- Leia também: Conheça a estratégia de backup 3-2-1
7. Integridade dos dados
É importante contar com agentes de backup que realizem a checagem cíclica de integridade dos dados.
Garantir que os dados de backup permaneçam inalterados e disponíveis é crucial para uma restauração bem-sucedida, em especial em banco de dados como MS SQLServer, Oracle, MySQL e outros.
8. Classificação dos dados
A classificação da proteção de dados é importante para determinar como armazenar, acessar, proteger, recuperar e atualizar dados e informações de forma mais eficiente com base nos critérios de cada empresa.
É essencial analisar suas aplicações e determinar quais delas estão impulsionando seus negócios, gerando lucros, e devem ser priorizadas para manter seus níveis operacionais.
Esse processo, fundamental para um bom plano de continuidade dos negócios (PCN), é chamado de análise de impacto nos negócios (BIA), e estabelece protocolos e ações para enfrentar um desastre.
Por exemplo, você pode usar um modelo de três níveis para projetar seu PCN:
- No nível 1, podem estar aplicações de missão crítica que exigem RPOs e RTOs de 1 hora;
- No nível 2, as aplicações críticas de negócios que procuram RTOs de 2 horas e RPOs de 8 horas;
- No nível 3, aplicações não críticas que buscam RTOs de 4 horas e RPOs de 24 horas.
Os parâmetros RPO e RTO ajudam a estabelecer os limites de perda de dados e tempo de recuperação de sistemas em caso de desastres. Como cada segundo perdido pode representar aumento nos prejuízos da corporação, contar com uma mensuração e um planejamento é fundamental para minimizá-los.
A Datasafer pode auxiliar nesse processo. A plataforma de backup em nuvem é exclusiva para provedores de serviços gerenciados (MSPs) e consultorias de TI, e conta com funcionalidades profissionais de backup, suporte especializado, além de permitir o monitoramento constante das rotinas.
Para se tornar um parceiro Datasafer, clique no banner abaixo e solicite um teste gratuito!