Zálohování

Last modified by Jan Šimeček on 2024/07/16 14:06

Obecně

Každý informační systém potřebuje zálohovat svoje data pro případ neočekávaných událostí. I systém Tritius obsahuje několik mechanismů pro zálohování dat.

Rizika

V následujících odstavcích jsou stručně popsány rizika, která ohrožují data Tritia nebo jejich integritu.

Chyba Tritia

Tritius může obsahovat chybu, která způsobí ztrátu dat. Náš tým využívá při vývoji automatického testování, které minimalizuje množství chyb v aplikaci. Přesto jsme jenom lidé a děláme chyby.

Chyba podpůrného software

Tritius využívá několik cizích programů, jako je např. databáze MySQL, vyhledávací engine SOLR, virtualizační nástroje apod. Tyto programy nemáme pod přímou kontrolou a mohou obsahovat chybu, která může způsobit ztrátu dat. Toto riziku se snažíme minimalizovat tím, že aktualizujeme software třetích stran pouze po otestování a nevyužíváme vývojové větve, ale pouze ty stabilní.

Chyba hardwaru

Tritius běží ve virtuálním stroji, který se rozbít nemůže. Může ale dojít k poruše podkladového systému, který poskytuje virtualizaci. Zpravidla jde o klasický server. Toto je asi nejpravděpodobnější scénář ztráty dat.

Typy záloh

Systém Tritius ukládá data na dvě místa.

  • Relační databáze MySQL.
  • Pracovní složka na disku serveru, kde je Tritius umístěn.

V relační databázi je uložena drtivá většina dat systému. Veškerá nastavní, záznamy o dílech, exemplářích, uživatelské účty atd. Na disku v pracovní složce Tritia jsou uložena data vyhledávacího enginu SOLR a také nahrané soubory jako jsou obálky knih, PDF obsahy, vygenerované exporty apod.

Zálohování relační databáze MySQL

Zálohování dat z relační databáze spočívá ve vytvoření tzv. SQL dumpu. Jde o textovou (čitelnou lidmi) reprezentaci SQL příkazů, které vytvoří a naplní znovu prázdnou databázi. V případy ztráty dat z databáze lze z tohoto dupmu sestavit databázi celou znovu a jde tedy o její kompletní zálohu. 

Zálohu systém vytváří zabalenou programem 7-zip a také zaheslovanou pro dodatečnou ochranu osobních informací v ní obsažených. Ačkoli je soubor textový a čitelný lidmi, bez znalosti jazyka SQL je pro obyčejného člověka nepochopitelný. 

Zálohování pracovní složky Tritia

Z pracovní složky Tritia je vytvořen prostý archiv, který lze při ztrátě dat rozbalit místo poškozeného adresáře. 

Zálohování celého virtuálního stroje

Naše virtuální servery v Zelených datech navíc zálohujeme celé. Virtualizační nástroj vytvoří kompletní zálohu aktuálního stavu disku. V případě kompletního výpadku systému je návrat k takové záloze nejrychlejší možné řešení.

Zálohování serverů u nás (SaaS, Zelená data)

Pokud provozujete Tritius na našich serverech, pak každou noc jsou automaticky vytvořeny zálohy databáze (dump databáze) a celého virtuálního stroje na úložiště umístěné přímo v Zelených datech. 

Rozpis záloh

IntervalPočetPopis
01:21 každý den3Každý den jsou vytvořeny zálohy a udržují se poslední 3 dny
01:21 každý týden1Každou neděli jsou vytvořena tzv. týdenní záloha
3:31 každý měsíc1Každý měsíc je vytvořena tzv. měsíční záloha

V každý okamžik je tedy dostupných několik záloh systému z různých dnů. Dohromady se uchovává 5 záloh. 

Zálohování serverů u zákazníka (SA, vlastní server)

Každou noc je automaticky spuštěna zálohovací procedura, která provede zálohu dat z databáze (SQL dump) a zálohu pracovní složky Tritia. Zálohy jsou kopírovány na externí úložiště (dodané vámi), aby byly dostupné v případě výpadku celého serveru s Tritiem.

Rozpis záloh

IntervalPočetPopis
2:30 každý den7Každý den jsou vytvořeny zálohy a udržuje se posledních 7 dnů
2:40 každá pondělí2Každé pondělí jsou vytvořený tzv. týdenní zálohy a udržují se poslení dva týdny.
2:50 každého 1.1Každý měsíc jsou vytvořeny tzv. měsíční zálohy a udržuje se pouze jedna tato záloha.

V každý okamžik je tedy dostupných několik záloh systému z různých dnů. Dohromady se uchovává 10 záloh. 

Odhad potřebné velikosti diskového prostoru pro zálohování

Úložiště pro zálohy musí pojmout 10 záloh SQL databáze a 10 záloh pracovní složky Tritia. Velikost záloh je závislá na velikosti knihovny, především na množství děl a svazků. 

Pro datové úložiště na zálohy doporučujeme kapacitu alespoň 100 GB pro středně velké knihovny (do 100 000 svazků), 50 GB pro menší knihovny (do 50 000 svazků).

V případě velmi malých knihoven může stačit několik jednotech GB a v případě opravdu velkých může být potřeba i násobná katapacita úložiště. V případě pochybností se nás neváhejte obrátit.

Obecně

Každý informační systém potřebuje zálohovat svoje data pro případ neočekávaných událostí. I systém Tritius obsahuje několik mechanismů pro zálohování dat.

Rizika

V následujících odstavcích jsou stručně popsány rizika, která ohrožují data Tritia nebo jejich integritu.

Chyba Tritia

Tritius může obsahovat chybu, která způsobí ztrátu dat. Náš tým využívá při vývoji automatického testování, které minimalizuje množství chyb v aplikaci. Přesto jsme jenom lidé a děláme chyby.

Chyba podpůrného software

Tritius využívá několik cizích programů, jako je např. databáze MySQL, vyhledávací engine SOLR, virtualizační nástroje apod. Tyto programy nemáme pod přímou kontrolou a mohou obsahovat chybu, která může způsobit ztrátu dat. Toto riziku se snažíme minimalizovat tím, že aktualizujeme software třetích stran pouze po otestování a nevyužíváme vývojové větve, ale pouze ty stabilní.

Chyba hardwaru

Tritius běží ve virtuálním stroji, který se rozbít nemůže. Může ale dojít k poruše podkladového systému, který poskytuje virtualizaci. Zpravidla jde o klasický server. Toto je asi nejpravděpodobnější scénář ztráty dat.

Typy záloh

Systém Tritius ukládá data na dvě místa.

  • Relační databáze MySQL.
  • Pracovní složka na disku serveru, kde je Tritius umístěn.

V relační databázi je uložena drtivá většina dat systému. Veškerá nastavní, záznamy o dílech, exemplářích, uživatelské účty atd. Na disku v pracovní složce Tritia jsou uložena data vyhledávacího enginu SOLR a také nahrané soubory jako jsou obálky knih, PDF obsahy, vygenerované exporty apod.

Zálohování relační databáze MySQL

Zálohování dat z relační databáze spočívá ve vytvoření tzv. SQL dumpu. Jde o textovou (čitelnou lidmi) reprezentaci SQL příkazů, které vytvoří a naplní znovu prázdnou databázi. V případy ztráty dat z databáze lze z tohoto dupmu sestavit databázi celou znovu a jde tedy o její kompletní zálohu. 

Zálohu systém vytváří zabalenou programem 7-zip a také zaheslovanou pro dodatečnou ochranu osobních informací v ní obsažených. Ačkoli je soubor textový a čitelný lidmi, bez znalosti jazyka SQL je pro obyčejného člověka nepochopitelný. 

Zálohování pracovní složky Tritia

Z pracovní složky Tritia je vytvořen prostý archiv, který lze při ztrátě dat rozbalit místo poškozeného adresáře. 

Zálohování celého virtuálního stroje

Naše virtuální servery v Zelených datech navíc zálohujeme celé. Virtualizační nástroj vytvoří kompletní zálohu aktuálního stavu disku. V případě kompletního výpadku systému je návrat k takové záloze nejrychlejší možné řešení.

Zálohování serverů u nás (SaaS, Zelená data)

Pokud provozujete Tritius na našich serverech, pak každou noc jsou automaticky vytvořeny zálohy databáze (dump databáze) a celého virtuálního stroje na úložiště umístěné přímo v Zelených datech. 

Rozpis záloh

IntervalPočetPopis
01:21 každý den3Každý den jsou vytvořeny zálohy a udržují se poslední 3 dny
01:21 každý týden1Každou neděli jsou vytvořena tzv. týdenní záloha
3:31 každý měsíc1Každý měsíc je vytvořena tzv. měsíční záloha

V každý okamžik je tedy dostupných několik záloh systému z různých dnů. Dohromady se uchovává 5 záloh. 

Zálohování serverů u zákazníka (SA, vlastní server)

Každou noc je automaticky spuštěna zálohovací procedura, která provede zálohu dat z databáze (SQL dump) a zálohu pracovní složky Tritia. Zálohy jsou kopírovány na externí úložiště (dodané vámi), aby byly dostupné v případě výpadku celého serveru s Tritiem.

Rozpis záloh

IntervalPočetPopis
2:30 každý den7Každý den jsou vytvořeny zálohy a udržuje se posledních 7 dnů
2:40 každá pondělí2Každé pondělí jsou vytvořený tzv. týdenní zálohy a udržují se poslení dva týdny.
2:50 každého 1.1Každý měsíc jsou vytvořeny tzv. měsíční zálohy a udržuje se pouze jedna tato záloha.

V každý okamžik je tedy dostupných několik záloh systému z různých dnů. Dohromady se uchovává 10 záloh. 

Odhad potřebné velikosti diskového prostoru pro zálohování

Úložiště pro zálohy musí pojmout 10 záloh SQL databáze a 10 záloh pracovní složky Tritia. Velikost záloh je závislá na velikosti knihovny, především na množství děl a svazků. 

Pro datové úložiště na zálohy doporučujeme kapacitu alespoň 100 GB pro středně velké knihovny (do 100 000 svazků), 50 GB pro menší knihovny (do 50 000 svazků).

V případě velmi malých knihoven může stačit několik jednotech GB a v případě opravdu velkých může být potřeba i násobná katapacita úložiště. V případě pochybností se nás neváhejte obrátit.