Infrastruktura hostingové centrum

Last modified by Martin Mahr on 2024/10/21 15:31

Servery jsou provozovány v profesionálním hostingovém centru https://www.faster.cz/zelena-data/.

  • Hostingové centrum je držitelem certifikátů: ISO 27001 a ISO 9001.
  • Ekologické hostingové centrum - solární panely, zpětné využití tepla ze serverů, ...
  • Servery jsou bezpečně uzamčeny a přístup k nim je monitorovaný přes evidenční systém a jsou pod neustálým kamerovým dohledem - https://bit.ly/3xxdA2V

Slovník pojmů

Zrcadlené disky

RAID (anglicky Redundant Array of Inexpensive Disks – vícenásobné diskové pole levných disků, nově též independent disks, tj. nezávislých disků) je v informatice metoda zabezpečení dat proti selhání pevného disku. Zabezpečení je realizováno specifickým ukládáním dat na více nezávislých disků, kdy jsou uložená data zachována i při selhání některého z nich.

My používáme RAID 10 viz. https://cs.wikipedia.org/wiki/RAID#RAID_10_(RAID_1+0)

RAID. Wikipedie [online]. [cit. 2021-4-29]. Dostupné z: https://cs.wikipedia.org/wiki/RAID

Datový sklad

Datový sklad (anglicky Data Warehouse, případně DWH) je zvláštní typ relační databáze, která umožňuje řešit úlohy zaměřené převážně na analytické dotazování nad rozsáhlými soubory dat.

Viz Wikipedia - Datový sklad

Datový sklad. Wikipedie [online]. [cit. 2021-4-29]. Dostupné z: https://cs.wikipedia.org/wiki/Datov%C3%BD_sklad#:~:text=Datov%C3%BD%20sklad%20(anglicky%20Data%20Warehouse,dotazov%C3%A1n%C3%AD%20nad%20rozs%C3%A1hl%C3%BDmi%20soubory%20dat.

Solr

Solr je technologie umožňující velmi rychlé vyhledávání na základě relevance (záznamy které s největší pravděpodobností chcete najít jsou umístěny na předních pozicích ve výsledku vyhledávání). Tato technologie umožňuje také facetování (seskupování výsledků a lepší filtrování).

Solr může být provozovaný ve formě Solr cloud, který umožňuje provoz aplikace pro indexování a vyhledávání napříč víc HW servery - umí tak rozprostřít zátěž rovnoměrně mezi servery a také řeší výpadek HW serveru (zastoupí jej jiný HW server). Umožňuje provoz tzv high availability systémů (systémy s vysokou dostupností).

Popis infrastruktury

Jedno u nás nenajdete nikdy, vše je minimálně zdvojeno (úsměv). Následující diagram je velmi zjednodušen, aby byl snáze pochopen.

Začneme pěkně od začátku:

  1. Připojení datového centra do internetu je díky dvě nezávislým internetovým připojením (pro případ výpadku jednoho z nich)
  2. Napájení hostingového centra je jištěno bateriovým systémem, na který se přejde okamžitě v případě výpadku proudu po dobu, než se naplno rozběhnou dva diesel agregátové generátory elektřiny - https://bit.ly/3gRaqRB
  3. Každý náš server obsahuje
    1. 2x síťovou kartu
    2. 2x zdroj 
    3. 2x procesor
    4. zrcadlené disky - pokud se jeden disk poškodí, tak jsou data na druhém disku (zrcadle prvního disku)
  4. Na vlastních serverech běží pouze aplikace bez jakýchkoliv dat knihovny - v případě výpadku celého HW serveru je možné spustit systém pro knihovnu na jiném serveru během několika minut (vždy máme dostatečnou kapacitu pro případ výpadku HW)
  5. Data knihovny jako jsou obálky atd jsou v datovém skladě (viz termín datový sklad)
  6. Vlastní nejdůležitější data knihovny uložená v databázi jsou uložena na databázovém serveru (u něj jsou také všechny komponenty zdvojeny). Máme servery hned dva, jednak pro případ výpadku, ale také pro minimalizaci zátěže.
    1. Primární databázový server - na tento server se zapisují veškerá data a s touto databází se pracuje z 90%
    2. Sekundární databázový server - data se synchronizují s primárním serverem v reálném čase. Slouží zejména jako záloha pro případ výpadku primárního serveru, ale také se z něj vytváří zálohy a jsou na něm provozovány výpočetně náročné operace (jako je např. indexace Solrem), aby zbytečně nezatěžovaly databázový server
  7. Zálohy databázového serveru se ukládají do datového skladu, odkud mají možnost zákazníci si zálohy stáhnout k sobě.
  8. Soustava serverů pro vyhledávání - jedná se o N serverů na kterých jsou umístěny indexy Solru a na těchto serverech je prováděno vyhledávání. Soustava serverů umožňuje rozprostření zátěže přes víc serverů a také je méně náchylná na výpadek celého HW (zastoupí jej jiný server)

1719559169499-466.png