Maybaygiare.org

Blog Network

Co je vysoká dostupnost? Návod

Čtení Čas: 8 minut

Vysoká dostupnost je popis systém navržen tak, aby být odolné, vysoce spolehlivý, plynule pracuje bez zásahu, nebo mají jediný bod selhání. Tyto systémy jsou vysoce žádané, aby se zvýšila dostupnost a uptime povinni udržovat infrastrukturu běží bez problému. Následující charakteristiky definují systém vysoké dostupnosti.

Vysoké Dostupnosti, Clustering

High-availability clustery serveru (aka HA Clustery) je definován jako skupina serverů, které podporují aplikace nebo služby, které mohou být využity spolehlivě s minimálním množstvím odstávek. Tyto serverové klastry fungují pomocí typu specializovaného softwaru, který využívá redundanci k dosažení kritických úrovní provozu five9. V současné době přibližně 60% podniků vyžaduje, aby five9 nebo vyšší poskytovaly životně důležité služby pro své podniky.

Software s vysokou dostupností využívá redundantního softwaru nainstalovaného na více systémech seskupením nebo shlukováním skupiny serverů zaměřených na společný cíl v případě selhání komponent. Bez této formy shlukování, pokud dojde k selhání aplikace nebo webu, nebude služba k dispozici, dokud nebudou servery opraveny. Ha clustering řeší tyto situace detekcí poruch a rychlým restartováním nebo nahrazením serveru nebo služby nebo serveru novým procesem, který nevyžaduje zásah člověka. Toto je definováno jako model „převzetí služeb při selhání“.

následující obrázek ukazuje jednoduchý klastr s vysokou dostupností dvou uzlů.

Vysoká Dostupnost hvězdokupy jsou často používány pro mise-kritických databází, sdílení dat, aplikací a e-commerce webové stránky šířit přes síť. Implementace s vysokou dostupností vytvářejí redundanci v klastru, aby odstranily jakýkoli jediný bod selhání, včetně více síťových připojení a ukládání dat, které lze redundantně připojit prostřednictvím geograficky rozmanitých sítí úložišť.

clusterové servery s vysokou dostupností obvykle používají metodiku replikace zvanou Heartbeat, která se používá ke sledování stavu a stavu každého uzlu v klastru prostřednictvím připojení k soukromé síti. Jedna zásadní okolnost všechny clustering software musí být schopen řešit, je tzv. split-brain, který nastane, když všechny soukromé interní odkazy jít dolů najednou, ale uzly v clusteru pokračovat v jízdě. Pokud k tomu dojde, každý uzel v klastru může nesprávně určit, že všechny ostatní uzly klesly, a pokusit se spustit služby, které mohou být stále spuštěny jiné uzly. Tato podmínka duplicitních instancí s podobnými službami, které by mohly způsobit poškození dat v systému.

typický verzi vysoké dostupnosti software poskytuje atributy, které zahrnují jak hardwarové a softwarové redundance. Mezi tyto funkce patří:

  • automatická detekce a objev hardwarových a softwarových komponent.
  • autonomní přiřazení aktivních i podmíněných rolí novým prvkům.
  • detekce neúspěšných softwarových služeb, hardwarových komponent a dalších systémových konstrukcí.
  • monitorování a oznamování redundantních komponent a kdy je třeba je aktivovat.
  • schopnost škálovat cluster tak, aby vyhovoval požadovaným změnám bez vnějšího zásahu.

odolnost

Fault tolerance je definována jako schopnost systému infrastruktury předvídat a odolat chyby a zajišťují automatickou reakci na tyto problémy, pokud se vyskytly. Primární kvalitou těchto systémů jsou pokročilé konstrukční faktory, které lze v případě problému vyvolat. Být schopen nakonfigurovat infrastrukturu, která představuje všechny možné řešení je značný úkol, který vyžaduje znalosti a zkušenosti, aby proti více obav, než k nim dojde. Systémoví architekti, kteří navrhují takové rámce, budou mít metodiky, které předpokládají prostředky ke zmírnění těchto problémů předem, a schopnost tyto rámce implementovat.

jsou k dispozici následující metodiky redundance, které by měly být přezkoumány během počátečních fází návrhu a implementace.

  • N + 1 Model – Tento pojem odvozuje součet potřebné vybavení (které budeme označovat jako „N“), aby se celý rámec a běží, s další nezávislé složky backup pro každou z “ N “ komponenty v případě poruchy.
  • N + 2 Model-podobný modelu N + 1, ale s další vrstvou ochrany, pokud by měly selhat dvě komponenty.
  • 2n Model-tato modalita má dvojí redundantní zálohu pro každý prvek, aby bylo zajištěno, že rámec systému je plně funkční.
  • 2n + 1 Model-tento model je opět podobný modelu 2N, ale s doplňkovou komponentou pro přidání terciární vrstvy ochrany do rámce systému.

Jak modely postupují z Nx na 2Nx, nákladový faktor se také exponenciálně zvyšuje jako u skutečně redundantních systémů, které vyžadují provozuschopnost. Tyto způsoby jsou rozhodující pro stabilitu a dostupnost.

Spolehlivost a Spolehlivost

Jedním z ústředních nájemci vysokou dostupnost systému je uptime. Provozuschopnost je prvořadý význam, zejména v případě, že účelem systému je poskytovat základní služby jako 911 systémy, které reagují na vznikající situace. V podnikání je vyžadován systém vysoké dostupnosti, který zajistí, že životně důležitá služba zůstane online. Jedním příkladem může být ISP nebo jiná služba, která nemůže tolerovat ztrátu funkce. Tyto systémy musí být navrženy s vysokou dostupností a odolností proti poruchám, aby byla zajištěna spolehlivost a dostupnost při minimalizaci prostojů.

řízené zpracování chyb

Pokud dojde k chybě, systém se přizpůsobí a kompenzuje problém, zatímco zůstane v provozu a online. Budování tohoto typu systému vyžaduje předvídavost a plánování neočekávaných. Schopnost předvídat problémy předem a plánování jejich řešení je jednou z hlavních vlastností systému vysoké dostupnosti.

Škálovatelnost

By měl systém vyskytnout problém jako dopravní špice nebo zvýšení využití zdrojů, schopnost systému měřítku k uspokojení těchto potřeb by mělo být automatické a okamžité. Budování funkcí, jako jsou tyto, do systému zajistí schopnost systému rychle reagovat na jakoukoli změnu systémové funkčnosti procesů architektury.

Dostupnost & Pět 9 Uptime

Pět 9 je standardem pro měření uptime. Toto měření může souviset se samotným systémem, systémovými procesy v rámci nebo programem pracujícím uvnitř infrastruktury. Tento odhad často souvisí s programem dodávaným klientům ve formě nebo webové stránce nebo webové aplikaci. Systémy Dostupnost může být měřena jako procento času, které systémy jsou k dispozici pomocí této rovnice: x = (n – y) * 100/n. Tento vzorec označuje, že tam, kde „n“ je celkový počet minut za kalendářní měsíc, a „y“ je počet minut, že služba je nedostupná v rámci kalendářního měsíce. Níže uvedená tabulka uvádí prostoje související s procentem zastoupených“ 9″.

jak vidíme, čím vyšší je počet „9“, tím více dostupnosti je poskytováno. Cílem systému s vysokou dostupností je dosáhnout minimálního množství potenciálních prostojů, aby byl systém vždy k dispozici pro poskytování určených služeb.

Heartbeat

jedna z hlavních komponent s vysokou dostupností se nazývá Heartbeat. Heartbeat je démon, který pracuje se softwarem pro správu clusteru, jako je kardiostimulátor, který je navržen speciálně pro správu zdrojů clusteru s vysokou dostupností. Jeho nejdůležitější vlastnosti jsou:

  • žádný specifický nebo pevný maximální počet uzlů-Heartbeat lze použít k vytváření velkých i elementárních klastrů.
  • monitorování zdrojů: zdroje mohou být při selhání automaticky restartovány nebo přesunuty do jiného uzlu.
  • mechanismus oplocení potřebný k odstranění neúspěšných uzlů z clusteru.
  • Vylepšená správa zdrojů založená na zásadách, vzájemné závislosti zdrojů a omezení.
  • Časové pravidlo nastavené tak, aby umožňovalo různé politiky v závislosti na definovaném časovém rámci.
  • skupina skriptů zdrojů (pro software jako Apache, DB2, Oracle, PostgreSQL atd.).) zahrnuty podrobnější řízení.
  • GUI pro konfiguraci, řízení a monitorování zdrojů a uzlů.

Clusteru, Architektura

Engineered Dostupnost

první segment vysoce dostupného systému je jednoznačně určen využití klastru aplikačních serverů, které jsou navrženy v předstihu, aby distribuovat zátěž mezi celý shluk, který zahrnuje možnost převzetí služeb při selhání sekundární a případně terciární systém.

druhá divize zahrnuje potřebu škálovatelnosti databáze. To znamená požadavek škálování, vodorovně nebo svisle, pomocí vícenásobné hlavní replikace, a vyvažovač zatížení pro zlepšení stability a provozuschopnosti databáze.

třetí charakteristikou je geografická rozmanitost. Tím je zajištěno, že pokud by přírodní katastrofa zasáhla jediné místo, toto selhání nebude bránit schopnosti poskytovat službu.

čtvrtou a možná nejdůležitější složkou je poskytnout metodiku replikace zálohy a obnovy po havárii. Schopnost zajistit funkční zálohu zaručuje, že naše data jsou bezpečná. Pomocí nejnovější strategie zálohování (3-2-3) uvádí, že byste měli mít tři kopie svých dat na dvou různých typech médií, ve třech geograficky odlišných místech mimo pracoviště pro zotavení po havárii.

Nekomplikované Nasazení

Při diskusi na téma nekomplikované nasazení, by měly být specificky mapován na vaše specifické obchodní požadavky. Následující vlastnosti budou přínosem pro náš operační rámec bez ohledu na vertikální odvětví:

  • Skromné Požadavky na Školení
  • Zvýšení Produktivity
  • Rozšířený Životní Cyklus
  • Efektivita Nákladů
  • Provozní Efektivity
  • Rychlá Implementace
  • Snížení Bezpečnostních Rizik
  • Jednoduchá Integrace
  • Zjednodušené Řízení

Tyto funkce definovat mnohé základní aspekty potřebné k zajištění vysoce spolehlivé, chyba-tolerantní, clustering řešení. Vysoká dostupnost, ve svém jádru, by měla být navržena s ohledem na tyto vlastnosti. Schopnosti, jako jsou tyto, jsou klíčovými hmatatelnými prvky, které jsou vyžadovány při přijímání možností nasazení.

Nejlepší Postupy, Cíle

Design

primárním cílem vysoké dostupnosti osvědčené postupy cílem je optimální návrh, instalaci, zavádění, integraci, a dodržování standardních úmluvy na nejnižší rozumnou cenu a minimální složitost při dosahování stanovených vzorovým cíle odstranit každý jediný bod selhání v systému.

dostupnost

nejprve by měl být před návrhem systému definován stanovený cíl. To zahrnuje stanovení toho, co je cílem bodu obnovy (RPO). RPO je největší množství prostojů, které je vaše společnost ochotna ztratit během velkého výpadku. Hardware, software a doplňkové služby HA by měly mít definovaný a testovaný RPO.

Nasazení

Next, systém by měl být postaven s nejvíce robustní, nákladově efektivní hardware k dispozici. To zahrnuje systémy, které jsou odolné vůči výpadky proudu a poruchy hardwaru, zahrnující vše od pevných disků, síťových složek, operačního systému a samotné aplikace zahrnující celý softwarový balík.

Hodnocení & Testování

Jakmile je systém postaven, nedílnou pilířem je testování náš cílový systém k zajištění převzetí služeb při selhání systému je připraven přepnout, pokud zdroj selže. To vyžaduje přípravu našich síťových konfigurací, serverů, softwaru synchronní replikace v reálném čase a přepínačů na přechod od zpracování zdrojové výroby k cílovému systému, který zpracovává přechod na okamžik. Tato metoda použitá v tomto scénáři je známá jako systém“ hot standby“. Kromě toho to zahrnuje nastavení plánovaného testování, protože systém je pravidelně testován.

Replikace

Zajištění reprodukovatelné a opakovatelné iterace celé softwarový balík ve více regionech je klíčem k neustálé trvanlivost, proveditelnost a spolehlivost application framework. Další významnou oblastí služeb je replikovatelný hardwarový segment, který doplňuje softwarové a monitorovací rámce. Umět se spoléhat na specializované zdvojování metodiky je zásadní pro zajištění plně odolný a spolehlivý systém.

Sledování & Sledování

a Konečně, průběžné sledování, hodnocení a pozorování by měla být přísně regulována, aby se zajistilo plnění cíle jsou splněny. Jakákoli odchylka od normy by měla být prozkoumána a posouzena, aby se určil dopad rozptylu na systém. Jakmile dispozice byla zřízena, a následná-up by měla být provedena analýza, zda veškeré změny by měly být přijaty, aby zahrnovala úpravy nebo změny potřebné k uvedení systému do nového stabilního stavu.

závěr

primárním cílem systému s vysokou dostupností je zabránit a odstranit všechny jednotlivé body selhání. To by mělo zahrnovat několik akčních plánů, které byly testovány a zavedeny, připraveny nezávisle a okamžitě reagovat na jakékoli a všechny poruchy služeb, narušení, a selhání. To zahrnuje nesrovnalosti hardwaru, softwaru a aplikací. Vymýcení prostojů lze dosáhnout složeným, kvalifikovaným plánováním a implementací systému. Kritické oko je nutné si představit a připravit se na jakýkoli výskyt nebo katastrofu, což by mohlo bránit primárnímu cíli stanoveného a očekávaného cíle provozuschopnosti. Dobře zavedený systém vysoké dostupnosti může tohoto cíle dosáhnout správným plánováním a návrhem, snížením nebo odstraněním narušení a maximalizací dostupnosti.

Pečlivé Plánování + Spolehlivé Provádění Metodik + Stabilní Softwarové Platformy + Zvukový Hardware Infrastruktury + Hladký Technické Operace + Obezřetné Řízení Gólů + Konzistentní Data Security + Předvídatelné Redundance Systémů + Robustní Řešení Zálohování + Více Možností Obnovení = 100% Uptime

Náš talentovaný Podporu Týmy jsou obsazeny zkušenými Linux techniky a správce Systému, kteří mají dokonalou znalost několik web hosting technologií, zejména ty popisované v tomto článku.
Pokud se vám jsou Plně Spravované VPS server, Cloud, Oddaný, VMWare Private Cloud, Soukromá Mateřská server nebo Dedikovaný server maj a ty jsou nepříjemné s provedením jakékoli kroky uvedené, můžeme být dosaženo prostřednictvím telefonu @800.580.4985, chatu nebo support ticket pomoci vám s tímto procesem.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.