Maybaygiare.org

Blog Network

高可用性とは何ですか? チュートリアル

読み取り時間:8分

高可用性は、フォールトトレラントであり、信頼性が高く、介入なしで継続的に動作するように設計されたシステム、またはシングルポイント障害を持つシステムの説明です。 これらのシステムは、インフラストラクチャを問題なく稼働させるために必要な可用性と稼働時間を向上させるために非常に求められています。 次の特性によって、高可用性システムが定義されます。

High Availability Clustering

High-availability server clusters(別名HA Clusters)は、最小限のダウンタイムで確実に利用できるアプリケーションまたはサービスをサポートするサー これらのサーバークラスターは、冗長性を利用してミッションクリティカルなレベルのfive9の稼働時間を達成する特殊なソフトウェアの種類を使用して 現在、企業の約60%が彼らのビジネスのための重要なサービスを提供するためにfive9以上を必要としています。

高可用性ソフトウェアは、コンポーネントが失敗した場合に共通の目標に焦点を当てたサーバーのグループをグループ化またはクラスタリングすること この形式のクラスタリングがないと、アプリケーションまたはwebサイトがクラッシュした場合、サーバーが修復されるまでサービスを利用できません。 HAクラスタリングは、障害を検出し、迅速に再起動したり、人間の介入を必要としない新しいプロセスでサーバーやサービスやサーバーを交換することにより、こ これは”フェイルオーバー”モデルとして定義されます。

次の図は、単純な2つのノードの高可用性クラスターを示しています。

高可用性クラスターは、ミッションクリティカルなデータベース、データ共有、アプリケーション、およ 高可用性の実装では、クラスタ内に冗長性が構築され、地理的に多様なストレージエリアネットワークを介して冗長に接続できる複数のネットワーク接続やデータストレージを介して単一障害点を削除できます。

高可用性クラスター化されたサーバーは、通常、プライベートネットワーク接続を介してクラスター内の各ノードの状態と正常性を監視するために使用されるHeartbeatと呼ばれるレプリケーション方法を使用します。 すべてのクラスタリングソフトウェアが対処できる必要がある重要な状況の1つは、すべてのプライベート内部リンクが同時にダウンしても、クラスター内のノードが引き続き実行されるときに発生するスプリットブレインと呼ばれます。 これが発生すると、クラスター内のすべてのノードが、他のすべてのノードがダウンしたと誤って判断し、他のノードがまだ実行されている可能性のあるサー システム上のデータの破損を引き起こす可能性があり、同様のサービスを実行している重複インスタンスのこの状態。

高可用性ソフトウェアの典型的なバージョンは、ハードウェアとソフトウェアの冗長性の両方を含む属性を提供します。 これらの機能は次のとおりです:

  • ハードウェアとソフトウェアコンポーネントの自動検出と発見。
  • 新しい要素へのアクティブロールと偶発ロールの両方の自律的な割り当て。
  • 障害が発生したソフトウェアサービス、ハードウェアコンポーネント、およびその他のシステム構成の検出。
  • 冗長コンポーネントの監視と通知、およびそれらをアクティブ化する必要がある場合。
  • 外部の介入なしに必要な変更に対応するためにクラスターを拡張する機能。

フォールトトレランス

フォールトトレランスは、システムのインフエラーを予見し、耐え、発生した場合は、これらの問題に自動応答を提供します。 これらのシステムの主な品質は、問題が発生した場合に呼び出すことができる高度な設計要因です。 すべての可能なソリューションを想定したインフラストラクチャを構成できることは、複数の懸念が発生する前に対処するための知識と経験を含 このようなフレームワークを設計するシステムアーキテクトは、これらの問題を事前に軽減する手段を想定した方法論と、これらのフレームワークを実装す

以下の冗長性方法論が利用可能であり、設計と実装の初期段階で検討する必要があります。

  • N+1モデル–この概念は、フレームワーク全体を稼働させ続けるために必要な機器の合計(これを”N”と呼びます)を推測し、障害が発生した場合には”N”コンポーネ
  • N+2モデル–N+1モデルに似ていますが、2つのコンポーネントが故障した場合の保護層が追加されています。
  • 2Nモデル–このモダリティは、システムのフレームワークが完全に機能していることを確認するために、各要素の二重冗長バックアップを持ってい
  • 2N+1モデル–このモデルは2Nモデルに似ていますが、システムのフレームワークに三次保護層を追加するための補足コンポーネントがあります。 モデルがNxから2nxに進歩するにつれて、稼働時間を必要とする真の冗長システムの場合と同様に、コスト要因も指数関数的に増加します。 これらの様相は安定性および供給のために重大である。

    信頼性と信頼性

    高可用性システムの中心的なテナントの一つは稼働時間です。 特に、システムの目的が緊急時の状況に対応する911システムのような不可欠なサービスを提供することである場合、稼働時間は非常に重要です。 ビジネスでは、重要なサービスをオンラインで維持するために、高可用性システムを持つことが必要です。 一例としては、機能の喪失を許容できないISPまたは他のサービスが挙げられます。 これらのシステムは、ダウンタイムを最小限に抑えながら信頼性と可用性を確保するために、高可用性と耐障害性を備えて設計する必要があります。

    オーケストレーションされたエラー処理

    エラーが発生した場合、システムはアップとオンラインのまま問題を適応させ、補 このタイプのシステムを構築するには、予期しないことに先見の明と計画が必要です。 事前に問題を予見し、その解決のための計画を立てることは、高可用性システムの主な資質の一つです。

    スケーラビリティ

    システムがトラフィックスパイクやリソース使用量の増加などの問題に遭遇した場合、それらのニー このような機能をシステムに構築することで、アーキテクチャプロセスのシステム機能の変化に迅速に対応するシステムの機能が提供されます。

    可用性&Five9の稼働時間

    Five9の稼働時間の測定の業界標準です。 この測定は、システム自体、フレームワーク内のシステムプロセス、またはインフラストラクチャ内で動作するプログラムに関連することができます。 この推定は、多くの場合、フォームまたはウェブサイトまたはwebアプリケーションでクライアントに配信されるプログラムに関連しています。 システムの可用性は、次の式を使用して、システムが利用可能な時間の割合として測定できます。x=(n–y)*100/n.この式は、”n”が暦月内の合計分、”y”が暦月内のサー 以下の表は、代表される”9″の割合に関連するダウンタイムの概要を示しています。 ご覧のように、”9″の数が多いほど、より多くの稼働時間が提供されます。 高可用性システムの目標は、システムが指定されたサービスを提供するために常に利用可能であることを保証するために、潜在的なダウンタイムの最小量を達成することです。

    Heartbeat

    主要な高可用性コンポーネントの一つはHeartbeatと呼ばれています。 Heartbeatは、高可用性クラスタリングリソース管理のために特別に設計されたPacemakerのようなクラスタ管理ソフトウェアで動作するデーモンです。 その最も重要な特性は次のとおりです。

    • ノードの特定のまたは固定された最大数はありません–Heartbeatは、大規模なクラスターだけでなく、基本的なクラスターを構築するために使用することができます。
    • リソース監視:リソースを自動的に再起動したり、障害時に別のノードに移動したりすることができます。
    • クラスターから障害が発生したノードを削除するために必要なフェンシングメカニズム。
    • 洗練されたポリシーベースのリソース管理、リソース間の依存関係、および制約。
    • 定義された時間枠に応じて異なるポリシーを許可する時間ベースのルールセット。
    • リソーススクリプトのグループ(Apache、DB2、Oracle、PostgreSQLなどのソフトウェア用)。)より詳細な管理が含まれています。
    • リソースとノードを構成、制御、監視するためのGUI。

    クラスターアーキテクチャ

    Engineered Availability

    高可用性システムの最初のセグメントは、クラスター全体に負荷を分散するように事前に設計されたクラスター化されたアプリケーションサーバーの明確に設計された利用です。

    第二の部門は、データベースのスケーラビリティの必要性が含まれています。 これには、複数のマスターレプリケーションを使用して水平または垂直にスケーリングし、データベースの安定性と稼働時間を向上させるためのロードバランサ P>

    第三の特性は、地理的多様性です。 これにより、自然災害が単一の場所を襲った場合、その障害がサービスを提供する能力を妨げないことが保証されます。

    第四に、おそらく最も重要なコンポーネントは、バックアップレプリケーションと障害復旧の方法論を提供することです。 作業バックアップを確保する能力は、私たちのデータが安全であることを保証します。 最新のバックアップ戦略(3-2-3)を使用すると、災害復旧のために、地理的に多様なオフサイトの場所に、二つの異なるメディアタイプのデータのコピーを

    複雑でない展開

    複雑でない展開のテーマを議論するときは、特定のビジネス要件に具体的にマップする必要があります。 次の特徴は企業の縦にもかかわらず私達の操作上のフレームワークに寄与します:

    • ささやかなトレーニング要件
    • 生産性の向上
    • ライフサイクルの拡張
    • 費用対効果
    • 運用効率
    • 迅速な実装
    • セキュリティリスクの削減
    • 簡単な統合
    • 簡略化された管理

    これらの機能は、信頼性の高い、フォールトトレラント、クラスタリングソリューションを確保するために必要な主な側面の多くを定義しています。 高可用性は、その中核に、これらの特性を念頭に置いて設計する必要があります。 これらのような機能は、展開オプションを採用する際に必要な資産である重要なタンジブルです。

    ベストプラクティスの目的

    デザイン

    高可用性ベストプラクテシステム内のすべての単一障害点を排除するというベンチマーク目標を達成しながら、最低の合理的なコストと最小限の複雑さで、標準的な慣習への設計、設置、展開、統合、および遵守。

    可用性

    まず、決定された目標は、システムの設計の前に定義する必要があります。 これには、目標復旧ポイント(RPO)の確立が含まれます。 RPOは、大規模な停止時に企業が失う可能性のある最大のダウンタイムです。 HAハードウェア、ソフトウェア、および補助サービスはすべて、定義され、テストされたRPOを持っている必要があります。

    展開

    次に、システムは利用可能な最も堅牢で費用対効果の高いハードウェアで構築する必要があります。 これには、停電やハードウェア障害に対して回復力のあるシステムが含まれ、ハードディスク、ネットワークコンポーネント、オペレーティングシステム、ソフ

    評価&テスト

    システムが構築されると、ソースに障害が発生した場合にフェイルオーバーシステムがスイッ そのためには、ネットワーク構成、サーバー、リアルタイム同期レプリケーションソフトウェア、ソース本番処理から瞬時に切り替えを処理するターゲットシステムへの移行に切り替えるスイッチを準備する必要があります。 このシナリオで使用されるこの方法は、”ホットスタンバイ”システムと呼ばれます。 さらに、これには、システムが定期的に再テストされる際に、厳格なテストスケジュールを設定することが含まれます。

    レプリケーション

    複数のリージョンにわたるソフトウェアスタック全体の再現性と反復可能な反復を確保することは、 他の重要なサービス領域は、ソフトウェアと監視フレームワークを補完する複製可能なハードウェアセグメントです。 専用の複製方法論に頼ることができることは、完全にフォールトトレラントで信頼性の高いシステムを保証するための基本的なものです。

    モニタリング&トラッキング

    最後に、パフォーマンス目標を確実に達成するために、継続的な監視、評価、観察 標準からの任意の偏差を調査し、分散がシステムに与える影響を決定するために評価する必要があります。 その処分が確立されたら、システムを新しい安定状態にするために必要な調整または変更を含むように変更を制定すべきかどうかについてのフ

    結論

    高可用性システムの主な目標は、すべての単一障害点を防止および排除することです。 これには、テストされ、実施され、すべてのサービス障害、中断、障害に独立してすぐに対応する準備ができている複数の行動計画が含まれている必要があ これには、ハードウェア、ソフトウェア、およびアプリケーションの不規則性が含まれます。 ダウンタイムの根絶はシステムの構成された、巧みな計画そして実施と達成することができる。 記述され、予想される稼働時間の目標の主な目的を妨げる可能性があるあらゆる発生や災害を想定し、準備するためには、批判的な目が必要です。 十分に確立された高可用性システムは、適切な計画と設計でこの目標を達成し、中断を削減または排除し、可用性を最大化することができます。

    慎重な計画+信頼性の高い実装方法+安定したソフトウェアプラットフォーム+健全なハードウェアインフラストラクチャ+スムーズな技術運用+慎重な管理目標+一貫性のあるデータセキュリティ+予測可能な冗長システム+堅牢なバックアップソリューション+複数の回復オプション=100%稼働時間

    私たちの才能のあるサポートチームは、複数のwebホスティング技術、特にこの記事で説明したものについての親密な知識を持っている経験豊富なLinux技術者とシステム管理者でスタッフされています。
    完全に管理されたVPSサーバー、Cloud Dedicated、VMWare Private Cloud、Private Parent server、または専用サーバーの所有者であり、概説された手順のいずれかを実行することに不快な場合は、電話@800.580.4985、チャッ

コメントを残す

メールアドレスが公開されることはありません。