Kaj je sistemska arhitektura podatkovnega skladišča Amazon Redshift?

Kaj Je Sistemska Arhitektura Podatkovnega Skladisca Amazon Redshift



Gostovanje in upravljanje podatkov v zbirkah podatkov in podatkovnih skladiščih je bilo vedno naporno in težavno opravilo. Za razumevanje podatkov je potrebnih veliko sredstev in računalniške moči. Amazon Web Services ima za ta namen rešitev na enem mestu. Ima storitev, imenovano Amazon Redshift, ki v celoti upravlja skladišča podatkov uporabnikov.

Ta članek bo podrobno razložil Amazon Redshift skupaj z njegovo arhitekturo podatkovnega skladišča. Vse komponente Redshiftove arhitekture sistema skladišča podatkov bodo podrobno razložene.







Kaj je Amazon Redshift?

IT je storitev skladiščenja podatkov, ki jo ponuja Amazon. Učinkovito upravlja in analizira velike nabore podatkov za analitiko in poročanje. Zgrajen je po modelu stebričnega skladiščenja. Za zagotavljanje visoko zmogljive obdelave podatkov uporablja gruče računalniških vozlišč, ki jih nadzira vodilno vozlišče.



Jemlje podatke iz različnih virov in jih združuje v skladišče podatkov. Ponuja različne funkcije, kot sta deljenje podatkov in analitika v realnem času. Za razumevanje funkcij in zmogljivosti Amazon Redshift si oglejte spodnjo sliko:







Pojdimo zdaj k arhitekturi njegovega sistema skladišča podatkov.

Kaj je sistemska arhitektura podatkovnega skladišča Amazon Redshift?

Ta sistemska arhitektura ima tri glavne dele. Ti deli so:



  • Shranjevanje
  • Pospešek
  • Računanje

Naj razumemo njihove namene:

Shranjevanje
Shranjevalni del obravnava storitve shranjevanja, ki jih ima Redshift. Ima lastno možnost upravljane storitve shranjevanja in možnost vedra S3.

Pospešek
Del pospeševanja je odvisen od uporabljene storitve shranjevanja in uporabljene računalniške moči. Shramba, ki jo upravlja Redshift, je hitrejša v primerjavi z drugimi možnostmi shranjevanja

Računanje
Računski del se zgolj ukvarja z računalniško močjo v uporabi. Računanje poteka z gručami, gruče pa imajo vozlišča. Vozlišča pa imajo rezine.

Za boljše razumevanje vseh elementov in komponent te arhitekture si oglejte spodnjo sliko:

Razumejmo njegove komponente eno za drugo.

Katere so arhitekturne komponente Amazon Redshift?

Sledijo arhitekturne komponente Amazon Redshift:

  • Grozdi
  • Vozlišča
  • Rezine vozlišč
  • Shranjevanje
  • Notranje omrežje
  • Baze podatkov

Razpravljajmo o teh eno za drugo:

Grozdi
Grozd je temeljna in jedrna enota. Sestavljen je iz številnih vozlišč. Če je gruča sestavljena iz več računalniških vozlišč, vstopi dodatno vodilno vozlišče, ki usklajuje dejavnosti teh računalniških vozlišč in upravlja zunanjo komunikacijo.

Vozlišča

Vozlišča v grozdih so dveh vrst. To so:

  • Vodilno vozlišče
  • Računalniško vozlišče

Naj jih razumemo enega za drugim:

Vodilno vozlišče
Upravlja komunikacijo z odjemalskimi programi in usklajuje interakcije z računalniškimi vozlišči. Vodilno vozlišče ima ključno vlogo pri izvajanju kompleksnih poizvedb. Sestavlja kodo na podlagi izvedbenega načrta, ki je razdeljen računalniškim vozliščem, in dodeljuje dele podatkov vsakemu posameznemu računalniškemu vozlišču.

Računalniško vozlišče
Računalniška vozlišča so hrbtenica arhitekture Amazon Redshift. Izvajajo tako shranjevanje kot obdelavo podatkov. Ti imajo namenske vire, kot sta pomnilnik in CPE.

Rezine vozlišč
Računalniška vozlišča so nadalje razdeljena na rezine. Te rezine delujejo skupaj pri obdelavi dodeljenih delovnih obremenitev in doseganju vzporednosti za izboljšanje obdelave poizvedb.

Shranjevanje
Shranjevanje podatkov znotraj Amazon Redshift upravlja »Redshift Managed Storage (RMS)«. Ima možnost neodvisnega prilagajanja prostora za shranjevanje z uporabo prostora za shranjevanje »Amazon S3«. RMS uporablja visoko zmogljiv lokalni pomnilnik na osnovi SSD kot predpomnilnik stopnje 1, ki optimizira zmogljivost.

Notranje omrežje
To notranje omrežje v Amazon Redshift pomaga pri hitri in varni komunikaciji med vodilnimi in računalniškimi vozlišči. To omrežje ni neposredno dostopno odjemalskim aplikacijam.

Baze podatkov
Grozdi imajo eno ali več baz podatkov. Podatki iz teh baz podatkov so v računalniških vozliščih. Odjemalske aplikacije komunicirajo z vodilnim vozliščem. Računalniško vozlišče upravlja izvajanje poizvedbe v računalniških vozliščih.

To je vse o Amazon Redshift in njegovih arhitekturnih elementih. Ta članek je izčrpno razložil delujoče komponente Amazon Redshift

Zaključek

Arhitektura Amazon Redshift je razlog, na katerem temeljijo njegove zmogljivosti. Vodilno vozlišče nadzira in upravlja računalniška vozlišča in rezine vozlišč pomagajo pri vzporedni obdelavi. Redshift Managed Storage uporablja pomnilnik na osnovi SSD za izboljšanje zmogljivosti. V tem članku je razložena arhitektura sistema Amazon Redshift Data Warehouse.