Kako ustvariti pajka za pridobivanje podatkov iz vedra S3?

AWS Glue se uporablja za odkrivanje podatkov, integracijo podatkov, pajkanje podatkov in ustvarjanje kataloga podatkov v oblaku. Uporabnik lahko iz AWS Glue ustvari pajka, ki bo preiskal podatke iz danega vira in jih nato shranil v podatkovni katalog, da pridobi informacije. Uporabnik mora samo zagnati pajka in vse ostalo bo izvedel pajek v nekaj trenutkih.

V tem priročniku je razloženo, kako ustvariti pajke za pridobivanje podatkov iz vedra S3.

Kako ustvariti pajka za pridobivanje podatkov iz vedra S3?

Če želite ustvariti pajka v AWS, obiščite » Lepilo AWS ” na nadzorni plošči Amazon:

Kliknite na ' Baze podatkov ” v razdelku Katalog podatkov, da ustvarite bazo podatkov:

Kliknite na ' Dodajte bazo podatkov ” za začetek konfiguracije:

Vnesite ime baze podatkov in pustite vse kot ni obvezno, preden kliknete » Ustvari bazo podatkov ” gumb:

Baza podatkov je bila uspešno ustvarjena:

Po tem preprosto pojdite na » Pajki ”, tako da jo kliknete na levi plošči:

Kliknite na ' Ustvari pajka ” gumb:

Vnesite ime pajka in kliknite » Naslednji ” gumb:

Kliknite na ' Dodajte vir podatkov ” za izbiro vira podatkov:

Če želite preveriti pot, kjer so shranjeni podatki, obiščite storitev S3:

Pojdite v vedro S3, kjer se naložijo podatki. Uporabnik lahko ustvariti vedro in nalaganje podatki o njem z nadzorne plošče AWS S3:

Kliknite na ' Brskajte po S3 ” za izbiro poti podatkov:

Izberite mapo s podatki in kliknite » Izberite ” gumb:

Pot S3 je bila izbrana, zdaj kliknite » Dodajte vir podatkov S3 ” gumb:

Ko je vir podatkov dodan, preprosto kliknite » Naslednji ” gumb:

Dodajte vlogo IAM in nato kliknite » Naslednji ” gumb:

Vnesite prej ustvarjeno ciljno bazo podatkov in nato vnesite ime tabele:

Izberite urnik na zahtevo za pajka in kliknite » Naslednji ” gumb:

Preglejte pajka in kliknite » Ustvari pajka ” gumb:

Pajek je bil uspešno ustvarjen, kliknite » Teči ” po izbiri:

Trajalo bo nekaj trenutkov, da se pajek zažene in pridobi podatke ter ustvari tabelo za shranjevanje podatkov:

Pojdite v ' Mize ” na nadzorni plošči Glue:

Izberite tabelo s klikom na njeno ime:

Prikazane so bile podrobnosti zgodbe, ki vsebujejo metapodatke pridobljenih podatkov:

Pomaknite se navzdol po strani in izberite razdelek za ogled tabele s podatki:

To je vse o ustvarjanju pajka za pridobivanje podatkov iz vedra S3.

Zaključek

Če želite ustvariti pajka za pridobivanje podatkov iz vedra S3, ustvarite bazo podatkov na AWS Glue, v kateri bodo shranjeni pajkani podatki. Konfigurirajte pajka na nadzorni plošči Glue tako, da zagotovite vir podatkov (vedro S3) in ciljno bazo podatkov. Zaženite pajka in pridobite podatke iz vedra S3 v tabelo baze podatkov, kot je podrobno razloženo v tem priročniku.

Kako ustvariti pajka za pridobivanje podatkov iz vedra S3?

Kako ustvariti pajka za pridobivanje podatkov iz vedra S3?

Zaključek

Kategorija

Priljubljene Objave

Kako preveriti, ali je procesor ARM64 ali x64 (64-bitni) v sistemu Windows 11?

Kako implementirati Fibonaccijevo zaporedje v Javi

Kako inicializirati matriko v Javi

Pridobite zapise z uporabo Rest API v Salesforce

Kako ustvariti generator naključnih gesel

Kako prenesti in zagnati CCleaner Professional v sistemu Windows?

Omogoči 2-faktorsko avtentikacijo z uporabo varnostnih ključev – QR koda – Roblox

Kako uporabljati operaterja IN v MySQL?

5 najboljših namiznih okolij za Raspberry Pi

Kako uporabljati funkcijo Upper_bound() v C++

3 metode za iskanje imena gostitelja za Raspberry Pi

Kako dodati vrzel med stolpci v Tailwind

Razumevanje vrat Exclusive-NOR – popolna vadnica

Kako ustvariti Elasticsearch Image Docker?

Kako uporabiti eno besedno zvezo za ustvarjanje več slik z uporabo Midjourney?

Ustvarite bazo podatkov v PostgreSQL z uporabo ukaza createdb

Kako odstraniti rumeni trikotnik na omrežni povezavi v sistemu Windows 10

Kako nastaviti prednost v upravitelju opravil v sistemu Windows (2022)

Kaj so ekipe za dve pici v AWS DevOps?

Kako uporabiti Not Equal v MATLAB?