Kako ustvariti pajka za pridobivanje podatkov iz vedra S3?

Kako Ustvariti Pajka Za Pridobivanje Podatkov Iz Vedra S3



AWS Glue se uporablja za odkrivanje podatkov, integracijo podatkov, pajkanje podatkov in ustvarjanje kataloga podatkov v oblaku. Uporabnik lahko iz AWS Glue ustvari pajka, ki bo preiskal podatke iz danega vira in jih nato shranil v podatkovni katalog, da pridobi informacije. Uporabnik mora samo zagnati pajka in vse ostalo bo izvedel pajek v nekaj trenutkih.

V tem priročniku je razloženo, kako ustvariti pajke za pridobivanje podatkov iz vedra S3.

Kako ustvariti pajka za pridobivanje podatkov iz vedra S3?

Če želite ustvariti pajka v AWS, obiščite » Lepilo AWS ” na nadzorni plošči Amazon:









Kliknite na ' Baze podatkov ” v razdelku Katalog podatkov, da ustvarite bazo podatkov:







Kliknite na ' Dodajte bazo podatkov ” za začetek konfiguracije:



Vnesite ime baze podatkov in pustite vse kot ni obvezno, preden kliknete » Ustvari bazo podatkov ” gumb:

Baza podatkov je bila uspešno ustvarjena:

Po tem preprosto pojdite na » Pajki ”, tako da jo kliknete na levi plošči:

Kliknite na ' Ustvari pajka ” gumb:

Vnesite ime pajka in kliknite » Naslednji ” gumb:

Kliknite na ' Dodajte vir podatkov ” za izbiro vira podatkov:

Če želite preveriti pot, kjer so shranjeni podatki, obiščite storitev S3:

Pojdite v vedro S3, kjer se naložijo podatki. Uporabnik lahko ustvariti vedro in nalaganje podatki o njem z nadzorne plošče AWS S3:

Kliknite na ' Brskajte po S3 ” za izbiro poti podatkov:

Izberite mapo s podatki in kliknite » Izberite ” gumb:

Pot S3 je bila izbrana, zdaj kliknite » Dodajte vir podatkov S3 ” gumb:

Ko je vir podatkov dodan, preprosto kliknite » Naslednji ” gumb:

Dodajte vlogo IAM in nato kliknite » Naslednji ” gumb:

Vnesite prej ustvarjeno ciljno bazo podatkov in nato vnesite ime tabele:

Izberite urnik na zahtevo za pajka in kliknite » Naslednji ” gumb:

Preglejte pajka in kliknite » Ustvari pajka ” gumb:

Pajek je bil uspešno ustvarjen, kliknite » Teči ” po izbiri:

Trajalo bo nekaj trenutkov, da se pajek zažene in pridobi podatke ter ustvari tabelo za shranjevanje podatkov:

Pojdite v ' Mize ” na nadzorni plošči Glue:

Izberite tabelo s klikom na njeno ime:

Prikazane so bile podrobnosti zgodbe, ki vsebujejo metapodatke pridobljenih podatkov:

Pomaknite se navzdol po strani in izberite razdelek za ogled tabele s podatki:

To je vse o ustvarjanju pajka za pridobivanje podatkov iz vedra S3.

Zaključek

Če želite ustvariti pajka za pridobivanje podatkov iz vedra S3, ustvarite bazo podatkov na AWS Glue, v kateri bodo shranjeni pajkani podatki. Konfigurirajte pajka na nadzorni plošči Glue tako, da zagotovite vir podatkov (vedro S3) in ciljno bazo podatkov. Zaženite pajka in pridobite podatke iz vedra S3 v tabelo baze podatkov, kot je podrobno razloženo v tem priročniku.