Pandas DataFrame v JSON

Pandas Dataframe V Json



»Pande« zagotavljajo možnost za obdelavo podatkov in analizo podatkov. V sodobnem svetu je analiza podatkov izjemno dragoceno orodje. Za dokončanje te naloge so v računalništvu na voljo različne podatkovne strukture. V »pandah« imamo DataFrame, ki je prav tako pretvorjen v »JSON«. 'JSON' lahko razložimo, ker gre za besedilo, ki uporablja zapise JavaScript Object. Prenos podatkov med strežniki in spletnimi aplikacijami uporablja »JSON«. V tem priročniku bomo preučili pretvorbo formata JSON za DataFrames. Za to pretvorbo iz DataFrame v »Json« ponuja »pandas« metodo »to_json()«. Kadarkoli moramo DataFrame pretvoriti v format »JSON«, uporabimo metodo »to_json()« »pand«. Da bi bolje razumeli, kako uporabiti funkcijo »pand«, ki je »to_json«, si oglejmo nekaj kod »pand« v tem priročniku.«

Primer št. 01
V praksi bomo pokazali, kako uporabiti metodo »to_json()« za »pandas« za spreminjanje podatkovnega okvira »pandas« v format JSON. Tukaj je uvožen paket »pandas«, ki je »numpy«, uvozimo pa ga kot »np«. Zdaj je treba za izvedbo kode »pandas« uvoziti pakete pande. Za uvoz tega paketa uporabimo ključno besedo »uvozi«. Nato nastavimo »pande kot pd«, kar pomeni, da lahko preprosto dostopamo do katerega koli »paketa pandas«, ki ga potrebujemo, ali ga uporabimo tako, da tam samo postavimo »pd«.

Tukaj ustvarimo matriko numpy z uporabo »np. array', ta 'np' nam pomaga pri dostopu do funkcij knjižnice numpy. Ta matrika numpy je shranjena tudi v spremenljivki »New_data«, v to matriko numpy pa dodamo »A, B, C, D« in »E, F, G, H«. Ta matrika numpy je zdaj pretvorjena v DataFrame z uporabo metode »pd.DataFrame«. To je metoda 'pande', do katere dostopamo tukaj, tako da postavimo 'pd'. Ko pretvorimo to matriko numpy v DataFrame, dodamo tudi imena stolpcev.







Imena, ki jih tukaj dodamo kot naslove stolpcev, so »col1, col2, col3 in col4«. Nato vidite, da imamo spodaj »tisk«, v katerem smo nastavili ime DataFrame, ki je v tem primeru »New_dataFrame«, tako da bo to upodobljeno ob izvedbi te kode. Zdaj ta DataFrame pretvarjamo v format JSON z uporabo metode »to_json()«. Ime podatkovnega okvira »New_dataFrame« nastavimo z metodo »to_json()« in to metodo tudi postavimo v spremenljivko »New_json«. Tukaj tej metodi »to_json()« nismo posredovali nobenega parametra. Format JSON DataFrame je zdaj postavljen v »tisk« in bo tudi upodobljen na konzoli.





Za prevajanje in izvajanje te kode pritisnemo »Shift+Enter« in če je koda brez napak, bo rezultat upodobljen. Tukaj prilepimo tudi rezultat te kode, v kateri smo prikazali DataFrame, ki smo ga ustvarili v tem primeru, in tudi format JSON tega DataFrame.





Primer št. 02
Tukaj uvozimo samo eno knjižnico, to je »pande«, nato pa se ustvari seznam »AtoZ_Courses« in vanj postavimo nekaj seznamov, ki so »Python, 29000, 35 dni in 1000.0«, nato postavimo » JavaScript, 27000, 55 dni in 2300.0', za tem dodamo 'HTMLCSS, 25000, 25 dni in 1500.0'. Zdaj smo vstavili še dva podatka, kot sta »DataBase, 24000, 45 dni in 1500.0« in »OOP, 21000, 35 dni, 1500.0«. Seznam »AtoZ_Courses« je zdaj spremenjen v DataFrame in poimenovali smo ga »AtoZ_Courses_df«. »Courses_Name, Payment, Duration in Bonus« so tukaj dodani kot imena stolpcev DataFrame.



DataFrame je zdaj ustvarjen v tem koraku in dodamo ga v stavku »print()« za prikaz na terminalu. Zdaj z uporabo metode »to_json()« preoblikujemo DataFrame »AtoZ_Courses_df« v format JSON. Ta metoda »to_json()« ima tudi parameter, ki je »orient= column«, kar je tudi privzeti parameter. Prikaže DataFrame kot diktat kot »format {ime stolpca -> {vrednost indeksa -> vrednost stolpca}}«.

Tukaj v formatu JSON prikaže ime stolpca in nato doda vse vrednosti tega stolpca skupaj z vrednostjo indeksa. Najprej omeni ime prvega stolpca, nato pa so vse vrednosti prvega stolpca upodobljene skupaj z vrednostmi indeksa, nato pa postavi ime drugega stolpca in tudi vse vrednosti drugega stolpca z indeksi itd.

Primer št. 03
DataFrame je ustvarjen v tej kodi z imenom »Bachelors_df«. V ta »Bachelors_df« smo vstavili pet stolpcev. Prvi stolpec, ki ga imamo tukaj, je stolpec »Študent« in vanj vstavimo »Lily, Smith, Bromley, Milli in Alexander«. Stolpec, ki sledi, je stolpec »Degree«, ki vsebuje »IT, BBA, English, CS in DVM«. Nato pride naprej »year_of_joining«, kjer dodamo leta pridružitve študentov, ki so »2015, 2018, 2017, 2015 in 2014«.

Stolpec poleg tega stolpca je »year_of_graduation«, ki vsebuje leta diplomiranja teh študentov »2019, 2022, 2021, 2019 in 2018«. Tu dodamo tudi stolpec »CGPA«, v katerega umestimo ocene CGPA študentov »3.3, 3.5, 3.6, 3.7 in 3.8«. Za prikaz »Bachelors_df« na terminalu ga vključimo v izraz »print()«. Zdaj pretvarjamo » Bachelors_df « DataFrame v format JSON z uporabo metode »to_json()«.

Parameter »orient= records« je prav tako posredovan tej metodi »to_json()« v tej kodi. Ta “orient= records” bo prikazal format JSON kot “[{ime stolpca -> vrednost stolpca}, … , {ime stolpca -> vrednost stolpca}]”. Oblika zapisa JSON DataFrame je zdaj nastavljena na »print« in bo prikazana tudi na terminalu.

DataFrame je tukaj preprosto prikazan v obliki stolpcev in vrstic, v formatu JSON pa lahko opazite, da vnese ime stolpca in nato prikaže vrednost tega stolpca; po prikazu vrednosti enega stolpca natisne ime drugega stolpca in nato vnese vrednost tega stolpca in nato tako naprej, ker smo parameter metode »to_josn« nastavili kot »orient= records«.

Primer št. 04
Ustvarimo matriko numpy 'My_data', v katero vstavimo '2, 4' in '6, 8'. Nato spremenite matriko numpy v DataFrame 'My_dataFrame' in nastavite imena stolpcev na 'A1 in A2'. Zdaj, potem ko tukaj prikažete DataFrame z uporabo »tiskanja«. Najprej uporabimo metodo “to_json()” brez parametrov in jo prikažemo. Po tem nastavimo parameter metode »to_json()« na »orient=split« in tudi natisnemo to obliko. Nato znova uporabimo »to_josn()« za »My_dataFrame« in tokrat posredujemo »orient=records« kot parameter te funkcije.

Pod tem postavimo »orient= index« z »My_dataFrame« in upodobimo ta format JSON. Po tem parametru ponovno uporabimo »to_json« s parametrom »orient = column« in ga tudi upodobimo. Nato posredujemo »orient= values« kot parameter metode »to_json()« in jo uporabimo za »My_dataFrame«. Prav tako smo parameter te funkcije nastavili na 'orient= table' in jo ponovno uporabili z istim DataFrameom ter prikazali tudi ta format JSON. Zdaj bomo opazili razliko med formati JSON v izhodu te kode.

Tukaj lahko enostavno najdete razliko med formati JSON, ki smo jih uporabili za isti DataFrame. Vsi parametri, ki smo jih posredovali v metodi »to_json«, so tukaj prikazani v različnih oblikah.

Zaključek

Ta priročnik prikazuje format JSON in podrobno razlaga ta format JSON ter kako pretvoriti pandas DataFrame v JSON. Pojasnili smo, da se metoda »to_json()« uporablja za pretvorbo pandas DataFrame v format JSON. Razpravljali smo tudi o različnih parametrih, ki smo jih tukaj posredovali metodi »to_json()«. Zagotovili smo popoln vodnik, v katerem smo uporabili metode »to_json()« tako, da smo v našo kodo »pandas« vstavili vse možne parametre za to metodo »to_json()« in jim v izhodu pokazali, kako ti parametri spremenijo obliko JSON.