Pandas Series v CSV

Pandas Series V Csv



Metoda “Series.to_csv()” v Pandas poda podani predmet serije v zapisu vrednosti, ločenih z vejico (csv). Ta funkcija preprosto vzame vrednosti iz serije in spremeni njihovo obliko z dodajanjem vejic za ločevanje vrednosti indeksa in stolpca.

Za uporabo te funkcije moramo uporabiti naslednjo sintakso:









Ta članek vam bo ponudil dve različni tehniki za učenje načinov uporabe te metode v programu python.



1. primer: uporaba metode Series.to_csv() za pretvorbo serije z datumsko-časovnim indeksom v vrednosti, ločene z vejico

Za spreminjanje serije v format CSV bomo uporabili funkcijo »Series.to_csv()«. Ta ilustracija bo ustvarila niz z DatetimeIndex in ga nato pretvorila v obliko zapisa vrednosti, ločenih z vejicami.





Za zagon te metode moramo imeti orodje, ki podpira programiranje python. Za sestavljanje kod je izbrano orodje “Spyder”. Da bi nanj napisali skript, smo najprej zagnali nameščeno orodje v našem sistemu. Program python potrebuje knjižnico za izvajanje svojih metod za doseganje zahtevanega rezultata. Knjižnica, ki smo jo naložili tukaj, je »Pande«. V isti vrstici kode je vzdevek te knjižnice označen kot »pd«. Torej, kamor koli v programu moramo za dostop do funkcije napisati 'pande'. Namesto tega bi napisali 'pd'.

Prvi korak za začetek uporabe kode je ustvarjanje serije Pandas. Moramo napisati 'pd', da uporabimo metodo ustvarjanja serije iz pand. Funkcija “pd.Series()” je poklicana za izdelavo niza z navedenimi vrednostmi. Vrednosti, ki smo jih zagotovili za serijo, so »Istanbul«, »Izmir«, »Ankara«, »Ankara«, »Antalya«, »Konya« in »Bursa«. Če želite temu nizu vrednosti dati ime, lahko to storite s parametrom »ime«. Tukaj smo to matriko vrednosti poimenovali »Mesta«, saj vsebuje imena 6 mest. Za shranjevanje te serije je bil ustvarjen objekt serije »Turkey«.



Za ustvarjanje DatetimeIndex smo priklicali metodo »pd.date_range()«. Med oklepaje te funkcije smo posredovali 4 argumente, ki so: »start«, »freq«, »periods« in »tz«.

Argument »začetek« vzame datum in čas, da začne iz njega generirati časovno obdobje. Tukaj smo določili začetni datum in čas kot »2022-03-02 02:30«. Parameter »freq« razvršča pogostost za časovno obdobje. Torej smo mu dali vrednost 'D'. Zdaj bo ustvaril časovno obdobje z dnevno frekvenco. Argument »obdobje« je nastavljen na »6«, kar pomeni, da bo ustvaril časovno obdobje za 6 dni. Zadnji parameter je »tz«, ki določa časovni pas za navedeno območje. Določili smo časovni pas za 'Azija/Istanbul'.

Za shranjevanje tega časovnega obdobja smo ustvarili spremenljivko »Datetime«. Za nastavitev DatetimeIndex smo uporabili lastnost 'Series.index'. Ime serije »Turkey« je opremljeno z lastnostjo ».index« in ji je dodeljeno časovno obdobje, shranjeno v spremenljivki »Datetime«. Tako bo lastnost »index« prevzela vrednosti iz spremenljivke »Datetime« in jih naredila za indeksni seznam serije »Turkey«. Nazadnje, za ogled izhodne serije smo uporabili metodo »print()« in ji posredovali serijo »Turkey« kot vhod za prikaz njene vsebine.

Pravkar smo pritisnili možnost »Zaženi datoteko«, da izvedemo skript. Posledično lahko vidimo niz z DatetimeIndex, ki se začne od »2022-03-02 02:30:00+03:00« in konča pri »2022-03-07 02:30:00+03:00«, ki ustvarja piko 6 dni. Pod nizom so omenjeni tudi »Freq :D«, ime matričnega seznama »Cities« in dtype »object«.

Zdaj se bomo naučili pretvoriti to serijo, ki smo jo pravkar videli na zgornjem posnetku, v format CSV. Za spreminjanje serije v vrednosti, ločene z vejicami, imamo metodo, ki jo ponuja modul pandas in je »Series.to_csv()«. Ta metoda vzame vrednosti podanega niza in doda vejice med vrednosti stolpcev.

Pokliče se funkcija “Series.to_csv()”. Ime serije, ki jo želimo pretvoriti, je omenjeno z metodo kot »Turkey.to_csv()«. Da bi ohranili vrednosti, ločene z vejicami, smo ustvarili spremenljivko »Comma_Separated« in nato njeno vsebino postavili v izhodno okno s klicem funkcije »print()«.

Tukaj je naša serija v formatu csv. Na posnetku lahko vidimo, da so vrednosti indeksa in serije ločene z vejicami.

Primer # 2: Uporaba metode Series.to_csv() za pretvorbo serije z vrednostmi NaN v vrednosti, ločene z vejico

Druga tehnika za izvajanje metode »Series.to_csv()« je uporaba te metode za pretvorbo serije, ki vsebuje nekaj ničelnih vnosov, v format CSV.

Na začetku smo uvozili potrebne pakete. »pd« je vzdevek za pande, »np« pa vzdevek za numpy. Komplet orodij numpy je naložen tukaj, ker bomo naredili nekaj ničelnih vnosov v našo serijo z uporabo »np.NaN«, medtem ko jo bomo ustvarjali z metodo pandas »pd.Series()«.

Funkcija “pd.Series()” se prikliče za izdelavo serije pand s temi vrednostmi: “Nil”, “Amazon”, np.NaN, “Ganges”, “Mississippi”, “np.NaN”, “Yangtze”, 'Donava', 'Mekong', 'np.NaN' in 'Volga'. Za niz je definiranih skupno 21 vrednosti, od katerih 3 vnosi vsebujejo vrednosti »np.NaN«, kar pomeni, da v nizu manjkajo 3 vrednosti. Lastnost »ime« določa ime za to matriko vrednosti, ki smo ji navedli »naslove«. Lastnost »indeks« se uporablja za nastavitev uporabniško določenega indeksnega seznama namesto privzetega seznama.

Tukaj želimo indeksni seznam z vrednostmi '10', '11', '12', '13', '14', '16', '17', '18', '19', '20', in 21'. Zdaj bo imela naša serija indeksni seznam, ki se bo začel z »10« namesto z »0«. Zdaj shranite to serijo, da jo bomo lahko kasneje uporabili v programu. Inicializirali smo objekt serije »Rivers« in mu dodelili izhodno serijo, ustvarjeno s klicanjem metode »pd.Series()«. Serijo si lahko ogledate tako, da jo postavite na ogled s funkcijo »print()« v pythonu.

Upodobljen izhod na terminalu je natisnil serijo, katere indeksni seznam se začne pri 10 in konča pri 21, kar pomeni, da ima serija 21 vrednosti.

Niz bo pretvorjen v format CSV z metodo »Series.to_csv()«.

Priklicali smo metodo »Series.to_csv()« z našo serijo »Turkey«. Zato bo ta metoda vzela vrednosti iz serije »Turkey« in jih pretvorila v obliko zapisa vrednosti, ločenih z vejicami. Rezultat se shrani v spremenljivko »Converted_csv«. In končno se pretvorjena serija natisne s pomočjo funkcije »print()«.

Na spodnjem posnetku izida lahko vidite, da so vrednosti niza zdaj spremenjene na način, da se z vejico ločijo od indeksnega seznama. Poleg tega je tam, kjer vrednosti manjkajo, z vejico natisnjena samo številka indeksa.

Zaključek

Spreminjanje serije pand v format CSV je praktičen pristop. To lahko dosežete z uporabo funkcije pandas “Series.to_csv()”. Ta vodnik je v praksi predstavil dve tehniki za uporabo te metode. V prvi ilustraciji smo poklicali to metodo za pretvorbo niza z DatetimeIndex v obliko zapisa vrednosti, ločenih z vejicami. 2. primer je uporabil funkcijo “Series.to_csv()”   za spreminjanje serije z nekaj manjkajočimi vnosi v format CSV. Obe tehniki sta bili praktično implementirani z uporabo orodja »Spyder« v operacijskem sistemu Windows.