Kako prebrati datoteko excel (xlsx) v pythonu

How Read Excel File Python



The .xlsx je razširitev Excelovega dokumenta, ki lahko shrani veliko količino podatkov v tabelarni obliki, številne vrste aritmetičnih in logičnih izračunov pa je mogoče enostavno narediti v Excelovi preglednici. Včasih je za namene programiranja potrebno prebrati podatke iz dokumenta Excel z uporabo skripta Python. V Pythonu obstaja veliko modulov za branje dokumenta Excel. Nekateri uporabni moduli so xlrd , openpyxl , in pande . Načini uporabe teh modulov za branje datoteke excel v Pythonu so bili prikazani v tej vadnici.

Predpogoj:

Za preverjanje primerov te vadnice bo potrebna lažna datoteka Excel z razširitvijo .xlsx. Uporabite lahko katero koli obstoječo datoteko Excel ali ustvarite novo. Tukaj je nova datoteka Excel z imenom sales.xlsx datoteka je bila ustvarjena z naslednjimi podatki. Ta datoteka je bila uporabljena za branje z uporabo različnih modulov python v naslednjem delu te vadnice.







sales.xlsx



Datum prodaje Prodajalec Znesek
05/12/18 Sila Ahmed 60000
12/06/19 Jaz Hossain 50.000
08/09/20 Sarmin Jahan 45000
04/07/21 Mahmudul Hasan 30000

Primer 1: Preberite datoteko excel z uporabo xlrd

Modul xlrd privzeto ni nameščen s programom Python. Zato morate modul pred uporabo namestiti. Najnovejša različica tega modula ne podpira datoteke excel s pripono .xlsx. Za branje datoteke xlsx morate namestiti različico 1.2.0 tega modula. Zaženite naslednji ukaz iz terminala, da namestite zahtevano različico xlrd .



$pipnamestite xlrd== 1.2.0

Po končanem namestitvenem postopku ustvarite datoteko python z naslednjim skriptom, da preberete datoteko sales.xlsx datoteko z uporabo xlrd modul. open_workbook () funkcija se uporablja v skriptu odprite datoteko xlsx za branje. Ta datoteka Excel vsebuje samo en list. Torej delovni zvezek.sheet_by_index () funkcija je bila uporabljena v skriptu z vrednostjo argumenta 0. Nato ugnezdeno 'Za' zanka je brala vrednosti celic na delovnem listu z uporabo vrednosti vrstic in stolpcev. Za določitev velikosti vrstice in stolpca na podlagi podatkov lista sta bili v skriptu uporabljeni dve funkciji range (). The cell_value () funkcija je uporabila za branje posebne vrednosti celice lista v vsaki iteraciji zanke. Vsako polje v izhodu bo ločeno z enim zavihkom.





# Uvozi modul xlrd
uvoz xlrd

# Odprite delovni zvezek
delovni zvezek = xlrd.open_workbook('sales.xlsx')

# Odprite delovni list
delovni list = delovni zvezek.list_v_indeksu(0)

# Ponovite vrstice in stolpce
zajazvobseg(0,5):
zajvobseg(0,3):
# Natisnite vrednosti celic s presledkom
tiskanje(delovni list.cell_value(i, j),konec=' t')
tiskanje('')

Izhod:

Po izvedbi zgornjega skripta se prikaže naslednji izhod.



Primer 2: Preberite datoteko excel z uporabo openpyxl

The openpyxl je še en modul python za branje datoteke xlsx in privzeto ni nameščen s programom Python. Za zagon tega modula pred uporabo izvedite naslednji ukaz iz terminala.

$pipnamestiteopenpyxl

Po končanem namestitvenem postopku ustvarite datoteko python z naslednjim skriptom, da preberete datoteko sales.xlsx mapa. Tako kot modul xlrd, openpyxl modul ima load_workbook () funkcijo za odpiranje datoteke xlsx za branje. The sales.xlsx file se uporablja kot vrednost argumenta te funkcije. Predmet wookbook.active je bil ustvarjen v skriptu za branje vrednosti datoteke max_row in max_column lastnosti. Te lastnosti so bile uporabljene v ugnezdenih zankah za branje vsebine sales.xlsx mapa. Funkcija range () je bila uporabljena za branje vrstic lista, funkcija iter_cols () pa za branje stolpcev lista. Vsako polje v izhodu bo ločeno z dvema zavihkoma zavihkov.

# Uvozi modul openyxl
uvozite openpyxl

# Določite spremenljivko, da naložite wookbook
wookbook = openpyxl.load_workbook('sales.xlsx')

# Določite spremenljivko za branje aktivnega lista:
delovni list = wookbook.active

# Ponovite zanko za branje vrednosti celic
zajazvobseg(0, delovni list.max_row):
za z vdelovni list.iter_cols(1, delovni list.max_column):
tiskanje(z[jaz].vrednost,konec=' t t')
tiskanje('')

Izhod:

Po izvedbi zgornjega skripta se prikaže naslednji izhod.

Primer 3: Preberite datoteko excel z uporabo pand

Modul pandas ni nameščen s prejšnjim modulom, podobnim pythonu. Torej, če ga niste namestili prej, ga morate namestiti. Zaženite naslednji ukaz, da namestite pande od terminala.

$pipnamestitepande

Po končanem namestitvenem postopku ustvarite datoteko python z naslednjim skriptom, da preberete datoteko sales.xlsx mapa. The read_excel () funkcija pandas se uporablja za branje datoteke xlsx. Ta funkcija je bila v skriptu uporabljena za branje datoteke sales.xlsx mapa. The DataFrame () funkcija je tukaj uporabila za branje vsebine datoteke xlsx v podatkovnem okviru in shranjevanje vrednosti v imenovano spremenljivko podatkov . Vrednost podatkov je bila natisnjena kasneje.

# Uvozi pande
uvoz pandkotpd

# Naložite datoteko xlsx
excel_data = pd.read_excel('sales.xlsx')
# Preberite vrednosti datoteke v podatkovnem okviru
data = pd.DataFrame(excel_data,stolpci=['Datum prodaje','Prodajalec','Znesek'])
# Natisnite vsebino
tiskanje('Vsebina datoteke je: n', podatki)

Izhod:

Po izvedbi zgornjega skripta se prikaže naslednji izhod. Rezultat tega skripta se razlikuje od prejšnjih dveh primerov. Številke vrstic so natisnjene v prvem stolpcu, kjer je vrednost vrstice odšteta od 0. Vrednosti datumov so poravnane na sredini. Imena prodajalcev so poravnana desno. Znesek je poravnan levo.

Zaključek:

Uporabniki pythona morajo delati z datotekami xlsx za različne namene programiranja. V tej vadnici so bili prikazani trije različni načini branja datoteke xlsx z uporabo treh modulov python. Vsak modul ima različne funkcije in lastnosti za branje datoteke xlsx. Ta vadnica bo uporabnikom pythona pomagala, da po branju te vadnice enostavno preberejo datoteko xlsx s skriptom python.