Seznam 10 najboljših knjig o podatkovni znanosti in opisov za splošne strokovnjake

Seznam 10 Najboljsih Knjig O Podatkovni Znanosti In Opisov Za Splosne Strokovnjake



Podatkovna znanost je področje študija, ki obdeluje ogromne količine podatkov z uporabo znanstvenih metod, procesov, algoritmov in sistemov za iskanje nevidnih vzorcev, pridobivanje pomembnih informacij, sprejemanje poslovnih odločitev v podjetjih in tudi uporabo v neposlovnih ustanovah. Neposlovne ustanove vključujejo panoge za zdravstvo, igre na srečo, prepoznavanje slik, sisteme priporočil, logistiko, odkrivanje goljufij (bančne in finančne institucije), internetno iskanje, prepoznavanje govora, ciljno oglaševanje, načrtovanje letalskih poti in razširjeno resničnost. Podatkovna znanost je podmnožica umetne inteligence. Podatki, ki se uporabljajo za analizo, lahko prihajajo iz številnih različnih virov in so predstavljeni v različnih formatih. Nekateri izvorni podatki so lahko standardizirani; drugi morda niso standardizirani.

Povedano drugače, za zbiranje podatkov se uporabljajo različne metodologije (množina podatka). Nato se iz zbranih podatkov izlušči znanje (dragoceni sklepi). Pri tem se po zbranih podatkih (podatkih) izvede raziskava, da se pridobijo novi podatki (rezultati), iz katerih se rešujejo problemi.







Podatkovna znanost kot (glavna) disciplina obstaja na ravni dodiplomskega in magistrskega študija na univerzi. Vendar le nekaj univerz na svetu ponuja znanost o podatkih na diplomi ali magistru. Na stopnji Bachelor's Degree študent diplomira z diplomo Data Science. To je kot diploma za splošne namene. Na stopnji magistrskega študija študent zapusti podiplomski študij podatkovne znanosti, specializiran za podatkovno analitiko, podatkovno inženirstvo ali kot podatkovni znanstvenik.



Bralca bi lahko presenetilo in morda na žalost, da so strojno učenje, modeliranje, statistika, programiranje in podatkovne baze predpogojno znanje za študij podatkovne znanosti na stopnji diplome kljub dejstvu, da so sami po sebi spoštovani univerzitetni predmeti, ki se jih študira v druge discipline na diplomski ali magistrski ravni. Ne glede na to, ko gre študent na univerzo, da bi študiral podatkovno znanost na stopnji stopnje, bodo vsi ti predmeti še vedno študirani poleg ali pred ustreznimi predmeti podatkovne znanosti.



Podatkovna znanost za diplomo ali njene specializacije, kot so podatkovna analitika, podatkovni inženiring ali kot podatkovni znanstvenik, se še vedno razvijajo; čeprav so dosegli stopnjo, da se po študiju (na univerzi) uporabljajo v panogah. Podatkovna znanost je na splošno razmeroma zelo nova disciplina.





Ne pozabite, da bi morali najprej biti generalist, preden postanete specialist. Razlike med specialističnimi programi še niso jasne. Razlike med splošnimi in specialističnimi programi še niso jasne.

Ker je Data Science relativno nova disciplina, knjige, predpisane v tem dokumentu, temeljijo na pokritosti vsebine in ne na pedagogiki (kako dobro knjiga poučuje). In so za program Bachelor's Degree (generalist). Obstajajo različni splošni tečaji.



Seznam

Za več podrobnosti in možen nakup s kreditno kartico je navedena hiperpovezava za vsako od knjig. Nobena knjiga ne pokriva vseh splošnih tečajev.

Bistvena matematika za znanost o podatkih: račun, statistika, teorija verjetnosti in linearna algebra

Napisal: Hadrien Jean

  • Založnik: Hadrien Jean
  • Datum objave: po 30. septembru 2020
  • Jezik: angleščina
  • Število strani: več kot 400

Vsebino te knjige lahko razumemo kot tečaj matematike za podatkovno znanost. Čeprav se podatkovne znanosti ni priporočljivo učiti sam, bi moral maturant, ki se želi sam naučiti podatkovne znanosti, začeti s to knjigo.

Vsebina: Računstvo; Statistika in verjetnost; Linearna algebra; Skalarji in vektorji; Matrike in tenzorji; Razpon, linearna odvisnost in prostorska transformacija; Sistemi linearnih enačb; Lastni vektorji in lastne vrednosti; Razčlenitev singularne vrednosti.

https://www.essentialmathfordatascience.com/

Zdravorazumski vodnik po podatkovnih strukturah in algoritmih: nadgradite svoje temeljne programske veščine / 2. izdaja

Napisal: Jay Wengrow

  • Založnik: Pragmatic Bookshelf
  • Datum objave: 15. september 2020
  • Jezik: angleščina
  • Dimenzije: 7,5 x 1,25 x 9,25 palcev
  • Število strani: ‎508

Ta knjiga obravnava algoritme in podatkovne strukture, ki se uporabljajo v podatkovni znanosti. Ob predpostavki, da se nekdo po končani srednji šoli sam uči Data Science, potem je to naslednja knjiga, ki jo je treba prebrati po prejšnji matematični knjigi. Primeri programov so podani v JavaScriptu, Pythonu in Rubyju.

Vsebina: Zakaj so podatkovne strukture pomembne; Zakaj so algoritmi pomembni; O ja! Zapis velike O; Pospešitev kode z velikim O; Optimiziranje kode z velikim O in brez njega; Optimizacija za optimistične scenarije; Big O v vsakdanji kodi; Izjemno hitro iskanje z zgoščenimi tabelami; Izdelava elegantne kode z nizi in čakalnimi vrstami; Rekurzivno Rekurzija z rekurzijo; Učenje rekurzivnega pisanja; dinamično programiranje; Rekurzivni algoritmi za hitrost; Podatkovne strukture, ki temeljijo na vozliščih; Pospešitev vseh stvari z binarnimi iskalnimi drevesi; Ohranjanje prioritet s kopicami; Ne boli poskusiti; Povezovanje vsega z grafi; Ukvarjanje s prostorsko stisko; Tehnike za optimizacijo kode

Pametnejša znanost o podatkih: Uspeh s projekti podatkov in umetne inteligence na ravni podjetja / 1 st Urejanje

Napisali: Neal Fishman, Cole Stryker in Grady Booch

  • Založnik: Wiley
  • Datum objave: 14. april 2020
  • Jezik: angleščina
  • Število strani: ‎286

Vsebina: Plezanje po lestvi AI; Okvir I. del: Premisleki za organizacije, ki uporabljajo umetno inteligenco; Uokvirjanje II. del: Premisleki za delo s podatki in umetno inteligenco; Pogled nazaj na analitiko: Več kot eno kladivo; Pogled naprej glede analitike: ni vse lahko žebelj; Obravnava operativnih disciplin na lestvici AI; Povečanje uporabe vaših podatkov: vodenje vrednosti; Vrednotenje podatkov s statistično analizo in omogočanje smiselnega dostopa; Dolgoročna gradnja; Konec potovanja: IA za AI.

Strojno učenje: verjetnostna perspektiva (serija Adaptive Computation and Machine Learning) Ilustrirana izdaja

Napisal: Kevin P. Murphy

  • Založnik: The MIT Press
  • Datum objave: 24. avgust 2012
  • Jezik: angleščina
  • Dimenzije: 8,25 x 1,79 x 9,27 palcev
  • Število strani: ‎1104

Ta knjiga je dobra za začetnike. Ponovno, tako kot vse ostale knjige, predpisane v tem dokumentu, ta knjiga ne zajema vsega, kar je potrebno za splošni program, ki žal še ni dokončan (tudi specialistični programi še niso dokončani). Tipičen začetnik tukaj je srednješolski maturant z uspehom iz matematike in računalništva.

Vsebina: Uvod (Strojno učenje: kaj in zakaj?, Nenadzorovano učenje, Nekateri osnovni koncepti strojnega učenja); Verjetnost; Generativni modeli za diskretne podatke; Gaussovi modeli; Bayesova statistika; Frekventna statistika; Linearna regresija; Logistična regresija; Posplošeni linearni modeli in eksponentna družina; Usmerjeni grafični modeli (Bayesove mreže); Modeli zmesi in EM algoritem; Latentni linearni modeli; Redki linearni modeli; jedrca; Gaussovi procesi; Prilagodljivi osnovni funkcijski modeli; Markov in skriti Markov modeli; modeli prostora stanja; Neusmerjeni grafični modeli (Markovska naključna polja); Natančno sklepanje za grafične modele; Variacijsko sklepanje; Več variacijskega sklepanja; Monte Carlo sklepanje; Markovljeva veriga Monte Carlo (MCMC) sklepanje; grozdenje; Učenje strukture grafičnega modela; modeli latentnih spremenljivk za diskretne podatke; Globoko učenje.

Podatkovna znanost za podjetja: Kaj morate vedeti o podatkovnem rudarjenju in podatkovno-analitičnem razmišljanju / 1. izdaja

Napisala: Tom Fawcett in Foster Provost

  • Založnik: O’Reilly Media
  • Datum objave: 17. september 2013
  • Jezik: angleščina
  • Dimenzije: 7 x 0,9 x 9,19 palcev
  • Število strani: ‎413

Vsebina: Podatkovno-analitično razmišljanje; Poslovne težave in rešitve podatkovne znanosti; Uvod v napovedno modeliranje: od korelacije do nadzorovane segmentacije; Prilagajanje modela podatkom; Prekomerno opremljanje in izogibanje temu; Podobnost, sosedje in grozdi; Odločitveno analitično razmišljanje I: Kaj je dober model?; Vizualizacija delovanja modela; Dokazi in verjetnosti; Predstavljanje in rudarjenje besedila; Odločitveno analitično razmišljanje II: proti analitičnemu inženirstvu; Druge naloge in tehnike podatkovne znanosti; Podatkovna znanost in poslovna strategija; Zaključek.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

Praktična statistika za podatkovne znanstvenike: 50+ bistvenih konceptov z uporabo R in Pythona / 2. izdaja

Napisali: Peter Bruce, Andrew Bruce in Peter Gedeck

  • Založnik: O’Reilly Media
  • Datum objave: 2. junij 2020
  • Jezik: angleščina
  • Dimenzije: 7 x 0,9 x 9,1 palcev
  • Število strani: ‎368

Vsebina: Raziskovalna analiza podatkov, porazdelitve podatkov in vzorčenja, statistični poskusi in testiranje pomembnosti, regresija in napovedovanje, klasifikacija, statistično strojno učenje, nenadzorovano učenje.

Knjiga Zakaj: Nova znanost o vzroku in posledici

Avtor: Judea Pearl, Dana Mackenzie

  • Založnik: Basic Book
  • Datum objave: 15. maj 2018
  • Jezik: angleščina
  • Dimenzije: 6,3 x 1,4 x 9,4 palca
  • Število strani: ‎432

Medtem ko veliko knjig Data Science za ilustracijo uporablja čisto poslovno industrijo, ta knjiga za ilustracijo uporablja medicinsko industrijo in druge discipline.

Vsebina: Uvod: Mind over Data; Lestev vzročnosti; Od bukanirjev do zamorcev: Geneza vzročnega sklepanja; Od dokazov do vzrokov: Prečastiti Bayes sreča g. Holmesa; Confounding and Deconfounding: Or, Slaying the Lurking Variable; Dimna razprava: Očiščenje zraka; Paradoksov na pretek!; Beyond Adjustment: The Conquest of Mount Intervention; Protidejstva: rudarski svetovi, ki bi lahko bili; Mediacija: iskanje mehanizma; Veliki podatki, umetna inteligenca in velika vprašanja.

Zgradite kariero v podatkovni znanosti

Avtorja: Emily Robinson in Jacqueline Nolis

  • Založnik: Manning
  • Datum objave: 24. marec 2020
  • Jezik: angleščina
  • Dimenzije: 7,38 x 0,8 x 9,25 palcev
  • Število strani: ‎354

Vsebina: Kako začeti s podatkovno znanostjo; Iskanje zaposlitve v znanosti o podatkih; Ustalitev v podatkovni znanosti; Rast v vaši vlogi Data Science.

https://www.manning.com/books/build-a-career-in-data-science

Podatkovna znanost za telebane / 2. izdaja

Napisala: Lillian Pierson

  • Založnik: For Dummies
  • Datum objave: 6. marec 2017
  • Jezik: angleški
  • Dimenzije: 7,3 x 1 x 9 palcev
  • Število strani: ‎384

Ta knjiga predpostavlja, da bralec že ima predhodno zahtevano znanje matematike in programiranja.

Vsebina:  Wrapping Your Head around Data Science; Raziskovanje cevovodov in infrastrukture podatkovnega inženiringa; Uporaba podatkovno usmerjenih vpogledov v podjetja in industrijo; Strojno učenje: Učenje iz podatkov z vašo napravo; Matematika, verjetnostno in statistično modeliranje; Uporaba združevanja v skupine za razdelitev podatkov; Modeliranje z instancami; Gradnja modelov, ki upravljajo naprave interneta stvari; Sledenje načelom oblikovanja vizualizacije podatkov; Uporaba D3.js za vizualizacijo podatkov; Spletne aplikacije za oblikovanje vizualizacije; Raziskovanje najboljših praks pri oblikovanju nadzorne plošče; Izdelava zemljevidov iz prostorskih podatkov; Uporaba Pythona za podatkovno znanost; Uporaba odprtokodnega R za podatkovno znanost; Uporaba SQL v podatkovni znanosti; Delanje podatkovne znanosti z Excelom in Knime; Data Science in Journalism: Nailing Down the Five Ws (and an H); Poglabljanje v znanost o okoljskih podatkih; Znanost o podatkih za spodbujanje rasti v e-trgovini; Uporaba podatkovne znanosti za opisovanje in napovedovanje kriminalnih dejavnosti; Deset fenomenalnih virov za odprte podatke; Deset brezplačnih orodij in aplikacij za znanost podatkov.

Rudarjenje ogromnih naborov podatkov / 3 rd Urejanje

Written by: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Založnik: Cambridge University Press
  • Datum objave: 13. februar 2020
  • Jezik: angleški
  • Dimenzije: 7 x 1 x 9,75 palcev
  • Število strani: ‎565

Ta knjiga prav tako predpostavlja, da bralec že ima predhodno zahtevano znanje matematike in programiranja.

Vsebina: podatkovno rudarjenje; MapReduce in nov sklad programske opreme; Algoritmi, ki uporabljajo MapReduce; Iskanje podobnih predmetov; Podatkovni tokovi rudarjenja; Analiza povezav; Pogosti nabori predmetov; grozdenje; Oglaševanje na spletu; Priporočilni sistemi; Grafi družbenih omrežij rudarjenja; Zmanjšanje dimenzionalnosti; Strojno učenje velikega obsega.

Zaključek

Razlike med specialističnimi programi še niso jasne. Prav tako še niso jasne razlike med splošnimi in specialističnimi programi. Vendar pa bo bralec po branju podanega seznama knjig bolje razumel posebne vloge podatkovnega analitika, podatkovnega inženiringa in podatkovnega znanstvenika ter se nato pomaknil naprej.