10 labāko datu zinātnes grāmatu saraksts un vispārīgie apraksti

10 Labako Datu Zinatnes Gramatu Saraksts Un Visparigie Apraksti



Datu zinātne ir studiju joma, kas apstrādā milzīgus datu apjomus, izmantojot zinātniskas metodes, procesus, algoritmus un sistēmas, lai atrastu neredzamus modeļus, iegūtu jēgpilnu informāciju, pieņemtu biznesa lēmumus uzņēmumos, kā arī izmantotu ar uzņēmējdarbību nesaistītās iestādēs. Ar uzņēmējdarbību nesaistītās iestādes ietver veselības aprūpes, spēļu, attēlu atpazīšanas, ieteikumu sistēmu, loģistikas, krāpšanas atklāšanas (bankas un finanšu iestādes), interneta meklēšanas, runas atpazīšanas, mērķtiecīgas reklāmas, aviokompāniju maršrutu plānošanas un paplašinātās realitātes nozares. Datu zinātne ir mākslīgā intelekta apakškopa. Dati, kas tiek izmantoti analīzei, var nākt no daudziem dažādiem avotiem un tiek parādīti dažādos formātos. Daži avota dati var būt standartizēti; citi var nebūt standartizēti.

Citiem vārdiem sakot, datu vākšanai tiek izmantotas dažādas metodoloģijas (datuskaits daudzskaitlī). Pēc tam no apkopotajiem datiem tiek iegūtas zināšanas (vērtīgi secinājumi). Šajā procesā pēc datu apkopošanas tiek veikta to (datu) izpēte, lai iegūtu jaunus datus (rezultātus), no kuriem tiek atrisinātas problēmas.







Datu zinātne kā (galvenā) disciplīna pastāv bakalaura un maģistra grāda līmenī universitātē. Tomēr tikai dažas pasaules universitātes piedāvā datu zinātni bakalaura vai maģistra programmā. Bakalaura līmenī students absolvē datu zinātnes grādu. Tas ir kā vispārējas nozīmes grāds. Maģistra grāda līmenī students iegūst pēcdiploma grādu datu zinātnē, kas specializējas datu analīzē, datu inženierijā vai kā datu zinātnieks.



Lasītāju varētu pārsteigt un, iespējams, diemžēl arī tas, ka mašīnmācība, modelēšana, statistika, programmēšana un datu bāzes ir priekšzināšanas, lai studētu datu zinātni bakalaura līmenī, neskatoties uz to, ka tie ir cienījami augstskolu kursi, kas apgūti citas disciplīnas bakalaura vai maģistra līmenī. Neskatoties uz to, kad students dodas uz universitāti, lai studētu datu zinātni grāda līmenī, visi šie kursi joprojām tiks apgūti līdztekus vai pirms atbilstošajiem datu zinātnes kursiem.



Datu zinātne bakalaura grādam vai tā specializācijas, piemēram, datu analīze, datu inženierija vai datu zinātnieks, joprojām tiek izstrādātas; lai gan viņi ir sasnieguši stadiju, ka pēc studijām (universitātē) tos izmanto nozarēs. Datu zinātne kopumā ir salīdzinoši ļoti jauna disciplīna.





Atcerieties, ka, pirms kļūstat par speciālistu, vispirms ir jābūt ģenerālistam. Atšķirības starp speciālistu programmām vēl nav skaidras. Atšķirības starp vispārējām un specializētajām programmām vēl nav skaidras.

Tā kā datu zinātne ir salīdzinoši jauna disciplīna, šajā dokumentā aprakstītās grāmatas ir balstītas uz satura aptvērumu, nevis pedagoģiju (cik labi grāmata māca). Un tie ir paredzēti bakalaura (vispārināta) programmai. Ir dažādi vispārīgie kursi.



Saraksts

Lai iegūtu sīkāku informāciju un iespējamo pirkumu ar kredītkarti, katrai grāmatai ir dota hipersaite. Neviena no grāmatām neaptver visus vispārīgos kursus.

Datu zinātnei nepieciešamā matemātika: aprēķini, statistika, varbūtības teorija un lineārā algebra

Autors: Hadriens Žans

  • Izdevējs: Hadrien Jean
  • Publicēšanas datums: pēc 2020. gada 30. septembra
  • Valoda: angļu
  • Lapu skaits: vairāk nekā 400

Šīs grāmatas saturu var uzskatīt par datu zinātnes matemātikas kursu. Lai gan nav ieteicams pašam apgūt datu zinātni, vidusskolas absolventam, kurš vēlas apgūt datu zinātni pats, vajadzētu sākt ar šo grāmatu.

Saturs: Calculus; Statistika un varbūtība; Lineārā algebra; Skalāri un vektori; Matricas un tenzori; Spin, lineārā atkarība un telpas transformācija; Lineāro vienādojumu sistēmas; Pašvektori un īpašvērtības; Singular Value Dekompozīcija.

https://www.essentialmathfordatascience.com/

Veselā saprāta rokasgrāmata datu struktūrām un algoritmiem: uzlabojiet savas galvenās programmēšanas prasmes / 2. izdevums

Autors: Džejs Vengrovs

  • Izdevējs: Pragmatic Bookshelf
  • Publicēšanas datums: 2020. gada 15. septembris
  • Valoda: angļu
  • Izmēri: 7,5 x 1,25 x 9,25 collas
  • Lapu skaits: 508

Šajā grāmatā ir apskatīti algoritmi un datu struktūras, kas tiek izmantotas datu zinātnē. Pieņemot, ka kāds pēc vidusskolas beigšanas pats apgūst datu zinātni, tad šī ir nākamā grāmata, kas jāizlasa pēc iepriekšējās matemātikas grāmatas izlasīšanas. Programmu piemēri ir sniegti JavaScript, Python un Ruby valodās.

Saturs: Kāpēc datu struktūras ir svarīgas; Kāpēc algoritmi ir svarīgi; Ak Jā! Lielais O apzīmējums; Koda paātrināšana ar Big O; Koda optimizēšana ar lielo O un bez tā; Optimizācija optimistiskiem scenārijiem; Big O ikdienas kodā; Aizraujoša ātra meklēšana ar hash tabulām; Eleganta koda izveide ar skursteņiem un rindām; Rekursīvi Rekursēt ar Rekursiju; Mācīšanās rakstīt rekursīvi; Dinamiskā programmēšana; Ātruma rekursīvie algoritmi; Uz mezgliem balstītas datu struktūras; Visu lietu paātrināšana, izmantojot bināros meklēšanas kokus; Saglabājiet savas prioritātes, izmantojot kaudzes; Trie nesāp; Visu savienošana ar grafikiem; Kosmosa ierobežojumu risināšana; Koda optimizācijas paņēmieni

Gudrāka datu zinātne: panākumi ar uzņēmuma līmeņa datiem un AI projektiem / 1 st Rediģēšana

Autori: Nīls Fišmens, Kols Strikers un Greidijs Būčs

  • Izdevējs: Wiley
  • Publicēšanas datums: 2020. gada 14. aprīlis
  • Valoda: angļu
  • Lapu skaits: 286

Saturs: kāpšana pa mākslīgā intelekta kāpnēm; Ietvera I daļa: apsvērumi organizācijām, kas izmanto AI; II daļa: apsvērumi darbam ar datiem un AI; Atskats uz analīzi: vairāk nekā viens āmurs; Skatieties uz priekšu par analīzi: ne viss var būt kā nagla; Darbības disciplīnu risināšana uz AI kāpnēm; Jūsu datu izmantošanas maksimāla palielināšana: uz vērtību orientēta; Datu novērtēšana ar statistisko analīzi un jēgpilnas piekļuves nodrošināšana; Būvniecība ilgtermiņā; Ceļojuma beigas: IA AI.

Mašīnmācīšanās: varbūtības perspektīva (adaptīvās skaitļošanas un mašīnmācīšanās sērija) ilustrēts izdevums

Autors: Kevins P. Mērfijs

  • Izdevējs: The MIT Press
  • Publicēšanas datums: 2012. gada 24. augusts
  • Valoda: angļu
  • Izmēri: 8,25 x 1,79 x 9,27 collas
  • Lapu skaits: 1104

Šī grāmata ir piemērota iesācējiem. Atkal, tāpat kā visas pārējās šajā dokumentā paredzētās grāmatas, arī šajā grāmatā nav ietverts viss nepieciešamais vispārīgajai programmai, kas diemžēl joprojām nav pabeigta (arī speciālistu programmas joprojām nav pabeigtas). Tipisks iesācējs šeit ir vidusskolas absolvents ar matemātikas un datorzinātņu nokārtojumu.

Saturs: Ievads (Mašīnmācība: kas un kāpēc?, Neuzraudzīta mācīšanās, Daži mašīnmācības pamatjēdzieni); Varbūtība; Ģeneratīvi modeļi diskrētiem datiem; Gausa modeļi; Bajesa statistika; Frekvenču statistika; Lineārā regresija; Loģistiskā regresija; Vispārinātie lineārie modeļi un eksponenciālā saime; Režisēti grafiskie modeļi (Bayes tīkli); Maisījumu modeļi un EM algoritms; Latentie lineārie modeļi; Reti lineāri modeļi; Kodoli; Gausa procesi; Adaptīvie bāzes funkciju modeļi; Markovs un slēptie Markova modeļi; Valsts telpas modeļi; Neorientēti grafiskie modeļi (Markova izlases lauki); Precīzs secinājums grafiskajiem modeļiem; Variāciju secinājumi; Vairāk variāciju secinājumu; Montekarlo secinājums; Markova ķēdes Monte Carlo (MCMC) secinājums; Klasterizācija; Grafiskā modeļa struktūras apguve; Slēptie mainīgo modeļi diskrētiem datiem; Dziļa mācīšanās.

Datu zinātne uzņēmumiem: kas jums jāzina par datu ieguvi un datu analītisko domāšanu / 1. izdevums

Autori: Toms Fosets un Fosters Provosts

  • Izdevējs: O'Reilly Media
  • Publicēšanas datums: 2013. gada 17. septembris
  • Valoda: angļu
  • Izmēri: 7 x 0,9 x 9,19 collas
  • Lapu skaits: 413

Saturs: datu analītiskā domāšana; Biznesa problēmas un datu zinātnes risinājumi; Ievads paredzamajā modelēšanā: no korelācijas līdz uzraudzītai segmentācijai; Modeļa pielāgošana datiem; Pārmērīga pielāgošana un izvairīšanās no tā; līdzība, kaimiņi un kopas; Lēmumu analītiskā domāšana I: kāds ir labs modelis?; Modeļa veiktspējas vizualizācija; Pierādījumi un varbūtības; Teksta attēlošana un ieguve; Lēmumu analītiskā domāšana II: ceļā uz analītisko inženieriju; Citi datu zinātnes uzdevumi un paņēmieni; Datu zinātne un uzņēmējdarbības stratēģija; Secinājums.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

Praktiska statistika datu zinātniekiem: vairāk nekā 50 būtiski jēdzieni, izmantojot R un Python / 2. izdevums

Autori: Pīters Brūss, Endrjū Brūss un Pīters Gedeks

  • Izdevējs: O'Reilly Media
  • Publicēšanas datums: 2020. gada 2. jūnijs
  • Valoda: angļu
  • Izmēri: 7 x 0,9 x 9,1 collas
  • Lapu skaits: 368

Saturs: izpētes datu analīze, datu un paraugu sadalījums, statistiskie eksperimenti un nozīmīguma pārbaude, regresija un prognozēšana, klasifikācija, statistikas mašīnmācīšanās, bez uzraudzības.

Grāmata Kāpēc: jaunā zinātne par cēloņiem un sekām

Autores: Judea Pearl, Dana Mackenzie

  • Izdevējs: Basic Book
  • Publicēšanas datums: 2018. gada 15. maijs
  • Valoda: angļu
  • Izmēri: 6,3 x 1,4 x 9,4 collas
  • Lapu skaits: 432

Lai gan daudzās Datu zinātnes grāmatās ilustrācijai izmantota tīrā uzņēmējdarbības nozare, šajā grāmatā ilustrācijai izmantota medicīnas nozare un citas disciplīnas.

Saturs: Ievads: Mind over Data; Cēloņsakarības kāpnes; No Buccaneers līdz jūrascūciņām: Cēloņsavienojuma ģenēze; No pierādījumiem līdz cēloņiem: Reverend Bayes Meets Mr Holmes; Sajaukšana un atjaukšana: vai, slēpjošā mainīgā nogalināšana; Dūmu pilnās debates: gaisa attīrīšana; Paradoksu pārpilnība!; Beyond Adjustment: The Conquest of Mount Intervention; Kontrafaktuāli: ieguves pasaules, kas varēja būt; Starpniecība: mehānisma meklēšana; Lielie dati, mākslīgais intelekts un lielie jautājumi.

Veidojiet karjeru datu zinātnē

Autores: Emīlija Robinsone un Žaklīna Nolisa

  • Izdevējs: Manning
  • Publicēšanas datums: 2020. gada 24. marts
  • Valoda: angļu
  • Izmēri: 7,38 x 0,8 x 9,25 collas
  • Lapu skaits: 354

Saturs: Darba sākšana ar datu zinātni; Datu zinātnes darba atrašana; Iedzīvošanās datu zinātnē; Pieaug jūsu datu zinātnes lomai.

https://www.manning.com/books/build-a-career-in-data-science

Datu zinātne manekeniem / 2. izdevums

Autore: Lillian Pierson

  • Izdevējs: For Dummies
  • Publicēšanas datums: 2017. gada 6. marts
  • Valoda: angļu
  • Izmēri: 7,3 x 1 x 9 collas
  • Lapu skaits: 384

Šajā grāmatā tiek pieņemts, ka lasītājam jau ir matemātikas un programmēšanas iepriekš nepieciešamās zināšanas.

Saturs: Datu zinātne; Datu inženierijas cauruļvadu un infrastruktūras izpēte; Datu vadītu ieskatu izmantošana uzņēmējdarbībā un rūpniecībā; Mašīnmācīšanās: mācīšanās no datiem, izmantojot jūsu mašīnu; Matemātikas, varbūtību un statistiskā modelēšana; Klasterizācijas izmantošana datu sadalīšanai; Modelēšana ar gadījumiem; Modeļu veidošana, kas darbojas ar lietiskā interneta ierīcēm; Datu vizualizācijas dizaina principu ievērošana; D3.js izmantošana datu vizualizācijai; Tīmeklī balstītas lietojumprogrammas vizualizācijas projektēšanai; Informācijas paneļa dizaina paraugprakses izpēte; Karšu veidošana no telpiskajiem datiem; Python izmantošana datu zinātnei; Atvērtā koda R izmantošana datu zinātnei; SQL izmantošana datu zinātnē; Datu zinātnes veikšana ar Excel un Knime; Datu zinātne žurnālistikā: piecu W (un H) noteikšana; Iedziļināšanās vides datu zinātnē; Datu zinātne e-komercijas izaugsmes veicināšanai; Datu zinātnes izmantošana, lai aprakstītu un prognozētu noziedzīgu darbību; Desmit fenomenāli atvērto datu resursi; Desmit bezmaksas datu zinātnes rīki un lietojumprogrammas.

Lielu datu kopu ieguve / 3 rd Rediģēšana

Autori: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Izdevējs: Cambridge University Press
  • Publicēšanas datums: 2020. gada 13. februāris
  • Valoda: angļu
  • Izmēri: 7 x 1 x 9,75 collas
  • Lapu skaits: 565

Šajā grāmatā ir arī pieņemts, ka lasītājam jau ir matemātikas un programmēšanas iepriekš nepieciešamās zināšanas.

Saturs: datu ieguve; MapReduce un jaunā programmatūras Stack; Algoritmi, izmantojot MapReduce; līdzīgu priekšmetu atrašana; Datu straumju ieguve; saišu analīze; Bieži vienumu komplekti; Klasterizācija; Reklāma tīmeklī; Ieteikumu sistēmas; Sociālo tīklu grafiku ieguve; Izmēru samazināšana; Liela mēroga mašīnmācība.

Secinājums

Atšķirības starp speciālistu programmām vēl nav skaidras. Arī atšķirības starp vispārējām un specializētajām programmām vēl nav skaidras. Tomēr pēc dotā grāmatu saraksta izlasīšanas lasītājs varēs labāk novērtēt datu analītiķa, datu inženierijas un datu zinātnieka īpašās lomas un pēc tam virzīties uz priekšu.