Kome je namenjena knjiga R - analiza podataka

 

 

  • Twitter
  • Facebook
  • Google plus
  • Linkedin
  • Pinterest
  • Email

 

Pregleda (30 dana / ukupno): 10 / 915

Kome je namenjena ova knjiga

r-analiza-podataka-sajt-eknjiga

VIŠE O KNJIZI.

Ako prvi put učite analizu podataka ili, pak, želite da poboljšate znanje koje već imate, ova knjiga će se pokazati dragocenim izvorom. Ako tražite knjigu koje će vas voditi od osnova do primene naprednih i efikasnih analitičkih metodologija i ako imate neko prethodno iskustvo u programiranju i matematici, onda je ova knjiga za vas.

Šta obuhvata ova knjiga?

Poglavlje 1, Osnove programskog jezika R, sadrži pregled aspekata R-a koje ćete morati da upoznate zbog sledećih poglavlja. Ovde učimo osnove R sintakse i osnovne strukture podataka R-a, pišemo funkcije, učitavamo podatke i instaliramo pakete.

U Poglavlju 2, Oblik podataka, razmatraju se univarijacioni podaci. Naučićete različite tipove podataka, opisivanje jedinstvenih podataka i vizuelizovanje oblika podataka.

Poglavlje 3, Opis veza, obuhvata multivarijacione podatke. Konkretno, naučićete tri osnovne klase bivarijacionih veza i njihov opis.

U Poglavlju 4, Verovatnoća, naučićete osnove teorije verovatnoće, Bajesovu teoremu i distribuciju verovatnoće.

U Poglavlju 5, Korišćenje podataka za uzorkovanje i procenu, razmatra se teorija uzorkovanja i procene. Pomoću primera naučićete centralnu graničnu teoremu, procenu parametara i intervale poverenja.

U Poglavlju 6, Testiranje hipoteza, predstavljeno je testiranje nulte hipoteze (NHST – Null Hypothesis Significance Testing). Naućićete mnogo popularnih testova hipoteza i njihove neparametarske alternative. Možda je najvažnije je da ćete razotkriti zablude o NHST-u.

U Poglavlju 7, Bajesove metode, predstavljena je alternativa za NHST koja se zasniva na intuitivnijem prikazu verovatnoće. Takođe ćete upoznati prednosti i nedostatke ovog pristupa.

U Poglavlju 8, Bootstrap, opisan je još jedan pristup za NHST pomoću tehnike pod nazivom ponovno uzorkovanje (resampling). Upoznaćete prednosti i nedostatke ovog pristupa. Osim toga, ovo poglavlje služi kao odlična nadgradnja sadržaja iz poglavlja 5 i 6.

U Poglavlju 9, Predviđanje kontinualnih promenljivih, započinjemo još jednu novu lekciju o prediktivnoj analitici i detaljno razmatramo linearnu regresiju. Naučićete sve što je potrebno o ovoj tehnici, kada da je koristite i na koje „zamke“ treba da obratite pažnju.

U Poglavlju 10, Predviđanje kategorijskih promenljivih, predstavljene su četiri najpopularnije tehnike klasifikacije. Koristićemo sve četiri tehnike u svim primerima, zahvaljujući čemu ćete shvatiti zašto je svaka od njih sjajna.

U Poglavlju 11, Predviđanje promena tokom vremena, završavamo lekciju o prediktivnoj analitici i predstavljamo analizu vremenskog niza i prognozu. Na kraju, razmatramo osnove jednog od odličnih metoda prognoze vremenskog niza.

Poglavlje 12, Izvori podataka, počinje lekcijom u kojoj je opisana analiza podataka u stvarnom svetu. Razmatra se upotreba različitih izvora podataka u R-u. Konkretno, naučićete kako da se povežete sa bazom podataka i da zahtevate i učitate JSON i XML pomoću primera.

U Poglavlju 13, Upravljanje nedostajućim podacima, opisani su nedostajući podaci, način za identifikovanje tipa nedostajućih podataka i dve osnovne metode za upravljanje njima.

U Poglavlju 14, Upravljanje neurednim podacima, predstavljeni su neki od problema u vezi sa korišćenjem nesavršenih podataka u praksi. Ovo obuhvata proveru neočekivanih unosa, korišćenje regexa i proveru valjanosti podataka pomoću paketa assertr.

U Poglavlju 15, Upravljanje velikim podacima, razmatrane su neke od tehnika koje mogu da se koriste za skupove podataka veće od podataka kojima se može brzo upravljati bez nekog planiranja. Ključni elementi ovog poglavlja su paralelizacija i Rcpp.

U Poglavlju 16, Korišćenje popularnih R paketa, potvrđujemo da smo već koristili mnogo popularnih paketa u ovoj lekciji, ali popunjavamo neke praznine i predstavljamo neke od najsavremenijih paketa, zahvaljujući kojima brzina i jednostavnost korišćenja postaju prioritet.

U Poglavlju 17, Reproducibilnost i najbolje tehnike, završavamo razmatranje izuzetno važne (ali često ignorisane) teme - kako da R koristite kao profesionalac. Ovo obuhvata učenje alatki, organizacije i reproducibilnosti.

Izvucite maksimum iz ove knjige

Kompletan kod u ovoj knjizi je napisan za najnoviju verziju R-a 3.4.3 u vreme pisanja ove knjige. Najbolje bi bilo da ažurirate R verziju, ali skoro ceo kod bi trebalo da funkcioniše u svakoj skorijoj verziji R-a. Neki R paketi koje ćemo instalirati ipak zahtevaju najnovije verzije. Za druge softvere koji su upotrebljeni u ovoj knjizi uputstva će biti navedena prema potrebi. Međutim, ako želite da budete u startnoj prednosti, instalirajte Rstudio, JAGS i C++ kompajler (ili Rtools ako koristite Windows).

 

Budite prvi koji će ostaviti komentar.

Ostavite komentar Ostavite komentar