st

Published on March 2017 | Categories: Documents | Downloads: 36 | Comments: 0 | Views: 514
of 17
Download PDF   Embed   Report

Comments

Content

SKRIPTA IZ STATISTIKE – 1.KOLOKVIJ 1. POGLAVLJE: PRIKUPLJANJE PODATAKA - Statističke alate i metode široko primjenjuju menadžeri iz svih područja djelovanja u: poslovanju, gospodarstvu, administraciji, politici. U ekonomiji značajne su: gospodarska statistika i poslovna statistika. 1.Gospodarska statistika kao predmet izučavanja ima makroekonomske podatke. Obuhvaća metode za njihovo prikupljanje kao i metode za izračunavanje, tumačenje i pravilno korištenje makroekonomskih indikatora pomoću kojih se mogu donositi utemeljeni zaključci odluke i izrađivati prognoze vezane za gospodarstvo države, regije, djelatnosti, ... - Službena statistika Hrvatske već je započela neophodnu harmonizaciju s metodologijama Europskog statističkog sustava - ESS (European Statistical System - ESS). Neki od primjera: Anketa radne snage –ARS, Anketa o potrošnji kućanstava –APK, Procjeni dohotka i životnih uvjeta privatnih kućanstva. Državni zavod za statistiku Republike Hrvatske (DZS RH,www.dzs.hr ) harmonizirao je istraživačke metodologije s metodologijama ESS-a, tj. Europskog statističkog ureda EUROSTAT-a. -Razvijen je novi statistički teritorijalni ustroj EU. Europska unija je podijeljena na statističke regije prema NUTS-u, koji predstavlja EUROSTAT-ov sustav nomenklature statističkih prostornih jedinica s višestrukim razinama kodova (Nomenclature of territorial units for statistics- NUTS). Cijela Hrvatska (oko 4,4milijuna stanovnika) je jedna NUTS I. regija (3.000.000 do 7.000.000). Hrvatska je podijeljena na tri statističke regije druge razine NUTS II. (800.000 do 3.000.000) i to su: 1. Regija Sjeverozapadna Hrvatska, 2. Regija Središnja Hrvatska i Istočna (Panonska) Hrvatska 3. Regija Jadranska Hrvatska. 2.Poslovna statistika se definira kao znanost o metodama koje se koriste za pretvaranje podataka u smislene informacije u poslovnom okruženju sa svrhom stjecanja znanja za uspješnije odlučivanje i prognoziranje u uvjetima neizvjesnosti i rizika. Ona predstavlja skup metoda za: 1. prikupljanje, sažimanje, odnosno uređivanje poslovnih podataka, 2. za obradu i analiziranje tih podataka 3. te za prikazivanje i tumačenje rezultata statističke analize. Metode su primjenjive u različitim područjima poslovanja kao npr.: 1. razvoj i proizvodnja, npr. za razvoj proizvoda i unapređenje procesa, 2. financije i upravljanje financijskim rizicima, npr. za financijsko planiranje i analizu, za uočavanja koeficijenata koji ukazuju na probleme ili na mogućnosti investiranja, 3. za analizu rizika ulaganja, 4. marketing, npr. za istraživanje tržišta i provedbu marketinške kampanje, 5. prodaja, npr. za analizu uspješnosti prodaje po prodajnim područjima, za prognoziranje prodaje. - Elementi ili članovi neke cjeline ili dijela, su subjekti ili objekti, primjerice osobe, poslovni subjekti, proizvodi, općine ili sl., o kojima se prikupljaju informacije. - Varijable su značajke koje se izučavaju, a koje podrazumijevaju različite vrijednosti za različite elemente. Te se vrijednosti nazivaju podacima. Nasuprot varijablama, konstante imaju nepromjenjive vrijednosti. - Podaci su opažanja ili mjerenja vezana za jednu varijablu, koja je predmet izučavanja statistike i koja povezuje istraživane elemente. Za svaki element izučavanja jedna varijabla će primiti određeni oblik ili određenu vrijednost, odnosno podatak. Izvori podataka i statistička analiza -Izvori podataka: I. primarni, sekundarni ili II. interni (unutarnji), eksterni (vanjski)

1

Mogu se pojaviti u različitim oblicima: u obliku publikacija i u elektroničkom obliku, kao baze podataka i poslovni registri (Registar poslovnih subjekata RH, Registar financijskih izvještaja). -Statistička analiza može biti: jednodimenzionalna analiza ili dvo-i višedimenzionalna, ako nas zanimaju odnos, povezanost,odnosno ovisnost između dviju ili više varijabli. -Sekundarni izvori podataka – u njih spadaju svi oni izvori koje mi koristimo za naše istraživanje a da i nismo sami prikupili na terenu i obradili nego je to učinio netko drugi, a mi se samo koristimo rezultatom tih tuđih istraživanja. Neki primjeri: €Državni zavod za statistiku Republike Hrvatske (DZS RH): http://www.dzs.hr, €Hrvatska narodna banka: http://www.hnb.hr, €Hrvatska gospodarska komora: http://www.hgk.hr, €Ministarstvo financija Republike Hrvatske: http://www.mfin.hr, €Hrvatska agencija za nadzor financijskih usluga- http://www.hanfa.hr, €Zagrebačka burza: http://www.zse.hr, €EUROSTAT -Primarni izvori podataka - su originalna, empirijska kvantitativna istraživanja koja provodimo mi sami. Razlikujemo: (1) anketna istraživanja (2) istraživanja pomoću pokusa (3) kontrolirana neposredna opažanja -Vrste podataka s obzirom na dizajn istraživanja: 1. anketni podaci dobiveni su primjenom dizajna ankete; telefonskim intervjuom, osobnim intervjuom, poštanskom metodom (slanje anketa putem pošte) 2. eksperimentalni podaci rezultat su primjene dizajna eksperimenta 3. opaženi podaci koji su prikupljeni dizajnom kontroliranih opažanja

1.

Anketni podaci - anketa se definira kao vrsta statističkog istraživanja koje proučava agregate jedinica, najčešće ljudi, ekonomskih ili društvenih institucija pomoću anketnog upitnika u popisu ili na statističkom uzorku jedinica. Cilj je izabrati reprezentativni uzorak jedinica i doći do što točnijih anketnih podataka sa svrhom daljnje obrade podataka. S obzirom na način prikupljanja razlikujemo: I.Anketa uz pomoć anketara: telefonskim intervjuom ili osobnim intervjuom II.Anketa bez anketara: poštanskom metodom ( klasična, mail ili Web anketa). Vrste anketnih pitanja: €1. Zatvorena pitanja s ponuđenim odgovorima: višestruki odgovori (a, b, c) ili dihotomni (samo 2 moguća odgovora); jednostavno se obrađuju. €2. Otvorena (teško ih je analizirati) €3. Demografska pitanja o karakteristikama ispitanika ili jedinice analize (prebivalište, dob) €4. Filterska pitanja za izdvajanje kvalificiranog sugovornika u intervju (jeste li zaposleni – ako je odgoor ne dalje anketu ne mora ni popunjavati ispitanik jer se anketa odnosi samo na zaposlene).

2.

Eksperimentalni podaci rezultat su primjene dizajna eksperimenta. U dizajnu eksperimenta sistematski se variraju faktori inputa koji se mogu kontrolirati te se određuju učinci koje ti faktori imaju na parametre izlaznog proizvoda. Naglasimo da je dizajn eksperimenta takav eksperiment u kojem analitičar kontrolira koji tretmani i kako se koriste. Primjerice, to je posebno korisna metoda u fazi razvoja proizvoda ili u fazi razrade promidžbene kampanje. Kod eksperimentalnih istraživanja, važne su unutarnja i vanjska

2

valjanost podataka. Interna valjanost eksperimentalnog istraživanja važna je u situacijama u kojima se uspoređuje ponašanje dvije ili više skupina ispitanika. Eksterna valjanost osigurava da se rezultati eksperimenta mogu primijeniti na širu populaciju.

3.

Opaženi podaci dobiveni su izravnim kontroliranim opažanjem. Primjerice, promatranja kupaca u određenim situacijama u trgovini je metoda tzv. tajnoga kupca.€

-Populacija je potpuni skup svih jedinica ili svih podataka koje zanimaju istraživača. Veličina ili opseg populacije, označena s N, najčešće je konačna, a može biti veoma velika, pa i beskonačna. -Uzorak je izabrani podskup populacije, a njegova je veličina označena s n. Veličina uzorka obično je značajno manja od veličine populacije, te omogućava veću brzinu i manje troškove prikupljanja podataka. Ako je uzorak slučajan, on čini temelj inferencijalne statistike. -Ciljana populacija nije uvijek jednaka onoj koja je dostupna, pa se ova druga naziva populacijom iz koje biramo uzorak. Stvarno istraživana populacija pokrivena je tzv. okvirom izbora uzorka. Iz statističkog uzorka, koji je po pravilu izabran kao nepristran, zaključci se smiju poopćavati samo na istraživanu populaciju iz koje je uzorak zaista i izabran. Primjeri populacija: 1. Objekti: računi, narudžbe, poluproizvodi, konačni, proizvodi, dionice, strojevi, proizvodi, stanovi 2. Osobe: punoljetni građani, studenti, zaposlenici, nezaposlene osobe, menadžeri, kućanstva 3. Poslovni subjekti: obrti, mala poduzeća, srednje velika poduzeća, velika poduzeća, poslovne jedinice, pogoni, dućani, poslovnice 4. Pojave: transakcije, kupovine 5. Prostorne jedinice: naselja, općine -Kada računamo određeni pokazatelj temeljem N podataka prikupljenih iz cijele populacije nazivamo ga parametar. Parametar je opisna mjera populacije. -Kada se isti taj pokazatelj računa temeljem n podataka prikupljenih iz uzorka nazivamo ga procjena parametra. Procjena je opisna mjera uzorka. -Statistika kao znanstvena induktivna metoda oslanja samo na statističke, odnosno slučajne ili probabilističke uzorke, kod kojih svi elementi populacije imaju poznatu i pozitivnu vjerojatnost izbora u uzorak, te koji omogućavaju računanje procjena te izračunavanje pogreške nastale zbog primjene uzorka pri procjenjivanju nepoznatog parametra populacije. -Primjena slučajnih uzoraka temelj je inferencijalne statistike, tj. postupaka procjenjivanja i testiranja statističkih hipoteza. -Tehnike statističkog uzorkovanja- statistički (slučajni) uzorak se provodi uz pretpostavku da svaka jedinica izbora ima poznatu i pozitivnu vjerojatnost izbora u uzorak, pri čemu vjerojatnosti izbora za pojedine jedinice mogu biti jednake ili nejednake. Stoga, takvi modeli uzoraka nazivaju probabilističkim uzorcima. Za nestatistički (namjerni) uzorak, tj. onaj koji nije slučajni (neprobabilistički uzorak) ova pretpostavka o poznavanju vjerojatnosti izbora nije ispunjena. 1. Nestatistički uzorci- za njih nije moguće izračunati pogrešku uzorka. Tehnike odabira jedinica u nestatistički uzorak mogu biti: (1)prikladno uzorkovanje, (2)namjerno, subjektivno ili po mišljenju stručnjaka uzorkovanje (3)izbor uzorka prema poznanstvu (4)uzorak dobrovoljaca i slično.

3

Ova vrsta uzoraka obrađuje se metodama deskriptivne statistike. 2.Statistički (slučajni) uzorci - tehnike odabira jedinica u slučajni, tj. statistički uzorak mogu biti: 1. Jednostavno slučajno uzorkovanje- koristi se kod homogenih skupova 2. Stratificirano slučajno uzorkovanje- koristi se kod heterogenih skupova 3. Sustavno (sistematsko) slučajno uzorkovanje 4. Izbor uzoraka skupina 1.Jednostavnog slučajnog uzorkovanja- svaka jedinica izbora i svaki uzorak imaju jednaku vjerojatnost da budu izabrani. Uzorkovanje se provodi primjenom tablice slučajnih brojeva lutrijskom metodom ili primjenom softvera koji ima funkciju generatora slučajnih brojeva.€Primjer: s liste ovlaštenih revizora izabiremo njih 50 u uzorak. 2.Stratificirano slučajno uzorkovanje- primjenjuje se kada postoje slojevi, odnosno stratumi unutar populacije koji su unutar sebe homogeni, a između sebe heterogeni prema ključnoj istraživanoj karakteristici. Primjeri: (1)razvrstavanje poduzeća u stratume prema veličini (2)stratifikacija srednjoškolaca na polaznike gimnazija i stručnih srednjih škola 3.Sustavno slučajno uzorkovanje- provodi se tako da se jedinice koje ulaze u uzorak odabiru prema nekakvom pravilu. Koristi se kada se pretpostavlja da su članovi populacije poredani na slučajan način. Primjer: izabiremo 50 ovlaštenih revizora s popisa 1014ovlaštenih revizora Anketni upitnik šaljemo npr. svakom 20-om revizoru (k=N/n=1014/50=20,28), gdje jek=20 korak izbora. -4.Uzorkovanje skupina- provodi se najčešće u dvije ili više etapa. Primjenjuje se kada treba uzeti uzorak iz populacije koja je smještena na zemljopisno udaljenim lokacijama. Primjeri: biraju se skupine učenika u vidu razreda ili škola, i na kraju se biraju učenici. Osnovni razlog izabiranja skupina elemenata umjesto samih elemenata je smanjenje troškova putovanja anketara. -Pogreške u istraživanju uzorkom dijele se na: (1) pogreške uzorka - prisutne su kod istraživanja pomoću slučajnih uzoraka. Na njih utječe: veličina uzorka, standardna devijacija populacije. (2) pogreške izvan uzorka ili neuzoračke pogreške- događaju se u svim anketnim istraživanjima temeljem popisa ili uzorka. Primjeri:€planiranje istraživanja, uzorkovanje (izbor uzorka), dizajniranje anketnih pitanja i anketnog upitnika, prikupljanje podataka, ručno editiranje i kodiranje,€unos podataka, analiza podataka. Osnovne vrste neuzoračkih pogrešaka su: 1) nepotpuni podaci- uzrokovani ili nepotpunim obuhvatom jedinica ili neodgovorima 2) pogreške mjerenja- propusti u mjernom instrumentu (anketnom upitniku), utjecaj anketara na odgovore 3) pogreške obrade podataka- nastaju pri unošenju podataka, sređivanju, prepisivanju, pri zaokruživanju brojeva, šifriranju te u fazama analiziranja.

Mjere se nominalnim i ordinalnim skalama

VARIJABLE KVALITATIVNE (NOMINALNE) ZEMLJOPISNE
-pokazuju povezanost jedinice s nekim prostorom -mjesto rođenja, mjesto registracije firme, područje prodaje

KVANTITATIVNE (NUMERIČKE) DISKRETNE -ima ih konačan broj, cjelobrojne su, dobivaju se brojenjem -broj proizvedenih komada, broj reklamacija, broj neplačenih računa, broj 4 djece, broj zaposlenih, broj članova kućanstva, broj kupaca

Mjere se intervalnim i omjernim skalama

ATRIBUTIVNE
-pokazuju svojstvo jedinice - vrsta proizvoda, vrsta kvara, prodajno mjesto, proizvođač, broj prizvoda

KONTINUIRANE -mogu poprimiti bilo
koju vrijednost u nekom intervalu, - dobivaju se mjerenjem -starost, potrošnja goriva, težina, cijene, vrijednost prodaje, visina plaće, duljina

PODACI S OBZIROM NA KORIŠTENU MJERNU SKALU NOMINALN -njima se opisuje naziv ili
ime, opisno svojstvo (atribut), ili vezanost neke jedinice za mjesto -nazivaju se modalitetima ili kategorijama - ne smiju se vršiti nikakve računske operacije - spol, bračni status, mjesto € stanovanja, zanimanje (kod njega postoji velik broj mogućih odgovora pa se primjenjuju nomenklature (NKD 2007.

ORDINALNI
-ili redoslijedni, brojevi i nazivi kojima se izražava redoslijed ili intenzitet - školska sprema, ocjena uspjeha na ispitu, te razina slaganja sa nekom tvrdnjom -pri redanju oblika bitan je poredak po jačini intenziteta. - ne smiju se vršiti nikakve računske operacije

INTERVALNI
- imaju jednake razlike u brojevima na intervalnoj skali. - položaj nule je dogovoran, vrijednost nule označava dogovornu vrijednost promatrane pojave. -Cezlijus, Fahranheit, Likterova skala (od izrazito se slažem- do izrazito se ne slažem

OMJERN -količine (t, kg, g) -iznosi (kn, $) -udaljenosti (km, m, cm, mm) -nula na omjernoj skali kazuje da nema svojstva -to su ustvari numeričke varijable koje su opisane u grafu ispred!!!

-Podaci još mogu biti: vremenske serije ili presječni podaci. Podaci koji su prikupljeni kroz razdoblja o jednoj vrsti jedinica (npr. vrijednost kredita građana po godinama unazad 25 godina, vrijednost prodaje po kvartalima posljednjih 8 godina, itd.) nazivaju se vremenske serije. One mogu biti intervalne ili trenutačne. Vremenski podaci mogu biti vezani uz intervale vremena kao, proizvodnja, broj prodanih komada TV aparata ili uz vremenske točke kao, stanje štednih uloga na dan 31.XII. po godinama, broj zaposlenika koncem mjeseca. -Ako se ista vrsta podataka prikuplja za više jedinica, primjerice, gospodarskih, prostornih, administrativnih ili organizacijskih, u jednom intervalu ili vremenskoj točki(npr. Broj zaposlenika prema različitim vrstama djelatnosti, ili vrijednost ostvarene prodaje po različitim prodajnim područjima poduzeća, uvijek uz istu vremensku definiciju) govori se o presječnim podacima. STATISTIČKE METODE - Razlikuju se dvije skupine statističkih metoda: 1. opisne (deskriptivne)- na temelju svih podataka 2. inferencijalne metode- na temelju slučajnog uzorka

1. Metode namijenjene statističkom opisivanju podataka dio su tzv. OPISNE
(DESKRIPTIVNE) statistike i one obuhvaćaju: 1. Izradu tablica 2. Grafikone (histogram, strukturni krug) 3. Brojčane opisne pokazatelje

5

Opisne metode se koriste kao polazna osnovica kod donošenja odluka temeljem skupa podataka koji se smatraju cjelovitom populacijom, te nije primjereno poopćavanje dosegnutih zaključaka. Obuhvaćeni su postupci prikupljanja, sažimanja, tabličnog i grafičkog prikazivanja te izračunavanja opisnih zbirnih pokazatelja kao štosu različite mjere:  € Mjere centralne tendencije  € Mjere raspršenosti  € Mjere nagnutosti  € Mjere zaobljenosti distribucije podataka OPISNE (DESKRIPTIVNE) STATISTIČKE METODE Jedan od osnovnih i najčešće korištenih brojčanih pokazatelja u poslovnoj statistici je aritmetička sredina ili prosjek, a koja je i najpoznatija u široj primjeni. Aritmetička sredina ili prosjek je zbroj svih vrijednosti podataka podijeljen s brojem podataka. Općenito, formula za računanje aritmetičke sredine je:

pri čemu se zbroj vrijednosti svih podataka naziva total, a broj podatka je opseg skupa podataka. Opisni brojčani pokazatelji mogu se razvrstati na slijedeći način kao: 1. mjere centralne tendencije: prosječna vrijednost ili aritmetička sredina, središnja vrijednost ili medijan, najčešća vrijednost ili mod, geometrijska sredina. 2. pokazatelji raspršenosti: raspon varijacije, standardna devijacija, koeficijent varijacije, interkvartili. 3. mjere položaja podatka: kvartili, percentil, standardizirano obilježje. 4. mjere oblika razdiobe podataka: pokazatelj nagnutosti ili asimetrije te pokazatelj zaobljenosti vrha distribucije podataka.

2.

INFERENCIJALNA STATISTIKA je skup metoda statističkog zaključivanja pomoću podataka slučajnog uzorka. To je induktivni pristup statističkoj analizi koji od manjeg broja podataka jednog slučajnog uzorka vodi do informacija o populaciji iz koje je taj uzorak izabran. Uz pomoć mehanizma vjerojatnosti ovdje se dolazi: € do procjena nepoznatih karakteristika populacije te € do zaključka postoji li dosta dokaza da se statistička pretpostavka (hipoteza)odbaci ili ne. Procjene mogu biti brojem ili intervalom. Dvije su osnovne skupine metoda inferencijalne statistike: 1. Metode procjenjivanja nepoznatih parametara populacije uz odabranu razinu pouzdanosti, i testiranja statističkih hipoteza. 2. Metode testiranja statističkih hipoteza o nepoznatim parametrima populacije uz odabranu razinu značajnosti.

1. Metode procjenjivanja- često za neku pojavu nisu dostupni svi podaci. Primjerice, ne možemo znati preferencije svih kupaca o zdravoj hrani. Ipak, podatak o udjelu kupaca koji bi kupio proizvode zdrave hrane vrlo nam je važan, jer o njemu ovisi koliko ćemo prostora u dućanu na policama zauzeti proizvodima zdrave hrane. U tom slučaju koristit ćemo uzorak kupaca te izračunati točkastu ili intervalnu procjenu udjela kupaca koji bi kupili proizvode zdrave hrane. Rezultat intervalne procjene mogla bi biti tvrdnja: Između 5% i 8% kupaca kupilo bi proizvode zdrave hrane uz 95% vjerojatnosti.

6

2. Testiranje statističkih hipoteza- često proizvođači daju izjave vezane
uz njihove proizvode. Primjeri: Moguće je da proizvođač na kutiji voćnoga soka navede da je udio voća u soku najmanje 50% ili proizvođač baterija može izjaviti da baterije traju dulje od svih ostalih konkurentskih proizvoda. Vrlo često, neprofitne udruge potrošača, kao i konkurentske kompanije provjeravaju jesu li ove tvrdnje točne. Takva se testiranja pretpostavki vrše pomoću slučajnog uzorka i uvažavanja vjerojatnosti da se pogrešno odbaci istinita statistička pretpostavka. Pogreška tipa 1- ako odbacimo točnu nultu hipotezu. Pogreška tipa 2- ako prihvatimo lažnu nultu hipotezu.

2.POGLAVLJE- GRAFIČKO I TABLIČNO PRIKAZIVANJE PODATAKA
HISTOGRAM- je stupčani grafikon sastavljen od uspravnih stupaca bez razmaka. Visine stupaca određene su frekvencijama. Histogram pomaže u vizualnom određivanju prosječne vrijednosti distribucije, varijabilnosti podataka, te oblika distribucije. Modaliteti diskretne varijable ili granice intervala prikazane su na horizontalnoj osi, dok su na vertikalnoj osi označene apsolutne ili relativne frekvencije (proporcije ili postoci). Širina stupca odgovara širini razreda grupiranih podataka, dok visine stupaca odgovaraju frekvencijama grupiranih podataka. Histogram pokazuje: 1. centriranost ili decentriranost podataka 2.raspršenost, odnosno disperziju numeričkih podataka, tj. varijabilnost oko centra 3.oblik razdiobe podataka: asimetriju, odnosno nagnutost i zaobljenost distribucije Histogram se često rabi u otkrivanju izvora nekvalitete, odnosno u praćenju stanja procesa u poslovanju. Poligon frekvencija je linijski grafikon koji prikazuje numeričke podatke iz tablice frekvencija. On pokazuje isto što i histogram. Dijagram točaka primjenjuje se kada se raspolaže s manjim brojem podataka. Iznad pojedinih vrijednosti ucrtava se onoliko točaka koliko često se ta vrijednost ponavlja u nizu podataka. S – L prikaz tj, dijagram je grafička tehnika koja se koristi za preliminarnu, eksplorativnu analizu numeričkih podataka. Konstrukcija S-L: podaci sortirani po veličini, brojevi su podijeljeni na stabla i listove, u prvom stupcu su poredana sva stabla od najmanjeg do najvećeg, u ostalim stupcima su poredani svi listovi od najmanjeg do najvećeg. Uz ovaj dijagram obavezno je navesti sustav dekodiranja vrijednosti. Dijagram rasipanja koristi se također za prikazivanje povezanosti dvije ili više varijable. Između varijabli se uvijek javlja jedan od tri odnosa: linearna ili nelinearna povezanost, ili uopće nema povezanosti između varijabli. Površinski grafikoni- u njih spadaju uspravni i položeni stupci koji se najčešće koriste za prikazivanje kvalitativnih podataka. Grafikon stupaca: 1. Položaj stupaca: uspravan ili položen 2. Jednostavnim stupcima nazivaju se oni koji prikazuju samo jedan niz podataka, a usporednim stupcima oni koji prikazuju dva ili više nizova podataka. 3. Stupci mogu prikazivati apsolutne i relativne frekvencije. Vremenski nizovi prikazuju promjenu jedne pojave u promatranim vremenskim točkama. Intervalni vremenski niz je vrsta vremenskog niza kod kojeg se

7

frekvencije dobivaju postepenim zbrajanjem unutar intervala odabrane vramenske jedinice.prikazuje se jednostavnim stupcima ili linijskim grafikonom. Trenutačni niz se prikazuje samo linijskim grafikonom. U njemu se vrijednost pojave mjeriu trenutku vremena. Dobar grafikon je onaj koji je jednostavan, jasan i pregledan. Bitno je da ima: naslov, izvor, mjerne jedinice i legendu. Postoje statističke tablice sa sirovim podacima ili sumarne tablice s pročišćenim podacima. Razlikujemo tablice po broju nizova koje prikazuju: 1. Jednostavna tablica, predočava jedan statistički niz 2. Skupna tablica predočava dva ili više njih 3. Tablica kontingence predočava zajedničku distribuciju podataka, kada su elementi jednog skupa podataka razvrstani istovremeno po kategorijama dvije varijable, najčešće kvalitativne. 3.POGLAVLJE: BROJČANE MJERE OPISNE STATISTIKE

Vrste statističkih opisnih pokazatelja: €Mjere centralne tendencije ili srednje vrijednost €Mjere stupnja varijabilnosti, koje se nazivaju mjerama disperzije €Pokazatelji oblika distribucije:  € koeficijent asimetrije,  € koeficijenti zaobljenosti  € Tablica pet ključnih pokazatelja i Box-and-Whiskers Plot  € standardizirana vrijednost  € empirijsko pravilo i pravilo Čebiševa Brojčane mjere za određivanje smjera i stupnja linearne povezanosti su kovarijacija, kovarijanca te koeficijent linearne korelacije.

1. 2. 3.

CENTRALNA TENDENCIJA je stupanj grupiranosti i usmjerenost podataka k nekoj centralnoj vrijednosti Brojčane opisne mjere centralne tendencije nazivaju se i srednjim vrijednostima. Ovdje se svrstavaju:

1.

8

(1)aritmetička sredina i geometrijska sredina, kao mjere temeljene na uključivanju svih vrijednosti brojčane varijable u izračun (2)položajne mjere kao što su mod i medijan, koje su određene svojim položajem u uređenom skupu brojčanih podataka ARITMETIČKA SREDINA Razlikuju se: (1)jednostavna aritmetička sredina, koja se računa za negrupirane podatke i (1)vagana ili ponderirana aritmetička sredina, koja se računa za podatke grupirane u distribuciju frekvencija Aritmetička sredina populacije= total populacije opseg populacije Aritmetička sredina uzorka= ___total uzorka______ broj podataka u uzorku IZDVOJENICE (eng. outliers) su ekstremne vrijednosti koje su netipično male ili netipično velike i to iz bilo kojeg razloga, primjerice, kao rezultat neuobičajenih okolnosti ili kao posljedica pogreške mjerenja. Korištenje prosjeka kao mjere centralne tendencije je jednostavno i praktično, ali i ima značajan nedostatak. Ekstremne vrijednosti, tj. najmanja vrijednost ili najveća vrijednost podatka, koje su neuobičajeno izdvojene, bilo kao veoma male ili kao veoma velike, imaju značajan utjecaj na vrijednost prosjeka te ga čine nereprezentativnim. -MEDIJAN je mjera položaja koja dijeli niz podataka na dva jednaka dijela. Pripada skupini pokazatelja koji se nazivaju kvantili i koji niz uređenih podataka brojčane varijable dijele općenito na q jednakih dijelova, a ima ih (q-1). Ukoliko niz podataka sadrži izdvojenice prikladnije je umjesto prosjeka koristiti medijan. Tumačenje medijana: Polovina podataka uređenog niza ima vrijednost jednaku medijanu ili manju od nje, a druga polovina članova skupa ima vrijednost jednaku ili veću od medijana. Asimetričnost distribucija- oblik distribucije ovisi o postojanju ekstremnih izdvojenih vrijednosti, koje uzrokuju desno asimetrični ili lijevo asimetrični oblik distribucije.

MOD je najčešća vrijednost u skupu podataka. Niz podataka ne mora imati niti jednu vrijednost koja se ponavlja, te je takva distribucija bezmodalana. Isto tako, moguće je da u nizu podataka postoji više vrijednosti koje se ponavljaju identičan broj puta, te je takva distribucija dvo-ili višemodalna.

9

VAGANI PROSJEK: Prosjek koji se računa temeljem distribucije frekvencija. Ukoliko distribucija frekvencija sadrži sve podatke iz populacije, izračunat ćemo vagani prosjek populacije. Ukoliko distribucija frekvencija sadrži sve podatke iz uzorka, izračunat ćemo vagani prosjek uzorka. MJERE DISPERZIJE- varijabilnost podataka mjeri se stupnjem rasipanja, odnosno disperzije oko neke mjere centralne tendencije. Brojčane mjere koje izražavaju varijabilnost zovu se mjerama disperzije. Mjere disperzije su slijedeće: 1.Raspon varijacije 2.Interkvartil 3.Varijanca 4.Standardna devijacija 5.Koeficijent varijacije 6.Srednje apsolutno odstupanje Potpune mjere disperzije temelje se na korištenju svih podataka populacije ili uzorka i to su varijanca, standardna devijacija i koeficijent varijacije. Nepotpune mjere se temelje na samo dva podatka ili informacije i to su raspon varijacije i interkvartil. RASPON VARIJACIJE PODATAKA- je najjednostavnija mjera. Predstavlja razliku između najveće i najmanje vrijednosti podatka: R = najveća vrijednost - najmanja vrijednost Nedostatak: Raspon podataka računa se temeljem samo dvije vrijednosti, dok su sve ostale potpuno zanemarene. Također, te krajnje vrijednosti mogu biti i rezultat neuobičajenih prilika, odnosno izdvojenice.

1.

2.

INTERKVARTILNI RASPON VARIJACIJE- označava varijabilnost središnjih 50% podataka distribucije. Ova mjera isključuje najmanjih 25% i najvećih 25% podataka, te na ovu mjeru disperzije izdvojenice nemaju utjecaja. IQ= Q3- Q1 Box-and-Whiskers Plot ili BP- je grafikon koji se sastoji od pravokutnika čije su dimenzije određene kvartilima i koji je podijeljen na mjestu medijana, te od "brkova" koji iz nje vire do udaljenosti najmanje i najveće vrijednosti. Zorno prikazuje raspon varijacije R i interkvartilni raspon varijacije IQ podataka, a koristi se i za identifikaciju izdvojenica. Razlikuju se: jednostavni BP dijagram i modificirani BP prikaz. Jednostavni BP dijagram, je onaj koji ističe pet vrijednosti: položaj medijana, oba kvartila te najmanje i najveće vrijednosti, pa se uz njega prikazuje tablica tih ključnih pet pokazatelja tzv. Five Number

10

Summary. Prikladan je za prikaz raspona varijacije i interkvartila te smjera eventualne asimetrije podataka.

Modificirani BP prikaz je onaj koji pored položaja medijana i kvartila pruža mogućnost uočavanja blagih, sumnjivih i ozbiljnih izdvojenica (outliera) temeljem ucrtanih karakterističnih ograda.

Karakteristika:
Treba napomenuti da donje i gornje vanjske međe modificiranog BP dijagrama mogu izaći izvan raspona podataka od xmax do xmin. Koeficijent varijacije je mjera disperzije kojom prosječno odstupanje od prosjeka izražavamo relativno, kao omjer standardne devijacije prosjeka. Radi lakšeg tumačenja, omjer množimo sa 100%, kako bismo odstupanje izrazili u postocima. Manja vrijednost koeficijenta varijacije ukazuje na malu relativnu disperziju podataka i na veliku reprezentativnost prosjeka. Ako koeficijent varijacije poprimi vrijednost veću od 30%, tada govorimo o slaboj reprezentativnosti prosjeka. Koeficijent varijacije može biti i veći od 100%, tada se radi o potpuno neprimjerenoj uporabi aritmetičke sredine kao srednje vrijednosti. Mjere oblika distribucije podataka €(1)koeficijent asimetrije i €(2)koeficijent zaobljenosti. Mjera (koeficijent) asimetrije koja se najčešće koristi zove se α3, a temelji se na odstupanjima pojedinih vrijednosti podataka od prosjeka dignutim na treću potenciju te korištenju standardne devijacije.

11

Pokazatelji zaobljenosti: α4 -opisuje zaobljenost vrha distribucije. Ovaj pokazatelj je uvijek pozitivan i jednak je 3 za tzv. normalnu distribuciju. Kod zašiljenijih distribucija on je veći od tri, dok je kod plosnatijih manji od tri. Eksces -relativan pokazatelj zaobljenosti, koji se označava grčim slovom kapa, tj. κ. Eksploracijska analiza U eksploracijske metode otkrivanja oblika distribucije, povezanosti među varijablama te otkrivanja izdvojenih ekstremnih vrijednosti uvrštava se analiza grafičkim alatima i brojčanim metodama. Često korištene metode temelje se na primjeni: (1)BP dijagrama i tablice 5'S, (2)Empirijskog pravila i Pravila Čebiševa, odnosno standardizirane varijable (z-skora) te (3)Kombinacije grafičkih i brojčanih metoda za eksploracijsku analizu Empirijsko pravilo i Pravilo Čebiševa vrlo su korisni statistički koncepti za otkrivanje netipičnih, izdvojenih vrijednosti, te za utvrđivanje relativnog položaja podatka s obzirom na aritmetičku sredinu, a temelje se na standardiziranoj vrijednosti varijable. 1.Empirijsko pravilo za distribuciju zvonolikog oblika i intervalne podatke definira sljedeće obuhvate podataka: €raspon µ ±1σ obuhvaća oko 68% podataka €raspon µ ±2σ obuhvaća oko 95% podataka €raspon µ ±3σ obuhvaća oko 99% podataka

12

2.Pravilo Čebiševa koristi se za sve ostale distribucije, koje nisu zvonolikog oblika, te definira sljedeće obuhvat podataka: €najmanje 0% podataka je obuhvaćeno rasponom ±1σ €najmanje 75% podataka je obuhvaćeno rasponom ±2σ €najmanje 89% podataka je obuhvaćeno rasponom ±3σ €najmanje 94% podataka je obuhvaćeno rasponom ±4σ €Prema izrazu: µ-kσ<x<xµ+kσ k>1 Podatak izdvojen tri standardne devijacije od prosjeka je netipičan.

3.Standardizirane vrijednosti računaju se za populaciju i uzorak, kojima se vrijednosti niza podataka preračunavaju u jedinice standardne devijacije. Standardizirane vrijednosti su posebno korisne kada želimo usporediti podatke iz dvije različite distribucije koje imaju različiti prosjek i standardnu devijaciju. Svako odstupanje veće od 3 standardne devijacije upućuje na zaključak da se radi o netipičnom podatku koji treba ispitati. Kovarijanca mjeri smjer i jakost linearne povezanosti između dviju varijabli. Brojnik kovarijance naziva se kovarijacijom. Kovarijacija pokazuje simultano variranje vrijednosti varijable X oko njenog prosjeka ivariranje vrijednosti varijable Y oko njenog prosjeka. Predznak kovarijacije određuje predznak kovarijance. Kovarijanca je fokusirana upravo na smjer i jakost linearne veze između dviju varijabli, a koristi se za izračunavanje koeficijenta linearne korelacije, koji također odražava smjer i stupanj (to jerelativna mjera) linearne povezanosti između dviju varijabli.

4.POGLAVLJE: VJEROJATNOST Slučajni eksperiment je postupak koji se može proizvoljan broj puta ponavljati. Završava s barem dva rezultata. Rezultati ili ishodi slučajnog eksperimenta opisuju se riječima, brojevima ili riječima i brojevima. Skup svih rezultata slučajnog eksperimenta zove se prostor elementarnih događaja ili prostor uzoraka. Svaki podskup prostora elementarnih događaja S je događaj. Npr. slučajni eksperiment bacanja novčića ima dva rezultata: pismo(P) i glava (G). Prostor elementarnih događaja S dakle ima 2 elementa. Vjerojatnost slučajnog događaja izraz je mogućnosti ostvarenja tog događaja, a može se definirati na više načina: -vjerojatnost a priori (klasična definicija vjerojatnosti) -vjerojatnost a posteriori (statistička definicija vjerojatnosti) -subjektivna vjerojatnost Klasična definicija vjerojatnosti (vjerojatnost a priori) poznata prije nego što se izvede slučajni pokus. Pretpostavke:-prostor elementarnih događaja S je konačan i poznat -na skupu S definiran je slučajni događaj A (broj ishoda koji realiziraju događaj A naziva se povoljnim za A)

13

Vjerojatnost događaja A je omjer broja, za događaj A povoljnih ishoda (M) jednako mogućih ishoda (N).

i broja svih

Statistička definicija vjerojatnosti (vjerojatnost a posteriori) Pretpostavka: slučajni eksperiment moguće je ponavljati beskonačno mnogo puta, -stabilizacija relativne frekvencije nastupa slučajnog događaja A oko konstante koja predstavlja vjerojatnost a posteriori događaja A.

Subjektivna vjerojatnost - procjenjuje se subjektivno.

Bayesov teorem Tipični problemi u poslovnoj statistici su oni u kojima se traži vjerojatnost nastupa nekog događaja uzrokovanog jednim od n mogućih uzroka, odnosno načina ostvarenja tog događaja. Primjer: Poduzeće proizvodi proizvod C na tri dislocirane lokacije. Učešće lokacije I u ukupnoj proizvodnji je 30%, lokacije II 45%, a lokacije III 25%. Na lokaciji I 4% proizvoda je škartno, dok je postotak škartnih proizvoda na lokaciji II 8%, a na lokaciji III 10%. Proizvodi sa sve tri lokacije se zajedno distribuiraju u prodajne centre. Kolika je vjerojatnost da je slučajno odabran proizvod škartan? Kolika je vjerojatnost da je proizvod proizveden na lokaciji II, ako je škartan? Oznake za slijedeće događaje: I - proizvod je proizveden na i-toj lokaciji ,i=1,2,3 L proizvod je loš D proizvod je dobar

14

SLUČAJNA VARIJABLA X - numerička funkcija koja svakom ishodu slučajnog pokusa pridružuje realni broj.

1.

Diskretna slučajna varijabla- distribucija vjerojatnosti diskretne slučajne varijable je skup uređenih parova vrijednosti varijable i pripadajuće vjerojatnosti. 2. Kontinuirana slučajna varijabla- funkcija gustoće vjerojatnosti (distribucija vjerojatnosti kontinuirane slučajne varijable) f(x) ima svojstva:

Statistička nezavisnost p(x,y)= p(x)*p(y). Ako vrijedi ova formula, varijable su nezavisne. Ako su varijable nezavisne, kovarijanca je jednala nuli. Cov(X,Y)=E(XY)E(X)*E(Y)
Proces upravljanja investicijama na principu diverzifikacije vrijednosne papire različitih tvrtki s ciljem smanjenja rizika) zove se portfeljni menedžment. (investiranja u

Cijena portfelja je slučajna varijabla Y izračunata kao linearna kombinacija: pri čemu je αi, broj vrijednosnih papira Ai u portfelju.

VELIKA VARIJANCA znači VELIKI RIZIK PORTFELJA!!! Odabrani modeli diskretnih distribucija vjerojatnosti;

15

Binomna distribucija Poissonova distribucija Hipergeometrijska distribucija Diskretna uniformna distribucija 1. Binomna distribucija vjerojatnosti- (analitički oblik, očekivana vrijednost, varijanca i standardna devijacija)  Slučajni se eksperiment sastoji od n identičnih pokušaja.  Svaki pokušaj rezultira s dva ishoda. Jedan od dva moguća rezultata smatra se uspjehom ("ostvario se događaj A"), a drugi neuspjehom ("nije se ostvario događaj A")  Vjerojatnost uspjeha ne mijenja se tokom izvođenja eksperimenta i u svakom je pojedinom pokušaju konstantna i iznosi p, vjerojatnost neuspjeha je (1-p).  Pojedini pokušaji međusobno su nezavisni.  Binomna varijabla X broji ostvarene uspjehe u n pokušaja.

1. 2. 3. 4.

2.

Poissonova distribucija vjerojatnosti (analitički oblik, očekivana vrijednost, varijanca i standardna devijacija) Prikladna za opis rijetkih događaja tj. onih koji se pojavljuju s malom vjerojatnosti.

3.

Hipergeometrijska distribucija  opisuje se broj "uspjeha" u n uzastopnih pokušaja iz konačne populacije bez ponavljanja.  pokušaji međusobno zavisni

Odabrani modeli kontinuiranih distribucija vjerojatnosti:  Normalna distribucija  Studentova distribucija  χ2-distribucija

16

  

F-distribucija Eksponencijalna distribucija Uniformna distribucija

1. Normalna

(Gaussova) distribucija- najčešće primjenjivana teoretska distribucija vjerojatnosti u opisivanju empirijskih pojava. Analitički oblik, očekivana vrijednost, varijanca.

17

Sponsor Documents

Or use your account on DocShare.tips

Hide

Forgot your password?

Or register your new account on DocShare.tips

Hide

Lost your password? Please enter your email address. You will receive a link to create a new password.

Back to log-in

Close