Hvilket tall er en statistisk egenskap for serien. Statistiske egenskaper. IV. Oppdatering av elevenes grunnleggende kunnskaper

Nøkkelord for abstraktet: statistiske egenskaper, statistisk forskning, utvalg, varianter, utvalgsstørrelse, aritmetisk gjennomsnitt, variasjonsserier, rekkevidde av serien, samplingsmodus, median for serien.

Statistisk forskning

Å studere, bearbeide og analysere kvantitative data for ulike sosioøkonomiske masseprosesser og fenomener, statistisk(fra det latinske ordet status - "stat, tilstand") forskning. Allerede i gamle stater førte de opptegnelser over befolkningen som var i stand til å betale skatt. Med samfunnsutviklingen var det nødvendig med vitenskapelige metoder for å bearbeide og analysere et bredt spekter av informasjon. Altså på 1800-tallet. biologisk statistikk dukket opp, kalt biometri, og studerte de numeriske egenskapene til individuelle biologiske individer og deres populasjoner. Du kan nevne mer enn et dusin forskjellige statistikker: økonomisk, finansiell, skattemessig, demografisk, medisinsk, meteorologisk, etc.

Hver statistisk studie består av innsamling og behandling av informasjon . Basert på de innhentede dataene lages ulike prognoser, deres pålitelighet vurderes osv. En viktig oppgave, uten hvilken statistiske data mister all mening, er å behandle de mottatte dataene.

La oss se på et eksempel. Elever i to sjuendeklassinger fikk en matematikkprøve bestående av 10 oppgaver. Ved kontroll av arbeidet ble antall oppgaver korrekt utført av elevene notert. Vi har to serier med tall:

7 "A" klasse: 8; 7; 2; 5; 10; 9; 8; 7; 7; 10; 9; 6; 5; 8; 8; 10; 9; 9; 10; 7; 9; 10; 7; 9; 6;
7 "B" klasse: 8; 7; 8; 6; 9; 9; 7; 8; 7; 9; 9; 6; 5; 8; 7; 10; 9; 10; 10; 7; 8; 9; 7; 9; 9.

Et sett med data innhentet som et resultat av en statistisk studie kalles prøvetaking, og hvert tall i denne serien er alternativ prøver. Antall tall i en rad kalles prøvestørrelse. I vårt eksempel er utvalgsstørrelsen antall elever i hver klasse som deltok i testingen. I hvert tilfelle er prøvestørrelsen 25.

Med de to ovennevnte dataseriene er det vanskelig å sammenligne testresultatene til elever i to klasser. Og tar vi i betraktning resultatene som vises av alle sjuendeklassinger i en by eller en hel region, vil informasjonen være så tungvint at den blir ubrukelig. Derfor, for statistisk databehandling, ulike statistiske egenskaper.

Gjennomsnitt. Variasjonsserie

En av egenskapene som er mye brukt i statistisk forskning er gjennomsnitt.

Definisjon. Aritmetisk gjennomsnitt serie av data kalles kvotienten av summen av alle varianter av serien og mengdene av varianten.

Siden antall alternativer er utvalgsstørrelsen, er det aritmetiske gjennomsnittet av utvalget kvotienten av summen av alle alternativer og utvalgsstørrelsen.

La oss se på et eksempel. La oss finne GPA, som elever i klasse 7 "A" mottok da de fullførte testen:

Denne beregningen av det aritmetiske gjennomsnittet av en prøve er ikke veldig praktisk. Du kan gjøre ting annerledes.La oss omskrive utvalget for klasse 7 "A", og ordne alternativene slik at hver neste ikke er mindre enn den forrige. Vi får:
2; 5; 5; 6; 6; 7; 7; 7; 7; 7; 8; 8; 8; 8; 9; 9; 9; 9; 9; 9; 10; 10; 10; 10; 10.

Denne prøveposten kalles bestilt serie med data (eller variantserie ). Nå er det lett å se at en elev fikk 2 poeng, to elever fikk 5 poeng, to elever fikk 6 poeng, fem elever fikk 7 poeng osv. Antallet forekomster av samme variant i en prøve kalles frekvensen av den varianten. Så, for eksempel, er frekvensen for alternativ 7 5, frekvensen for alternativ 10 er 5. La oss lage en tabell over frekvensene for alternativer for elever i klasse 7 "A". I den første linjen skriver vi ned alle mulige poeng som elevene kunne få ved gjennomføring av prøven, d.v.s. tall fra 0 til 10. I den andre linjen skriver vi ned de tilsvarende frekvensene, dvs. antall elever som fikk det angitte antall poeng.

La oss sjekke om vi gjorde en feil ved beregning av frekvenser: summen av frekvenser skal være lik prøvestørrelsen. Faktisk, 0 + 0 + 1+ 0 + 0 + 2 + 2 + 5 + 4 + 6 + 5 = 25 (selvfølgelig trenger du ikke å skrive nuller). Nå kan du beregne det aritmetiske gjennomsnittet av prøven enklere:

Legg merke til at det aritmetiske gjennomsnittet av den bestilte dataserien og det aritmetiske gjennomsnittet av utvalget er det samme tallet. La oss lage en tabell over samplingsfrekvenser for klasse 7 "B".

Merk at tabellen over frekvenser vanligvis ikke inkluderer alternativer hvis frekvenser er lik null. I dette tilfellet vil frekvenstabellen for klasse 7 "B" være som følger:

La oss finne prøvestørrelsen: 1 + 2 + 6 + 5 + 8 + 3 = 25. La oss nå finne det aritmetiske gjennomsnittet:

Når vi kjenner den gjennomsnittlige poengsummen til elever i klasse 7 "A" og 7 "B", kan vi konkludere med at elever i klasse 7 "B" generelt klarte testen bedre, fordi 8,04 > 7,8 .

De kompilerte frekvenstabellene lar oss trekke andre nyttige konklusjoner basert på resultatene av testingen. For eksempel, for det første utvalget (resultater fra elever i klasse 7 "A"), er den laveste poengsummen 2, den høyeste er 10. Resultatene til alle elevene i klassen er plassert mellom disse tallene. For det andre utvalget er det minste alternativet 5, det største er 10. Dette kan bety at klasse 7 "B" er mer homogen i sin matematiske forberedelse enn klasse 7 "A".

Radområde. Mote prøvetaking

En annen indikator som brukes når man analyserer statistiske data er rekke serier.

Definisjon. Forskjellen mellom det største og minste utvalgsalternativet kalles rekkevidden til serien.

I eksemplet diskutert tidligere er rekkevidden til den første prøven (eller den bestilte serien med data) 10 - 2 = 8, og den andre er 10 - 5 = 5. Utvalget av prøven finnes i tilfelle hvor mengden av dataspredning i serien har betydning for studien. For eksempel, i meteorologi er ikke bare den gjennomsnittlige daglige temperaturen viktig, men også de numeriske egenskapene til lufttemperatursvingninger i løpet av dagen, dvs. prøvetakingsområdet.

Merk at i praksis, når man analyserer data innhentet som et resultat av en studie, er det praktisk å bruke en annen statistisk egenskap - den s.k. prøvetakingsmodus.

Definisjon. Samplingsalternativet som har høyest frekvens kalles samplingsmodus.

I det betraktede eksemplet med studiet av testresultater utført i to syvende klasser, er modusen for både første og andre rad tallet 9, som forekommer oftere enn andre i både den første og andre prøven.

Modusen til en serie blir funnet når det er nødvendig å identifisere en indikator som er typisk for en gitt prøve. Hvis vi for eksempel studerer data om størrelsene på herreskjorter som selges i en butikk på en bestemt dag, kan det være praktisk å bruke en indikator som mote, som kjennetegner størrelsen som er størst etterspørsel etter.

Hvis i en prøve forekommer to tall med samme frekvens, som overskrider frekvensene som andre tall forekommer med, så er begge disse alternativene en modus for denne serien. Så, på rad 2; 3; 3; 3; 5; 5; 6; 6; 6; 7; 8; 8 to moduser er nummer 3 og 6. Det kan hende at det vil være mer enn to moduser i prøven, eller det vil ikke være noen modus i det hele tatt. For eksempel rad 2; 2; 3; 3; 4; 4; 5; 5 har ingen mod.

Median av serien

En annen egenskap som brukes i statistikk er median av serien.

La oss se på et eksempel. Laboratorieansatte kjøpte aksjer i ett foretak. Antall aksjer kjøpt av ansatte viste seg å være som følger: 2; 3; 5; 6; 8; 9; 51. Du må beregne gjennomsnittlig antall kjøpte aksjer.

Denne serien har ingen mote. La oss finne det aritmetiske gjennomsnittet av serien:

Det funnet tallet gjenspeiler ikke den reelle situasjonen med fordelingen av andeler mellom laboratorieansatte, siden det er mer enn seks av syv varianter av serien. For å estimere gjennomsnittsverdien vil vi gå annerledes frem. La oss lage en ordnet serie fra de innhentede dataene og finne alternativet skrevet i midten av serien.
2; 3; 5; 6 ; 8; 9; 51.
Dette alternativet kalles median . Det er lik 6. Naturligvis karakteriserer den funnet verdien bare omtrentlig gjennomsnittet av serien, men denne egenskapen er nærmere virkeligheten.

Hvis en serie har et partall av varianter, regnes det aritmetiske gjennomsnittet av de to midterste elementene som medianen. For eksempel er medianen av serier 3; 3; 4; 5; 5: 6 : 6; 7; 7; 40 er det aritmetiske gjennomsnittet av tallene 5 og 6, dvs. (5 + 6)/2 = 5,5.

Definisjon. Hvis det er et oddetall alternativer i en ordnet serie med data, kalles gjennomsnittlig antall alternativer medianen av serien. Hvis det er et partall av varianter i en ordnet serie, kalles det aritmetiske gjennomsnittet av de to midterste variantene medianen av serien.

Medianen av et tilfeldig utvalg er medianen av den tilsvarende ordnede serien. Merk at hvis den bestilte serien med data inneholder 2n - 1 alternativ ( n - naturlig tall), så er medianen n-i-alternativet, og hvis den bestilte serien med data inneholder 2n tall, da er medianen det aritmetiske gjennomsnittet n th og n+1 tall.

La oss se på et eksempel. Under skytekonkurransen fikk utøveren følgende antall poeng: 9; 9; 8; 10; 8; 7; 9; 10; 8; 7. La oss finne: a) prøvestørrelse; b) aritmetisk gjennomsnitt av prøven; c) omfang; d) modus for serien; e) prøvemedian.

For å løse problemet, la oss skrive ned en bestilt serie med data:
7; 7; 8; 8; 8; 9; 9; 9; 10; 10.

A) Utøveren avfyrte 10 skudd, noe som betyr at prøvestørrelsen er 10.

B) Finn det aritmetiske gjennomsnittet av utvalget

C) Seriens rekkevidde er 10 - 7 = 3.

D) Denne serien har to moduser: 8 og 9.

D) Finn medianen til prøven. Denne serien inneholder et jevnt antall alternativer. La oss finne det aritmetiske gjennomsnittet av to tall skrevet i midten av rekken: (8 + 9)/2 = 8,5. Prøvemedianen er 8,5.

Dette er en matematikksammendrag om emnet "Statistiske egenskaper". Velg neste trinn:

  • Gå til neste sammendrag:

UTDANNINGSDEPARTEMENT AV BYEN MOSKVA

STATS BUDGETTÆRENDE UTDANNINGSINSTITUSJON

KOMMUNIKASJONSHØGSKOLE nr. 54 oppkalt etter P.M. VOSTRUKHINA

Statistiske egenskaper.

Studieveiledning for leksjon del 1.

Utvikler:

Matematikklærer

T.N. Rudzina


- Dette matematiske begreper , ved hjelp av dette beskrives de særegne og egenskapene til et datasett oppnådd gjennom observasjon eller annen metode. Betydningen av egenskapene ligger også i at de "spørre" , Fra hvilke posisjoner er det tilrådelig å analysere det eksisterende datasettet? .

Statistiske egenskaper inkluderer:

gjennomsnitt , omfang , mote , median .

La oss se på et eksempel:

Når du studerer studiebelastning elevene ble tildelt en gruppe på 12 sjuendeklassinger. De ble bedt om å notere på en gitt dag tiden (i minutter) de brukte på å fullføre hjemmelekser i algebra. Vi mottok følgende data:

23, 18, 25 20, 25, 25, 32, 37, 34, 26 34, 25 .

Med denne serien med data, kan bestemmes b, hvor mange minutter i gjennomsnitt elevene brukte på algebra lekser.

For å gjøre dette må de angitte tallene legges til og summen divideres med 12:


Antall 27 det resulterende resultatet kalles aritmetisk gjennomsnitt tallserien som vurderes.

Definisjon :

Aritmetisk gjennomsnitt av en rekke tall kalles kvotienten for å dele summen av disse tallene med antall ledd.

Vanligvis blir det aritmetiske gjennomsnittet funnet når de ønsker å bestemme gjennomsnittsverdien for en bestemt serie med data: gjennomsnittlig hveteavling per 1 hektar i regionen, gjennomsnittlig daglig melkeytelse fra en ku på gården, gjennomsnittslønnen til en teamarbeider per skift osv. Merk at det aritmetiske gjennomsnittet bare finnes for homogene mengder. Det gir for eksempel ingen mening å bruke gjennomsnittlig utbytte av korn- og melonavlinger som en generell indikator. Dessuten, selv for homogene mengder, er det noen ganger meningsløst å beregne det aritmetiske gjennomsnittet, for eksempel å finne gjennomsnittstemperaturen til pasienter på et sykehus, gjennomsnittlig skostørrelse ...


I eksemplet som ble vurdert fant vi at elevene i gjennomsnitt brukte 27 minutter på algebra-lekser. Analyse av den gitte dataserien viser imidlertid at tidsbruken til enkelte elever avviker betydelig fra 27 minutter, dvs. fra det aritmetiske gjennomsnittet. Den høyeste strømningshastigheten er 37 minutter, og den minste er 18 minutter. Forskjellen mellom største og minste tidsforbruk er 19 minutter. I dette tilfellet sier de det omfang rad er 19.

Definisjon :

I sikte rad tall er forskjellen mellom det største og minste av disse tallene.

Rekkevidden finner man når de vil bestemme hvor stor spredningen av data i en serie er.


Når vi analyserer informasjon om tiden brukt av syvendeklassinger på algebra lekser, kan vi være interessert ikke bare i gjennomsnitt Og omfang den innhentede serien med data, men også andre indikatorer. Det er for eksempel interessant å vite hvilket tidsforbruk som er typisk for en utvalgt gruppe elever, dvs. hvilket tall som forekommer oftest i dataserien. Det er lett å se at et slikt tall er tallet 25. De sier at tallet 25 er mote serien som vurderes.

Definisjon :

Mote en tallserie er det tallet som forekommer hyppigst i en gitt serie .

En tallserie kan ha mer enn ett mote eller ikke har mote i det hele tatt.

For eksempel, i serien med tall 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 to mote- Dette er tall 47 Og 52 , siden hvert av disse tallene forekommer to ganger, og de resterende tallene forekommer mindre enn to ganger i serien, og i serien med tall 69, 68, 66, 70, 67, 71, 74, 63, 73, 72 - mote Nei.


La oss vurdere en annen statistisk egenskap.

La oss starte med et eksempel. Tabellen viser strømforbruket i januar for beboere i ni leiligheter

La oss lage en ordnet serie fra dataene gitt i tabellen:

64, 72, 72, 75, 78 , 82, 85, 91, 93.

Den resulterende ordnede serien inneholder ni tall. Det er ikke vanskelig å legge merke til at i midten av raden er det tallet 78: til venstre for det er det skrevet fire tall og til høyre er det også fire tall. De sier at antallet 78 er mediantallet, eller med andre ord, median, den aktuelle rekkefølgen av tall (fra det latinske ordet mediana, som betyr "gjennomsnittlig"). Dette tallet er også vurdert median original dataserie.


La oss nå gi et annet eksempel. Anta at ved innsamling av data om strømforbruk ble ytterligere en tidel lagt til de angitte ni leilighetene. Vi fikk følgende tabell:

Akkurat som i det første tilfellet, la oss presentere de oppnådde dataene i form av en ordnet serie med tall:

64, 72, 72, 75, 78 , 82 , 85, 88, 91, 93

Denne tallserien har et partall av ledd og det er to tall plassert i midten av serien: 78 Og 82 .

Antall 80 , som ikke er medlem av serien, deler denne serien i to like store grupper: til venstre for den er det fem medlemmer av serien og til høyre er det også fem medlemmer av serien:


64, 72, 72, 75, 78, 82, 85, 88, 91, 93

De sier at i dette tilfellet er medianen for den bestilte serien under vurdering, så vel som den originale dataserien registrert i tabellen, tallet 80 .

Definisjon :

Median ryddig av en tallserie med et oddetall ledd er tallet skrevet i midten, og median en ordnet rekke med tall med et oddetall av ledd kalles det aritmetiske gjennomsnittet av de to tallene som er skrevet i midten.

Median vilkårlig av en tallserie kalles medianen til den tilsvarende ordnede rekken.


Hvis en bestilt nummerserie inneholder 2 n -1 medlemmer, da er medianen for serien n termin, siden n – 1 medlemmer verdt opptil n medlem og n – 1 medlemmer - etter n medlem.

Hvis den bestilte serien inneholder 2 n medlemmer, så er medianen det aritmetiske gjennomsnittet av medlemmene som står på n-m og n + 1 -de plassene.

I hvert av eksemplene diskutert ovenfor, definerer median, kan vi angi nummeret på leiligheten som strømforbruket til beboerne overstiger medianverdien for, dvs. median .

La oss se på et annet eksempel.

Det er kjent at 34 ansatte ved avdelingen kjøpte aksjer i et bestemt aksjeselskap. Data om antall aksjer kjøpt av ansatte er presentert i følgende rekkefølge:

2, 2, 2, 2, 2, 3, 3, ……, 3, 4, 4, ……., 4, 100

Vi finner median denne raden. Siden det er 34 tall totalt i serien, altså median lik det aritmetiske gjennomsnittet av 17. og 18. ledd, dvs. lik (3 + 4) : 2 = 3,5

Beregner gjennomsnitt av denne serien finner vi at den er omtrent lik 6,2, dvs. I gjennomsnitt kjøpte avdelingsansatte ca. 6 aksjer. Det ser vi i i dette tilfellet median reflekterer bedre den virkelige situasjonen, siden alle ansatte unntatt én kjøpte ikke mer enn 4 aksjer.

Indikatorer som f.eks gjennomsnitt , mote Og median og karakterisere dataene som er oppnådd som et resultat av observasjoner på forskjellige måter. Derfor, i praksis, når man analyserer data, avhengig av den spesifikke situasjonen, brukes enten alle tre indikatorene eller noen av dem.

Hvis for eksempel informasjon om årsinntekten til flere reiseselskaper i byen analyseres, er det praktisk å bruke alle tre indikatorene. Gjennomsnitt vil vise den gjennomsnittlige årlige inntekten til bedrifter, mote vil karakterisere en typisk årsinntekt, median vil tillate deg å identifisere reiseselskaper hvis årsinntekt er under gjennomsnittet.

Hvis du studerer data om størrelsene på herresko som selges på en bestemt dag i et varehus, er det praktisk å bruke en slik indikator som mote, som kjennetegner størrelsen i størst etterspørsel. Finne i dette tilfellet gjennomsnitt eller median gir ikke mening .

Når man analyserer resultatene vist av deltakere i en svømmetur i en avstand på 100, og den mest akseptable egenskapen er median. Kunnskap medianer vil tillate oss å velge en gruppe idrettsutøvere som har vist resultater over gjennomsnittet til å delta i konkurranser.

Statistiske egenskaper : gjennomsnitt , Maud EN, median er kalt gjennomsnittlige måleresultater .

Leksjonstype: en leksjon i å lære nytt materiale.

Hensikten med leksjonen: Skape betingelser for å mestre emnet på nivå med forståelse og primær memorering; for dannelse av matematisk kompetanse til elevens personlighet

Pedagogisk: danne en idé om statistikk som en vitenskap; gjøre studentene kjent med begrepene grunnleggende statistiske egenskaper; utvikle evnen til å finne det aritmetiske gjennomsnittet, området, modusen, medianen til en serie og analysere data.
Pedagogisk: fremme mestring av konsepter og deres tolkning; utvikling av supra-fag ferdigheter for analyse, sammenligning, systematisering og generalisering; bidra til dannelsen av nøkkelkompetanse (kognitiv, informativ, kommunikativ) i ulike stadier leksjon, bidra til dannelsen av en enhetlig vitenskapelig bilde verden ved å identifisere tverrfaglige sammenhenger mellom statistikk og ulike vitenskaper.
Pedagogisk: dyrke interesse for emnet som studeres, informasjonskultur; beredskap til å følge allment aksepterte normer og regler, høy effektivitet og organisering.

Teknologier som brukes: MDO-teknologi.
Nødvendig utstyr, materialer: multimediaprojektor, datamaskin, interaktiv tavle.

Timeplan

Organisering av tid. Klassen er delt inn i 4 grupper.

Inkluder en video fra filmen Office Romance.

WMV-fil (.wmv)

Hvilket konsept tror du vi skal snakke om i dag?

……..det stemmer, om statistikk

Hva er statistikk? (lysbilde 2)

…….. dette er definisjonen ordboken gir oss (lysbilde 3)

Påvirker statistikk menneskers liv og samfunn? Uttrykk gjetningene dine hvis du ønsker det.

Statistikk som vitenskap inkluderer forskjellige seksjoner: politisk, økonomisk, anvendt, juridisk, medisinsk, etc.

Vi vil være interessert i matematisk statistikk. Hva er spesielt med matematikkstatistikk?

…….. selvfølgelig ved hjelp av matematikk (lysbilde 4)

Matematikkstatistikk har en rekke egenskaper. (snu ordet «statistiske kjennetegn» på tavlen).

Her er konseptene. (på tavlen er det skilt med ordene: halveringslinje, lunula, muldyr, aritmetisk gjennomsnitt, median, modus, rekkevidde, diameter, middel, maksimum, optimum, invariant, konstant, høyde) Gjett hvilken av dem som kan klassifiseres som statistisk, tror du?

(Plasser de foreslåtte ordene etter ordet statistiske egenskaper)

Nå vil du vende deg til tekster som vil hjelpe deg med å bekrefte eller tilbakevise antakelsene dine: er de utvalgte konseptene statistiske egenskaper og hvor stor innflytelse statistikk har på samfunnets liv. Hver elev fikk en tabell (vedlegg 1), som han må fylle ut i løpet av timen La oss huske reglene for å jobbe i en gruppe: rolig, selvstendig, på en forretningsmessig måte, med ansvarsfordeling. Gruppen skal fylle ut tabellen (vedlegg 2)

Arbeid i grupper. Tekster for grupper. Vedlegg 3. (10 min)

Beskyttelse (definisjonslysbilde + oppgavelysbilde)

Husk å fylle ut påminnelsesarkene. (Vi spør hver gruppe som noterte hva for seg selv angående denne egenskapen i notatarket) (vedlegg 1.2)

Gjennomsnitt

La oss sette ting i orden i de statistiske karakteristikkene

(behold bare 4 egenskaper)

Gruppe 1 går til styret og snakker om de statistiske karakteristikkene - det aritmetiske gjennomsnittet, løsningen av de foreslåtte problemene, konklusjoner. (lysbilde 5,6).

Gruppe 2 går til styret og snakker om de statistiske egenskapene - modus, løsning av de foreslåtte problemene, konklusjoner. (lysbilde 7.8)

Gruppe 3 går til styret og snakker om de statistiske kjennetegnene - omfang, løsning av de foreslåtte problemene, konklusjoner. (lysbilde 9,10)

Gruppe 4 går til styret og snakker om de statistiske kjennetegnene - median, løsning på de foreslåtte problemene, konklusjoner. (lysbilde 11,12)

Alle grupper kom frem til at det er en sammenheng mellom samfunnslivet og statistikk, påvirkningen er stor, selv når vi ikke forventer det.

La oss gå til lysbildene og se hvordan statistiske egenskaper kan manifestere seg i hverdagen vår (lysbilder med vitser 13-19, 20)

Nå tilbyr vi deg å jobbe som statister. (4 problemer med praktisk innhold deles ut) (7 minutter)

Så, hvilken statistisk egenskap jobbet du med i den første oppgaven, hva fikk du?

…….. mote – øye- og hårfarge (gjennomfør en rask undersøkelse av hver gruppe)

…….. span - håndflatebredde (gjennomfør en rask undersøkelse av hver gruppe)

hvilken statistisk egenskap jobbet du med i den tredje oppgaven, hva gjorde du?

…….. median – skostørrelse (gjennomfør en rask undersøkelse av hver gruppe)

hvilken statistisk egenskap jobbet du med i den andre oppgaven, hva gjorde du?

…….. aritmetisk gjennomsnitt – høyde (gjennomfør en rask undersøkelse av hver gruppe)

Etter resultatene å dømme ser den gjennomsnittlige unge mannen i klassen vår slik ut (lysbilde 21)

Og jenta er sånn (lysbilde 22)

På et så optimistisk notat avslutter vi leksjonen vår.

(Svar på oppgaver vedlegg 5)

Vedlegg 1.

Vedlegg 2.

Vedlegg 3.

Gruppe 1. Statistikk studerer størrelsen på individuelle befolkningsgrupper i landet og dets regioner, produksjon og forbruk av ulike typer produkter, transport av varer og passasjerer med ulike transportformer, Naturlige ressurser og så videre. Resultatene fra statistiske studier er mye brukt for praktiske og vitenskapelige konklusjoner.

Aritmetisk gjennomsnitt en serie tall kalles en statistisk egenskap som lar deg finne kvotienten for å dele summen av disse tallene med antall ledd. Vanligvis blir det aritmetiske gjennomsnittet funnet når de ønsker å bestemme gjennomsnittsverdien for en bestemt serie med data: gjennomsnittlig hveteavling per hektar i regionen, gjennomsnittlig daglig melkeytelse fra en ku på gården, gjennomsnittlig produksjon av en arbeider. , etc. Merk at det aritmetiske gjennomsnittet bare finnes for homogene mengder.

For eksempel, når man studerte elevarbeidsmengden, ble en gruppe på 12 syvendeklassinger identifisert. De ble bedt om å registrere tiden (i minutter) brukt på algebra-lekser på en gitt dag. Vi mottok følgende data: 23, 18, 25, 20, 25, 25, 32, 37, 34, 26, 34, 25.

Med denne serien med data kan vi bestemme hvor mange minutter elevene i gjennomsnitt brukte på algebra-lekser. For å gjøre dette må de angitte tallene legges til og den resulterende mengden divideres med mengden, dvs. i dette tilfellet 12:

ons. aritme. ===27

Dermed fant vi at elevene brukte i snitt 27 minutter på algebra-lekser.

Finn det aritmetiske gjennomsnittet i følgende oppgaver:

Oppgave 1. Fra luftforurensningene foreslått i tabellen, som kommer fra stasjonære kilder i Khanty-Mansi autonome Okrug-Yugra, velg først utslippene av de vanligste stoffene, og bestem deretter den gjennomsnittlige mengden av disse utslippene i tre år, presentert i tabellen i tusen tonn.

faste stoffer

gassformig og flytende stoffer

svoveldioksid

nitrogenoksider

karbonmonoksid

Oppgave 2. Bestem gjennomsnittlig lufttemperatur i byen Urai 14. februar 2017, hvis du vet det på nettstedene: Yandex -9 oC, Gismeteo -11 oC rp5 -16 oC, - 11 oC, meteonovosti -15 oC, meteonova -10 oC, synoptisk -11 oC.

Statistikkens rolle i våre liv er så viktig at folk ofte, uten å tenke eller innse, stadig bruker elementer av statistisk metodikk, ikke bare i arbeidsprosesser, men også i hverdagen. Å jobbe og slappe av, handle, møte andre barn, ta noen avgjørelser, en person bruker et visst informasjonssystem som er tilgjengelig for ham, etablerte smaker og vaner, fakta, systematiserer, sammenligner disse faktaene, analyserer dem, trekker en konklusjon og tar visse beslutninger , tar spesifikke handlinger. Dermed inneholder hver person elementer av statistisk tenkning, som representerer evnen til å analysere og syntetisere informasjon om verden rundt seg.

Gruppe 2.

Betydningen av ordet " statistikk

Resultatene fra statistiske studier er mye brukt for praktiske og vitenskapelige konklusjoner.

Ved behandling av data bruker statistikk noen egenskaper, en av dem er mote. Mote brukes for eksempel til å bestemme størrelsen på klær og sko som er mest etterspurt blant kundene.

Mote serie - verdien i et sett med observasjoner som forekommer oftest. Mote = typisk. I serien 3,4,3,5,5,4,5,3,5 modus = 5. Som det vanligste tallet.

Noen ganger forekommer mer enn én modus samtidig. For eksempel: 6, 2, 6, 6, 8, 9, 9, 9, 10; modus = 6 og 9. I dette tilfellet kan vi si at populasjonen er multimodal. Av de strukturelle gjennomsnittene er det bare modusen som har en så unik egenskap.

Det er ingen modus i nummerserien 69,68,72,74,89,87,84.

Mote som gjennomsnittlig verdi brukes oftere for data av ikke-numerisk karakter. Blant de listede bilfargene - hvit, svart, metallisk blå, hvit, metallisk blå, hvit - vil moten være lik hvit. På sakkyndig vurdering med dens hjelp bestemmes de mest populære produkttypene, noe som tas i betraktning når man anslår salg eller planlegger produksjonen deres

Løs følgende problemer:

Oppgave 1. I elvene i Khanty-Mansiysk Autonome Okrug Det er mange fisker The Big Yugan River er bebodd av gjedde, abbor, mort, karpe, ide og lake. Agan-elven er hjemsted for fisk: gjedde, abbor, mort, sterlet, crucian carpe, ide, lake, nelma. Vakh-elven er hjemsted for fisk: gjedde, abbor, mort. Tromagan-elven er hjemsted for fisk: gjedde, abbor, mort, karpe, id, lake. Settet med fisk i KhMAO-Yugra er multimodalt (gjedde, abbor og mort finnes i alle elver i distriktet. Bestem den mest typiske fisken i elvene som presenteres.

Zalacha 2. Tabellen viser strømforbruket i januar for beboere i 9 leiligheter

Bestem modusen for denne serien

Gruppe 3. Betydningen av ordet " statistikk"har gjennomgått betydelige endringer i løpet av de siste to århundrene. Ordet «statistikk» har samme rot som ordet «stat» og betydde opprinnelig ledelsens kunst og vitenskap: de første universitetsstatistikklærerne i Tyskland på 1700-tallet ville i dag bli kalt spesialister i statistikk. samfunnsfag. Fordi myndighetsvedtak til en viss grad er basert på data om befolkning, industri mv. Statistikere begynte naturligvis å være interessert i slike data, og etter hvert begynte ordet "statistikk" å bety innsamling av data om befolkningen, om staten, og deretter innsamling og behandling av data generelt. Det er ingen vits i å trekke ut data hvis det ikke er noen fordel å hente på det. Derfor er en av hovedoppgavene til statistikk riktig behandling av informasjon.

I dag gjennomsyrer statistikk og dataanalyse nesten alle moderne område kunnskap: økonomi, reklame, markedsføring, business, medisin, utdanning, etc. Det bestemmer dynamikken i utvikling, nedgang eller vekst sosiale fenomener. Dette er en vitenskap som løser visse problemer takket være tilstedeværelse og utvikling statistiske metoder, inkludert takket være utviklingen informasjonsteknologi.

Ved behandling av data bruker statistikken visse egenskaper, hvorav en er medianen.

Median er verdien av et kvantum som ligger i midten av en bestilt serie.

Medianen deler serien i to like deler slik at det er like mange enheter på hver side av den. I dette tilfellet har den ene halvparten en verdi av attributtet ikke mer enn medianen, og den andre halvparten har ikke mindre.

Medianen er funnet ved hjelp av følgende algoritme:

Ordne tallene i stigende rekkefølge

Hvis en serie inneholder et oddetall av elementer, så er medianen tallet i midten;

Hvis en serie inneholder et partall av elementer, ligger medianen mellom de to midterste elementene i rekken og er lik det aritmetiske gjennomsnittet beregnet over disse to elementene.

Eksempel. Finn medianen for serien 16,13,15,10,19,22,25,12,18,14,19,14,16,10.

Løsning. La oss bygge en serie i stigende rekkefølge: 10,10,12,13,14,14,15,16,16,18,19,19,22,25, den inneholder et partall av elementer n=14, derfor medianen ligger mellom de to midterste elementene i prøven - mellom et 7-element og et 8-element: 10,10,12,13,14,14,15,16,16,18,19,19,22,25 og er lik det aritmetiske gjennomsnittet av disse elementene: Me=(15+16 )/2=15,5

La oss gi eksempler på den reelle bruken av medianen i statistikk. Så, når vi analyserer resultatene vist av deltakerne i løpet, lar medianen oss identifisere en gruppe idrettsutøvere som viste resultater over medianen og nominere dem til neste trinn i konkurransen.

Matematisk egenskapen til medianen er at summen av absolutte (modulo) avvik fra medianverdien gir minst mulig verdi. Dette faktum finner sin anvendelse, for eksempel når du løser transportproblemer, når det er nødvendig å beregne byggeplassen til et objekt nær en vei på en slik måte at den totale lengden på flyreiser til den fra forskjellige steder er minimal (stopp, gass stasjoner, lager, etc., etc. .).

Løs følgende problemer:

Oppgave 1. Aktuelle sikkerhetskostnader miljø i Khanty-Mansi Autonome Okrug utgjorde millioner av rubler:

Finn medianen for denne serien.

Gruppe 4. Statistikk- en vitenskap som omhandler innhenting, bearbeiding og analyse av kvantitative data om ulike massefenomener som forekommer i naturen og samfunnet.

En av hovedoppgavene til statistikk er riktig behandling av informasjon. Selvfølgelig har statistikk mange andre: innhenting og lagring av informasjon, utvikling av ulike prognoser, vurdering av påliteligheten, etc.

Et av de statistiske målene for forskjellen eller spredningen av data er "Rekkevidde". I sikte serie er forskjellen mellom det største og minste av disse tallene. La oss analysere problemet: Når vi studerer arbeidsmengden til studenter, ble en gruppe på 12 personer tildelt. De ble bedt om å registrere tiden (i minutter) brukt på algebra-lekser på en gitt dag. Vi mottok følgende data: 23, 18, 25, 20, 25, 25, 32, 37, 34, 26, 34, 25.

Det største tidsforbruket er 37 minutter, og det minste er 18 minutter. La oss finne rekkevidden til serien:

37-18=19 minutter.

Løs følgende problemer:

Oppgave 1. Ob-elven er en arterie Vest-Sibir og fører sine farvann over et land som Russland. Lengden på vassdraget er 3650 km. Ob-elven er nummer to blant russiske elver, nest etter Lena. Sammen med sin sideelv Irtysh, er Ob på første plass når det gjelder lengde i Russland (5410 km) og på andre plass i Asia. Dybden til Ob er fra 2-6 m i begynnelsen, nær byen Biysk , som når 25 m nær byen Novosibirsk (nær vannkraftstasjonen), reduseres til 8 m nær munningen av Tom og øker igjen til 15 m i de øvre delene av Ob-bukten, der elven renner. Finn dybdeområdet til elven Ob.

Oppgave 2. I perioden fra 17. til 19. desember nådde avviket i gjennomsnittlig daglig temperatur fra normen i Khanty-Mansi autonome okrug 16-26 grader. Og 21. desember rapporterte administrasjonen av Beloyarsk-distriktet i Khanty-Mansi autonome Okrug et temperaturfall på opptil -62°C, i Khanty-Mansiysk - 40°, i Surgut - 43°, i Urai - 38°, i Yugorsk - 42°, i Kondinsk - 33°. Finn temperaturområdet til dataene bosetninger.

Statistikk studerer størrelsen på individuelle befolkningsgrupper i landet og dets regioner, produksjon og forbruk av ulike typer produkter, transport av varer og passasjerer med ulike transportformer, naturressurser, etc. Resultatene fra statistiske studier er mye brukt for praktiske og vitenskapelige konklusjoner.

Statistikkens rolle i våre liv er så betydelig at folk ofte, uten å tenke eller innse det, stadig bruker elementer av statistisk metodikk ikke bare i arbeidsprosesser, men også i hverdagen. Å jobbe og slappe av, handle, møte andre barn, ta noen avgjørelser, en person bruker et visst informasjonssystem som er tilgjengelig for ham, etablerte smaker og vaner, fakta, systematiserer, sammenligner disse faktaene, analyserer dem, trekker en konklusjon og tar visse beslutninger , tar spesifikke handlinger. Dermed inneholder hver person elementer av statistisk tenkning, som representerer evnen til å analysere og syntetisere informasjon om verden rundt seg. Resultatene fra statistiske studier er mye brukt for praktiske og vitenskapelige konklusjoner.

Vedlegg 4.

Oppgave 1. Intervju 10 personer fra klassen. Bestem den vanligste blant dem

hår- og øyenfarge. Hvilken statistikk jobbet du med?

Oppgave 2. Intervju 10 personer fra klassen. Mål bredden på håndflatene deres. Finn forskjellen

den største og laveste verdier. Hvilken statistisk egenskap brukes

i dette problemet?

Oppgave 3. Intervju 9 personer fra klassen. Finn ut skostørrelsen deres. Still inn tallene

stigende rekkefølge. Bestem medianen av serien.

Oppgave 4. Intervju 10 personer fra klassen. Finn ut høyden deres. Finn gjennomsnittshøyden

respondenter. Hvilken type statistisk karakteristikk jobbet du med?

Vedlegg 5.

Svar på oppgaver.

Gjennomsnitt

Gjedde, abbor, mort

Laboratorierapport

i emnet "Metoder og metoder for statistisk databehandling"

Fullført av: Galimova A.R., gr. 4195

Sjekket av: Mokshin V.V.

Kazan, 2013

1. Individuell oppgave. 3

2. Planlegging av forsøk. 4

2.1. Strategisk planlegging. 4

2.1.1. D - optimale planer.. 5

3. Grunnleggende statistiske egenskaper ved ISD. 8

4. Vurdere normaliteten til ISD. 9

5. Temporal prognose. 1. 3

6. Korrelasjonsanalyse. 15

7. Klyngeanalyse. 16

8. Faktoranalyse. 22

9. Regresjonsanalyse. 27

10. Variansanalyse. 35

11. Optimalisering av faktorverdier og effektive ytelsesindikatorer. 35

Konklusjoner... 36

Applikasjon. 37

Individuell oppgave

BUF1 – for 3 plasser;

BUF2 – ubegrenset antall plasser;

GOT − eksponentiell lov, gjennomsnittlig 20 000 tidsenheter;

VOSST - spesial Earls lov, gjennomsnittlig i en fase 25 enheter. vr., telle. fase 3;

GT− uniform lov, 225±25 tidsenheter;

РК1 – eksponentiell lov, gjennomsnittlig Х1=100 enheter. tid;

RK2− normalrett, gjennomsnitt X2=90, art. av 8 enheter vr.;

KAN1-KANМ – enhetlig lov, 75±15 tidsenheter;

X3=M – antall kanaler.

Velge en kanal for overføring basert på det minste antallet oppgaver som det sendes informasjon for. Utilgjengelighetsmodusen brukes og fjernes via kanaler uavhengig av hverandre.

Fullfør simuleringen etter å ha fjernet 300 problemer fra systemet (løst pluss feil).

Optimaliserte faktorer: X1 – gjennomsnittlig løsningstid på PC1, X2 – gjennomsnittlig løsningstid på PC2, X3 – antall kanaler. X1 og X2 bør endres med ±20 % av de angitte gjennomsnittsverdiene; X3 fra 2 til 6.

La oss bygge en modell i Arena-systemet

Figur 1 - Simuleringsmodell, bygget i Arena-modelleringssystemet

Planlegging av eksperimenter

Hensikten med planlegging er å oppnå resultater med en gitt pålitelighet til lavest mulig kostnad. Det er strategisk og taktisk planlegging.

Strategisk planlegging

For strategisk planlegging vil vi bruke konseptet med en "svart boks", hvis essens er abstraksjon fra fysisk enhet prosesser som forekommer i det simulerte systemet og konklusjoner om dets funksjon kun på grunnlag av inngangs- og utdatavariabler. Inndata, uavhengige variabler kalles faktorer. Utganger er svar, deres verdi avhenger av verdiene til faktorer og parametere til OP.

Faktorer i vårt tilfelle er indikatorer (parametere) som vi skal optimalisere; svar er effektive indikatorer på driftseffektiviteten til det modellerte systemet. Strukturopplegg svart boks er vist i figur 1.

Fig.1 Blokkdiagram av black box-konseptet

Andreordensplaner lar deg danne en responsfunksjon i form av et komplett kvadratisk polynom, som inneholder et større antall ledd enn det ufullstendige kvadratiske polynomet dannet ved bruk av førsteordensplaner, og derfor krever at et større antall eksperimenter utføres . Det komplette kvadratiske polynomet for m=3 har formen:

D - optimale planer

I D- i optimale planer går ikke verdiene til faktorene utover de etablerte grensene for endringsområdene. I tillegg har de en annen betydelig fordel, som gir minimal feil over hele aksepterte spekter av faktorendringer. I praksis brukes Kono-planene og Kiefer-planene oftest.

Ris. 2 Geometrisk tolkning av Kiefers trefaktordesign på kube

Strategisk plan bestemmer antall systemalternativer som må modelleres og verdiene til faktorene i hvert alternativ. For 3 optimaliserte faktorer foreslås en D-optimal plan ved å bruke Kiefer-algoritmen, som består av 26 alternativer og er presentert i tabell 1.

Tabell 1 - Kiefers design for et 3-faktor eksperiment

x 1 x 2 x 3 x 1 x 2 x 1 x 3 x 2 x 3 x 1 x 2 x 3 x 4 x 5 x 6
-1 -1 -1 -1 -1
-1 -1 -1
-1 -1 -1 -1
-1 -1
-1
-1 -1
-1 -1 -1 -1
-1 -1
-1 -1 -1 -1
-1 -1
-1
-1 -1
-1
-1 -1
-1 -1 -1 -1
-1 -1
-1 -1 -1 -1
-1 -1
-1 -1 -1 -1

Her: ; ;

Vi beregner verdiene av X 1, X 2, X 3 i henhold til individuelle instruksjoner. I henhold til betingelsene for den enkelte oppgaven er de optimaliserte faktorene: X1 – gjennomsnittlig løsningstid på PC1, X2 – gjennomsnittlig løsningstid på PC2, X3 – antall kanaler. X1 og X2 bør endres med ±20 % av de angitte gjennomsnittsverdiene; X3 fra 2 til 6.

På PK1, den eksponentielle lovbetingelsen, er gjennomsnittet 100 tidsenheter, derfor er verdien 0 - 100, 1-120, -1 -80 (siden vi endrer med ±20 % av den angitte gjennomsnittsverdien.

RK2 følger normalloven i henhold til oppdragsbetingelsene og gjennomsnittsverdien er 90 enheter. tid og modifikator ±20 tidsenheter, derfor 0-90, 1 – 108, -1-72. Vi legger inn alle data i tabell 2.

Tabell 1 - Data for faktorene X 1, X 2, X 3

-1
x1
x2
x3

Y 1 – PC1 utnyttelsesgrad (0÷1)*100 %;

Y 2 - PC2 utnyttelsesgrad (0÷1)*100 %;

Y 3 – Gjennomsnittlig totaltid for å fullføre oppgaver.

Den D-optimale planen i henhold til Kiefer-algoritmen for en individuell oppgave og svarene Y 1 , Y 2 , Y 3 på faktorene til den enkelte oppgaven er presentert i tabell 3.

Tabell 2 - D-optimal plan i henhold til Kiefer-algoritmen (for individuelle oppgaver)

x 1 x 2 x 3 x 1 x 2 x 1 x 3 x 2 x 3 x 1 x 2 x 3 x 4 x 5 x 6

Tabell 4 - Svar Y 1, Y 2, Y 3

Y 1 Y2 Y 3
32,24 30,41 309,16
36,41 28,81 322,98
43,54 26,95 322,92
32,23 38,00 326,79
36,42 36,00 339,98
43,54 33,75 338,75
32,22 45,6 344,71
36,44 43,18 357,16
43,54 40,56 354,91
32,24 30,41 309,16
36,41 28,82 310,97
43,54 26,95 322,91
32,23 38,00 326,79
36,42 36,01 327,97
32,22 45,59 344,70
36,44 43,19 345,15
43,54 40,56 354,91
32,24 30,41 309,16
36,41 28,77 314,34
43,54 26,95 322,91
32,23 38,00 326,79
36,42 35,96 331,34
43,54 33,75 338,75
32,22 45,59 344,70
36,44 43,14 348,51
43,54 40,56 354,91

Grunnleggende statistiske egenskaper ved ISD.

De viktigste statistiske egenskapene er:

1. Gyldig N - prøvestørrelse;

2. Gjennomsnitt - aritmetisk gjennomsnitt. Gjennomsnittsverdien til en tilfeldig variabel representerer dens mest typiske, mest sannsynlige verdi, et slags senter som alle verdiene til attributtet er spredt rundt.

3. Median – median. Medianen er verdien av en tilfeldig variabel som deler alle utvalgstilfeller i to like deler.

4. Standardavvik - standardavvik. Standardavvik (eller standardavvik) er et mål på variasjonen (variasjonen) til en egenskap. Den viser hvor mye tilfeller i gjennomsnitt avviker fra gjennomsnittsverdien til karakteristikken.

5. Varians – spredning. Dispersjon er et mål på variasjon, variasjon av en egenskap og representerer midtre firkant tilfellers avvik fra gjennomsnittsverdien av karakteristikken. I motsetning til andre variasjonsindikatorer, kan varians dekomponeres i dens komponentdeler, og dermed tillate en å evaluere påvirkningen ulike faktorer til variasjon av en egenskap.

6. Standard feil av gjennomsnitt. Standardfeilen til gjennomsnittet er hvor mye utvalgets gjennomsnitt avviker fra populasjonsgjennomsnittet, forutsatt at fordelingen er nær normalen.

7. 95 % konfidensgrenser for gjennomsnitt - 95 % konfidensintervall for gjennomsnittet. Intervallet der gjennomsnittsverdien av en populasjonskarakteristikk faller med sannsynlighet 0,95.

8. Minimum, maksimum - minimum og maksimum verdier.

9. Skjevhet – asymmetri. Asymmetri karakteriserer graden av forskyvning variantserie i forhold til gjennomsnittsverdien i størrelse og retning.

10. Standard feil for skjevhet – standard feil for asymmetri.

11. Kurtosis – overskudd. Kurtosis karakteriserer graden av konsentrasjon av tilfeller rundt gjennomsnittsverdien og er et slags mål på kurvens bratthet.

12. Standard feil av Kurtosis - standard feil av kurtosis.

Tabell 5 - Resultater av beskrivende statistikk


Vurderer normaliteten til ISD.

Normalloven er den mest brukte. Den brukes til å representere et bredt spekter av tilfeldige prosesser, slik som forventet levealder, endringer i økonomiske og tekniske indikatorer.

La oss anta at de innledende statistiske dataene er underlagt normalloven, og som parametere for normalloven vil vi akseptere estimater av den matematiske forventningen og standardavviket beregnet ved hjelp av formlene.

Den normale lovtetthetsfunksjonen har formen:

; .

Hvis konfidensen P i antakelsen om normalitet til den empiriske fordelingen, som kan finnes fra statistiske tabeller, ikke er mindre enn 0,20, avvises ikke antakelsen om normalitet. Hvis R k<0,20, то предположение о нормальности рекомендуется отвергнуть.

Korrespondansen mellom de empiriske og hypotetiske fordelingene kan overvåkes visuelt ved hjelp av grafer. Når du bruker Kolmogorovs godhet-of-fit-test, er det å foretrekke å bruke distribusjonsfunksjoner. Slike grafer er konstruert og produsert i spesielle programvareprosedyrer PPP Statistica 6.0 og Excel 2007, som beregningene er orientert mot ved hjelp av det matematiske apparatet som presenteres. La oss forestille oss fordelingen av variabler på histogrammer (fig. 3.-fig. 8.).

Tettheten til normalfordelingen legges over histogrammene for å kontrollere distribusjonens nærhet til normalformen ved å bruke Kolmogorov-Smirnov-testen.


Relatert informasjon.


Laboratoriearbeid nr. 9

Statistisk dataanalyse

Målet med arbeidet: lære å behandle statistiske data i regneark ved hjelp av innebygde funksjoner; utforske mulighetene til analysepakken i MS Excel 2010 og noen av dens verktøy: Generering av tilfeldige tall, histogram, beskrivende statistikk.

Teoretisk del

Svært ofte for behandling av data innhentet som et resultat av å undersøke et stort antall objekter eller fenomener ( Statistisk data), brukes metoder for matematisk statistikk.

Moderne matematisk statistikk er delt inn i to brede områder: beskrivende Og analytisk statistikk. Beskrivende statistikk dekker metoder for å beskrive statistiske data, presentere dem i form av tabeller, distribusjoner osv.

Analytisk statistikk kalles også teorien om statistisk slutning. Emnet er behandlingen av data innhentet under eksperimentet og formuleringen av konklusjoner som har praktisk betydning for en lang rekke områder av menneskelig aktivitet.

Settet med tall oppnådd som et resultat av undersøkelsen kalles statistisk aggregat.

Prøvepopulasjon(eller prøvetaking) er en samling av tilfeldig valgte objekter. Generell befolkning er samlingen av gjenstander som prøven er laget av. Volum av en populasjon (generelt eller utvalg) er antall objekter i denne populasjonen.

For statistisk bearbeiding presenteres resultatene av objektforskning i form av tall x 1 ,x 2 ,…, x k. Hvis verdien x 1 observert n 1 gang, verdi x 2 observert n 2 ganger osv., deretter de observerte verdiene x i er kalt alternativer, og antall repetisjoner n i er kalt frekvenser. Prosedyren for å telle frekvenser kalles datagruppering.

Prøvestørrelse n lik summen av alle frekvenser n i:

Relativ frekvens verdier x i frekvensforholdet til denne verdien kalles n i til prøvestørrelse n:

Statistisk frekvensfordeling(eller ganske enkelt frekvensfordeling) er en liste over alternativer og deres tilsvarende frekvenser, skrevet i tabellform:



Relativ frekvensfordeling kalt en liste over alternativer og deres tilsvarende relative frekvenser.


Grunnleggende statistiske egenskaper.

Moderne regneark har et stort utvalg av verktøy for å analysere statistiske data. De mest brukte statistiske funksjonene er innebygd i hovedkjernen av programmet, det vil si at disse funksjonene er tilgjengelige fra det øyeblikket programmet startes. Andre mer spesialiserte funksjoner er inkludert i tilleggsrutiner. Spesielt i Excel kalles en slik rutine analyseverktøy. Analysepakkens kommandoer og funksjoner kalles analyseverktøy. Vi vil begrense oss til å undersøke noen få grunnleggende innebygde statistiske funksjoner og de mest nyttige analyseverktøyene i Excel-regnearkanalysepakken.

Gjennomsnittlig verdi.

AVERAGE-funksjonen beregner utvalget (eller det generelle) gjennomsnittet, det vil si den aritmetiske gjennomsnittsverdien til en karakteristikk av et utvalg (eller generell) populasjon. Argumentet til AVERAGE-funksjonen er et sett med tall, vanligvis spesifisert som et celleområde, for eksempel =AVERAGE(A3:A201).