Deskriptorer

Maksimun

Definition: Maksimum defineres som det tal med den største talværdi i et datasæt.

Minimum

Definition: Minimum defineres som det tal med den mindste talværdi i et datasæt.

Middelværdi

Definition: Middelværdien defineres som gennemsnittet af talværdierne i datasættet. Middelværdien for populationsdata benævnes normalt med symbolet \(\mu\) (my). For stikprøvedata bruges i stedet symbolet \(\bar{x}\) (x-streg). $${ X=\{x_1,x_2,...,x_n\} }$$ $${ \mu = \frac{x_1 + x_2 + ... + x_n}{n} }$$

Variationsbredde

Definition: Variationsbredden er afstanden mellem maksimum og minimum.

MEDIAN

Definition: Medianen deler datasættet i to lige store dele. Hvis elementerne i et datasæt ordnes, så talværdierne er stigende fra venstre mod højre, så er medianen det midterste elements talværdi. Er der et lige antal elementer i datasættet, så er medianen gennemsnittet af de to midterste elementers talværdi.

SKÆVHED

Definition: Hvis middelværdien er større end medianen, er datasættet højreskævt. Hvis middelværdien er mindre end medianen, er datasættet venstreskævt.

KVARTILER

Definition: Kvartiler deler datasættet i fire lige store dele. Der er i alt fem kvartiler, hvor 0. kvartil (Q0) er det samme som minimum, 2. kvartil (Q2) er det samme som medianen, og 4. kvartil (Q4) er det samme som maksimum.

Hvis der er et lige antal elementer i datasættet, beregnes 1. kvartil (Q1) på samme måde som medianen for den første halvdel af datasættet og 3. kvartil (Q3) som medianen for den sidste halvdel af datasættet.

Hvis der er et ulige antal elementer i datasættet, medtages medianen ikke i hverken den første eller sidste halvdel af datasættet, og kvartilerne beregnes som ovenfor.

Note: Der er desværre ikke enighed i verden om, hvordan kvartiler beregnes, så der kan være andre acceptable måder, som vil give et anderledes resultat.

KVARTILBREDDE

Definition: Kvartilbredden er afstanden fra 1. kvartil til 3. kvartil. Den kaldes også for kvartilafstanden.

BOKSPLOT

Definition: Et boksplot er et plot, som viser de fem kvartiler, hvor kvartilbredden er fremhævet.

FRAKTILER

Definition: En fraktil er en procentgrænse, hvor andelen af elementer, som er mindre end eller lig med fraktilen, er mindst lige så stor som fraktilens procentværdi.

Den kan beregnes som værdien for \(x_i\), givet \(i \geq \frac{P}{100} \cdot n\), hvor \(i\) er det mindste tal, som opfylder uligheden, \(P\) er fraktilens procent, og \(n\) er antallet af elementer i datasættet.

Note: Dette er en blandt flere accepterede måder at beregne fraktiler på. De forskellige måder giver forskellige resultater, men har alle det tilfælles, at de bliver mere ens jo flere elementer, der er i et datasæt.

HYPPIGHED

Definition: Hyppigheden for et tal er det antal gange, som det forekommer i datasættet.

TYPETAL

Definition: Det eller de tal, som forekommer oftest kaldes for typetallet. Det er også det tal med den største hyppighed.

FREKVENS

Definition: Frekvensen for et tal er hyppigheden i procent af det samlede antal elementer i datasættet. $${ \text{frekvens}=\frac{\text{hyppighed}}{n} }$$ Den akkumulerede (eller kumulerede) frekvens er summen af frekvenserne for alle talværdierne mindre end eller lig med tallet.

VARIANS

Definition: For en population beregnes variansen som den gennemsnitlige kvadratafvigelse. $${ VAR_p=\frac{1}{n}\cdot \sum_{i=1}^n (x_i-\mu)^2=\frac{(x_1-\mu)^2+(x_2-\mu)^2+...+(x_n-\mu)^2}{n} }$$ hvor \(\mu\) er populationens middelværdi.

For en stikprøve beregnes variansen $${ VAR_s=\frac{1}{n-1}\cdot \sum_{i=1}^n (x_i-\bar{x})^2=\frac{(x_1-\bar{x})^2+(x_2-\bar{x})^2+...+(x_n-\bar{x})^2}{n-1} }$$ hvor \(\bar{x}\) er stikprøvens middelværdi.

SPREDNING

Definition: Spredningen er kvadratroden af variansen.

For en population skrives $${ \sigma=\sqrt{VAR_p} \text{ eller }\sigma^2=VAR_p }$$ For en stikprøve skrives $${ s=\sqrt{VAR_s} \text{ eller } s^2=VAR_s }$$ Note: Spredningen kaldes også for standardafvigelsen.

ANTAL INTERVALGRUPPER

Antallet af intervalgrupper bør i udgangspunktet være \(\sqrt{n}\). Dog bør det tilpasses, så intervalbredden passer med det forventede og normalt bør antallet af intervalgrupper være mellem 5-10 (evt. 12 ved måneder), for at der dels er nok data i hver intervalgruppe. Men der skal heller ikke være for mange, så man mister overblikket.

FORDELING I INTERVALGRUPPEN

Når kildedata ikke er kendt, antages data at være jævnt fordelt i et interval.

VARIANS OG SPREDNING - SÆRLIGT FOR GRUPPEREDE DATA

Ved beregning af varians og spredning antages det, at alle data i et interval har intervallets middelværdi, men ellers er beregningen præcis den samme som ved kildedata.

SIMPELT INDEKS

Definition: Indekstallet til et givet tidspunkt i beregnes som \(\frac{x_i}{x_0} \cdot 100\), hvor \(x_i\) angiver den faktiske værdi, og \(x_0\) angiver den faktiske værdi i referencetidspunktet. Referencetidspunktet kaldes også basisår, hvis udviklingen ses over et bestemt antal år.

SIMPELT INDEKS MED LØBENDE BASISÅR

Et simpelt indeks med løbende basisår er en variant af det simple indeks, hvor basisåret hele tiden beregnes som året lige før.

VÆRDIINDEKS

Definition: Et værdiindeks (PQ-indeks) beregnes som $${ PQ_{n:0}=\frac{\sum p_n \cdot q_n}{\sum p_0 \cdot q_0} \cdot 100 }$$

LASPEYRES' PRISINDEKS

Definition: Laspeyres’ prisindeks beregnes vægtet med mængder fra basisåret. $${ P_{n:0}^{\mathrm{La}} = \frac{\sum p_n \cdot q_0}{\sum p_0 \cdot q_0} \cdot 100 }$$

PAASCHES PRISINDEKS

Definition: Paasches prisindeks beregnes vægtet med mængder fra år n. $${ P_{n:0}^{\mathrm{Pa}}=\frac{\sum p_n \cdot q_n}{\sum p_0 \cdot q_n} \cdot 100 }$$

FISCHERS PRISINDEKS

Definition: Fischers prisindeks beregnes som det geometriske gennemsnit af Laspeyres’ prisindeks og Paasches prisindeks. $${ P_{n:0}^{\mathrm{Fi}}=\sqrt{P_{n:0}^{La} \cdot P_{n:0}^{Pa}} }$$