I 'Statistikhörnan' publiceras kortare eller längre inlägg om statistisk analys eller problemformulering eller annat som hör till ämnet. På denna sida visas en kort beskrivning via siffran till vänster. Rubriken är en länk till ett större dokument.       Alla är välkomna med bidrag!

  «1»   Avrundning och normalitetstest...

  «3»   Idén med plus/minus 3-sigma...

  «5»   'Midnattsloppet' i Göteborg...

  «7»   0 fel bland 'n' kontrollerade...

  «9»   EM-fotboll 2012...

«11»   Stickprovsparadoxen...

«13»   En sannolikhetsberäkning...

«15»   Antal kvinnor i styrelser...

«1» Rounding error and test of normality:

There is a common statistical test called Anderson-Darling (AD), (see the literature for details). It is very often used to test the normality of a set of data and is routinely incorporated in common computer programs. However, the normal distribution is a continuous distribution and thus numerical values have (theoretically) an unlimited number of decimals while real measurements always carry a limited, often small, number of decimals.

This paper shows, by simulation, how the test is influenced by number of decimals but also how adding a small random term improves the result. (NB that a set of data having a limited number of decimals is formally a discrete distribution and thus, by definition, not a normal distribution and thus correctly rejected by the test. Although, such an interpretation is usually too strict and perhaps useless).

(pages: 5, size: 324k, format: doc, language: eng)  •
«3» The following text comes from Canadian Family Physician Vol 38, Nov -92:

'Summary Fifteen percent of biopsy-proven respondents saw five or more doctors before 'Celiac Disease' was diagnosed. Mean delays in diagnosis ranged from 5.8 (±10.9) years for those with nausea and vomiting and 13.9 (±14.5) years for those with headache or migraine.'

The data material is very skewed and the minimum value is 1 month, median is one year, and maximum value is > 60 years. The example is illuminating as when it is shown many people starts to think using a normal distribution in the back of their minds and therefore become confused as already one standard deviation below the mean gives negative values!! The article is otherwise serious and correct.

(pages: 2, size: 51k, format: doc, language: eng)  •
«5» 'Midnattsloppet' i Göteborg

Dokumentet innehåller några grafer över data från Midnattsloppet, augusti 2009. Loppet går i centrala Göteborg (och på andra ställen) sent en lördagskväll genom delvis mörka gator. Festglada människor, ibland alltför festglada, kantar motionsvägen.

(sidor: 3, storlek: 872k, format: pdf, språk: sv)  •
«7» 0 fel bland 'n' kontrollerade

A short story about the special case when you check 'n' items, humans, etc and you find 0 faulty items or 0 humans with a certain disease, attribute, etc. In most discussions people will react with a short 'good!' but what inference about the true fault rate can be done?
An amazingly easy and powerful approximation can be used. The document also contain the theoretical derivation of the approximation.

(pages: 3, size: 102k, format: doc, language: eng)  •
«9» EM-fotboll 2012

Sport och idrott innehåller ofta numeriska resultat som intresserar människor. De variabler som mäts kan också anses vara typiska för ett industriellt sammanhang.

Dokumentet använder bl.a. Poissonfördelningen för att beskriva resultatet från fotbolls-EM under sommaren 2012. 'StaM-Bladet' (se referenser i dokumentet) innehåller också ungefär samma beskrivning för VM 1990 0ch 1994.

(sidor: 5, storlek: 496k, format: pdf, språk: sv)  •
«11» Stickprovsparadoxen

När man diskuterar ett stickprovsförfarande på ett företag blir det alltid tal om partistorlekar och att '...självklart måste man ta hänsyn till dessa då man tar sitt prov...'. Visst verkar det naturligt att öka stickprovets storlek då man har större partier. Det visar sig dock, kanske paradoxalt, att partistorleken spelar ingen eller mycket ringa roll vid praktiskt stickprovstagning. Detta faktum kallas ibland på engelska för 'The Sampling Paradox' och i dokumentet reder vi ut en del fakta med hjälp av statistikteori.

(sidor: 3, storlek: 332k, format: pdf, språk: sv)  •
«13» En sannolikhetsberäkning

Dokumentet diskuterar sannolikheten för ett utfall då man kontrollerar 1800 produkter som producerats av 6 identiska positioner.
Resultatet blev 3 felaktiga produkter från en och samma position.
Fråga är nu: "Vad är sannolikheten för denna händelse, dvs att alla tre felaktiga kommer från samma position?

Lösningen är att använda den klassiska beskrivningen av sannolikhet nämligen 'antal gynnsamma fall' dividerat med 'antal möjliga fall':

   p= antal gynnsamma fall antal möjliga fall
(Antal sidor: 2, storlek: 234k, format: pdf, språk: sv)  •
«13» Antal kvinnor i styrelser...

Dokumentet diskuterar hur man kan resonera i samband med frågan om kvinnorepresentation i styrelser. Man kan få åtminstone ett visst stöd i retoriken om man kan använda statistik teori och ett statistiskt resonemang baserat på binomialfördeiningen.


(Antal sidor: 2, storlek: 90k, format: pdf, språk: sv)  •

  «2»   Två normalfördelningar och fem krav...

  «4»   Shainins försöksplaner...

  «6»   Slumpmässiga stickprov...

  «8»   0 händelser under en tidsperiod...

«10»   Lognormalfördelningen – några enkla...

«12»   Beräkning av startat antal...

«14»   Noggrannhet hos två klockor...

«16»   NPS som mätetal...

«2» Two normal distributions and five requirements:

Frequently the very mathematics or statistics of a problem is fairly straightforward. Instead, the formulation of the problem might need some extra thinking and this document discusses such a problem. Suppose that we have a process that welds two seams of a plastic bag containing a liquid. The liquid is released by squeezing the bag by hand until the weaker seam breaks.

This document discusses a rather simple situation involving two normal distributions but where an extra requirement makes the formulation slightly more difficult. By considering the problem as a bivariate situation it becomes simpler. We do not involve the theoretical bivariate distribution, as it would disturb the discussion. See also the button 'Webbinarium' and webbinarium 1. More info is available via the button Arkiv>Smått&gott and the document 'Webbinarium 1, Two normal.zip'.

(pages: 3, size: 209k, format: doc, language: eng)  •
«4» Shainins försöksplaner

Det finns problem av flera olika slag. Många av dem har sin grund i slumpmässig variation: vissa enheter funkar bra, andra sämre fast de ser likadana ut. En man som hette Shainin pekade ut en metod för att angripa sådana problem. Det här inlägget beskriver den typ av statistiska försöksplaner som Shainin utvecklade för detta ändamål.

(sidor: 3, storlek: 1.1Mb, format: pdf, språk: sv)  •
«6» Slumpmässiga stickprov

Om en statistiker vill lära sig något om en population brukar han eller hon ta ett stickprov från populationen och beräkna medelvärde, standardavvikelse eller vad man nu är intresserad av. Men vi vet alla att det är svårt att ta ett stickprov på ett sätt så att stickprovet blir representativt. Svårigheten illustreras i den här artikeln med ett exempel som är så tokigt att vi alla kan skratta åt det – men hade det formulerats i andra ord hade vi kanske gjort likadant själva!

(sidor: 2, storlek: 160k, format: pdf, språk: sv)  •
«8» 0 händelser under en tidsperiod

Suppose that you have observed an event process and found 0 events during the observed time, surface, volume or whatever you have studied. You have chosen the Poisson as a model for the outcome. How can you proceed using the available information to draw conclusions about the intensity λ of the process?
The document discusses some ideas.

(pages: 2, size: 55k, format: doc, language: eng)  •
«10» Lognormalfördelningen – några enkla iakttagelser

I de flesta läroböcker beskrivs ofta lognormalfördelningen, och de flesta andra fördelningar, med ett matematiskt uttryck inklusive dess parametrar. Från detta matematiska uttryck har sedan väntevärde och standardavvikelse härletts som en funktion av parametrarna.
Om man vill ta reda på vilka 'in-parametrar' som ger ett visst väntevärde och standardavvikelse kan det ibland bli besvärligt. Detta dokument anger några sätt hur man kan göra just detta i en lognormalfördelning.

(sidor: 3, storlek: 406k, format: pdf, språk: sv)  •
«12» Beräkning av startat antal

Antag att vi producerar elektronikkomponenter, t.ex. mönsterkort. Vi börjar då med ett råmaterial, ett ämne, som vi sedan förädlar genom att borra hål för komponenter, etsa fram mönster, skyddslacka ytan, konturbearbeta. Varje sådan operation är inte helt felfri så i slutändan har man antagligen färre produkter än antal ämnen vid start.
Om vi i slutändan har färre produkter än vi har lovat kunden uppstår kostnader av typ omstartskostnader, förseningskostnader, etc. Om vi i stället har fler produkter tvingas vi kassera eller ge bort dem utan ersättning. Hur skall man eller kan man resonera om det 'överantal' som man bör starta med?

(sidor: 4, storlek: 184k, format: doc, språk: sv)  •
«14» Noggrannhet hos två klockor

Texten behandlar mätresultatet då två vanliga moderna armbandsklockor jämförts med tiden som anges i en vanlig TV. Jämförelsen har skett över några veckor.

Dessutom finns samma mätresultat för en avsevärt billigare klocka.


(sidor: 14, storlek: 205k, format: doc, språk: eng)  •
«16» NPS som mätetal...

Det är populärt att hitta på olika slags nyckeltal, KPI (Key Performance Indicator). NPS (Net Promotor Score) är ett sådant som används för att titta på något slags kundtillfredsställelse. Enligt förespråkarna är det mycket användbart och kan ge användarna värdefull information hur de betraktas av sina kunder.
Emellertid är det också viktigt att undersöka och förstå nyckeltalets numeriska egenskaper, variation, avigsidor, etc.

Dokumentet visar ett resonemang samt en simulering.

(sidor: 4, storlek: 176k, format: docx, språk: sv)  •
Warning: include(../meny/menyerindstat.html): Failed to open stream: No such file or directory in /customers/1/5/b/indstat.se/httpd.www/stathornan/statistikhornan1.php on line 399 Warning: include(): Failed opening '../meny/menyerindstat.html' for inclusion (include_path='.:/usr/share/php') in /customers/1/5/b/indstat.se/httpd.www/stathornan/statistikhornan1.php on line 399