Aritmetiskt medelvärde

Från Wikipedia, den fria encyklopedin
Hoppa till navigation Hoppa till sökning

Det aritmetiska medelvärdet , även kallat det aritmetiska medelvärdet (kallas i genomsnitt också genomsnittet ) är en term som används i statistik . Det är en platsparameter . Vi beräknar detta medelvärde med summan av de observerade talen med deras taldelningar .
Det aritmetiska medelvärdet för ett prov kallas också det empiriska medelvärdet . [1]

definition

Halva summan av två storlekar och ges av:

.

Som storlekarna bilda en aritmetisk sekvens , är summan av egenskaperna hos egenskaperna dividerat med antalet funktionsbärare

som "aritmetiskt medelvärde" (läsa: tvärs över ). Om det aritmetiska medelvärdet inte vägs (se även avsnittet Viktat aritmetiskt medelvärde ) kallas det också för enkelt aritmetiskt medelvärde eller ovägt aritmetiskt medelvärde .

Till exempel är det aritmetiska medelvärdet av de två talen och :

.

Det aritmetiska medelvärdet beskriver mitten av en fördelning med ett numeriskt värde och representerar således en positionsparameter Det aritmetiska medelvärdet definieras meningsfullt för alla metriska egenskaper. I allmänhet är den inte lämplig för kvalitativa drag, men den ger digotomiska egenskaper med två kategorier och en meningsfull tolkning. I detta fall är det aritmetiska medelvärdet detsamma som den relativa frekvensen . [2] Ibland används genomsnittssymbolen ø för att beteckna det aritmetiska medelvärdet. Till skillnad från den empiriska medianen är det aritmetiska medelvärdet mycket mottagligt för outliers (se median ). Det aritmetiska medelvärdet kan tolkas som "mitten av" mätvärdena. Det finns dock ingen information om i vilken utsträckning mätvärdena sprider sig runt det aritmetiska medelvärdet. Detta problem kan lösas med införandet av "medelkvadratavvikelsen" från det aritmetiska medelvärdet, den empiriska variansen .

Definition för frekvensdata

För frekvensdata med egenskaperna och de tillhörande relativa frekvenserna det aritmetiska medelresultatet som [3]

.

Aritmetiskt medelvärde för skiktning

Om ett stratifierat urval är tillgängligt är det aritmetiska medelvärdet för skikten känt, det aritmetiska medelvärdet för den totala undersökningen kan beräknas. Det är en undersökningspopulation med Funktionsbärare i skikten med respektive antal funktionsbärare och aritmetiska medel tilldelas. Det aritmetiska medelvärdet i definieras sedan av [3]

.

Rekursiv representation av det aritmetiska medelvärdet

När man överväger stationära stokastiska processer där data registreras i kronologisk ordning, är det lämpligt att använda en rekursionsformel för att beräkna det aritmetiska medelvärdet. Detta kan härledas direkt från grundformeln för det aritmetiska medelvärdet. Som kan ses i den angivna formeln för små uppgifterna tyngre viktade och för stora det tidigare beräknade aritmetiska medelvärdet. Fördelen med rekursionsformeln är att data behöver inte sparas, vilket är z. B. erbjuder för applikationer på en mikrokontroller .

Ett första steg för att göra denna rekursiva variant av det aritmetiska medelvärdet användbart för tidsvariabla stokastiska processer är införandet av en så kallad glömningsfaktor . Tidsvariabel här betyder att det verkliga förväntade värdet varierar som en funktion av tiden. Normalt kan det antas att klustermedelsvärdena motsvarar de tidsmässiga medelvärdena. Införandet av glömningsfaktorn innebär att rekursionsekvationen kan reagera på sådana förändringar. En möjlighet är t.ex. B. en procentuell viktning av gränsvärdet för :

Att kringgå de rationella termerna beroende på , kan denna ekvation också användas direkt i gränsvärdet specificera enligt följande:

Naturligtvis måste det klargöras om detta tillvägagångssätt är praktiskt genomförbart i en viss tillämpning. Det bör noteras att användning av gränsvärdet resulterar i ett annat "övergående svar". Ur systemteori (eller kontrollteknik) synas en sådan rekursionsekvation också som ett tidsdiskret PT1-element . I praktiskt språkligt språk skulle man använda parametern som det beskrivs här, kalla det "fumelfaktorn", som är avsedd att avslöja att detta initialt inte är optimalt valt. Kalman -filtret , Wiener -filtret , den rekursiva minst kvadratiska algoritmen , metoden för maximal sannolikhet och i allmänhet det optimala filtret bör nämnas ytterligare om detta ämne.

Jämförelse av de rekursiva aritmetiska medelvärdena med och utan glömningsfaktorn i en enkel tidsvarierande stokastisk process

Beteendet för rekursionsekvationerna som ges här kan ses som ett exempel på en enkel ostadig, stokastisk process ( normalt fördelad i områden ). Under tiden visar det förväntade värdet och variansen av slumpmässiga data ett oregelbundet beteende. Den enkla rekursionsekvationen utan att glömma faktorn (aritmetiskt medelvärde 1) reagerar bara mycket långsamt på beteendet hos datamängden. Medan rekursionsekvationerna med glömningsfaktor (aritmetiskt medelvärde 2 & 3, ) reagerar mycket snabbare. Det märks också att algoritmerna med glömningsfaktorn leder till en något högre ljudnivå. I det här exemplet bör det dock vara klart att den snabbare responstiden har företräde. Resultaten "Aritmetiskt medelvärde 2" och "Aritmetiskt medelvärde 3" skiljer sig mycket lite från varandra. Beroende på datauppsättningen, särskilt datamängden, kan detta se väldigt annorlunda ut.

egenskaper

Ersättningsvärde

Det följer direkt av definitionen av det aritmetiska medelvärdet att

.

När du får det aritmetiska medelvärdet med urvalsstorleken multipliceras, då får du summan av funktionerna . [4] Denna beräkningsregel kallas substitutvärdeegenskapen eller extrapolationsegenskapen och används ofta i matematiska bevis. Det kan tolkas enligt följande: Summan av allt Individuella värden kan ses som ersatta av lika värden för storleken på det aritmetiska medelvärdet.

Fokus egendom

Avvikelserna av de uppmätta värdena från medelvärdet

kallas också "uppenbara fel". Tyngdpunktsegenskapen (även kallad nollegenskap ) betyder att summan av de uppenbara felen eller summan av avvikelserna för alla observerade mätvärden från det aritmetiska medelvärdet är lika med noll, d.v.s.

eller vid frekvens .

Detta kan visas med hjälp av egenskapen substitutvärde enligt följande:

Tyngdpunkten spelar en stor roll i begreppet frihetsgrader . På grund av egenskapen hos tyngdpunkten för det aritmetiska medelvärdet är den sista avvikelsen redan genom det första definitivt. Följaktligen bara variera Avvikelser är fria och man är därför i genomsnitt, t.ex. B. med den empiriska variansen genom att titta på antalet frihetsgrader dividerat. [5]

Optimality -egendom

I statistiken är man ofta intresserad av summan av de kvadrerade avvikelserna från ett centrum för att minimera. När du sätter mitten genom ett värde vill sätta på den horisontella axeln, som är summan av de kvadrerade avvikelserna

mellan datum och centrum minimeras då är minimeringsvärdet. Detta resultat kan uppnås genom att helt enkelt härleda den objektiva funktionen till som ska visas:

.

Detta är ett minimum eftersom det är det andra derivatet av till är lika med 2, dvs. större än 0, vilket är en tillräcklig förutsättning för ett minimum.

Detta resulterar i följande optimitetsegenskap (även kallad minimeringsegenskap):

för alla [6] eller med andra ord [7]

Linjär transformationsegenskap

Beroende på skalnivå är det aritmetiska medelvärdet likvärdigt med speciella transformationer. Det gäller den linjära omvandlingen [6]

,

där

.

Triangel ojämlikheter

Följande triangel ojämlikhet gäller det aritmetiska medelvärdet: Det aritmetiska medelvärdet av positiva egenskaper är större än eller lika med det geometriska medelvärdet för dessa karakteristiska värden, d.v.s.

.

Jämlikheten ges bara om alla egenskaper är desamma. Dessutom gäller det absoluta värdet för det aritmetiska medelvärdet för flera karakteristiska värden att det är mindre än eller lika med rotmedeltorget

. [Åttonde]

Exempel

Enkla exempel

  • Det aritmetiska medelvärdet på 50 och 100 är
  • Det aritmetiska medelvärdet av 8, 5 och −1 är

Applikationsexempel

En bil kör 100 km / h i en timme och 200 km / h följande timme. Med vilken konstant hastighet måste en annan bil köra för att köra samma sträcka på två timmar?

Vägen som den första bilen har kört totalt är

och den andra bilen

i vilken är hastigheten på den andra bilen. Ut gav upp

och sålunda

Vägt aritmetiskt medelvärde

Du kan också definiera ett vägat aritmetiskt medelvärde (även känt som ett vägat aritmetiskt medelvärde). Det utvidgar omfattningen av det enkla aritmetiska medelvärdet till värden med olika viktningar . Ett exempel är beräkningen av ett skolbetyg, där muntliga och skriftliga prestationer ingår i olika grader. När Richmanns blandningsregel används för att bestämma blandningstemperaturen för två kroppar gjorda av samma material, beräknas också ett viktat aritmetiskt medelvärde.

Beskrivande statistik

Till exempel används det vägda medelvärdet när man tittar på medel , slutet Prover av samma population med olika urvalsstorlekar vill kombinera:

.

sannolikhetsberäkning

Provmedelvärde

De specifika egenskaperna kan ses som insikter om slumpmässiga variabler grepp. Alla Värde representerar således en realisering av respektive slumpmässig variabel efter att provet har dragits Det aritmetiska medelvärdet av dessa slumpmässiga variabler

är också känt som provmedelvärdet och är också en slumpmässig variabel.

Omvägd variansvägning

Är oberoende fördelade slumpmässiga variabler (dvs. är en slumpmässig variabel med slumpmässiga variabler och är en slumpmässig variabel med slumpmässiga variabler ) med ett gemensamt förväntat värde men olika varianter , det vägda medelvärdet har också det förväntade värdet och dess varians är

.

Man väljer som vikt , så variansen förenklar till

.

Det följer av Cauchy-Schwarz-ojämlikheten

.

Valet av vikter eller ett val som står i proportion till det minimerar variansen av det vägda medelvärdet. Denna formel kan användas för att beräkna vikterna beroende på variansen av respektive värde, vilket följaktligen påverkar medelvärdet i större eller mindre utsträckning, välj på lämpligt sätt.

Oberoende och identiskt fördelade slumpmässiga variabler

Är Slumpmässiga variabler som är oberoende och identiskt fördelade med förväntat värde och varians är, så har provmedlet också det förväntade värdet , men den mindre variationen (se standardfel ). Om en slumpmässig variabel har begränsad förväntning och varians, följer det av Chebyshev -ojämlikheten att det aritmetiska medelvärdet för ett prov konvergerar stokastiskt till förväntningen av den slumpmässiga variabeln. Enligt många kriterier är det aritmetiska medelvärdet därför en lämplig uppskattning av det förväntade värdet av den fördelning som urvalet härstammar från.

Är särskilt provgenomsnitt av omfattningen från samma befolkning, så har variansen så valet är ditt optimal.

Vägt aritmetiskt medelvärde som förväntat värde

I fallet med en diskret slumpmässig variabel med en oändligt begränsad bärare det förväntade värdet av slumpmässiga variabelresultat som

.

Här är sannolikheten att värdet accepterar. Detta förväntade värde kan användas som ett vägt medelvärde av värdena med sannolikheterna tolkas. Vid lika fördelning gäller följande och blir därmed till det aritmetiska medelvärdet av värdena [9]

.

Exempel på vägda genomsnitt

En bonde producerar 100 kg smör som en sidlinje. Han kan sälja 10 kg för 10 € / kg, ytterligare 10 kg för 6 € / kg och resten måste han sälja för 3 € / kg. Till vilket (vägt) genomsnittligt pris sålde han sitt smör? Lösning: (10 kg x 10 € / kg + 10 kg x 6 € / kg + 80 kg x 3 € / kg) / (10 kg + 10 kg + 80 kg) = 400 € / 100 kg = 4 € / kg. Genomsnittspriset viktat med den sålda kvantiteten motsvarar det fasta pris till vilket den totala mängden måste säljas för att uppnå samma intäkter som vid försäljning av delkvantiteter till förändrade priser.

Det aritmetiska medelvärdet de Siffrorna 1, 2 och 3 är lika med 2, det aritmetiska medelvärdet de Nummer 4 och 5 är 4,5. Det aritmetiska medelvärdet för alla 5 siffror resulterar som medelvärdet för de partiella medelvärdena viktade med provstorleken:

Om observationerna är tillgängliga som en klassificerad frekvens kan det aritmetiska medelvärdet ungefär bestämmas som ett vägt medelvärde, med klassens mitt som värde och klassstorleken som vikten. Till exempel, om det finns ett barn i en skolklass i viktklassen 20 till 25 kg, 7 barn i viktklassen 25 till 30 kg, 8 barn i viktklassen 30 till 35 kg och 4 barn i 35 till 40 kg viktklass kan medelvikten beräknas som

uppskatta. För att fastställa kvaliteten på denna uppskattning måste det lägsta / högsta möjliga medelvärdet sedan bestämmas genom att ta de minsta / största värdena per intervall som grund. Damit ergibt sich dann, dass der tatsächliche Mittelwert zwischen 28,75 kg und 33,75 kg liegt. Der Fehler der Schätzung 31,25 beträgt also maximal ±2,5 kg oder ±8 %.

Der Mittelwert einer Funktion

Als Mittelwert der Riemann-integrierbaren Funktion wird die Zahl

definiert.

Die Bezeichnung Mittelwert ist insofern gerechtfertigt, als für eine äquidistante Zerlegung des Intervalls mit der Schrittweite das arithmetische Mittel

gegen konvergiert. [10]

Ist stetig , so besagt der Mittelwertsatz der Integralrechnung , dass es ein gibt mit , die Funktion nimmt also an mindestens einer Stelle ihren Mittelwert an.

Der Mittelwert der Funktion mit dem Gewicht (wobei für alle ) ist

.

Für Lebesgue-Integrale im Maßraum mit einem endlichen Maß lässt sich der Mittelwert einer Lebesgue-integrierbaren Funktion als

definieren. Handelt es sich um einen Wahrscheinlichkeitsraum , gilt also , so nimmt der Mittelwert die Form

an; das entspricht genau dem Erwartungswert von .

Der Mittelwert einer Funktion hat in Physik und Technik erhebliche Bedeutung insbesondere bei periodischen Funktionen der Zeit, siehe Gleichwert .

Quasi-arithmetischer Mittelwert ( f -Mittel)

Sei eine auf einem reellen Intervall streng monotone stetige (und daher invertierbare) Funktion und seien

Gewichtsfaktoren. Dann ist für das mit den Gewichten gewichtete quasi-arithmetische Mittel definiert als

.

Offensichtlich gilt

Für erhält man das arithmetische, für das geometrische Mittel und für das - Potenzmittel .

Dieser Mittelwert lässt sich auf das gewichtete quasi-arithmetische Mittel einer Funktion verallgemeinern, wobei in einem die Bildmenge von umfassenden Intervall streng monoton und stetig sei:

Siehe auch

Weblinks

Einzelnachweise

  1. Karl Bosch : Elementare Einführung in die angewandte Statistik . 8. Auflage. Vieweg, Wiesbaden 2005, S.   13 .
  2. Ludwig Fahrmeir , Rita Künstler, Iris Pigeot , Gerhard Tutz : Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3 , S. 49.
  3. a b Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3 , S. 50.
  4. Horst Degen, Peter Lorscheid: Statistik-Lehrbuch: mit Wirtschafts- und Bevölkerungsstatistik. S. 42.
  5. Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3 , S. 65.
  6. a b Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3 , S. 54.
  7. bezeichnet analog zu ( Argument des Maximums ) das Argument des Minimums
  8. IN Bronstein, KA Semendjajew ua: Taschenbuch der Mathematik . 2. Auflage. 1995, S. 19 ff.
  9. IN Bronstein, KA Semendjajew ua: Taschenbuch der Mathematik. 2. Auflage. 1995, S. 629.
  10. H. Heuser: Lehrbuch der Analysis . Teil 1. 8. Auflage. Teubner, Stuttgart 1990, ISBN 3-519-12231-6 .