Standaarddeviatie in Excel

Het rekenkundig gemiddelde is een van de meest populaire statistische methoden die overal wordt berekend. Maar op zich is het absoluut onbetrouwbaar. Veel mensen kennen het gezegde dat de een kool eet, de ander vlees, en gemiddeld eten ze allebei koolrolletjes. Aan het voorbeeld van het gemiddelde salaris is het heel gemakkelijk om dit weer te geven. Een paar procent van de mensen die miljoenen verdienen, heeft geen grote invloed op de statistieken, maar ze kunnen de objectiviteit ervan aanzienlijk bederven en het cijfer met enkele tientallen procenten overschatten.

Hoe kleiner de spreiding tussen de waarden, hoe meer u op deze statistiek kunt vertrouwen. Het wordt daarom sterk aanbevolen om altijd de standaarddeviatie samen met het rekenkundig gemiddelde te berekenen. Vandaag zullen we uitzoeken hoe we dit correct kunnen doen met Microsoft Excel.

Standaarddeviatie - wat is het?

De standaarddeviatie (of standaarddeviatie) is de vierkantswortel van de variantie. De laatste term verwijst op zijn beurt naar de mate van spreiding van waarden. Om de variantie te verkrijgen, en dus de afgeleide ervan in de vorm van een standaarddeviatie, is er een speciale formule, die echter niet zo belangrijk voor ons is. Het is vrij complex van structuur, maar kan tegelijkertijd volledig worden geautomatiseerd met behulp van Excel. Het belangrijkste is om te weten welke parameters aan de functie moeten worden doorgegeven. Over het algemeen zijn de argumenten voor zowel het berekenen van de variantie als de standaarddeviatie hetzelfde.

  1. Eerst krijgen we het rekenkundig gemiddelde.
  2. Daarna wordt elke beginwaarde vergeleken met het gemiddelde en wordt het verschil daartussen bepaald.
  3. Daarna wordt elk verschil tot de tweede macht verheven, waarna de resulterende resultaten bij elkaar worden opgeteld.
  4. Ten slotte is de laatste stap het delen van de resulterende waarde door het totale aantal elementen in het gegeven monster.

Nadat we het verschil tussen één waarde en het rekenkundig gemiddelde van de hele steekproef hebben ontvangen, kunnen we de afstand vanaf een bepaald punt op de coördinatenlijn bepalen. Voor een beginner is alle logica duidelijk, zelfs tot aan de derde stap. Waarom de waarde kwadrateren? Het feit is dat het verschil soms negatief kan zijn en dat we een positief getal moeten krijgen. En, zoals je weet, een min maal een min geeft een plus. En dan moeten we het rekenkundig gemiddelde van de resulterende waarden bepalen. De dispersie heeft verschillende eigenschappen:

  1. Als je de variantie afleidt van een enkel getal, dan is het altijd nul.
  2. Als een willekeurig getal wordt vermenigvuldigd met een constante A, dan neemt de variantie toe met een factor A kwadraat. Simpel gezegd, de constante kan uit het spreidingsteken worden gehaald en tot de tweede macht worden verhoogd.
  3. Als de constante A wordt opgeteld bij een willekeurig getal of daarvan wordt afgetrokken, verandert de variantie hiervan niet.
  4. Als twee willekeurige getallen, bijvoorbeeld aangeduid met de variabelen X en Y, niet van elkaar afhankelijk zijn, dan is in dit geval de formule voor hen geldig. D(X+Y) = D(X) + D(Y)
  5. Als we wijzigingen aanbrengen in de vorige formule en proberen de variantie van het verschil tussen deze waarden te bepalen, dan zal het ook de som van deze varianties zijn.

Standaarddeviatie is een wiskundige term die is afgeleid van dispersie. Het verkrijgen is heel eenvoudig: neem gewoon de vierkantswortel van de variantie.

Het verschil tussen variantie en standaarddeviatie is puur in het vlak van eenheden, om zo te zeggen. De standaarddeviatie is veel gemakkelijker af te lezen omdat deze niet in kwadraten van een getal wordt weergegeven, maar direct in waarden. In eenvoudige bewoordingen, als in de numerieke reeks 1,2,3,4,5 het rekenkundig gemiddelde 3 is, dan is de standaarddeviatie dienovereenkomstig het getal 1,58. Dit vertelt ons dat gemiddeld één getal 1,58 afwijkt van het gemiddelde getal (dat in ons voorbeeld XNUMX is).

De variantie is hetzelfde getal, alleen in het kwadraat. In ons voorbeeld is het iets minder dan 2,5. In principe kun je zowel de variantie als de standaarddeviatie gebruiken voor statistische berekeningen, je moet alleen precies weten met welke indicator de gebruiker werkt.

Standaarddeviatie berekenen in Excel

We hebben twee hoofdvarianten van de formule. De eerste wordt berekend op basis van de steekproefpopulatie. De tweede – volgens de generaal. Om de standaarddeviatie voor een steekproefpopulatie te berekenen, moet u de functie STDEV.V. Als het nodig is om de berekening voor de algemene bevolking uit te voeren, dan is het noodzakelijk om de functie te gebruiken STDEV.G.

Het verschil tussen de steekproefpopulatie en de algemene populatie is dat in het eerste geval de gegevens direct worden verwerkt, op basis waarvan het rekenkundig gemiddelde en de standaarddeviatie worden berekend. Als we het hebben over de algemene bevolking, dan is dit de hele reeks kwantitatieve gegevens met betrekking tot het bestudeerde fenomeen. Idealiter zou het monster volledig representatief moeten zijn. Dat wil zeggen, bij het onderzoek moeten mensen betrokken zijn die in gelijke verhoudingen kunnen worden gecorreleerd met de algemene bevolking. Als in een voorwaardelijk land bijvoorbeeld 50% mannen en 50% vrouwen zijn, moet de steekproef dezelfde verhoudingen hebben.

Daarom kan de standaarddeviatie voor de algemene populatie enigszins afwijken van de steekproef, omdat in het tweede geval de oorspronkelijke cijfers kleiner zijn. Maar over het algemeen werken beide functies op dezelfde manier. Nu zullen we beschrijven wat er moet gebeuren om ze te kunnen bellen. En dat kan op drie manieren.

Methode 1. Handmatige formule-invoer

Handmatige invoer is op het eerste gezicht een nogal gecompliceerde methode. Iedereen zou het echter moeten bezitten als ze een professionele Excel-gebruiker willen zijn. Het voordeel is dat u het invoervenster voor argumenten helemaal niet hoeft op te roepen. Als je goed oefent, gaat het veel sneller dan met de andere twee methoden. Het belangrijkste is dat de vingers worden getraind. Idealiter zou elke Excel-gebruiker bekend moeten zijn met de blinde methode om formules en functies snel in te voeren.

  1. We klikken met de linkermuisknop op de cel waarin de formule voor het verkrijgen van de standaarddeviatie zal worden geschreven. U kunt het ook invoeren als argument voor een van de andere functies. In dit geval moet u op de formule-invoerregel klikken en vervolgens het argument invoeren waar het resultaat moet worden weergegeven.
  2. De algemene formule is als volgt: =STDEV.Y(getal1(cell_address1), number2(cell_address2),...). Als we de tweede optie gebruiken, dan gaat alles op precies dezelfde manier, alleen de letter G in de functienaam wordt veranderd in B. Het maximum aantal ondersteunde argumenten is 255. Standaarddeviatie in Excel
  3. Nadat het invoeren van de formule is voltooid, bevestigen we onze acties. Druk hiervoor op de enter-toets. Standaarddeviatie in Excel

Om de standaarddeviatie te berekenen, moeten we dus dezelfde argumenten gebruiken als voor het verkrijgen van het rekenkundig gemiddelde. Al het andere kan het programma alleen doen. Ook kun je als argument een hele reeks waarden gebruiken, op basis waarvan de berekening van de standaarddeviatie zal worden uitgevoerd. Laten we nu eens kijken naar andere methoden die begrijpelijker zijn voor een beginnende Excel-gebruiker. Maar op de lange termijn zullen ze moeten worden opgegeven omdat:

  1. Het handmatig invoeren van de formule kan veel tijd besparen. Een Excel-gebruiker die de formule en de syntaxis ervan onthoudt, heeft een aanzienlijk voordeel ten opzichte van de persoon die net begint en de gewenste functie zoekt in de lijst in de Functiewizard of op het lint. Bovendien is toetsenbordinvoer zelf veel sneller dan het gebruik van een muis.
  2. Minder vermoeide ogen. U hoeft niet constant de focus te verschuiven van een tafel naar een raam, dan naar een ander raam, dan naar het toetsenbord en dan weer terug naar de tafel. Dit helpt ook om aanzienlijk tijd en moeite te besparen, die vervolgens kan worden besteed aan het verwerken van echte informatie, in plaats van het onderhouden van formules.
  3. Het handmatig invoeren van formules is veel flexibeler dan het gebruik van de volgende twee methoden. De gebruiker kan onmiddellijk de vereiste cellen van het bereik specificeren zonder deze direct te selecteren, of de hele tabel in één keer bekijken, om het risico te vermijden dat het dialoogvenster het blokkeert.
  4. Het handmatig gebruiken van formules is een soort brug naar het schrijven van macro's. Dit helpt je natuurlijk niet om de VBA-taal te leren, maar het vormt de juiste gewoontes. Als iemand gewend is om commando's te geven aan een computer met behulp van het toetsenbord, zal het veel gemakkelijker voor hem zijn om elke andere programmeertaal onder de knie te krijgen, inclusief het ontwikkelen van macro's voor spreadsheets.

Maar natuurlijk wel. Het gebruik van andere methoden is veel beter als u nieuw bent en net begint. Daarom kijken we naar andere manieren om de standaarddeviatie te berekenen.

Methode 2. Tabblad Formules

Een andere methode die beschikbaar is voor de gebruiker die de standaarddeviatie van het bereik wil krijgen, is door het tabblad "Formules" in het hoofdmenu te gebruiken. Laten we in meer detail beschrijven wat hiervoor moet worden gedaan:

  1. Selecteer de cel waarin we het resultaat willen schrijven.
  2. Daarna vinden we het tabblad "Formules" op het lint en gaan we ernaartoe. Standaarddeviatie in Excel
  3. Laten we het blok "Bibliotheek met functies" gebruiken. Er is een knop "Meer functies". In de lijst die zal zijn, zullen we het item "Statistisch" vinden. Daarna kiezen we welke formule we gaan gebruiken. Standaarddeviatie in Excel
  4. Daarna verschijnt een venster voor het invoeren van argumenten. Daarin geven we alle getallen, links naar cellen of bereiken aan die aan de berekeningen zullen deelnemen. Nadat we klaar zijn, klikt u op de knop "OK".

De voordelen van deze methode:

  1. Snelheid. Deze methode is vrij snel en stelt u in staat om de gewenste formule in slechts een paar klikken in te voeren.
  2. Nauwkeurigheid. Er is geen risico dat u per ongeluk de verkeerde cel of de verkeerde letter schrijft en vervolgens tijd verspilt met herwerken.

We kunnen zeggen dat dit de beste manier is na handmatige invoer. MAAR de derde methode is ook nuttig in sommige situaties.

Methode 3: Functiewizard

De Functiewizard is een andere handige methode voor het invoeren van formules voor beginners die de namen en syntaxis van functies nog niet hebben onthouden. De knop voor het starten van de Functiewizard bevindt zich in de buurt van de formule-invoerregel. Het belangrijkste voordeel voor een beginner tegen de achtergrond van de vorige methoden ligt in de gedetailleerde programmahints, welke functie waarvoor verantwoordelijk is en welke argumenten in welke volgorde moeten worden ingevoerd. Het zijn twee letters - fx. Wij klikken erop. Standaarddeviatie in Excel

Daarna verschijnt een lijst met functies. Je kunt het proberen te vinden in de volledige alfabetische lijst, of de categorie "Statistisch" openen, waar je deze operator ook kunt vinden.

Standaarddeviatie in Excel

We kunnen in de lijst zien dat de functie STDEV is nog steeds aanwezig. Dit wordt gedaan om oude bestanden compatibel te maken met de nieuwe versie van Excel. Het wordt echter ten zeerste aanbevolen om de nieuwe functies die hierboven worden vermeld te gebruiken, omdat deze verouderde functie op een gegeven moment mogelijk niet langer wordt ondersteund.

Nadat we op OK hebben geklikt, hebben we de mogelijkheid om het argumentenvenster te openen. Elk argument is een enkel getal, een adres per cel (als het een numerieke waarde bevat), of reeksen waarden die worden gebruikt voor het rekenkundig gemiddelde en de standaarddeviatie. Nadat we alle argumenten hebben ingevoerd, klikt u op de knop "OK". De gegevens worden ingevoerd in de cel waarin we de formule hebben ingevoerd.

Standaarddeviatie in Excel

Conclusie

Het is dus niet moeilijk om met Excel de standaarddeviatie te berekenen. En de functie zelf is de basis van statistische berekeningen, wat intuïtief is. Het ligt immers voor de hand dat niet alleen de gemiddelde waarde van belang is, maar ook de spreiding van waarden waaruit het rekenkundig gemiddelde wordt afgeleid. Immers, als de helft van de mensen rijk is en de andere helft arm, dan is er in feite geen middenklasse. Maar tegelijkertijd, als we het rekenkundig gemiddelde afleiden, blijkt dat de gemiddelde burger slechts een vertegenwoordiger van de middenklasse is. Maar het klinkt in ieder geval vreemd. Al met al veel succes met deze functie.

Laat een reactie achter