En grunnleggende statistikkmetode for analyse av kvantitative data
Lineære regresjonsmodeller brukes til å vise eller forutsi forholdet mellom to variabler eller faktorer . Faktoren som forutsies (den faktoren som ligningen løser for ) kalles avhengig variabel. Faktorene som brukes til å forutsi verdien av den avhengige variabelen kalles de uavhengige variablene.
Gode data forteller ikke alltid hele historien. Regresjonsanalyse brukes ofte i forskning som det fastslår at det eksisterer en sammenheng mellom variabler.
Men korrelasjonen er ikke den samme som årsakssammenheng . Selv en linje i en enkel lineær regresjon som passer godt til datapunktene, kan vel ikke si noe endelig om et årsak-og-effektforhold.
I enkel lineær regresjon består hver observasjon av to verdier. En verdi er for den avhengige variabelen, og en verdi er for den uavhengige variabelen.
- Enkel lineær regresjonsanalyse Den enkleste formen for en regresjonsanalyse bruker på avhengig variabel og en uavhengig variabel. I denne enkle modellen tilnærmer en rett linje forholdet mellom den avhengige variabelen og den uavhengige variabelen.
- Flere regresjonsanalyser Når to eller flere uavhengige variabler brukes i regresjonsanalyse, er modellen ikke lenger en enkel lineær.
Enkel lineær regresjonsmodell
Den enkle lineære regresjonsmodellen er representert slik: y = ( β 0 + β 1 + Ε
Ved matematisk konvensjon er de to faktorene som er involvert i en enkel lineær regresjonsanalyse betegnet x og y .
Likningen som beskriver hvordan y er relatert til x er kjent som regresjonsmodellen . Den lineære regresjonsmodellen inneholder også et feilbegrepet som er representert av Ε , eller det greske bokstavet epsilon. Feiltermen brukes til å ta hensyn til variabiliteten i y som ikke kan forklares av det lineære forholdet mellom x og y .
Det er også parametere som representerer befolkningen som studeres. Disse parametrene av modellen som er representert av ( β 0 + β 1 x ).
Enkel lineær regresjonsmodell
Den enkle lineære regresjonsligningen er representert slik: Ε ( y ) = ( β 0 + β 1 x ).
Den enkle lineære regresjonsligningen er grafet som en rett linje.
( β 0 er y- avskjæringen av regresjonslinjen.
β 1 er skråningen.
Ε ( y ) er den gjennomsnittlige eller forventede verdien av y for en gitt verdi på x .
En regresjonslinje kan vise et positivt lineært forhold, et negativt lineært forhold eller ingen sammenheng. Hvis den graferte linjen i en enkel lineær regresjon er flat (ikke skrå), er det ikke noe forhold mellom de to variablene. Hvis regresjonslinjen skråner oppover med den nedre enden av linjen ved y- avskjæringen (akse) av grafen, og den øvre enden av linjen strekker seg oppover i graffeltet, er det et positivt lineært forhold fra x- avsnittet (aksen) . Hvis regresjonslinjen skråner nedover med den øvre enden av linjen ved y- avskjæringen (akse) av grafen, og den nedre enden av linjen strekker seg nedover i graffeltet, mot x- avskjæringen (akse) eksisterer et negativt lineært forhold.
Estimert lineær regresjonsligning
Hvis parametrene for befolkningen var kjent, kunne den enkle lineære regresjonsligningen (vist nedenfor) brukes til å beregne middelverdien av y for en kjent verdi av x .
Ε ( y ) = ( β 0 + β 1 x ).
I praksis er parameterverdiene imidlertid ikke kjent, slik at de må estimeres ved å bruke data fra en prøve av befolkningen. Befolkningsparametrene er estimert ved å bruke prøvestatistikk . Prøvestatistikken er representert ved b 0 + b 1. Når prøvestatistikkene er erstattet av populasjonsparametrene, dannes den estimerte regresjonsligningen.
Den estimerte regresjonsligningen er vist nedenfor.
( ŷ ) = ( β 0 + β 1 x
( ŷ ) er uttalt og hatt .
Grafen av estimert enkel regresjonsligning kalles estimert regresjonslinje.
B 0 er y-avskjæringen.
B 1 er bakken.
Ŷ ) er den estimerte verdien av y for en gitt verdi på x .
Viktig merknad: Regresjonsanalyse brukes ikke til å tolke årsakssammenheng mellom variabler. Regresjonsanalyse kan imidlertid indikere hvordan variabler er relaterte eller i hvilken grad variabler er knyttet til hverandre.
På denne måten har regresjonsanalyse en tendens til å lage fremtredende forhold som garanterer en kunnskapsrik forsker som tar en nærmere titt .
Også kjent som: bivariat regresjon, regresjonsanalyse
Eksempler: Den minste kvadratmetoden er en statistisk prosedyre for bruk av prøvedata for å finne verdien av estimert regresjonsligning. Den minste kvadratmetoden ble foreslått av Carl Friedrich Gauss, som ble født i år 1777 og døde i 1855. Den minste kvadratmetoden er fortsatt mye brukt.
kilder:
Anderson, DR, Sweeney, DJ, og Williams, TA (2003). Essentials of Statistics for Business and Economics (3. ed.) Mason, Ohio: Southwestern, Thompson Learning.
______. (2010). Forklart: Regresjonsanalyse. MIT News.
McIntyre, L. (1994). Bruke sigarettdata for en introduksjon til flere regresjoner. Journal of Statistics Education, 2 (1).
Mendenhall, W. og Sincich, T. (1992). Statistikk for ingeniørfag og vitenskap (3. ed.), New York, NY: Dellen Publishing Co.
Panchenko, D. 18.443 Statistikk for søknader, høst 2006, seksjon 14, enkel lineær regresjon. (Massachusetts Institute of Technology: MIT OpenCourseWare)