Lær hva enkel lineær regresjon er og hvordan den fungerer

En grunnleggende statistikkmetode for analyse av kvantitative data

Rettferdig Colin Broug, Fotograf. © 10. juni 2010 Stock.xchng

Lineære regresjonsmodeller brukes til å vise eller forutsi forholdet mellom to variabler eller faktorer . Faktoren som forutsies (den faktoren som ligningen løser for ) kalles avhengig variabel. Faktorene som brukes til å forutsi verdien av den avhengige variabelen kalles de uavhengige variablene.

Gode ​​data forteller ikke alltid hele historien. Regresjonsanalyse brukes ofte i forskning som det fastslår at det eksisterer en sammenheng mellom variabler.

Men korrelasjonen er ikke den samme som årsakssammenheng . Selv en linje i en enkel lineær regresjon som passer godt til datapunktene, kan vel ikke si noe endelig om et årsak-og-effektforhold.

I enkel lineær regresjon består hver observasjon av to verdier. En verdi er for den avhengige variabelen, og en verdi er for den uavhengige variabelen.

Enkel lineær regresjonsmodell

Den enkle lineære regresjonsmodellen er representert slik: y = ( β 0 + β 1 + Ε

Ved matematisk konvensjon er de to faktorene som er involvert i en enkel lineær regresjonsanalyse betegnet x og y .

Likningen som beskriver hvordan y er relatert til x er kjent som regresjonsmodellen . Den lineære regresjonsmodellen inneholder også et feilbegrepet som er representert av Ε , eller det greske bokstavet epsilon. Feiltermen brukes til å ta hensyn til variabiliteten i y som ikke kan forklares av det lineære forholdet mellom x og y .

Det er også parametere som representerer befolkningen som studeres. Disse parametrene av modellen som er representert av ( β 0 + β 1 x ).

Enkel lineær regresjonsmodell

Den enkle lineære regresjonsligningen er representert slik: Ε ( y ) = ( β 0 + β 1 x ).

Den enkle lineære regresjonsligningen er grafet som en rett linje.

( β 0 er y- avskjæringen av regresjonslinjen.

β 1 er skråningen.

Ε ( y ) er den gjennomsnittlige eller forventede verdien av y for en gitt verdi på x .

En regresjonslinje kan vise et positivt lineært forhold, et negativt lineært forhold eller ingen sammenheng. Hvis den graferte linjen i en enkel lineær regresjon er flat (ikke skrå), er det ikke noe forhold mellom de to variablene. Hvis regresjonslinjen skråner oppover med den nedre enden av linjen ved y- avskjæringen (akse) av grafen, og den øvre enden av linjen strekker seg oppover i graffeltet, er det et positivt lineært forhold fra x- avsnittet (aksen) . Hvis regresjonslinjen skråner nedover med den øvre enden av linjen ved y- avskjæringen (akse) av grafen, og den nedre enden av linjen strekker seg nedover i graffeltet, mot x- avskjæringen (akse) eksisterer et negativt lineært forhold.

Estimert lineær regresjonsligning

Hvis parametrene for befolkningen var kjent, kunne den enkle lineære regresjonsligningen (vist nedenfor) brukes til å beregne middelverdien av y for en kjent verdi av x .

Ε ( y ) = ( β 0 + β 1 x ).

I praksis er parameterverdiene imidlertid ikke kjent, slik at de må estimeres ved å bruke data fra en prøve av befolkningen. Befolkningsparametrene er estimert ved å bruke prøvestatistikk . Prøvestatistikken er representert ved b 0 + b 1. Når prøvestatistikkene er erstattet av populasjonsparametrene, dannes den estimerte regresjonsligningen.

Den estimerte regresjonsligningen er vist nedenfor.

( ŷ ) = ( β 0 + β 1 x

( ŷ ) er uttalt og hatt .

Grafen av estimert enkel regresjonsligning kalles estimert regresjonslinje.

B 0 er y-avskjæringen.

B 1 er bakken.

Ŷ ) er den estimerte verdien av y for en gitt verdi på x .

Viktig merknad: Regresjonsanalyse brukes ikke til å tolke årsakssammenheng mellom variabler. Regresjonsanalyse kan imidlertid indikere hvordan variabler er relaterte eller i hvilken grad variabler er knyttet til hverandre.

På denne måten har regresjonsanalyse en tendens til å lage fremtredende forhold som garanterer en kunnskapsrik forsker som tar en nærmere titt .

Også kjent som: bivariat regresjon, regresjonsanalyse

Eksempler: Den minste kvadratmetoden er en statistisk prosedyre for bruk av prøvedata for å finne verdien av estimert regresjonsligning. Den minste kvadratmetoden ble foreslått av Carl Friedrich Gauss, som ble født i år 1777 og døde i 1855. Den minste kvadratmetoden er fortsatt mye brukt.

kilder:

Anderson, DR, Sweeney, DJ, og Williams, TA (2003). Essentials of Statistics for Business and Economics (3. ed.) Mason, Ohio: Southwestern, Thompson Learning.

______. (2010). Forklart: Regresjonsanalyse. MIT News.

McIntyre, L. (1994). Bruke sigarettdata for en introduksjon til flere regresjoner. Journal of Statistics Education, 2 (1).

Mendenhall, W. og Sincich, T. (1992). Statistikk for ingeniørfag og vitenskap (3. ed.), New York, NY: Dellen Publishing Co.

Panchenko, D. 18.443 Statistikk for søknader, høst 2006, seksjon 14, enkel lineær regresjon. (Massachusetts Institute of Technology: MIT OpenCourseWare)