Isang Pangunahing Pamamaraan ng Istatistika sa Pagsuri ng Dami ng Data
Ang mga modelo ng linear regression ay ginagamit upang ipakita o hulaan ang kaugnayan sa pagitan ng dalawang mga variable o mga kadahilanan . Ang kadahilanan na hinuhulaan (ang kadahilanan na ang equation ay malulutas ) ay tinatawag na dependent variable. Ang mga kadahilanan na ginagamit upang mahulaan ang halaga ng umaasa variable ay tinatawag na ang mga independiyenteng mga variable.
Ang mabuting data ay hindi laging sinasabi sa kumpletong kuwento. Karaniwang ginagamit ang pagsusuri sa pagbabalik-tanaw sa pananaliksik habang itinatatag nito na umiiral ang ugnayan sa pagitan ng mga variable.
Ngunit ang ugnayan ay hindi katulad ng pagsasagawa . Kahit na ang isang linya sa isang simpleng linear na pagbabagu-bago na naaangkop sa mga punto ng data ay maaaring hindi maaaring sabihin ng isang tiyak na bagay tungkol sa isang sanhi-at-epekto na relasyon.
Sa simpleng linear regression, ang bawat pagmamasid ay binubuo ng dalawang halaga. Ang isang halaga ay para sa dependent variable at isang halaga ay para sa malayang variable.
- Simple Linear Regression Analysis Ang pinakasimpleng anyo ng isang pagtatasa ng pagbabalik ay gumagamit ng dependent variable at isang malayang variable. Sa ganitong simpleng modelo , ang isang tuwid na linya ay tumutukoy sa kaugnayan sa pagitan ng dependent variable at ang malayang variable.
- Maramihang Pagtatasa ng Pagsusuri Kapag ang dalawa o higit pang mga malayang variable ay ginagamit sa pagtatasa ng pagbabalik, ang modelo ay hindi na isang simpleng linear na isa.
Simple Linear Regression Model
Ang simpleng linear regression model ay kinakatawan tulad nito: y = ( β 0 + β 1 + Ε
Sa pamamagitan ng matematika convention, ang dalawang mga kadahilanan na kasangkot sa isang simpleng linear pagbabalik pagtatasa ay itinalagang x at y .
Ang equation na naglalarawan kung paano nauugnay ang y sa x ay kilala bilang modelo ng pagbabalik . Ang modelo ng linear regression ay naglalaman din ng isang term na error na kinakatawan ng Ε , o ang Griyegong sulat na epsilon. Ang terminong ginamit sa error ay ginagamit upang i-account para sa pagkakaiba-iba sa y na hindi maaaring ipaliwanag ng linear na relasyon sa pagitan ng x at y .
Mayroon ding mga parameter na kumakatawan sa populasyon na pinag-aralan. Ang mga parameter na ito ng modelo na kinakatawan ng ( β 0+ β 1 x ).
Simple Linear Regression Model
Ang simpleng linear regression equation ay kinakatawan tulad nito: Ε ( y ) = ( β 0 + β 1 x ).
Ang simpleng linear regression equation ay na-graphed bilang isang tuwid na linya.
( β 0 ay ang panghihimasok y ng linya ng pagbabalik.
β 1 ay ang slope.
Ε ( y ) ay ang ibig sabihin o inaasahang halaga ng y para sa isang ibinigay na halaga ng x .
Ang isang linya ng pagbabalik ay maaaring magpakita ng isang positibong linear na relasyon, isang negatibong linear na relasyon, o walang relasyon. Kung ang graphed line sa isang simpleng linear na pagbabalik ay flat (hindi sloped), walang kaugnayan sa pagitan ng dalawang mga variable. Kung ang linya ng pagbabalik ay umakyat nang paitaas sa mas mababang dulo ng linya sa y intercept (axis) ng graph, at ang itaas na dulo ng linya na pagpapalawak ng paitaas sa patlang ng graph, ang layo mula sa x intercept (axis) ang isang positibong linear na relasyon ay umiiral . Kung ang linya ng pagbabalik ay lumilipad pababa sa itaas na dulo ng linya sa y intercept (aksis) ng graph, at ang mas mababang dulo ng linya na pagpapalawak pababa sa field ng graph, patungo sa x intercept (aksis) ang negatibong linear na relasyon ay umiiral.
Tinantyang Equation Linear Regression
Kung ang mga parameter ng populasyon ay kilala, ang simpleng linear regression equation (ipinapakita sa ibaba) ay maaaring gamitin upang kumpirmahin ang ibig sabihin ng halaga ng y para sa isang kilalang halaga ng x .
Ε ( y ) = ( β 0 + β 1 x ).
Gayunpaman, sa pagsasagawa, ang mga halaga ng parameter ay hindi kilala upang dapat itong tinantiya sa pamamagitan ng paggamit ng data mula sa isang sample ng populasyon. Tinatantya ang mga parameter ng populasyon sa pamamagitan ng paggamit ng mga istatistika ng sample Ang sample na mga istatistika ay kinakatawan ng b 0 + b 1. Kapag ang mga istatistika ng sample ay pinalitan para sa mga parameter ng populasyon, ang tinatayang equation ng pagbabalik ay nabuo.
Ang tinantyang equation ng pagbabalik ay ipinapakita sa ibaba.
( ŷ ) = ( β 0 + β 1 x
( ŷ ) ay binibigkas na sumbrero .
Ang graph ng tinatayang simpleng equation ng pagbabalik ay tinatawag na tinantyang linya ng pagbabalik.
Ang b 0 ay ang pangharang ng y.
Ang b 1 ay ang slope.
Ang ŷ ) ay ang tinantyang halaga ng y para sa isang ibinigay na halaga ng x .
Mahalagang Paunawa: Ang pagtatasa ng pagbabalik ay hindi ginagamit upang mabigyang-kahulugan ang mga sanhi ng kaugnayan sa pagitan ng mga variable. Gayunpaman, maaaring suriin kung paano nauugnay ang mga variable o kung saan ang mga variable ay nauugnay sa bawat isa.
Sa paggawa nito, ang pag-aaral ng pagbabalik ay may posibilidad na gumawa ng mga kapansin-pansin na mga relasyon na nagpapahintulot sa isang mas maalam na mananaliksik na mas malapitan ang pagtingin .
Kilala rin ang: bivariate regression, pagtatasa ng pagbabalik
Mga halimbawa: Ang Pinakamababang Kuwaresma ay isang pamamaraan ng istatistika para sa paggamit ng sample data upang mahanap ang halaga ng tinatayang equation ng pagbabalik. Ang Paraan ng Pinakamaang Kaha ay ipinanukala ni Carl Friedrich Gauss, na ipinanganak noong taong 1777 at namatay noong 1855. Ang Paraan ng Pinakamaliit na Squares ay malawakang ginagamit.
Pinagmulan:
Anderson, DR, Sweeney, DJ, at Williams, TA (2003). Mga Mahalagang Istatistika para sa Negosyo at Ekonomiya (ika-3 ed.) Mason, Ohio: Southwestern, Thompson Learning.
______. (2010). Ipinaliwanag: Pagtatasa ng Pagsusuri. MIT News.
McIntyre, L. (1994). Paggamit ng Data ng Sigarilyo para sa Isang Panimula sa Maramihang Pagbabalik. Journal of Statistics Edukasyon, 2 (1).
Mendenhall, W., at Sincich, T. (1992). Statistics for Engineering and the Sciences (3rd ed.), New York, NY: Dellen Publishing Co.
Panchenko, D. 18.443 Statistics for Applications, Fall 2006, Section 14, Simple Linear Regression. (Massachusetts Institute of Technology: MIT OpenCourseWare)