Top Banner

of 17

Sesion 1 No Para 2014 I

Oct 12, 2015

Download

Documents

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
  • 1ESTADISTICA

    La Estadstica se divide en 2 reas de estudio:DESCRIPTIVA : Area que se dedica a analizary representar los datos en forma bsica

    Estadstica

    y representar los datos en forma bsica,tratando de extraer conclusiones sobre elcomportamiento de las variables en estudio.

    Este anlisis se realiza a travs de laRecoleccin, descripcin y resumen de datos.

    INFERENCIAL : Encargada del anlisis e

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    INFERENCIAL : Encargada del anlisis einterpretacin de los datos que nos permiteninferir o estimar caractersticas de la poblacina partir del estudio de una muestra.

    Tiene como base de anlisis, el modelamiento,la inferencia y prediccin.

    Aplicacin de la tcnica de muestreo

    apropiado.

    REPRESENTACION GRAFICA DEL ANALISIS DE INFERENCIA

    POBLACIONmuestra

    apropiado.

    PARAMETROSMedia Poblacional ()Varianza Poblacional(2)

    ESTIMADORMedia Muestral ( )Varianza Muestral(s2)Proporcin Muestral(p)

    x

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    ( )Proporcin Poblacional()

    Estadstica Inferencial

    error muestral: - x

  • 2DEFINICIONES IMPORTANTES

    Poblacin: Es la totalidad de elementos acerca del cual sedesea informacin.

    Muestra: Es un subconjunto o parte de la poblacin

    La mayor parte del tiempo los investigadores trabajan con informacinlimitada de la poblacin, ya sea por tiempo, costo, disponibilidad y/ofacilidad para obtener la informacin. En este caso se acostumbra atrabajar con un subconjunto de esta, denominado Muestra

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    Una buena muestra debe ser representativa y confiable, esto es, debereflejar lo ms fiel posible las caractersticas de la poblacin en estudio.

    TIPOS DE MUESTRAS

    Un punto clave en el proceso de inferencia es la eleccin de lamuestra, pues los resultados de la inferencia sern tanto mejorescuanto ms representativa sea sta de la poblacin de partida.

    Existen varias formas de seleccionar muestras de las poblaciones:

    Muestra aleatoria: cuando los elementos de la poblacin se eligende forma aleatoria, usando cualquier mecanismo de azar.

    Muestra aleatoria simple (m.a.s.): Se garantiza que todos losindividuos de la poblacin tengan la misma probabilidad de ser

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    individuos de la poblacin tengan la misma probabilidad de serelegidos en la muestra y que cada uno de sus elementos se elijande forma independiente.

  • 3Muestra sistemtica: Previamente los individuos de la poblacin seencuentran en una lista, despus se elige uno al azar (xi) y a continuacin,a intervalos constantes, se eligen todos los dems hasta completar lamuestra.

    Los intervalos son seleccionados en base a un coeficiente de elevacin k= N/n= N/n .

    Donde: N es el tamao de la poblacin y n el de la muestra.

    La eleccin de los elementos muestrales vendrn dados por xi+k, xi+2k,.

    Ejemplo: Si se va a encuestar a una muestra de tamao 50 de una poblacind 500 l i t l d l i d t 10 E t i t l d l i

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    de 500, el intervalo de seleccin es de tamao 10. Este intervalo de seleccinindica que se habr de formar cada dcimo caso de la poblacin paraintegrarlo a la muestra. El primer caso se selecciona arbitrariamente o al azar.Suponiendo que en este ejemplo el primer caso seleccionado sea el nmero13, el segundo ser el 23 y as sucesivamente hasta completar el tamao demuestra deseado.

    Muestra estratificada: se dividen los elementos de la poblacinen clases o estratos (edad, renta, etc) y dentro de cada uno deellos se eligen los elementos por m. a. s. o sistemtico.

    Muestra no aleatoria: Se seleccionan los individuos de formasubjetiva (opintica), lo que puede introducir cierto sesgo a losresultados obtenidos.

    A partir de ahora utilizamos siempre el muestreo aleatorio simple.

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

  • 4MUESTRA ALEATORIA SIMPLE(m.a.s)

    Definicin: Sea X una variable aleatoria correspondiente a unapoblacin con funcin de distribucin f(x).p ( )

    Si las variables X1, X2, .., Xn son independientes y tienen la mismadistribucin f(x) que la distribucin de la poblacin, entonces lasvariables aleatorias X1, X2, .., Xn forman un conjunto de variablesindependientes e idnticamente distribuidas, que constituyen unamuestra aleatoria simple de tamao n proveniente de una poblacincon distribucin f(x)

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    con distribucin f(x).

    (X1,X2,..,Xn) muestra aleatoria simple.

    Caso continuo:

    Si X1,X2,..,Xn son variables aleatorias continuas, independientes eidnticamente distribuidas la distribucin de densidad conjunta ser:

    FUNCIN DE DISTRIBUCIN CONJUNTA DE VARIABLES INDEPENDIENTES E IDENTICAMENTE DISTRIBUIDAS

    idnticamente distribuidas, la distribucin de densidad conjunta ser:

    )()().......()(),......,(1

    2121 =

    ==n

    iinn xfxfxfxfxxxf

    Caso discreto:

    Si X1,X2,..,Xn son variables aleatorias discretas, independientes eidnticamente distribuidas la distribucin de probabilidad conjunta ser:

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    idnticamente distribuidas, la distribucin de probabilidad conjunta ser:

    )()().......()(),......,(1

    22112211 ii

    n

    innnn xXPxXPxXPxXPxXxXxXP =========

    =

  • 5Parmetro: es una caracterizacin numrica de ladistribucin de la poblacin (esperanza, varianza,).

    Es un valor fijo y desconocido, puesto que paraEs un valor fijo y desconocido, puesto que paraconocerlo necesitaramos estudiar toda la poblacin.

    Como los parmetros poblacionales son difciles deobtener directamente, se recurre a los estadsticos oestadgrafos para estimarlos.

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    Estadstico: es una variables aleatorias que depende solamente de lamuestra observada.

    Es una caracterizacin numrica de la muestra (media, varianza, ).

    Su valor no es fijo, sino que depende de la muestra particularseleccionada.

    Por ejemplo: Si X1, X2, ..., Xn, es una muestra aleatoria de una poblacinX, entonces :

    )(1 1

    2

    2 =xx

    syxx

    n

    iin

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    Son estadsticos.

    11

    1 == = nsyxnx ii in

  • 6Distribucin Muestral: Se llama as a la funcin de distribucin (oprobabilidad) de un estadstico.

    Error Estndar del Estadstico: es la desviacin estndar de ladistribucin muestral de un estadstico.

    Teoremas de aplicacin:

    Teorema 1: Si X e Y son dos variables aleatorias Independientes, a yb son constantes, entonces:

    E[aX bY] = aE[X] bE[Y]

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    E[aX bY] = aE[X] bE[Y]

    Una consecuencia inmediata de este teorema: cuando a=1 y b=1, es:

    E(X Y) = E(X) E(Y)

    Teorema 2: Si X e Y son dos variables aleatorias Independientes,entonces:

    a) E(XY) = E(X) E(Y)

    b) Var(X+Y)= Var(X) + Var(Y)

    Teorema 3: Si X e Y son variables aleatorias independientes,entonces;

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    Cov(X,Y)=0

  • 7Teorema 4: Si X e Y son dos variables aleatorias con funcin deprobabilidad conjunta y varianzas finitas, entonces:

    Var(aX bY)= a2Var(X) + b2Var(Y) 2ab Cov(X,Y)

    Var(X)=E(X2) ( )2

    Asimismo, es importante considerar la siguiente propiedad:

    X

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    SUMA DE VARIABLES ALEATORIAS DE DISTRIBUCIN DESCONOCIDA

    Sean n variables X1, X2, ...., Xn independientes con esperanzay varianza finitas : iiXE =)( 2)( iiXV =y

    n

    n

    ii XXXXS +++==

    =......21

    1

    y sea

    Entonces , utilizando propiedades de Esperanza y de Varianciaindicados en los teoremas anteriores:

    === n in in i XEXESE )()()(

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    === i

    ii

    ii

    i111

    )()()(

    y como las variables son independientes:

    ===

    ===n

    ii

    n

    ii

    n

    ii XVXVSV

    1

    2

    11)()()(

  • 8Ejemplo de aplicacin

    Consideremos una muestra de n elementos de una poblacin.

    Definamos Xi como la observacin hecha al i-simo elemento.

    Se dispone entonces de n variables aleatorias independientes :Se dispone entonces de n variables aleatorias independientes :

    X1 ,X2 ,...., Xn idnticamente distribuidas

    2)()(:...1

    ===

    ii XVyXEni

    I di l M di V i i d

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    Indicar la Media y Variancia de:

    n

    XX

    n

    ii

    == 1

    Solucin

    Hacemos =

    =n

    iiXS

    1entonces :

    nXEXESE ni

    n

    ii

    n

    ii

    =======

    111)()()(

    RECORDANDO: X1 ,X2 ,...., Xn idnticamente distribuidas

    2)()(:...1 === ii XVyXEni

    iii 111

    ===

    ====n

    i

    n

    ii

    n

    ii nXVXVSV

    1

    22

    11)()()(

    Definiendo :nS

    n

    XX

    n

    ii =

    = =1 , entonces:

    nn

    SEnn

    SEXE 1)(1)()( ====

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    nn

    nSV

    nnSVXV

    22

    221)(1)()( ====

    Luego, X es una variable aleatoria que se distribuye con media y variancia :

    nXVyXE

    2

    )()( ==

  • 9X es una variable aleatoria que se distribuye con media y varianza :

    nXV

    XE2

    )(

    )(

    ==

    Observaciones:

    vemos que la esperanza de la media muestral es igual a la media poblacional, yque la variaza de la media muestral es menor que la variancia poblacional

    RECORDANDO: X1 ,X2 ,...., Xn idnticamente distribuidas

    2)()(:...1 === ii XVyXEni

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    que la variaza de la media muestral es menor que la variancia poblacional,disminuyendo su valor a medida que aumenta el tamao de la muestra.

    Esto significa que la distribucin de la media muestral es ms concentrada que la dela propia variable, y cuanto mayor sea el tamao de la muestra ms se concentraesta distribucin alrededor de la media poblacional.

    LEY DE LOS GRANDES NMEROS

    Cualquiera sea la distribucin de la variable X (siempre que tengaesperanza y varianza finitas), la distribucin de la media muestral ( ) seXconcentra ms y ms alrededor de la media Poblacional , conformeaumente el tamao de la muestra.

    Entonces:

    La Ley de los Grandes Nmeros afirma que la media muestral de nvalores observados es aproximadamente igual a E(X) cuando n

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

  • 10

    Sea d un nmero real positivo, arbitrariamente pequeo.La probabilidad de que la media muestral diste de la mediapoblacional en una magnitud mayor que d tiende a "cero"

    X

    enunciando dicho concepto en trminos de probabilidad ser:

    { } 0 > ndXP Es decir:

    poblacional en una magnitud mayor que d tiende a ceroa medida que el tamao de la muestra (n) tiende a "infinito"

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    X cuando nLo que significa que :

    TEOREMA DEL LMITE CENTRAL

    Es el teorema ms importante de toda la inferencia estadstica.

    La Ley de los Grandes Nmeros trata de la convergencia enprobabilidad pero nada dice acerca de la distribucin de la mediaprobabilidad, pero nada dice acerca de la distribucin de la media(o proporcin) muestral.

    El Teorema del Lmite Central trata de la convergencia endistribucin de la suma de variables aleatorias independientes, delas cuales no se requiere conocer su distribucin.

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    Enunciando el Teorema:

  • 11

    Sean n variables aleatorias independientes e idnticamentedistribuidos: X1, X2,...., Xn con esperanza y varianza finitas,con n grande. Entonces la distribucin de la suma de estasvariables converge a la distribucin Normal.

    Sean: X X X independientes con =)( iXESean: X1,X2,....,Xn independientes con ( ) = 02iXV

    y ))(),((......211 nnnD

    nn

    i inSVSENXXXXS

    =+++==

    Entonces: ( ) )10(NSES Dnn

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    ( )( )

    )1,0(NV nS

    nn

    n

    El teorema del lmite central garantiza una distribucin normal cuando n es suficientemente grande.

    Aplicacin del Teorema del Lmite Central

    - Hallar la Distribucin de la media , teniendo en cuenta lo siguiente:XSe considera una muestra de tamao n (n suficientemente grande)donde se define v.a. Xi con dado que lasn variables aleatorias independientes X1 ,X2 ,....,Xn se encuentran

    ( ) 2)( == ii XVXEp 1 2 n

    idnticamente distribuidas.

    Solucin:

    grandementesuficientendado

    SVSENXXXXS nnD

    nn

    iin

    ""

    ))(),((......211

    +++== =

    Luego por el Teorema del Lmite Central:

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    ===

    ====n

    i

    n

    ii

    n

    iin nXEXESE

    111)()()(

    2

    1

    2

    11)()()( nXVXVSV n

    ii

    n

    ii

    n

    iin ====

    ===

    Tenemos:

  • 12

    Por el Teorema del Lmite Central tambin se establece que:

    ( )

    Entonces

    NSESD

    nS

    nn

    n )(

    :

    )1,0(

    ( )( )

    ( ) =

    =

    ==

    NXnnS

    nSpero

    NnnS

    nnS

    SVSES

    Entonces

    Dnn

    D

    n

    nn

    n

    nn2

    )10(

    )1,0(

    :

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA

    ==

    nNXnpara

    Nn

    nnnpero

    n

    2

    ,~""

    )1,0(

    DISTRIBUCIONES DE PROBABILIDAD IMPORTANTES

    Hemos visto la distribucin muestral de la media para un tamao de

    muestra grande (n30) lo que nos permita determinar su aproximacin a

    la normal basados en la aplicacin del Teorema del Limite Central.la normal basados en la aplicacin del Teorema del Limite Central.

    Sin embargo cuando la muestra es pequea (n

  • 13

    DISTRIBUCIN CHI-CUADRADO

    Definicin:

    Sean Z1, Z2, , Zr variables aleatorias independientes distribuidasnormalmente cada una con media 0 y varianza 1 La variablenormalmente, cada una con media 0 y varianza 1. La variablealeatoria:

    Se dice que X es una variable aleatoria chi-cuadrado con r gradosde libertad (o que tiene una distribucin chi-cuadrado con r grados delibertad)

    2).(

    222

    21 ~... lgrrZZZX +++=

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA 2010-I

    libertad).

    Nota:Los grados de libertad son el nmero de variables aleatoriasindependientes de la muestra.

    La media y varianza de la variable aleatoria chi-cuadrado con r grados

    de libertad son:

    rXVarV

    rXEE

    2)()(

    )()(

    22

    2

    ===

    ===

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA 2010-I

  • 14

    Teorema 1: Si la Variable aleatoria X es N(,2), entonces la v.a.

    2.).1(2

    2

    ~)( lgXY

    =

    Teorema 2: (Propiedad Aditiva o reproductiva de la Chi-cuadrado):

    Sea: X12, X22, Xp2 variables aleatorias chi-cuadrados

    independientes con grados de libertad r1, r2,,rp respectivamente,

    entonces la variable aleatoria :

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA 2010-I

    =

    =+++=p

    iilgrp rrdondeXXXX

    1

    2).(

    222

    21

    2 :~...

    Teorema 3: Sea: X1, X2, Xn una muestra aleatoria de variables con

    distribucin N(,2). Entonces, la variable aleatoria:

    21

    2

    ~)(

    n

    iiX

    =

    Adicionalmente: Sea X1,.., Xn, con distribucin normal con

    es una variable aleatoria normal N(, 2/n), por lo tanto:

    ).(2 ~ lgn

    =

    =n

    iiXn

    X1

    1

    )10(~ NX

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA 2010-I

    Entonces:

    )1,0(~/

    Nn

    2).1(2

    2

    2

    22

    ~)()(/ lg

    Xn

    n

    Xn

    X

    ==

  • 15

    Definicin:

    Sea Z una variable aleatoria N(0,1). Sea Y una v.a. que tiene una

    DISTRIBUCIN t-STUDENT

    distribucin Chi-cuadro con r grados de libertad, y si Z e Y son

    independientes, entonces la variable aleatoria :

    )(~/ rt

    YrZ

    rYZT ==

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA 2010-I

    Se dice que tiene una distribucin t-student (o simplemente tiene una

    distribucin t ) con r grados de libertad.

    Esta distribucin es simtrica y su media y varianza esta dado por :

    22

    )(

    10)(

    2 >==>==rrTVar

    rTE

    As, la distribucin t no tiene media cuando r=1 y la varianza no existe

    cuando r=1 2.

    La distribucin t es muy similar a la distribucin normal estndar, ya

    b l

    2r

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA 2010-I

    que ambas cumplen:

    -Varan de - a -Son simtricas

    -y centradas alrededor de t=0

  • 16

    En mucha situaciones estaremos interesados en comparar las varianzas de

    dos variables aleatorias independientes distribuidas normalmente, en estos

    casos recurriremos a la distribucin F.

    DISTRIBUCIN F- FISHER

    Definicin:

    Sea U y V dos variables aleatorias independientes que tiene

    distribuciones Chi-cuadrado, con r1 y r2 grados de libertad,

    respectivamente. Entonces la variable aleatoria:

    U

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA 2010-I

    Tiene una distribucin F-fisher con r1 y r2 grados de libertad .

    ),(2

    121

    ~ rrFrVrUF =

    La media y varianza de la variable aleatoria F- Fisher con r1 y r2 grados

    de libertad son:

    4,)4()2(

    )2(2)(

    2,2

    )(

    22

    221

    21222

    22

    2

    >+==

    >==

    rrrr

    rrrFV

    rrrFE

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA 2010-I

  • 17

    DISTRIBUCION MUESTRAL DEDISTRIBUCION MUESTRAL DEDISTRIBUCION MUESTRAL DE DISTRIBUCION MUESTRAL DE ESTADISTICOSESTADISTICOS

    LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA 2010-I