Passa al documento
Questo è un documento Premium. Alcuni documenti su Studocu sono Premium. Passa a Premium per sbloccarne la visualizzazione.

Formulario statistica

Corso

Statistica (10129)

67 Documenti
Gli studenti hanno condiviso 67 documenti in questo corso
Anno accademico: 2017/2018
Caricato da:
Studente anonimo
Questo documento è stato caricato da uno studente come te che ha optato per l'anonimità.
Università degli Studi di Verona

Commenti

accedi o registrati per pubblicare commenti.

Studylists correlate

SecondoStatisticaStatistica

Anteprima del testo

Statistica descrittiva

indici

indici (o misure) di posizione

media campionaria di n osservazioni x

1

, x

2

, ..., x

n

x=

1

n

i= 1

n

x i

per k campioni x

ì

ripetuti ciascuno con frequenza f

i

x=

1

n

i= 1

k

x i

f i

proprietà

Posto

y i

=a x i

b

:

y=a  x

mediana m di n osservazioni x

1

≤ x

2

≤ ...

≤ x

n

se n è dispari:

m=x n 1 / 2

se n è pari:

m=

x n/ 2

x n/ 2  1

2

moda

punto di massimo della distribuzione di frequenza

una distribuzione con un solo punto di massimo è detta unimodale

una distribuzione con più punti di massimo è detta plurimodale

indici di dispersione

varianza di n osservazioni x

1

, x

2

, ..., x

n

2

=

1

n

i= 1

n

x i

x

2

per k campioni x

ì

ripetuti ciascuno con frequenza f

i

2

=

1

n

i= 1

k

x i

x

2

f i

=

1

n

i= 1

k

x i

2

f i

−

x

2

proprietà

posto

y i

=a x i

b

:

y

2

=a

2

x

2

deviazione standard o scarto quadratico medio

=

2

range di n osservazioni x

1

≤ x

2

≤ ...

≤ x

n

differenza tra massima e minima osservazione

range=x n

−x 1

p-esimo quantile (o 100p-esimo percentile) di di

n osservazioni x

1 ≤

x

2 ≤

...

x

n

p∈ℝ0,1, si considera il numero np

se np non è intero: k è l'intero successivo ,

Q

p

=x k

se np è intero: k = np , Q

p

=

x k

x k 1

2

quartili

Q

1

primo quartile: quantile per p = 0.

Q

2

secondo quartile: quantile per p = 0 (= mediana)

Q

3

terzo quartile: quantile per p = 0.

differenza interquartile (IQR – InterQuartile

Range)

IQR=Q

3

−Q

1

indici di forma

coefficiente di asimmetria (skewness)

sk=

1

n

i= 1

n

x i

x

3

se vale zero indica che la distribuzione è simmetrica rispetto alla media

se positivo denota una coda verso destra

se negativo denota una coda verso sinistra

coefficiente di curtosi

curt=

1

n

i= 1

n

x i

−x

4

misura quanto la distribuzione è appuntita

correlazioni

covarianza

di n osservazioni congiunte di 2 variabili {(x

1

,y

1

), (x

2

,y

2

), ..., (x

n

,y

n

)}:

xy

=

1

n

i= 1

n

x i

xy i

y=

1

n

i= 1

n

x i

y i

−

x  y

se

xy

 0

x e y sono direttamente correlate: a valori grandi (piccoli) di

x corrispondo valori grandi (piccoli) di y;

se

xy

 0

x e y sono inversamente correlate: a valori grandi (piccoli)

di x corrispondo valori piccoli (grandi) di y;

se

xy

= 0

x e y sono incorrelate;

coefficiente di correlazione

xy

=

xy

x

y

;

− 1 

xy

 1

indice normalizzato, adimensionale ed invariante per trasformazioni

lineari delle variabili

regressione lineare

retta

y=a x

b

che meglio approssima la nuvola di punti x

i

, y i

a=

xy

x

2

;

b=y−x

xy

x

2

valori stimati

y i

=a x i

b

rappresentano i valori stimati di y a partire dalla retta di regressione

lineare

residui

r i

=y i

− y i

differenza tra i valori reali e stimati

valore previsto

y 0

=a x 0

b

x

0

è un valore diverso dai valori x

i

già osservati

cambiamento di scala

logy=alogx

b

y=e

b

x

a

devianza totale

DEV

TOT

=DEV

REG

DEV

RES

=

i= 1

n

y i

y

2

DEV

REG

=

i= 1

n

y i

y

2

; DEV

RES

=

i= 1

n

y i

− y i

2

coefficiente di determinazione

R

2

=

DEV

REG

DEV

TOT

= 1 −

DEV

RES

DEV

TOT

=

y

2

y

2

;

0 ≤R

2

≤ 1

tanto più esso si avvicina ad uno tanto più la funzione di regressione

trovata è buona.

Formulario di Probabilità e Statistica [2005-07-24] - Copyright © 2005 Nicola Asuni (info@tecnick – tecnick)

1

Probabilità

definizioni

eventi elementari

tutti i possibili esiti di un esperimento aleatorio

evento

ogni sottoinsieme di uno spazio campionario discreto 

spazio campionario

insieme di tutti gli eventi elementari; può essere:

discreto

se gli elementi sono un numero finito o un'infinità numerabile

P{

k

}=p k

continuo

se è più numeroso (ad esempio: tutti i numeri reali in un certo

intervallo)

linguaggio

insiemi eventi

, intero spazio campionario

evento certo

∅, insieme vuoto

evento impossibile

insieme

A

l'evento si verifica

insieme

A complementare di A

l'evento non si verifica

A∪B

, (unione)

si verifica almeno uno dei due eventi

A∩B, (intersezione)

gli eventi si verificano simultaneamente

A∖B

, ( sottrazione =

A∩

B

)

si verifica A e non si verifica B

A∩B=∅, eventi disgiunti

gli eventi sono incompatibili

B⊆A(B incluso in A)

B

implica A

proprietà eventi A, B, C sottoinsiemi di Ω

A∪A=A

A∩A=A

A∪B=B∪A

A∩B=B∩A

A∪B∪C=A∪C∪C

A∩B∩C=A∩C∩C

A∪B∩C=A∪B∩A∪C

A∩B∪C=A∩B∪A∩C

A∪∅=A

A∩∅=∅

A∪=

A∩=A

A∪

A=

A∩

A=∅

A∪B=

A∩

B

A∩B=

A∪

B

A=A

probabilità su Ω

P: P[0,1]

proprietà

P= 1

P∅= 0

P

A= 1 −PA

PA∪B=PAPB−PA∩B

P∪

n= 1

A

n

=∑

n= 1

PA

n

 , con A i

∩A

j

=∅sei≠j

probabilità classica

la probabilità di un evento è il rapporto dei casi favorevoli ed il numero

dei casi possibili

posto Ω di N elementi

k

(k = 1, 2, .., N) e

P{

k

}=p ,eventielementari equiprobabili

, A evento

qualunque

PA=

k

∈A

P{

k

}=p∣A∣=

∣A∣

N

=

∣A∣

∣∣

∣A∣èil numerodi elementidi A

permutazione di n oggetti

è ogni allineamento di n oggetti distinti in n caselle

P

n

=n!=nn− 1 n− 2 ⋯ 3 ⋅ 2

proprietà di n! (n fattoriale)

0 != 1

n!

n

=n− 1 !

n!

m!

=nn− 1 n− 2 ⋯m 1 , conmn

disposizione di n oggetti in k posti

è ogni allineamento di k oggetti scelti tra n oggetti distinti in k posti

D

n ,k

=nn− 1 n− 2 ⋯n−k 1 , con 1 ≤k≤n

D

n ,n

=P

n

=n!

disposizione con ripetizione di n oggetti in k

posti

è ogni allineamento di k oggetti scelti tra n oggetti e ripetibili, in k posti

D

n ,k

=n

k

, con k≥ 1

combinazione di n oggetti di classe k

è ogni sottoinsieme di k elementi dell'insieme di n oggetti

(modi per scegliere k oggetti tra n)

C

n ,k

=

D

n,k

P

k

=

n

k

=

nn− 1 n− 2 ⋯n−k 1 

k!

,

conn≥ 1 ; 0 ≤k≤n

coefficiente Binomiale

n

k

=

n

n−k

=C

n ,k

;

n

1

=n

;

n

0

=

n

n

= 1

combinazione con ripetizione di k oggetti scelti

fra n

ogni gruppo formato di k oggetti scelti fra n, che possono essere ripetuti

(modi per disporre k oggetti uguali in n posti)

C

n ,k

=

nk− 1

k

=

nk− 1

n− 1

permutazione con ripetizione di n oggetti uguali

fra loro a gruppi

(allineamento in n posti di n oggetti)

P

k1,k2,..

=

n!

k 1

!k 2

!k r

!

Formulario di Probabilità e Statistica [2005-07-24] - Copyright © 2005 Nicola Asuni (info@tecnick – tecnick)

2

proprietà

CovX , X=VarX

CovX ,c= 0 , per ogni costantec

CovX ,Y=CovY , X

CovXY , Z=CovX , ZCovY ,Z

CovY ,YZ=CovX ,YCovX ,Z

CovaX ,Y=aCovX ,Y

CovX ,aY=aCovX ,Y

VarXY=VarXVarY2CovX ,Y

∣CovX ,Y∣≤

VarX⋅VarY dis−Swartz

correlazione

due v. con varianza finita si dicono incorrelate se:

CovX ,Y= 0

in tal caso:

VarXY=VarXVarY

coefficiente di correlazione di X, Y

XY

XY

X

⋅

Y

CovX ,Y

VarX⋅VarY

, dove− 1 ≤ XY

≤ 1

se

XY

è vicino a zero: X e Y sono quasi indipendenti

se

XY

è positivo: ad X grande corrisponderà in genere una Y grande

se

XY

è negativo: ad X grande corrisponderà in genere una Y piccola

se

XY

=± 1 le v. sono una funzione lineare dell'altra:

Y=aXb

standardizzata di X

è una v. ottenuta da una v. X con media e varianza finite:

X

=

X−

X

X

EX

= 0 ; Var X

= 1

disuguaglianza di Cebicev

sia X una v. di valore atteso 

X

e varianza 

X

2

finite, allora per

ogni  0 :

P

X−

X

≥

X

≤

1

2

, ovvero

P

X−

X



X

=P

X

−

X

X

X



X

≥ 1 −

1

2

processo di Bernoulli

sequenza di esperimenti di Bernoulli indipendenti di uguale parametro

p

esperimento bernulliano o prova di Bernoulli

è un esperimento aleatorio che può avere solo due esiti possibili:

• successo : con probabilità p

• insuccesso : con probabilità (1-p)

p è il parametro della prova di Bernoulli

processo di Bernoulli limitato

il numero di prove è finito

bernulliana di parametro p

X~Bp

descrive l'esito di ogni prova di Bernoulli

p X

 1 =p ; p X

 0 = 1 −p

EX=p ; VarX=p 1 −p

la probabilità di ottenere, in n prove, una particolare sequenza di k

successi e (n-k) insuccessi è:

p

k

 1 −p

n−k

la probabilità di ottenere, in n prove, almeno un successo è:

1 − 1 −p

n

Binomiale di parametri n e p

X~Bn , p

conta il numero complessivo di successi ottenuti in n prove (estrazione

con reimissione)

p X

k=

n

k

p

k

 1 −p

n−k

, k=0,1,2,...,n

EX=np

; VarX=np 1 −p

skX=

1 −2p

np 1 −np

;

curtX= 3 

1 −6p 1 −p

np 1 −p

il numero di oggetti di tipo K che si trovano in un campione di n oggetti

estratti con reimmissione da un insieme di N oggetti che contiene K

oggetti di un tipo e (N-K) oggetti di un'altro è:

X~Bn ,

K

N

processo di Bernoulli illimitato

sequenza infinita di prove

Binomiale negativa di parametri -n e p

X~B−n , p

conta il numero di insuccessi che si ottengono prima di ottenere n

successi

p X

k=

nk− 1

k

p

n

 1 −p

k

, k=0,1,2,...

EX=n

1 −p

p

;

VarX=n

1 −p

p

2

il numero Y di prove necessarie per ottenere n successi:

PY=k=PXn=k=PX=k−n=

k− 1

k−n

p

n

 1 −p

k−n

,

per k=n ,n1,n2,...

Geometrica di parametro p

X~Gp

conta il numero di prove necessarie per ottenere il primo successo

p X

k=p 1 −p

k− 1

, per k=1,2,3,...

EX=

1

p

;

VarX=

1 −p

p

2

Geometrica traslata di parametro p

X~G 'p

conta il numero di insuccessi prima del primo successo

p X

k=p 1 −p

k

, per k=0,1,2,...

EX=

1 −p

p

;

VarX=

1 −p

p

2

Ipergeometrica di parametri (N, K, n)

X~GN , K ,n , con N≥k ; N≥n

conta il numero di oggetti di tipo K che si trovano in un campione di n

oggetti estratti senza reimmissione da un insieme di N oggetti che

contiene K oggetti di un tipo e (N-K) oggetti di un altro.

p X

k=

K

k



N−K

n−k

N

n

, con 0 ≤k≤n ; k≤K ;n−k≤N−K

EX=n

K

N

; VarX=n

K

N

1 −

K

N



N−n

N− 1

approssimazione Binomiale

per N (e quindi K) molto grandi (N > 10n) è come se estraessimo con

reimissione:

XGN , K ,n XBn ,

K

N

 , per N∞

Formulario di Probabilità e Statistica [2005-07-24] - Copyright © 2005 Nicola Asuni (info@tecnick – tecnick)

4

p X

k

n

k

p

k

 1 −p

n−k

, per N∞ , p=

K

N

EX=np ; VarX=np 1 −p

N−n

N− 1

N−n

N− 1

 (fattore di correzione per la popolazione finita (< 1))

Poisson di parametro λ > 0

Y~P

0

, con 0

permette di descrivere quantitativamente situazioni in cui non abbiamo

accesso ai valori di N e p, ma possediamo un unica informazione

numerica: il parametro λ (numero medio di arrivi)

p Y

k=e

−

k

k!

, per k=0,1,2,

EY= ; VarY=

skX=

1

; curtX= 3 

1

proprietà

se

X

i

~P

0



i

allora:

X

1

X

2

X

n

~P

0



1



2



n

approssimazione della Binomiale

per N molto grande e p molto piccolo:

XBN , p YP 0

Np , PX=kPY=k

processo Poisson di intensità ν

permette di calcolare probabilità di eventi che accadono in un certo

intervallo di tempo diverso da quello su cui abbiamo informazioni di

partenza;

posto =t con  numero medio di arrivi nell'unità di tempo, il

numero X

t

di arrivi nell'intervallo di tempo [0,t]è dato da

X

t

~P

0

t

p X t

k=e

−t

t

k

k!

, per k=0,1,2,

EX

t

=t

;

VarX t

=t

variabili aleatorie continue

densità continua f

x

determina la legge della v. continua X;

è una densità di probabilità

PX∈I≡

I

f x

tdt , con I⊆ℝ

f x

:ℝℝ ; f x

t≥ 0 , per ogni t∈ℝ ; ∫

f x

tdt= 1

proprietà

PX=t= 0 , per ogni t∈ℝ (la probabilità che assuma un

valore fissato è nulla (integrale di un punto))

PX≤a=PXa

Pa≤Xb=PaXb

esempi di densità continue

densità uniforme

f X

t=

1

b−a

I

a,b

t , a ,b∈ℝ,ab

con

I

a ,b

t= 1 , per t∈a ,b

I

a ,b

t= 0 , per t∉a ,b

(funzione indicatrice)

PX∈J=

J

1

b−a

I

a,b

tdt=

1

b−a

∣a ,b∩J∣

densità di Cauchy

f X

t=

1

 1 t

2

PaXb= ∫

a

b

1

 1 t

2

= 1 /arctanb−arctana

densità Normale Standard

“curva a campana” di Gauss, o curva degli errori

f X

t=

1

 2 

e

−t

2

/ 2

PaXb= ∫

a

b

1

2 

e

−t

2

/ 2

dt

funzione di ripartizione di X (f.d.)

equivale alla densità discreta nel caso continuo

F

X

t:ℝ[0,1]

F

X

t=PX≤t , perognit∈ℝ

F

X

t= ∫

−∞

t

f X

ydy , per X continua

F

X

t= ∑

x k ≤t

p X

x k

 , per X discreta

proprietà

set 1

t 2

,X≤t 1

⊆X≤t 2

, PX≤t 1

≤PX≤t2,

F

X

tèmonotonacrescente

F

X

t 1 pert∞

F

X

t 0 pert−∞

F

X

b−F X

a=PX≤b−PX≤a=PaX≤b ,

cona ,b∈ℝ , ab

la f.d. di una v. continua è sempre una funzione continua

nei punti in cui la densità è continua; in questi punti è derivabile:

F

X

'

t=f X

t

quantile α -esimo (q

α

)

PX≤q 

= , con q 

∈a ,b⊆ℝ , ∈0,1

variabili aleatorie legate al processo di

Poisson

legge Esponenziale di parametro ν

Y~Esp , con 0

misura l'istante del primo arrivo in un processo di Poisson X

t

di

intensità ν, o il tempo di attesa tra due arrivi successivi;

è l'unico modello adeguato a rappresentare il tempo di vita di un

apparecchio non soggetto ad usura

F

Y

t= 1 −e

−t

, per t 0

F

Y

t= 0 , per t≤ 0

f Y

t=e

−t

, per t 0

f Y

t= 0 , per t 0

EY=

1

;

VarY=

1

2

skX= 2 ; curtX= 9

stimatore non distorto per legge Esponenziale

U=T

n− 1

n

=

n− 1

i= 1

n

X

i

Formulario di Probabilità e Statistica [2005-07-24] - Copyright © 2005 Nicola Asuni (info@tecnick – tecnick)

5

distribuite (i.i.):

X

n

~N,

2

n

E

X

n

= ;

Var

X

n

=

2

n

media campionaria standardizzata

S

n

=

X

n

−

/

n

, n=1,2,3,

teorema del limite centrale

PS

n

≤tt per n∞ , t∈ℝ

approssimazione Normale

Date X

i

v.a.i.i. , EX i

=, VarXi=

2

con n abbastanza

grande:

X

n

≃N,

2

n

 ossia P

X

n

t≃

n

t−

i= 1

n

X

i

≃Nn,n

2

 ossia P ∑

i= 1

n

X

i

t≃

t−n

n

approssimazione Normale di Gamma per n grande:

Y~n ,

Y≃N

n

,

n

2

F

Y

t=PYt≃

t−n

n

approssimazione Normale della Binomiale:

approssimazione utile in problemi di campionamento

NOTA: vale se: np 5 ; n 1 −p 5

Y~Bn , p

Y≃Nnp,np 1 −p

F

Y

t=PY≤t≃

t−np

np 1 −p

,perv.a

F

Y

k=PY≤k≃

k0−np

np 1 −p

,

k=0,1,2,,n , perv.a

momenti ed indici di forma per v.

momento r-esimo di X

r

'

=EX

r

r

'

=

k

x k

r

p X

x k

 , per X discreta

r

'

=

x

r

f X

xdx , per X continua

momento r-esimo centrato di X

r

=EX−EX

r

r

=

k

x k

−

r

p X

x k

 , con=EX , per X discreta

r

=

x−

r

f X

xdx , per X continua

coefficiente di asimmetria (skewness) di una v.

X con μ '

3

finito

misura l'assimetria di X rispetto al valore atteso

skX=

3

2

3 / 2

=E

[

X−

3

]

coefficiente di curtosi di una v. X con μ '

4

finito

misura quanto la densità di X sia appuntita

curtX=

4

2

2

=E

[

X−

4

]

,=EX , 

2

=Var X

statistica inferenziale

campionamento e stime

definizioni

modello statistico

famiglia di leggi di v., dipendenti da uno o più parametri incogniti:

{p X

x;:∈I}

 è un vettore di parametri

campione casuale di ampiezza n

estratto da una popolazione di densità p

X

x; è una ennupla di v.

indipendenti e identicamente distribuite (i.i)

X

1,

X

2,

, X

n

,

ciascuna avente legge p

X

x;.

stima di parametri e stimatori

stima puntuale dei parametri

stimare il valore vero del parametro (o dei parametri) a partire dal

campione casuale

stima del parametro p della popolazione bernulliana

p=x n

, con x i

valorieffettivamente osservati

statistica T

è una qualsiasi v. T funzione del campione casuale X

1,

X

2,

, X

n

di ampiezza n estratto da una popolazione di legge

p X

x ,

:

T=fX 1,

X

2,

, X

n

 , con f :ℝ

n

ℝ

stimatore del parametro θ

statistica che viene usata per stimare il valore del parametro

è corretto (non distorto) se ET= altrimenti è detto distorto

stima del parametro θ

=fx 1,

x 2,

, x n

 , calcolato acampionamento eseguito

stimatore consistente

varT n

 0 per n∞ , conT n

stimatore correttodi

valore atteso della media campionaria

E

X

n

=

varianza della media campionaria

Var

X

n

=

2

n

legge dei grandi numeri

P{

X

n

−

} 0 , per n∞

stime

stima di 

2

=h

S

n

2

1

n− 1

i= 1

n

X

i

− X

n

2

, varianza campionaria

a campionamento effettuato:

Formulario di Probabilità e Statistica [2005-07-24] - Copyright © 2005 Nicola Asuni (info@tecnick – tecnick)

7

s n

2

1

n− 1

i= 1

n

x i

x n

2

=

1

n− 1

i= 1

n

x i

2

n

n− 1

x n

2

stima popolazione Normale

=

x n

2

=s n

2

se μ è nota:

2

=

1

n

i= 1

n

X

i

−

2

stima popolazione Gamma

=

x n

s n

2

; r=

x n

2

s n

2

leggi

legge Chi quadro con n gradi di libertà

Y~X

2

n ≡Y~

n

2

,

1

2

X

i

sono v. indipendenti, ciascuna di legge N(0,1)

f Y

t=c n

t

n

2

− 1

e

t

2

, per t 0

f Y

t= 0 , per t 0

EY=n ; VarY=2n

proprietà

posto

Y

1

~X

2

n 1

, Y

2

~X

2

n 2

indipendenti:

Y

1

Y

2

~X

2

n 1

n 2

intervallo a cui una v. di legge Chi quadro appartiene con probabilità

α:

PX

1 −

2

2

nYX 1 

2

2

n=

approssimazione Normale di Chi quadro per n grande

X

2

n≃Nn ,2n , per n grande

PYt≃

t−n

2n

X

2

n≃z 

2nn

approssimazioni

Sia

X

i

, X

2,

, X

n

un campione casuale estratto da una popolazione

di legge N,

2

, allora:

i= 1

n

X

i

−

~X

2

n

i= 1

n

X

i

X

n

~X

2

n− 1 

n− 1 S n

2

2

~X

2

n− 1 

S

n

2

eX n

sonotraloroindipendenti

legge t di student a n gradi di libertà

T~tn ; con T=

Z

Y/n

, ZN0,1 , YX

2

n

f T

t=c n

1 

t

2

n

n 1 

2

, per t∈ℝ

ET= 0 , tranne per n= 1 per cui nonesiste finito

per t∞ la t di student tende alla Normale standard

approssimazioni

Sia X

i

, X

2,

, X

n

un campione casuale estratto da una popolazione

di legge N,

2

, allora:

X

n

−

S

n

2

/n

~tn− 1 

calcoli con i quantili

posto

t 

n

quantile α-esimo della legge t(n):

PTt 

n=

PTt 1 −

n=

P

T

t 1 −/ 2

n=

P∣T∣t

 1 / 2

n=

t 1 −

2

n− 1 ≃z 1 

2

, approssimazione per n 120

approssimazione di quantili tramite

interpolazione lineare

y=mxq ,

equazione dellarettache passa peri punti{q 1,

t 

q 1

},{q 2,

t 

q 2

}

t 

x=t 

q 1

−

t 

q 2

−t 

q 1

q 2

−q 1

x−q 1

 , con q 1

xq 2

legge di fisher con m e n gradi di libertà

X~Fm ,n ; con X=

U/m

V/n

, U~X

2

m , V~X

2

n

proprietà

1

X

~Fn ,m

PXF

m ,n=

P

1

X

1

F

m ,n

= 1 −

1

F

m ,n

=F

1 −

n ,m

S

1

2

S

2

2

=Fm−1,n− 1 

intervallo di confidenza al livello del 100 α % per

h(θ)

Sia X

1,

X

2,

, X

n

 un campione casuale estratto da una

popolazione di densità fx;; siano

T

1

=t 1

X

1,

X

2,

, X

n

,

T

2

=t 2

X

1,

X

2,

, X

n

due statistiche, e sia h una funzione

del parametro che si vuole stimare; fissato un numero ∈0,1,

l'intervallo aleatorio (T

1

, T

2

) si dice intervallo di confidenza al 100α%

per h(θ) se:

P

T

1

hT 2

=

a campionamento eseguito l'intervallo (t 1 ,t 2 ) si dice “calcolato al

campione”;

h(θ) appartiene all'intervallo (t

1,

t

2

) con una confidenza del 100α%;

t

1

e t

2

sono detti limiti di confidenza

intervallo di confidenza per la media

(di una popolazione Normale o popolazione qualsiasi con n grande

n≥ 30 )

= X

n

±z  1 / 2

n

= X

n

±E , convarianza nota

=

X

n

±t  1 

2

n− 1 

S

n

2

n

,con varianzaincognita

Formulario di Probabilità e Statistica [2005-07-24] - Copyright © 2005 Nicola Asuni (info@tecnick – tecnick)

8

test su due frequenze di due popolazioni

bernoulliane indipendenti

estraiamo due campioni n, m da due popolazioni bernoulliane

indipendenti

X~Bp 1

 , Y~Bp 2

;

questa procedura è valida se

i= 1

n

x i

 5 ;

i= 1

m

y i

 5

z=

x n

y m

p 1 −p

1

n

1

m

con p=

n  x n

m  y m

nm

H

0

H

1

rifiutare H

0

se

p 1

=p 2

p 1

≠p 2

∣z∣z

1 −/ 2

p 1

≤p 2

p 1

p 2

zz 1 −

p 1

≥p 2

p 1

p 2

z−z 1 −

inferenze su una varianza

X

2

=

n− 1 s n

2

0

2

H

0

H

1

rifiutare H

0

se

2

=

0

2

2

≠

0

2

X

2

X

1 −/ 2

2

n− 1  o X

2

X

/ 2

2

n− 1 

2

≤

0

2

2



0

2

X

2

X

1 −

2

n− 1 

2

≥

0

2

2



0

2

X

2

X

2

n− 1 

intervallo di confidenza

n− 1 s n

2

X

1 

2

2

n− 1 

,

n− 1 s n

2

X

1 −

2

2

n− 1 

inferenze su due varianze

estraiamo due campioni n, m da due popolazioni normali indipendenti

con medie incognite;

F=

s

X

2

s

Y

2

H

0

H

1

rifiutare H

0

se

X

2

=

Y

2

X

2

≠

Y

2

FF

1 −/ 2

n−1,m− 1 

FF

/ 2

n−1,m− 1 

X

2

≤

Y

2

X

2



Y

2

FF

1 −

n−1,m− 1 

X

2

≥

Y

2

X

2

≤

Y

2

FF

1 −

n−1,m− 1 

intervallo di confidenza

1

F

1 

2

n−1,m− 1 

s X

2

s Y

2

,

1

F

1 −

2

n−1,m− 1 

s X

2

s Y

2

test Chi quadro di adattamento

ha lo scopo di verificare se certi dati empirici si adattino bene ad una

distribuzione teorica assegnata;

si costruisce la seguente tabella:

classi A

1

A

2

... A

k

i= 1

k

freq. rel. attese p

1

p

2

... p

k

1

freq. ass. attese

np 1

np

2

...

np k

n

freq. ass.

osservate

N

1

N

2

... N

k

n

scarti quad.

pesati

np 1

−N

1

2

np 1

np 2

−N

2

2

np 2

...

np k

−N

k

2

np k

Q

le classi andranno accorpate in maniera tale che le frequenze assolute

attese siano tutte maggiori o uguali a 5;

Chi quadro calcolato dal campione:

Q=

i= 1

k

np i

−N

i

2

np i

QX

2

k− 1  per n∞ , con p i

assegnate a priori

QX

2

k− 1 −r per n∞, con p i

calcolatedopo

aver stimator parametriincogniti

fissato α, si stabilisce la regola di decisione:

si rifiuti H 0

se QX 1 −

2

k− 1 −r (si calcola tramite tabelle)

il p-value corrispondente al valore Q è:

=PXQ, con X~X

2

k− 1 −r

test Chi quadro di indipendenza

verifica l'indipendenza o meno di due variabili;

si costruisce una tabella di contingenza di rs classi:

A

1

A

2

... A

r

Tot.

B

1

n

11

n

21

...

n

r

n

⋅ 1

B

2

n

12

n

22

...

n

r

n ⋅ 2

... ... ... ... ... ...

B

s

n

1s

n

2s

...

n rs

n

⋅s

Tot. n

1 ⋅

n

2 ⋅

... n

r⋅

n

si costruisce una tabella di rs classi:

A

1

A

2

...

A

r

B

1

n

1

⋅n

1

n

n 2

⋅n 1

n

...

n r

⋅n 1

n

B

2

n 1

⋅n 2

n

n 2

⋅n 2

n

...

n r

⋅n 2

n

... ... ... ... ...

B

s

n 1

⋅n s

n

n 2

⋅n s

n

...

n r

⋅n s

n

ciascuna delle frequenze attese deve essere:

n i⋅

n ⋅j

n

≥ 5

si calcola il chi-quadro:

Q=

i= 1

r

j= 1

s n ij

n i⋅

n ⋅j

n

2

n i⋅

n ⋅j

n

fissato α, si stabilisce la regola di decisione:

sirifiuti H 0

se QX 1 −

2

r− 1 s− 1 

(si calcola tramite tabelle)

il p-value corrispondente al valore Q è:

=PXQ , con X~X

2

r− 1 s− 1 

Formulario di Probabilità e Statistica [2005-07-24] - Copyright © 2005 Nicola Asuni (info@tecnick – tecnick)

10

Questo documento è stato utile?
Questo è un documento Premium. Alcuni documenti su Studocu sono Premium. Passa a Premium per sbloccarne la visualizzazione.

Formulario statistica

Corso: Statistica (10129)

67 Documenti
Gli studenti hanno condiviso 67 documenti in questo corso
Questo documento è stato utile?

Questa è un'anteprima

Vuoi avere accesso completo? Passa a Premium e sblocca tutte le 10 pagine
  • Accedi a tutti i documenti

  • Scarica senza limiti

  • Migliora i tuoi voti

Upload

Condividi i tuoi documenti per sbloccare

Sei già passato a Premium?
Statistica descrittiva
indici
indici (o misure) di posizione
media campionaria di n osservazioni x1, x2, ..., xn
x=1
n
i=1
n
xi
per k campioni xì ripetuti ciascuno con frequenza fi
x=1
n
i=1
k
xifi
proprietà
Posto
yi=a xib
:
y=a
x
mediana m di n osservazioni x 1 x2 ... xn
se n è dispari:
m=xn1/ 2
se n è pari:
m=xn/2xn/21
2
moda
punto di massimo della distribuzione di frequenza
una distribuzione con un solo punto di massimo è detta unimodale
una distribuzione con più punti di massimo è detta plurimodale
indici di dispersione
varianza di n osservazioni x 1, x2, ..., xn
2=1
n
i=1
n
xi
x2
per k campioni xì ripetuti ciascuno con frequenza fi
2=1
n
i=1
k
xi
x2fi= 1
n
i=1
k
xi
2fi−
x2
proprietà
posto
yi=a xib
:
deviazione standard o scarto quadratico medio
=
2
range di n osservazioni x 1 x2 ... xn
differenza tra massima e minima osservazione
range=xnx1
p-esimo quantile (o 100p-esimo percentile) di di
n osservazioni x 1 x2 ... xn
p 0,1
, si considera il numero np
se np non è intero: k è l'intero successivo ,
Qp=xk
se np è intero: k = np ,
Qp=xkxk1
2
quartili
Q1 primo quartile: quantile per p = 0.25
Q2 secondo quartile: quantile per p = 0.5 (= mediana)
Q3 terzo quartile: quantile per p = 0.75
differenza interquartile (IQR – InterQuartile
Range)
IQR=Q3Q1
indici di forma
coefficiente di asimmetria (skewness)
sk=1
n
i=1
n
xi
x
3
se vale zero indica che la distribuzione è simmetrica rispetto alla media
se positivo denota una coda verso destra
se negativo denota una coda verso sinistra
coefficiente di curtosi
curt=1
n
i=1
n
xi
x
4
misura quanto la distribuzione è appuntita
correlazioni
covarianza
di n osservazioni congiunte di 2 variabili {(x1,y1), (x2,y2), ..., (xn,yn)}:
xy=1
n
i=1
n
xi
x yi
y= 1
n
i=1
n
xiyi−
x
y
se
xy0
x e y sono direttamente correlate: a valori grandi (piccoli) di
x corrispondo valori grandi (piccoli) di y;
se
xy 0
x e y sono inversamente correlate: a valori grandi (piccoli)
di x corrispondo valori piccoli (grandi) di y;
se
xy =0
x e y sono incorrelate;
coefficiente di correlazione
xy=xy
xy
;
1xy 1
indice normalizzato, adimensionale ed invariante per trasformazioni
lineari delle variabili
regressione lineare
retta
y= a x
b
che meglio approssima la nuvola di punti
xi, yi
a=xy
x
2
;
b=
y
xxy
x
2
valori stimati
yi=a xi
b
rappresentano i valori stimati di y a partire dalla retta di regressione
lineare
residui
ri=yi yi
differenza tra i valori reali e stimati
valore previsto
y0= a x0
b
x0 è un valore diverso dai valori xi già osservati
cambiamento di scala
logy=alogx
b
y=e
bxa
devianza totale
DEV TOT =DEV REGDEV RES=
i=1
n
yi
y2
DEV REG=
i=1
n
yi
y2; DEV RES =
i=1
n
yi yi2
coefficiente di determinazione
R2=DEV REG
DEV TOT
=1DEV RES
DEV TOT
=y
2
y
2
;
0R21
tanto più esso si avvicina ad uno tanto più la funzione di regressione
trovata è buona.
Formulario di Probabilità e Statistica [2005-07-24] - Copyright © 2005 Nicola Asuni (info@tecnick.comwww.tecnick.com)
*** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. *** 1

Perché questa pagina è sfocata?

Questo è un documento Premium. Per leggere l'intero documento devi passare all'abbonamento Premium.

Perché questa pagina è sfocata?

Questo è un documento Premium. Per leggere l'intero documento devi passare all'abbonamento Premium.

Perché questa pagina è sfocata?

Questo è un documento Premium. Per leggere l'intero documento devi passare all'abbonamento Premium.