Valor-p

Na estatistica classica, o valor - p (tambem chamado de nivel descritivo ou probabilidade de significancia ) ^[
1
], e a probabilidade de se obter uma estatistica de teste igual ou mais extrema que aquela observada em uma amostra, sob a hipotese nula . Por exemplo, em testes de hipotese, pode-se rejeitar a hipotese nula a 5% caso o valor- p seja menor que 5%. Assim, uma outra interpretacao para o valor- p , e que este e o menor nivel de significancia com que se rejeitaria a hipotese nula. Em termos gerais, um valor- p pequeno significa que a probabilidade de obter um valor da estatistica de teste como o observado e muito improvavel, levando assim a rejeicao da hipotese nula.

Em um teste classico de hipoteses, sao definidas duas hipoteses, a nula ( H ₀) e a alternativa ( H _A). Em muitas aplicacoes da estatistica, convenciona-se definir a hipotese alternativa como a hipotese formulada pelo pesquisador, enquanto a hipotese nula e o seu complemento. A principio, a hipotese nula e considerada a verdadeira. Ao confrontarmos a hipotese nula com os achados de uma amostra aleatoria tomada de uma populacao de interesse, verifica-se a sua plausibilidade em termos probabilisticos, o que nos leva a rejeitarmos ou nao H ₀. Se nao rejeitamos H ₀, tomamo-la como verdadeira; caso contrario, tomamos H _A como verdadeira.

No entanto, por utilizarmos nesta tomada de decisao uma amostra (uma parte da populacao) e nao a populacao inteira, podemos cometer dois tipos de erro. Cometemos um erro tipo I quando rejeitamos H ₀ e H ₀ e verdadeira, e cometemos um erro tipo II quando nao rejeitamos H ₀ e H ₀ e falsa. A tabela abaixo descreve estas situacoes.

	A hipotese H ₀ e verdadeira	A hipotese H ₀ e falsa
Rejeita-se H ₀	Erro do tipo I	sem erro
Nao se rejeita H ₀	sem erro	Erro do tipo II

A probabilidade de cometermos um erro tipo I e chamada de nivel de significancia , denotado pela letra grega $\alpha$ . O nivel de significancia e geralmente determinado pelo pesquisador antes da coleta dos dados. Em muitas aplicacoes da estatistica, o nivel de significancia e tradicionalmente fixado em 0,05. ^[
2
]

Com base nestes conceitos, podemos definir o valor- p como a menor escolha que teriamos feito para o nivel de significancia, de forma que rejeitariamos H ₀. Por exemplo, vamos supor que o nivel de significancia foi fixado em $\alpha$ = 0,05. Um valor- p igual a 0,20 indica que nos teriamos rejeitado H ₀ se tivessemos escolhido um nivel de significancia de 0,20, ao menos. Como escolhemos $\alpha$ = 0,05, nao rejeitamos H ₀. Isto leva a uma regra simplista, mas usual, onde rejeitamos H ₀ se o valor- p e menor que $\alpha$ e nao rejeitamos H ₀ caso contrario.

E preciso muita cautela na interpretacao de um valor- p , dado que esta medida e bastante influenciada pelo tamanho da amostra. Amostras grandes tendem a produzir valores- p pequenos, ainda que o efeito observado nao tenha grande importancia pratica, enquanto amostras pequenas tendem a produzir valores- p grandes, ainda que exista um importante efeito em um ponto de vista pratico. ^[
3
] Por isso, o uso dos valores- p nas pesquisas medicas tem sido bastante criticado por varios autores. ^[
4
]^[
5
]

Enganos comuns e controversias na interpretacao do valor- p [ editar | editar codigo-fonte ]

O valor-p e, basicamente, um parametro estatistico que indica se determinada hipotese, formulada a priori , deve ser rejeitada ou nao. Em um teste estatistico, como num teste randomizado ? muito comum em testes com seres humanos ? considera-se que as hipoteses sao sempre estabelecidas antes da coleta dos dados, isto e, parte-se de uma premissa de que os dados sao coletados “as cegas”, o que nem sempre acontece. ^[
6
] Por exemplo, caso se pretenda comprovar a eficacia de uma nova droga no tratamento de uma doenca, pode-se escolher um grupo de pessoas que vai tomar o medicamento e outro grupo, chamado grupo de controle, que tomara apenas uma pilula de acucar, chamada de placebo . Em testes desse tipo, nem os proprios aplicadores dos medicamentos sabem para qual grupo estao sendo destinados determinado tipo de droga, e, em muitas ocasioes, nao tem ideia de qual tipo de hipotese esta sendo testada. Apos a coleta, seguem-se os testes estatisticos que geram parametros como o valor- p , que servem para validar a eficacia do metodo ou nao.

O problema nao esta no resultado do teste em si, mas na crenca quase absoluta de que o conceito do valor- p ? que pertence a uma tradicao de pensamento na Estatistica chamada de “frequentista” ou " frequencista " ? seja correto para a tomada de decisoes, como atestar se determinada descoberta pode ser considerada realmente significativa. O caso da crenca no valor- p e, mais ainda, no intervalo de 5% para o que e chamado “nivel de significancia” de uma descoberta foi assunto abordado em um artigo da Nature, de 2017. ^[
7
] Nele sao comentadas que diversos cientistas tem razoes para acreditar que ha um equivoco na interpretacao e no uso indiscriminado do conceito, o que pode levar, inclusive, a uma taxa maior de “falsas descobertas”, supondo-se, naturalmente, uma pesquisa idonea.

Em 07 Marco de 2016 a American Statistics Association ^[
8
] publicou um artigo de diretriz para reduzir as interpretacoes erradas sobre o valor-P, entre os quais podem ser citados:

O valor- p nao e a probabilidade de a hipotese nula de um teste ser verdadeira.
O valor- p nao e a probabilidade de um dado resultado ter sido obtido de um "acaso".
O valor- p nao e a probabilidade de a hipotese nula ter sido enganosamente rejeitada.
A magnitude do valor- p nao indica o tamanho ou a importancia de um efeito observado. Por exemplo, em uma pesquisa clinica onde sao comparados dois tratamentos, um valor- p bastante pequeno nao e um indicador de que existe uma grande diferenca entre os efeitos dos tratamentos comparados.
Valor- p e nivel de significancia nao sao sinonimos. ^[
9
] O valor- p e sempre obtido de uma amostra, enquanto o nivel de significancia e geralmente fixado antes da coleta dos dados.

Ver tambem [ editar | editar codigo-fonte ]

Estatistica de teste

Referencias

↑ Glossario Ingles-Portugues de Estatistica, Sociedade Portuguesa de Estatistica e Associacao Brasileira de Estatistica [1]
↑ Gauvreau K, Pagano M. Why 5%? Nutrition 1994;10(1):93-4.
↑ Altman DG, Bland JM. Absence of evidence is not evidence of absence. British Medical Journal 1995; 311:485.
↑ Grimes DA, Schulz KF. An overview of clinical research: the lay of the land. The Lancet 2002; 359:57-61.
↑ Gardner MJ, Altman DG. Confidence intervals rather than P values: estimation rather than hypothesis testing. British Medical Journal (Clin Res Ed) 1986;292(6522):746-50.
↑ Leek, Jeffrey T.; Peng, Roger D. (abril de 2015). ≪Statistics: P values are just the tip of the iceberg≫ . Nature (7549): 612?612. ISSN 0028-0836 . doi : 10.1038/520612a . Consultado em 2 de novembro de 2022
↑ Singh Chawla, Dalmeet (1 de agosto de 2017). ≪Big names in statistics want to shake up much-maligned P value≫ . Nature (em ingles) (7665): 16?17. ISSN 1476-4687 . doi : 10.1038/nature.2017.22375 . Consultado em 2 de novembro de 2022
↑ Wasserstein, Ronald L.; Lazar, Nicole A. (2 de abril de 2016). ≪The ASA's Statement on p-Values: Context, Process, and Purpose≫ . The American Statistician . 70 (2): 129?133. ISSN 0003-1305 . doi : 10.1080/00031305.2016.1154108
↑ Hubbard R. The widespread misinterpretation of p-values as error probabilities. Journal of Applied Statistics 2011 [Ahead of print].

[1] Glossario Ingles-Portugues de Estatistica, Sociedade Portuguesa de Estatistica e Associacao Brasileira de Estatistica [1]

[2] Gauvreau K, Pagano M. Why 5%? Nutrition 1994;10(1):93-4.

[3] Altman DG, Bland JM. Absence of evidence is not evidence of absence. British Medical Journal 1995; 311:485.

[4] Grimes DA, Schulz KF. An overview of clinical research: the lay of the land. The Lancet 2002; 359:57-61.

[5] Gardner MJ, Altman DG. Confidence intervals rather than P values: estimation rather than hypothesis testing. British Medical Journal (Clin Res Ed) 1986;292(6522):746-50.

[6] Leek, Jeffrey T.; Peng, Roger D. (abril de 2015). ≪Statistics: P values are just the tip of the iceberg≫ . Nature (7549): 612?612. ISSN 0028-0836 . doi : 10.1038/520612a . Consultado em 2 de novembro de 2022

[7] Singh Chawla, Dalmeet (1 de agosto de 2017). ≪Big names in statistics want to shake up much-maligned P value≫ . Nature (em ingles) (7665): 16?17. ISSN 1476-4687 . doi : 10.1038/nature.2017.22375 . Consultado em 2 de novembro de 2022

[8] Wasserstein, Ronald L.; Lazar, Nicole A. (2 de abril de 2016). ≪The ASA's Statement on p-Values: Context, Process, and Purpose≫ . The American Statistician . 70 (2): 129?133. ISSN 0003-1305 . doi : 10.1080/00031305.2016.1154108

[9] Hubbard R. The widespread misinterpretation of p-values as error probabilities. Journal of Applied Statistics 2011 [Ahead of print].

[ 1 ]

[ 2 ]

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]