Estatistica
e a
ciencia
que utiliza as
teorias probabilisticas
para explicar a frequencia da ocorrencia de eventos,
[
1
]
tanto em
estudos observacionais
quanto em
experimentos
para
modelar
a
aleatoriedade
e a
incerteza
de forma a
estimar
ou possibilitar a previsao de
fenomenos
futuros, conforme o caso.
Se dedica a coleta,
analise
e interpretacao de dados e preocupa-se com os metodos de coleta, organizacao, resumo, apresentacao e interpretacao dos dados, assim como tirar conclusoes sobre as caracteristicas das fontes donde estes foram retirados, para melhor compreender as situacoes.
Algumas praticas estatisticas incluem, por exemplo, o planejamento, a sumarizacao e a interpretacao de observacoes. Dado que o objetivo da estatistica e a producao da melhor
informacao
possivel a partir dos
dados
disponiveis, alguns autores sugerem que a estatistica seja um ramo da
teoria da decisao
.
Devido as suas raizes empiricas e seu foco em aplicacoes, a estatistica geralmente e considerada uma disciplina distinta da
matematica
, e nao um ramo dessa.
[
2
]
[
3
]
O termo "estatistica" surge da expressao em
latim
statisticum collegium,
"palestra sobre os assuntos do
Estado
", de onde surgiu a palavra em
lingua italiana
statista
, que significa "homem de estado", ou
politico
, e a palavra
alema
Statistik
, designando a
analise de dados
sobre o Estado. A palavra foi proposta pela primeira vez no
seculo XVII
, em latim, por Schmeitzel na
Universidade de Jena
e adotada pelo academico alemao Godofredo Achenwall. Aparece como vocabulario na
Enciclopedia Britanica
em
1797
, e adquiriu um significado de coleta e classificacao de dados, no inicio do
seculo XIX
.
De acordo com a Revista do
Instituto Internacional de Estatistica
,
Cinco homens,
Hermann Conring
,
Gottfried Achenwall
,
Johann Peter Sussmilch
,
John Graunt
e
William Petty
ja receberam a honra de serem chamados de fundadores da estatistica por diferentes autores.
[
4
]
Alguns autores dizem que e comum encontrar como marco inicial da estatistica a publicacao do
"
Observations on the Bills of Mortality
"
(Observacoes sobre os Censos de Mortalidade, 1662) de John Graunt. As primeiras aplicacoes do pensamento estatistico estavam voltadas para as necessidades de
Estado
, na formulacao de politicas publicas, fornecendo dados
demograficos
e
economicos
. A abrangencia da estatistica aumentou no comeco do seculo XIX para incluir a acumulacao e analise de dados de maneira geral. Hoje, a estatistica e largamente aplicada nas
ciencias naturais
, e
sociais
, inclusive na
administracao publica
e
privada
.
Seus fundamentos matematicos foram postos no seculo XVII com o desenvolvimento da
teoria das probabilidades
por
Pascal
e
Fermat
, que surgiu com o estudo dos jogos de azar. O
metodo dos minimos quadrados
foi descrito pela primeira vez por
Carl Friedrich Gauss
, aproximadamente no ano de 1794. O uso de computadores modernos tem permitido a computacao de dados estatisticos em larga escala e tambem tornaram possivel novos metodos antes impraticaveis.
Ligacoes para estatistica observacional
fenomeno
sao coletados pelos
fenomenos estatisticos
.
- Estatistica inferencial
e o conjunto de tecnicas utilizadas para identificar relacoes entre variaveis que representem ou nao relacoes de causa e efeito;
- Estatistica robusta
e o conjunto de tecnicas utilizadas para atenuar o efeito de outliers e preservar a forma de uma distribuicao tao aderente quanto possivel aos dados empiricos.
A estatistica nao e uma ferramenta matematica que nos informa sobre o quanto de
erro
nossas observacoes apresentam sobre a realidade
pesquisada
. A estatistica baseia-se na medicao do erro que existe entre a estimativa de quanto uma
amostra
representa adequadamente a
populacao
da qual foi extraida. Assim o conhecimento de teoria de
conjuntos
,
analise combinatoria
e
calculo
sao indispensaveis para compreender como o erro se comporta e a magnitude do mesmo. E o erro (erro amostral) que define a
qualidade
da observacao e do delineamento experimental.
A faceta dessa ferramenta mais palpavel e a
estatistica descritiva
. A descricao dos dados coletados e comumente apresentado em graficos ou relatorios e serve tanto a prospeccao de uma ou mais variaveis para posterior aplicacao ou nao de testes estatisticos bem como a apresentacao de resultados de delineamentos experimentais.
Nos descrevemos o nosso
conhecimento
de forma matematica e tentamos aprender mais sobre aquilo que podemos observar. Isto requer:
- O planejamento das observacoes por forma a controlar a sua variabilidade (concepcao do experimento);
- Sumarizacao da colecao de observacoes;
- Inferencia estatistica
- obter um consenso sobre o que as observacoes nos dizem sobre o mundo que observamos.
Em algumas formas de
estatistica descritiva
, nomeadamente
mineracao de dados
(
data mining
), os segundo e terceiro passos tornam-se normalmente mais importantes que o primeiro.
A
probabilidade
de um evento e definida como um
numero
entre zero e um.
Normalmente aproximamos a probabilidade de alguma coisa para cima ou para baixo porque elas sao tao provaveis ou improvaveis de ocorrer, que e facil de reconhece-las como probabilidade de um ou zero. Entretanto, isso pode levar a desentendimentos e comportamentos perigosos, porque e dificil distinguir entre, uma probabilidade de 10
?4
e uma de 10
?9
, a despeito da grande diferenca numerica entre elas. Por exemplo, se voce espera atravessar uma estrada 10
5
ou 10
6
vezes na sua vida, definir o risco de atravessa-la em 10
?9
significa que voce esta bem seguro pelo resto da sua vida. Entretanto, um risco de 10
?4
significa que e bem provavel que voce tenha um acidente, mesmo que intuitivamente um risco de 0,01% pareca muito baixo.
O crescimento rapido e sustentados no poder de processamento dos computadores a partir da segunda metade do seculo XX teve um forte impacto na pratica da estatistica. Os modelos estatisticos mais antigos eram quase sempre
lineares
, mas os computadores modernos, junto com
algoritmos
numericos apropriados, causaram um aumento do interesse nos
modelos nao-lineares
(especialmente
redes neurais
e
arvores de decisao
) assim como na criacao de novos tipos, como o
modelo linear generalizado
e o
modelo multi-nivel
.
O aumento na capacidade de computacao tambem tem levado a popularizacao de metodos que demandam muitos calculos baseados em
reamostragem
(em
ingles
e no
jargao
do meio
resampling
), como testes de permutacao e
bootstrap
, enquanto tecnicas como a
amostragem de Gibbs
tem feito com que os metodos de
Bayes
fiquem mais faceis. A revolucao informatica tambem tem levado a um aumento na enfase na estatistica "experimental" e "empirica". Um grande numero de softwares estatisticos, de uso tanto geral como especifico estao disponiveis no mercado.
Algumas ciencias usam a
estatistica aplicada
tao extensivamente que elas tem uma terminologia especializada. Estas disciplinas incluem:
Estatistica forma uma ferramenta chave nos negocios e na
industrializacao
como um todo. E utilizada a fim de entender sistemas variaveis, controle de processos (chamado de "
controle estatistico de processo
" ou CEP), custos financeiros (contabil) e de qualidade e para sumarizacao de dados e tambem
tomada de decisao
baseada em dados. Nessas funcoes ela e uma ferramenta chave, e e a unica ferramenta segura.
Referencias
- TRIOLA, Mario F.
Introducao a Estatistica
. LTC. 10a edicao 2008. 722p.
ISBN 85-216-1586-8
- MANN, Prem S.
Introducao a Estatistica
. LTC. 5a edicao 2006, 774p.
ISBN 85-216-1506-X
- WITTE, John S.; WITTE, Robert S.
Estatistica
. LTC. 7a edicao 2005. 506p.
ISBN 85-216-1441-1
- BUSSAB, Wilton.
Estatistica Basica
. Saraiva. 5a edicao 2006. 540p.
ISBN 85-02-03497-9
- MOORE, David S.
A Estatistica Basica e sua Pratica
. LTC. 3a edicao 2005. 688p.
ISBN 85-216-1443-8
- MILONE, Guiseppe.
Estatistica Geral e Aplicada
. Thomson Pioneira. 498p.1a edicao 2003.
ISBN 85-221-0339-9