Um dos principais problemas que muitas empresas estão enfrentando atualmente, está relacionado a qualidade da informação, pois por vezes, grandes empresas investem muitos milhões num ecossistema de big data. Entretanto, não podem confiar em seus dados ou não tem uma perspectiva do quanto essas medições estão erradas.

Vou tentar desmistificar o erro, tentando explorá-lo de diferentes maneiras. Então, convido você a se aprofundar nesses conceitos.

Toda medição tem um erro associado a ela, segue abaixo os principais:

Tipos de Erros em medições

Erro Grosseiro

Erros grosseiros são causados por pessoas, ou sistemas, que erram no manuseio de algum instrumento de medida, cálculo da medida ou na hora de gravar os resultados.

Erro gravíssimo

É um erro muito grave ocasionado, geralmente por falta de atenção, que pode levar à alguma consequência catastrófica.

Erros na Medida

Os erros na medida podem ser classificados como erro sistemático e erro aleatório.


Erro Sistemático

É um erro que afeta todas as repetições de uma medida e apresenta-se igualmente deslocada do valor verdadeiro.

Uma forma de diminuir esse erro é melhorar o instrumento de medição.

Os erros sistemáticos podem ser classificados como: Erro Instrumental, Erro Ambiental, Erro Observacional e Erro Teórico.

– Erro Instrumental
Erro devido a falta de calibração do instrumento de medição

– Erro ambiental
São os erros devidos a fatores do ambiente, que podem interferir na medida, como: umidade, temperatura e pressão.

– Erro observacional
Este tipo de erro ocorre em a pequenas falhas de procedimentos ou limitações do observador. Por exemplo, o efeito de paralaxe na leitura de escalas de instrumentos.

– Erro teórico
Erros teóricos são causados ​​pela simplificação do modelo de um sistema. Por exemplo, uma teoria afirma que a temperatura ao redor do sistema não mudará as leituras feitas, entretanto a temperatura muda as leituras.


Erro Aleatório

Erros aleatórios são causados por alguma variável que não foi prevista na hora da medição, por exemplo, como alguém chamando a atenção da pessoa que está medindo ou alguma variação na corrente elétrica de um sensor.

Uma forma de diminuir erros aleatórios é através da repetição de uma medida, pelo menos três vezes, e depois realizar o cálculo de média.

Então podemos definir de forma genérica o erro sendo:


Erro = Erro Sistemático + Erro Aleatório + Erro Grosseiro + Erro Gravíssimo


Erro Tipo I e Tipo 2

Ambos erros estão associados a testes de hipóteses Estatísticos (Estatística Inferencial), onde o erro do tipo 1 ocorre quando a hipótese nula é rejeitada, porém ela é verdadeira. Enquanto, o do tipo 2 acontece quando a hipótese nula  é aceita, porém deveria ser rejeitada.

                               

Acurácia e Precisão (Exatidão)

 

Acurácia

Acurácia refere-se a proximidade de um valor medido a um valor padrão ou conhecido. Por exemplo, se no laboratório você obtiver uma medição de peso de 3,2 kg para uma determinada substância, mas o peso real ou conhecido for de 10 kg, a medição não será exata. Nesse caso, sua medição não está próxima do valor conhecido.
A acurácia de uma medição, também poder ser definido como o quão próximo a medida está do valor real da quantidade sendo medida. A acurácia das medições é frequentemente reduzida pela redução de erros sistemáticos.

Precisão

A precisão refere-se à proximidade de duas ou mais medidas entre si. Usando o exemplo acima, se você pesar uma determinada substância cinco vezes e obter 3,2 kg de cada vez, sua medição será muito precisa. A precisão é independente da sua acuracidade. Você pode ser muito preciso, mas sem acuracidade, conforme descrito acima. Você também pode ter acuracidade, mas ser impreciso numa medição.

Além disso, segundo R. H. B. ,a precisão de uma medição é o quão próximo um número de medições da mesma quantidade concordam entre si. A precisão é limitada pelos erros aleatórios. Geralmente pode ser determinado repetindo-se as medições.

Medidas de Dispersão

As medidas de dispersão (Variância, Amplitude e Desvio Padrão) estão relacionadas com a precisão, pois quanto menor o desvio padrão, por exemplo, maior será a precisão.

Medidas de Centralidade

Já as medidas de centralidade (Moda, Média e Mediana) podem estar relacionadas a acurácia quando comparadas com o valor de referência.

Outliers

São valores, numa série que se afasta muito dos demais, logo uma amostragem com muitos outliers, indica baixa precisão e acurácia.


Fonte da imagem: GeeksforGeeks

Erro padrão

O erro padrão é uma medida que relaciona a média amostral com a média populacional. O erro padrão ser pequeno, indica uma maior assertividade na estimativa do cálculo da média populacional.


Onde:


Se = Erro padrão amostral

S = Desvio Padrão amostral

n = tamanho da amostra

 

Fontes:
1 – http://www.fis.ita.br/labfis45/erros/errostextos/erros2.htm
2 – https://www.physics.umd.edu/courses/Phys276/Hill/Information/Notes/ErrorAnalysis.html
3 – https://labwrite.ncsu.edu/Experimental%20Design/accuracyprecision.htm
4 – https://freepik.com

1 Comentário. Deixe novo

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Preencha esse campo
Preencha esse campo
Digite um endereço de e-mail válido.

Menu