6 Gráfico de dispersão, linha de tendência e regressão linear – bsci 1510l literatura e guia de estatísticas – guias de pesquisa na quantidade de bitcoin da Universidade de vanderbilt

No exemplo acima, o Excel calculou e plotou um gráfico linear linha de tendência através dos pontos. Você deve notar que a linha de tendência é a melhor linha que se encaixa nos pontos. Pode ou não passar por qualquer ponto em particular. É por isso que outro nome para a linha de tendência é a linha de melhor ajuste. Em gráficos científicos, quase nunca "liga os pontos". (Existe outro tipo de gráfico que o Excel faz que faz isso – não o use!) O nome do processo usado para criar a linha de melhor ajuste é chamado de regressão linear.

Quando ajustamos a melhor linha através dos pontos de um gráfico de dispersão, geralmente temos um de dois objetivos em mente. Um uso importante da regressão linear é preditivo. No exemplo, gostaríamos de prever o quão rápido a cauda será sacudida, dado um tratamento que é um tamanho que não medimos especificamente.


Se nós sabemos a equação do linha de melhor ajuste podemos ligar números para calcular o valor previsto. O outro uso importante da regressão linear é como um teste estatístico de significância. Nesse caso, simplesmente queremos saber se alterar o tamanho do tratamento tem um efeito significativo na taxa de abanar a cauda. Podemos não nos importar realmente em descrever a maneira como os fatores variam (a equação); podemos apenas querer saber se eles variam significativamente ou não. Nesse caso, o que queremos saber é se a inclinação da linha de melhor ajuste é diferente de zero ou não. Se a taxa de abanar a cauda fosse completamente aleatória e não afetada pelo tamanho do tratamento, a linha de melhor ajuste seria horizontal, mostrando que a taxa média de abanar era a mesma, independentemente do tamanho do tratamento. UMA regressão linear pode facilitar ambos os usos.

o que é uma mina bitcoin

No exemplo para demonstrar como criar um gráfico de dispersão no Excel, vimos que a linha de melhor ajuste através dos dados de taxa de abanão / cauda de tratamento teve um declive positivo. No entanto, pode-se argumentar que a taxa de troca não está relacionada ao tratamento do tamanho e que foi simplesmente uma coincidência que os pontos do lado direito do gráfico fossem mais altos do que os do lado esquerdo. Como havia apenas cinco pontos de dados, esse seria um resultado bastante provável. Podemos enquadrar essa situação usando o mesmo idioma da Seção 5.2. Em uma regressão, nossa hipótese nula é que a inclinação da linha de melhor ajuste é zero. Quando conduzimos o teste estatístico de regressão, o software calculará um valor de P. Lembre-se da interpretação geral de P: se a hipótese nula fosse verdadeira, P é a probabilidade de ocorrerem desvios tão grandes ou maiores do que os observados na amostra. devido a uma amostragem não representativa do acaso. Neste teste em particular, P indica a probabilidade de que uma inclinação tão grande ou maior do que a da linha de melhor ajuste ocorreria devido a desvios de probabilidade de uma inclinação real de zero. Se os desvios de uma inclinação de zero forem grandes o suficiente para o valor de P cair abaixo de 0,05, então dizemos que a linha de melhor ajuste difere significativamente de zero. Neste caso, afirmamos adicionalmente que o fator representado graficamente no eixo horizontal tem um efeito significativo no fator representado graficamente no eixo Y.

Em um experimento simples de um fator, como o exemplo de estudo da pressão arterial das Seções 4.2 a 5.3, presumimos que a presença do fator tenha um efeito fixo no tamanho da quantidade medida nos ensaios. Esse efeito se manifesta criando uma diferença no valor médio da quantidade medida. Em contraste, em uma regressão linear, assumimos que o fator experimental tem um efeito variável que aumenta linearmente com o tamanho do fator. Por exemplo, podemos testar um medicamento administrando-o em doses que variam de zero a algum valor máximo. Em um experimento do tipo regressão como esse, não há um único nível de tratamento que seja o controle, já que cada ponto de dados coletado pode ter um valor diferente. Regressão e variantes de regressão como regressão múltipla e análise de covariância (ANCOVA) são alguns dos procedimentos estatísticos mais comuns em uso.

valor de 1 bitcoin em usd

A Fig. 14 mostra um gráfico de dados experimentais simulados. Esses dados têm um componente linear que pode ser descrito por uma linha de melhor ajuste com uma inclinação diferente de zero. Eles também têm um componente aleatório que faz com que eles fiquem espalhados em torno da linha de melhor ajuste. Uma análise de regressão desses dados calcula que a equação da linha de melhor ajuste é y = 6x + 55. Dependendo do software utilizado, esta informação pode ser fornecida como uma equação real, ou o coeficiente de X (isto é, a inclinação) e o intercepto podem ser listados em uma tabela.

Existem outros padrões de dados para os quais a linha de melhor ajuste também seria y = 6x + 55. A Fig. 15 mostra dois outros conjuntos de dados que também têm a mesma linha de melhor ajuste. Uma diferença importante entre esses conjuntos de dados é o grau em que os pontos são agrupados em torno da linha de melhor ajuste. A tensão de ajuste à linha é descrita pela quantidade R 2. Seu valor varia de 0 (essencialmente uma nuvem aleatória de pontos) a 1 (os pontos caem perfeitamente em uma linha reta). No lado esquerdo da Fig. 15, os pontos são muito bem agrupados em torno da linha de melhor ajuste e o valor de R 2 é muito próximo de 1. No lado direito da Fig. 15, o componente aleatório dos dados é muito grande e os pontos quase formar uma nuvem. Subsequentemente, o valor de R 2 é muito baixo. Apesar desse valor baixo, a linha de melhor ajuste ainda difere significativamente de zero porque é baseada em um grande tamanho de amostra.

bitcoin кошелек регистрация

Para calcular as estatísticas associadas à linha de tendência usando uma análise de regressão linear, clique na faixa de opções Dados. Clique em Análise de dados na seção Análise. Selecione Regressão e clique em OK. Clique no botão de seleção Input Y Range: e selecione o intervalo de células para a coluna que contém os valores de Y. Clique no botão de seleção Input X Range: e selecione o intervalo de células para a coluna que contém os valores de X. Nota: se houver um rótulo de texto acima da coluna de números, você poderá selecioná-lo e marcar a caixa Etiquetas. Se não houver rótulo de texto acima da coluna, selecione apenas os números e não selecione a caixa Etiquetas. Para colocar os resultados na mesma folha que a coluna de números, clique no rádio Output Range botão então Clique no botão de seleção. Clique na célula superior esquerda da área da planilha onde deseja que os resultados sejam concluídos. Em seguida, pressione OK.

O Resumo Saída contém mais informações do que estamos interessados ​​no momento. No entanto, se você já tiver o Excel, coloque a equação da linha e o valor de R 2 no gráfico, você poderá compará-los com a tabela de saída. Você encontrará o valor de R Square na seção Regression Statistics. Ignore a tabela ANOVA. Na última tabela, o valor do Intercept será encontrado em uma linha sob "Coeficientes" e a inclinação será listada como o coeficiente da linha que contém o rótulo da coluna (por exemplo, "taxa de wag") ou "X Variável 1" (se não houver nenhum rótulo de coluna). O valor P real para a regressão é encontrado na mesma linha sob "Valor P".

compre bitcoin instantaneamente com cartão de débito