13 de março de 2019 freakonometrics macbeth ato 1 cena 1 análise

Cada vez que temos um estudo de caso em meus cursos atuariais (com dados reais), os alunos ficam surpresos por ter dificuldade em obter um modelo “bom” e ficam sempre surpresos por ter uma AUC baixa ao tentar modelar a probabilidade de reivindicar macbeth act 2 cena 4 resumo uma perda, uma morte, uma fraude, etc. E a cada vez, eu continuo dizendo: “sim, eu sei, e é isso que esperamos porque há muita ‘aleatoriedade’ no seguro”. Para ser mais específico, decidi executar algumas simulações e calcular o aucs para ver o que está acontecendo. E porque eu não quero perder tempo montando modelos, vamos supor que temos cada vez um modelo perfeito. Então eu quero mostrar que o limite superior dos mineradores ethereum para venda AUC é realmente muito baixo! Então, não é um problema de modelagem, é um problema fundamental em seguros!


Por “modelo perfeito” quero dizer o seguinte: \ omega denota o fator de heterogeneidade, porque as pessoas são diferentes. Nós gostaríamos de receber \ mathbb {P} [Y = 1 | \ omega]. Infelizmente, as vagas não são observáveis! Portanto, usamos covariáveis ​​(como a idade do motorista do carro no seguro automóvel, ou do segurado no seguro de vida, etc.). Assim, temos dados (y_i, \ boldsymbol {x} _i) e os usamos para treinar um modelo, a fim de aproximar \ mathbb {P} [Y = 1 | \ boldsymbol {X}]. E então, verificamos se nosso modelo é bom (ou não) usando a curva ROC, obtida de matrizes de confusão, comparando y_i’s e \ widehat {y} _i’s onde \ widehat {y} _i = 1 quando \ mathbb { P} [y_i kurs eth = 1 | \ boldsymbol {x} _i] excede um determinado limite. Aqui, não tentarei construir modelos. Eu vou prever \ widehat {y} _i = 1 cada vez que a verdadeira probabilidade subjacente \ mathbb {P} [y_i = 1 | \ omega_i] exceder um limite! O ponto é que é possível reivindicar uma perda (y = 1) mesmo que a probabilidade seja de 3% (e na maior parte do tempo \ widehat {y} = 0), e não reivindicar um (y = 0) mesmo se o a probabilidade é de 97% (e na maior parte do tempo \ widehat {y} = 1). Essa é a ideia com teorias éticas e princípios aleatórios, certo?

Em ambos os casos, há, em média, 25% de chance de reclamar uma perda. Mas à esquerda, há mais heterogeneidade, mais dispersão. Para ilustrar, usei a seta, que é um intervalo clássico de 90%: 90% dos indivíduos têm uma probabilidade de reivindicar uma perda nesse intervalo. (aqui 10% -40%), 5% estão abaixo de 10% (baixo risco) e 5% estão acima de 40% (alto risco). Posteriormente, diremos que temos em média 25%, com uma dispersão de 30% (40% menos 10%). À direita, é mais de 25% em média, com uma dispersão de 15%. O que eu chamo de dispersão é a diferença entre os quantis de 95% e 5%.

Considere agora algum conjunto de dados, com variáveis ​​bernoulli y, desenhado com essas probabilidades p (\ omega). Então, vamos supor que somos capazes de obter um modelo perfeito carteira wallet mac: Eu não estimar um modelo baseado em algumas covariáveis, aqui, suponho que eu conheço perfeitamente a probabilidade (o que é verdade, porque eu fiz gerar esses dados ). Mais especificamente, para gerar um vetor de probabilidades, aqui eu uso uma distribuição beta com uma dada média, e o que é eth uma dada variância (para capturar a heterogeneidade que mencionei acima)

Como explicamos, a perda é aqui em uma base individual, portanto, por política, a seguradora enfrenta a perda (aleatória) S- \ mathbb {E} [S], que é, em média, nula. Essa é a segunda linha. Para a última linha, continuo dizendo que analisamos a perda total da seguradora, mas isso não está correto. Aqui, com um fator n, teríamos a variância da perda total para a seguradora. Acabamos de remover o fator n na tabela

Considere algumas simulações simples. No gráfico à esquerda, temos no eixo x o fator de risco, e no eixo y, o éter dimetílico de perda usa (indo aproximadamente de 0 a 20). O prêmio puro é a média dessas perdas. Aqui é 10. Essa é a linha vermelha simples (à esquerda). No meio, o eixo y é o lucro / perda segurado por apólice. Alguém com uma perda de criptomoeda eth próxima de 0 significa um ganho de 10, alguém com uma perda próxima a 20 significa uma perda de 10. Em média, não há lucro (essa é a linha simples). E então, à direita, temos a distribuição do lucro / perda (por contrato). Mais uma vez, em média, é 0, com alguma variação,

Então temos o lucro / perda por apólice para o segurado, no meio. Aqui, quando a perda estava perto de 0, o ganho é menor: é 6 (enquanto era 10 antes). Quando era quase 10, anteriormente, significava um lucro de 0, mas agora é uma perda de 4 ou um ganho de 4. A distribuição de lucros / perdas agora está à direita. Há menos dispersão e menos variação. Que a diminuição da variação já discutimos antes. Resumindo, a segmentação reduz a variabilidade do resultado para a seguradora. Isso é o que observamos nos advogados de ética.