Viés de dados de mão oculta Infoworld Bitcoin App na Índia

27 mar 2018, entre outros escândalos recentes, a Aliança Nacional Fair Housing e outras três organizações entraram com pedidos uma ação judicial contra o Facebook que a plataforma de publicidade do Facebook permitem distinguir proprietários e corretores de várias categorias de pessoas, impedindo-os de receber listagens de apartamentos. O resultado e os custos potenciais ainda são desconhecidos.

Nós ainda não sabemos se esta perseguição é baseada em sérios problemas de dados que são unilaterais, ruins (ou antiéticos). decisões de negócios, ou ambos. Mas organizações que querem aumentar o conhecimento de dados de seus funcionários e criar dados decisões de negócios deve criar consciência viés dados e seus custos.


Qual viés de dados

Você pode pensar que as informações coletadas por sensores e aplicativos devem ser gratuitas viés dados Por definição – afinal, bilhões de pontos de dados são registrados de forma neutra. Mas isso não é necessariamente verdade. Considere o que acontece quando a cidade de Boston lança um aplicativo para smartphone para localizar e consertar buracos. Conforme relatado, havia uma distorção oculta nos dados. A penetração do uso de smartphones entre os idosos e a população de baixa renda foi de apenas cerca de 16%, o que distorce significativamente os relatórios de problemas e os moradores que mais necessitam de serviços. Casos como tweets durante as tendências da gripe Sandy ou do Google são outros exemplos de viés dados pode ter um impacto negativo nos serviços públicos. [InfoWorld Essentials: O que é análise de Big Data? Tudo o que você precisa saber • O que é Data Mining? Como o Analytics revela ideias? | Analise análises e big data com o Relatório de big data e análise do InfoWorld. ] Consequências de dados distorcidos

Práticas discriminatórias são uma consequência de dados enviesados. Isso pode acontecer nos casos em que há um desalinhamento, que vê ofertas de emprego, como mostrou um estudo recente. O software de reconhecimento facial do Google também foi destacado como um viés racista significativo. Tal como acontece com a aplicação Facebook, as conseqüências de dados parciais podem ser mais graves do que a decisão errada ou a alocação inadequada de recursos: você pode violar a lei, mesmo sem conhecê-lo. A Sprint e a Time Warner foram multadas em vários milhões de dólares pela FTC. Uma breve visão geral dos diferentes tipos de distorções

• Viés de seleção: nesse caso, você está trabalhando com um subconjunto de dados em vez de uma amostra válida em toda a população. Por exemplo, um registro que inclua apenas clientes homens em Boston não fornece informações sobre a base de clientes em potencial na Nova Inglaterra. O uso de tweets para classificar apenas o sucesso de um produto não fornece informações sobre a população maior que usa o produto, mas não envia um tweet.

• Viés de causa e efeito: somos treinados para procurar correlações e padrões. No entanto, esses relacionamentos de dados incorporados podem não apenas ser supérfluos, mas podem falsificar a análise subsequente. Eu ouvi um bom exemplo dos dados do Titanic em uma conferência no ano passado. Nesse caso, os dados continham colunas altamente correlacionadas que conectavam aqueles que sobreviveram àqueles montados em botes salva-vidas. Mas nenhuma variável dá uma visão sobre os melhores fatores da causa que poderiam ter uma melhor chance de sobrevivência. Os dados do cliente que usamos regularmente têm muitos elementos correlacionados, por ex. Cidade e código postal.

Você precisa entender e se comunicar com suas equipes, qual é o viés e como elas podem influenciar seu trabalho com os dados. Esta não é apenas uma parte fundamental da implementação competência de dados estratégico e essencial para um gerenciamento de dados eficaz e ético decisões de negócios, Mas não entender isso pode ter sérias consequências para o seu negócio. Parte dessa estratégia é ensinar às pessoas que trabalham com dados como usar perfis de dados, preparação de dados ou ferramentas de BI para detectar possíveis vieses. Por exemplo:

Estas são práticas básicas de qualidade de dados que devem ser integradas para ajudar a configurar competência de dados na sua organização. Além disso, você deseja integrar métodos científicos básicos. Certifique-se de que suas equipes entendam os diferentes tipos de preconceito e preste atenção ao viés nas perguntas feitas ou nas metas que você está buscando. Outras suposições devem ser coletadas, avaliadas e apresentadas em algoritmos de teste e análises de análise antes de tomar decisões específicas. Proteja sua empresa contra distorção de dados

Os dados e as escolhas tendenciosas representam um risco significativo para sua organização, tanto monetária quanto ética, o que pode afetar sua capacidade de atingir suas metas de vendas e manter a reputação de sua marca. Para evitar decisões tendenciosas, você precisa entender quais são os objetivos da sua empresa e examinar os dados usados ​​e testar diferentes hipóteses. Os resultados devem ser incluídos em um processo de avaliação que avalie os preconceitos, riscos e considerações éticas.

Não é algo que possa ser delegado a uma equipe sobrecarregada de governança ou de risco e conformidade; ela deve ser integrada, comunicada e implementada em sua cultura corporativa. Se você seguir esta abordagem e fazer este tipo de questões, isso pode fazer uma contribuição significativa para evitar danos ao seu negócio, seja através de multas, gestão de reputação, ou ambos.