Plano de qualidade e outras ações para limpeza de dados

É difícil imaginar que um prato feito com ingredientes de má qualidade possa ser saboroso. Obviamente a receita, o talento do cozinheiro e os instrumentos da cozinha podem fazer diferença, mas no final do dia tudo começa por ingredientes de boa qualidade. E assim também o é com dados. O primeiro fator de sucesso para análises estatísticas e execução de modelos de machine learning são dados limpos e de qualidade. Uma outra forma de colocar essa verdade é o famoso (ou infame talvez?) dito: “garbage in, garbage out“. Ao efetuarmos quaisquer processos, sejam eles análises informativas, preditivas ou prescritivas, baseados em informações qualidade duvidosa, estaremos colocando em risco a confiabilidade dos resultados, o que no limite pode resultar em perdas financeiras, dependendo do tipo de decisão que o processo de dados vai apoiar.

Continue reading “Plano de qualidade e outras ações para limpeza de dados”

Análise de requisitos de dados: é viável?

A imagem de um mago branco sozinho em uma torre alta e sombria, rodeada em sua base por um exército de orcs (na verdade Uruk-hais, para evitar desentendimentos de ordem nerd) pilhando florestas, acendendo fogueiras e esquentando caldeiras para construir armas de guerra, foi materializada em nossas mentes durante a famosa trilogia Senhor dos Anéis, lançada durante os três primeiros anos do nosso milênio corrente. E nós torcíamos, o tempo todo, para que aquele mago perdesse a guerra que estava para acontecer, muito devido à sua prepotência e descaso pela realidade ao seu redor – a natureza, as pessoas e a sociedade que ali existia.

Continue reading “Análise de requisitos de dados: é viável?”