É difícil imaginar que um prato feito com ingredientes de má qualidade possa ser saboroso. Obviamente a receita, o talento do cozinheiro e os instrumentos da cozinha podem fazer diferença, mas no final do dia tudo começa por ingredientes de boa qualidade. E assim também o é com dados. O primeiro fator de sucesso para análises estatísticas e execução de modelos de machine learning são dados limpos e de qualidade. Uma outra forma de colocar essa verdade é o famoso (ou infame talvez?) dito: “garbage in, garbage out“. Ao efetuarmos quaisquer processos, sejam eles análises informativas, preditivas ou prescritivas, baseados em informações qualidade duvidosa, estaremos colocando em risco a confiabilidade dos resultados, o que no limite pode resultar em perdas financeiras, dependendo do tipo de decisão que o processo de dados vai apoiar.
Continue reading “Plano de qualidade e outras ações para limpeza de dados”