Exportar todos os usuários ativos do AD

Exportar usuários do AD pode ser chato, principalmente por causa do encoding e filtragem. O comando abaixo do powershell já tem tratamento de encoding e filtro de usuários ativos. \o/

get-aduser -filter 'enabled -eq $true' -Properties * | select displayname, city, company, department, EmailAddress, telephonenumber | export-csv -path .\export-all.csv -Encoding UTF8 -Force

Atualizar todos os repos

A preguiça de fazer coisas repetidas é um padrão entre devs. Hoje eu queria dar uma olhada nas entregas do time e precisava atualizar meus repos, então fiz essas duas linhas de powershell:

PS> $var1 = Get-ChildItem . -directory | Select Name
PS> foreach($directory in $var1) { cd $directory.Name; git pull; cd .. }

Como todos meus repos compartilham o mesmo diretório base, todos eles foram atualizados. =]

Plano de qualidade e outras ações para limpeza de dados

É difícil imaginar que um prato feito com ingredientes de má qualidade possa ser saboroso. Obviamente a receita, o talento do cozinheiro e os instrumentos da cozinha podem fazer diferença, mas no final do dia tudo começa por ingredientes de boa qualidade. E assim também o é com dados. O primeiro fator de sucesso para análises estatísticas e execução de modelos de machine learning são dados limpos e de qualidade. Uma outra forma de colocar essa verdade é o famoso (ou infame talvez?) dito: “garbage in, garbage out“. Ao efetuarmos quaisquer processos, sejam eles análises informativas, preditivas ou prescritivas, baseados em informações qualidade duvidosa, estaremos colocando em risco a confiabilidade dos resultados, o que no limite pode resultar em perdas financeiras, dependendo do tipo de decisão que o processo de dados vai apoiar.

Continue reading “Plano de qualidade e outras ações para limpeza de dados”

Estrutura de Dados e Algoritmos são importantes para Ciência de Dados?

Há algum tempo que, em áreas de tecnologia computacional e suas diversas vertentes, poucas coisas são mais discutidas do que quais disciplinas devem compor o repertório teórico de um profissional. Em ciência de dados não poderia ser diferente. É possível definir algumas justificativas para essa busca da combinação perfeita de competências:  áreas computacionais figuram entre as mais novas do conhecimento humano, estão em evolução extremamente acelerada e esta se dá muitas vezes fora da academia, no mercado competitivo das empresas privadas. Na indústria de software, a qual podemos associar a imagem de “irmã mais velha” da ciência de dados, as mesmas preocupações existem. E a resposta ao questionamento – que muitas vezes não agrada – costuma ser: depende.

Continue reading “Estrutura de Dados e Algoritmos são importantes para Ciência de Dados?”

Governança de Dados & Data Lake – Dá para ser Feliz?

Pensamos na felicidade como um estado de espírito de alegria e satisfação1. Mas existe também um segundo significado, sendo este mais útil para nossa reflexão: “concurso de circunstâncias que causam ventura”2. Com o aumento na quantidade total de dados que produzimos, na velocidade de sua produção e nos formatos de armazenamento3, poderíamos facilmente afirmar que as circunstâncias para nossa ventura (ou, em outras palavras, êxito) em utilizá-los (para embasar a tomada de decisão dos negócios) não são as melhores. Mesmo considerando as novas tecnologias e ferramentas que são lançadas a todo momento, a complexidade da tarefa pode ser esmagadora.

Continue reading “Governança de Dados & Data Lake – Dá para ser Feliz?”

Reflexões Sobre A Abstração E Suas Aplicações No Pensamento Computacional

Talvez não seja exagero dizer que a abstração é a mais poderosa das ferramentas intelectuais humanas, ou que se trata da capacidade que define o homo sapiens. Muito antes de se tornar um dos pilares do pensamento computacional, a abstração teve suas origens na própria revolução cognitiva da espécie humana que, generalizando situações cotidianas e objetos reais em forma de sinais e sons, pouco a pouco constituiu o que hoje chamamos de linguagem.

Continue reading “Reflexões Sobre A Abstração E Suas Aplicações No Pensamento Computacional”