Baixe o material de estudo
O CESPE/CEBRASPE é uma das bancas mais exigentes quando se trata de avaliação de candidatos para cargos de tecnologia da informação. No tema banco de dados e data warehouse, as questões são elaboradas de forma a testar não apenas a memorização de conceitos, mas a compreensão profunda do funcionamento e das características dos sistemas de apoio à decisão.
Um dos itens recorrentes envolve a afirmação de que “fatos, dimensões e medidas são elementos essenciais de um data warehouse”. Esse item é correto, e sua recorrência nas provas mostra que o CESPE valoriza o domínio da modelagem dimensional. Os candidatos devem lembrar que a tabela fato armazena as medidas (quantitativas), enquanto as tabelas dimensão armazenam os contextos de análise (como tempo, cliente, produto).
Outra questão importante apareceu no TRF-6, com a afirmação de que a principal característica de um DW é armazenar dados em um ambiente de atualização contínua, com alterações em tempo real. Essa assertiva está errada, pois fere um princípio central dos DWs: eles são não voláteis e atualizados em lotes periódicos, geralmente por meio de processos ETL. Essa confusão com sistemas OLTP é comum, e o candidato atento deve notar a armadilha.
Em provas como STJ 2024, o CESPE afirmou que um data warehouse é projetado para suportar operações transacionais diárias, como inserções e atualizações frequentes. Novamente, o item está errado, pois tais características pertencem a sistemas OLTP. Um DW serve para leitura intensiva e análise de grandes volumes históricos, com pouca ou nenhuma escrita.
Já o item que dizia que “os bancos de dados dimensionais que atendem ao data warehouse devem ser implementados de forma normalizada” também está errado. Esquemas dimensionais (estrela e floco de neve) geralmente são desnormalizados, visando otimizar a performance de leitura e simplificar as junções. A normalização completa é característica dos sistemas transacionais, e não dos sistemas analíticos.
Em outra prova (CNJ 2024), foi afirmado que data warehouses podem armazenar dados em formatos variados, como registros semiestruturados e arquivos não estruturados. Essa afirmativa é controversa: em um DW tradicional relacional, a estrutura é bem definida. Porém, o surgimento de arquiteturas modernas e o uso de bancos híbridos pode tornar essa afirmativa plausível em contextos mais modernos, como DWs em nuvem ou com extensões NoSQL.
A questão do nível de granularidade também é recorrente. Em um item da prova do CNMP, o CESPE afirma que quanto mais detalhes uma unidade de dados contém, maior o nível de granularidade. Essa afirmação está tecnicamente invertida: granularidade se refere ao nível de detalhe — quanto mais detalhado o dado, menor a granularidade; quanto mais resumido, maior a granularidade.
Outra questão interessante envolve a arquitetura física e os esquemas utilizados. O CESPE já afirmou que o esquema estrela é composto por uma tabela fato e múltiplas tabelas dimensão, ligadas por chaves estrangeiras. Esse item está correto e é uma definição clássica. Já no esquema floco de neve, as dimensões podem ser normalizadas, o que aumenta o número de tabelas e a complexidade das junções.
Em 2023, na prova da Petrobras, foi apresentada uma questão afirmando que as tabelas fato geralmente são muito grandes, o que é correto. Elas armazenam os dados transacionais consolidados e acumulam milhões de registros ao longo do tempo. As dimensões, por outro lado, são relativamente pequenas e estáveis.
Já na prova da ANATEL, a banca cobrou a ideia de chave substituta (surrogate key). O item afirmava que as dimensões geralmente utilizam chaves substitutas para garantir um identificador único. Essa afirmativa está correta e reflete uma prática comum em DWs para evitar problemas de integridade referencial ao longo do tempo.
Em provas mais recentes, como EMBRAPA 2025, o CESPE afirmou que o esquema estrela oferece melhor desempenho em grandes volumes de dados históricos, em comparação com o snowflake. Esse item está correto, pois a desnormalização do estrela favorece a simplicidade nas consultas e melhora o desempenho analítico.
Em outro item da CODEVASF 2024, foi dito que o DW é um processo que reúne dados históricos, limpos e transformados, visando análises estratégicas. Essa afirmativa está correta, pois descreve com precisão a função e o fluxo básico do processo ETL e da arquitetura DW.
Por fim, é essencial que o candidato perceba que o CESPE gosta de testar diferenças conceituais entre OLTP e OLAP, além de exigências arquiteturais e práticas de modelagem. A leitura atenta do item e o confronto com os princípios básicos de cada modelo são fundamentais para acertar.
Em resumo, Data Warehouse é um dos temas mais quentes em provas objetivas do CESPE. Para ter sucesso, o candidato precisa conhecer a teoria, mas também reconhecer pegadinhas semânticas, como inversões de termos, uso indevido de conceitos OLTP em contextos OLAP e afirmações baseadas em tecnologias emergentes.
Quer garantir mais acertos? Monte uma planilha com os itens que você errou nas questões de DW, classifique por tema (modelagem, arquitetura, ETL, granularidade) e revise cada um com teoria e exemplos. Esse método ajuda a consolidar o conhecimento e evita que você caia duas vezes na mesma armadilha.
Fonte: Gran Cursos Online