Baixe o material de estudo
Com o crescente volume de dados gerado pelas organizações, a necessidade de armazenar, organizar e analisar essas informações de maneira eficiente se tornou fundamental. Um Data Warehouse é uma solução desenvolvida para consolidar e estruturar grandes quantidades de dados, permitindo a tomada de decisões estratégicas baseada em informações confiáveis e bem organizadas. Diferente de bancos de dados transacionais, que priorizam a agilidade nas operações diárias, o Data Warehouse é projetado para análise histórica e extração de insights.
Uma das principais características do Data Warehouse é sua orientação a assunto. Isso significa que os dados são organizados em torno de temas específicos, como vendas, clientes, produtos ou finanças. Essa abordagem permite que os tomadores de decisão tenham uma visão clara e estruturada das informações mais relevantes para o negócio, ao contrário dos bancos de dados operacionais, que armazenam dados voltados para transações individuais.
Outra propriedade essencial é a integração dos dados. Um Data Warehouse recebe informações de diversas fontes, como sistemas ERP, CRM e bancos de dados legados, e as padroniza para garantir a consistência e confiabilidade dos dados. Esse processo de integração resolve problemas comuns, como dados duplicados, formatos inconsistentes e divergências entre diferentes sistemas.
O Data Warehouse também se destaca por ser não volátil, o que significa que os dados armazenados não sofrem alterações frequentes. Ao contrário de sistemas transacionais, onde as informações são constantemente atualizadas e modificadas, no Data Warehouse os dados são carregados de forma peródica e mantidos inalterados. Isso garante a confiabilidade das informações para análises históricas e cria uma base estável para tomada de decisão.
Uma característica fundamental do Data Warehouse é sua estrutura histórica no tempo. Isso significa que os dados armazenados contêm informações de diferentes momentos, permitindo a análise de tendências e padrões ao longo dos anos. Em sistemas transacionais, os dados mais antigos são frequentemente substituídos ou apagados para otimizar a eficiência operacional, mas no Data Warehouse eles são mantidos por longos períodos, garantindo uma visão completa da evolução do negócio.
A combinação dessas propriedades torna o Data Warehouse uma ferramenta essencial para Business Intelligence (BI). As organizações podem utilizar dados consolidados para criar relatórios avançados, painéis interativos e dashboards, facilitando a identificação de oportunidades e desafios. A capacidade de analisar informações históricas permite prever tendências, otimizar processos e melhorar a tomada de decisão.
Para que um Data Warehouse seja eficaz, ele precisa ser bem projetado, considerando aspectos como modelagem dimensional e esquemas de armazenamento. Os modelos mais comuns incluem o Esquema Estrela (Star Schema), que organiza os dados em uma tabela fato central conectada a tabelas dimensão, e o Esquema Floco de Neve (Snowflake Schema), que normaliza as tabelas dimensão para reduzir redundâncias.
O processo de ETL (Extract, Transform, Load) é o processo que alimenta, geralmente, um Data Warehouse. Ele consiste na extração dos dados de diversas fontes, transformação para garantir consistência e qualidade, e carregamento no repositório final. Uma implementação eficiente de ETL garante que o Data Warehouse esteja sempre atualizado e pronto para análises.
Atualmente, com a evolução das tecnologias de armazenamento e processamento de dados, os Data Warehouses estão migrando para soluções baseadas em nuvem, como Google BigQuery, Amazon Redshift e Snowflake. Esses serviços oferecem escalabilidade, desempenho e integração facilitada com ferramentas de análise e BI, tornando a gestão dos dados mais eficiente e acessível.
O Data Warehouse também desempenha um papel importante na mineração de dados (Data Mining), permitindo que algoritmos identifiquem padrões, correlações e anomalias em grandes volumes de informações. Com isso, é possível detectar fraudes, segmentar clientes e otimizar processos internos com base em dados confiáveis.
Vamos resolver algumas questões de concurso recentes sobre o tema:
A analista Bia está implementando um ambiente de Business Intelligence (BI) para apoiar as decisões dos gestores do TJMS. Para isso, Bia está extraindo dados oriundos de diversos sistemas de informação para carregar em um banco de dados. Na arquitetura de um ambiente BI, o componente que armazena dados orientado a assunto, integrado, variante no tempo e não volátil que Bia deve implementar é o:
A) OLAP;
B) dashboard;
C) data warehouse;
D) data mining;
E) repositório de metadados.
Gabarito: C
Comentários:
A questão descreve um componente da arquitetura de BI que armazena dados com as seguintes características: orientado a assunto, integrado, variante no tempo e não volátil. Vamos analisar cada alternativa:
Alternativa A – OLAP (Incorreta)
OLAP (Online Analytical Processing) é uma tecnologia que permite a análise interativa de grandes volumes de dados, oferecendo operações como drill-down, roll-up, slice e dice. No entanto, OLAP não é um repositório de armazenamento de dados, mas sim uma camada que facilita a exploração dos dados já armazenados no Data Warehouse. Portanto, não é a resposta correta.
Alternativa B – Dashboard (Incorreta)
Os dashboards são ferramentas que exibem visualmente os dados em gráficos, tabelas e indicadores para facilitar a análise e a tomada de decisão. No entanto, um dashboard não armazena os dados, apenas os apresenta de forma estruturada. Dessa forma, essa alternativa não atende aos critérios da questão.
Alternativa C – Data Warehouse (Correta)
O Data Warehouse (DW) é a base para um ambiente de Business Intelligence e possui exatamente as características descritas na questão:
✔ Orientado a assunto: organiza os dados por temas relevantes para a organização.
✔ Integrado: consolida dados de múltiplas fontes em um formato padronizado.
✔ Variável no tempo: armazena históricos, permitindo análises temporais.
✔ Não volátil: os dados, uma vez carregados, não são alterados nem apagados.
Como Bia está extraindo dados de vários sistemas para carregar em um banco de dados consolidado para análises, o Data Warehouse é a resposta correta.
Alternativa D – Data Mining (Incorreta)
O Data Mining (Mineração de Dados) é uma técnica usada para descobrir padrões, tendências e relações ocultas nos dados armazenados, mas não é um componente de armazenamento. O Data Mining trabalha sobre os dados de um Data Warehouse, mas não é o repositório primário dos dados.
Alternativa E – Repositório de Metadados (Incorreta)
Os repositórios de metadados armazenam informações sobre os dados, como estrutura, origem e significado, mas não armazenam os dados propriamente ditos. Eles auxiliam na governança dos dados e na interpretação das informações no Data Warehouse, mas não são um substituto para ele.
Um armazém de dados (Data Warehouse – DW) é um conjunto de dados que atende a quatro propriedades: orientado por assunto, conciso e integrado, variável com o tempo e não volátil.
Para atender à propriedade de não volatilidade
A) os assuntos são divididos em dimensões.
B) o DW deve garantir que todo dado inserido deverá estar correto.
C) as informações carregadas no DW devem ser posicionadas no tempo.
D) o DW deve garantir que o dado inserido não será apagado ou atualizado.
E) o DW deve garantir consultas extremamente complexas e com baixo tempo de resposta.
Gabarito: D
Comentários:
A questão trata da propriedade não volátil de um Data Warehouse (DW), que significa que os dados armazenados não sofrem alterações frequentes, ou seja, não são atualizados nem removidos após serem carregados. Vamos analisar cada alternativa:
Alternativa A – Os assuntos são divididos em dimensões. (Incorreta)
A separação dos dados em dimensões está relacionada à orientação a assunto, não à não volatilidade. O modelo dimensional, composto por tabelas fato e tabelas dimensão, facilita a análise dos dados, mas não impede que os dados sejam alterados ou removidos. Portanto, essa alternativa não se aplica ao conceito de não volatilidade.
Alternativa B – O DW deve garantir que todo dado inserido deverá estar correto. (Incorreta)
A garantia da correção dos dados está relacionada à integração e qualidade dos dados, que fazem parte do processo de ETL (Extract, Transform, Load), mas não à não volatilidade. Embora a qualidade dos dados seja fundamental para a confiabilidade do DW, esse conceito não tem relação direta com a impossibilidade de alteração ou remoção dos dados.
Alternativa C – As informações carregadas no DW devem ser posicionadas no tempo. (Incorreta)
Essa afirmação está relacionada à propriedade de histórico no tempo, que garante que os dados armazenados representam um período específico e permitem análises de tendências e evolução ao longo do tempo. Embora essa característica seja essencial em um DW, ela não define a propriedade de não volatilidade.
Alternativa D – O DW deve garantir que o dado inserido não será apagado ou atualizado. (Correta)
A não volatilidade significa que os dados, uma vez inseridos no DW, não devem ser alterados ou excluídos, garantindo um histórico confiável para análises futuras. Novos dados podem ser adicionados periodicamente, mas as informações antigas permanecem inalteradas, preservando a integridade das análises. Essa alternativa corresponde exatamente ao conceito de não volatilidade.
Alternativa E – O DW deve garantir consultas extremamente complexas e com baixo tempo de resposta. (Incorreta)
A otimização de consultas e a eficiência no tempo de resposta são aspectos desejáveis em um Data Warehouse, mas estão mais relacionadas à modelagem e ao uso de técnicas como indexação e particionamento. A não volatilidade diz respeito à permanência dos dados, não ao desempenho das consultas.
Prova: FGV – 2024 – AL-TO – Analista Legislativo – Desenvolvimento de Sistema
Armazéns de dados (ou data warehouses) são bases de dados que se mostram como uma interessante opção em processos de tomada de decisão. Elas armazenam grandes volumes de dados históricos e agregados para apoiar a tomada de decisões estratégicas e operacionais da organização.
Assinale a opção que apresenta uma característica correta de um data warehouse.
A) Adequam-se a sistemas OLTP (On Line Transaction Processing).
B) Apresentam como característica a dimensão temporal.
C) Armazenam especificamente dados de natureza transacional.
D) Orientam seu conteúdo à aplicação
E) Possuem dados de natureza volátil.
Gabarito: B
Comentários:
A questão pede uma característica correta de um Data Warehouse (DW). Vamos analisar cada alternativa.
Alternativa A – Adequam-se a sistemas OLTP (On Line Transaction Processing). (Incorreta)
Os sistemas OLTP (Online Transaction Processing) são projetados para processar transações operacionais em tempo real, como registros de compras, movimentações bancárias e cadastros de usuários. Já um Data Warehouse é projetado para análises estratégicas e tomadas de decisão, lidando com grandes volumes de dados históricos e agregados.
Alternativa B – Apresentam como característica a dimensão temporal. (Correta)
Uma das principais características do Data Warehouse é sua dimensão temporal, ou seja, os dados armazenados refletem um histórico de informações, permitindo análises ao longo do tempo. Essa característica possibilita identificar tendências, padrões e mudanças nos dados.
Alternativa C – Armazenam especificamente dados de natureza transacional. (Incorreta)
Os dados armazenados em um Data Warehouse vêm de fontes transacionais, mas são transformados, agregados e estruturados para análise. O foco do DW não está na execução de transações individuais, e sim no suporte à decisão por meio da análise de grandes volumes de dados organizados por assunto.
Alternativa D – Orientam seu conteúdo à aplicação. (Incorreta)
O Data Warehouse é orientado a assunto, ou seja, organiza as informações por temas relevantes para a empresa (como vendas, clientes, produtos, desempenho financeiro), e não por aplicação. Sistemas transacionais geralmente são orientados à aplicação, enquanto um DW agrupa os dados para análises estratégicas.
Alternativa E – Possuem dados de natureza volátil. (Incorreta)
A não volatilidade é uma característica fundamental dos Data Warehouses. Os dados, uma vez carregados no DW, não são alterados nem apagados, garantindo um histórico confiável para análises.
Quer ficar por dentro dos concursos públicos abertos e previstos pelo Brasil? Clique nos links abaixo:
CONCURSOS 2025
CONCURSOS ABERTOS
QUESTÕES DE CONCURSOS
Receba gratuitamente no seu celular as principais notícias do mundo dos concursos. Clique no link abaixo e inscreva-se:
TELEGRAM
Fonte: Gran Cursos Online