Acesse o conteúdo completo – XML para o concurso da Caixa (TI)
Neste artigo iremos abordar sobre os conceitos gerais de XML (Extensible Markup Language), que é uma linguagem de marcação universal para codificação de dados de forma legível por humanos e máquinas.
Este é um dos assuntos cobrados pela Cesgranrio no concurso da Caixa Econômica Federal, área Tecnologia da Informação. Por isso, vamos abordar os tópicos principais para concursos públicos.
Assim, estruturamos este artigo da seguinte forma:
- O que é XML?
- Sintaxe
- O que é XML bem formado?
- Conclusão
O que é XML?
XML é uma linguagem de marcação universal e autodescritiva que permite aos usuários definir suas próprias tags para descrever dados de maneira estruturada e legível por máquina e por humanos.
As tags são cercadas por colchetes angulares (“<” e “>”), com elementos aninhados para representar hierarquias de dados. Os documentos XML são organizados em uma estrutura de árvore que tem início na “raiz” e se estende até as “folhas”. Por exemplo:
Neste exemplo simples, temos um elemento raiz
Sintaxe
As regras de sintaxe são simples e lógicas, sendo fáceis de aprender e aplicar. A seguir, veremos as principais.
Documentos XML devem ter um elemento raiz
Os documentos XML devem iniciar com um elemento raiz que seja pai de todos os outros elementos:
Note que existem apenas um elemento “raiz”, podendo ter vários filhos.
Prólogo XML
Normalmente, em documentos XML, temos a seguinte linha:
Essa linha é chamada de prólogo XML e é opcional. Entretanto, se existir, deve aparecer antes do conteúdo do XML. A codificação UTF-8 é importante pois evita erros no documento caso este contenha caracteres internacionais. Por isso, o UTF-8 é a codificação de caracteres padrão para documentos XML.
Por fim, é importante salientar que o prólogo NÃO FAZ PARTE do documento XML.
Os elementos devem ter uma tag de fechamento
Em XML, todos os elementos devem possuir uma tag de fechamento, que podem ser representadas das seguintes formas:
ou
No primeiro caso, o elemento possui conteúdo. Por outro lado, no segundo caso, o elemento não possui conteúdo, sendo possível fechá-lo apenas com />. Assim, há duas formas de fechar um elemento. O primeiro caso pode ser utilizado para elementos com conteúdo ou para elementos vazios. Já o segundo caso, é usado apenas para elementos sem conteúdos.
XML é Case Sensitive
As tags XML diferenciam maiúsculas de minúsculas, ou seja, a tag
Aninhamento dos elementos
Em XML, todos os elementos devem ser aninhados uns aos outros, ou seja, quando um elemento X for aberto dentro de um elemento Y, o elemento X deve fechado dentro do elemento Y.
Vejamos um exemplo:
Esse exemplo está correto, perceba que o elemento Y abre e fecha dentro de X. Portanto, estão aninhados de forma correta.
Vejamos um outro exemplo abaixo:
Nesse exemplo, os elementos estão INCORRETAMENTE aninhados, pois o elemento Y fecha depois de seu pai, o elemento X. Isso é proibido!
Ao incluir um atributo, seu valor é obrigatório
Os elementos XML podem conter atributos, que são compostos, obrigatoriamente,por um par de nome e valor. Isso significa que não posso ter um atributo sem valor. Os valores dos atributos devem sempre estar entre aspas “ “.
No exemplo acima, o elemento email possui um atributo data com o valor “10/04/2024”.
Caracteres especiais devem ser substituídos por referências de entidade
Certos caracteres, como <, >, &, ‘ e “ não podem ser usados diretamente, pois podem ser interpretados como marcações. Em vez disso, devem ser substituídos por entidades XML:
- < é substituído por <
- > é substituído por >
- & é substituído por &
- ” é substituído por “
- ‘ é substituído por ‘
Por exemplo, ao colocar um caractere como “<” dentro de um elemento, será gerado um erro porque o analisador o interpreta como o início de um novo elemento.
Assim, o seguinte trecho gerará um erro:
Devendo ser substituído por:
Mas muita atenção: somente os caracteres < e & são estritamente ilegais em XML. Mas é uma boa prática substituir os demais caracteres também pelas referências de entidade.
Comentários XML
A forma de escrever comentários é similar à utilizada em HTML:
Não é permitido inserir dois hífens no meio de um comentário:
Espaços em branco
Diferentemente do que ocorre no HTML, que trunca vários espaços em branco para um único espaço em branco, no XML os espaços em branco são preservados, ou seja, se você incluir vários espaços em brancos, todos serão considerados:
O que é um XML bem formado?
Os documentos XML que são elaborados em conformidade com as regras de sintaxe mostradas anteriormente são considerados “bem formados”. Isso significa que todos os elementos devem estar corretamente aninhados, todos os atributos devem estar entre aspas e todas as tags devem ser fechadas adequadamente. Um XML bem formado é essencial para que um documento possa ser processado por aplicativos.
Conclusão
Bom pessoal, concluímos o artigo com os conceitos iniciais de XML. Embora seja apenas uma introdução, com essas regras de sintaxe já podemos resolver a maioria das questões desse assunto. Espero que o conteúdo aqui apresentado seja útil para sua aprovação. Bons estudos!
Quer saber quais serão os próximos concursos?
Confira nossos artigos!
Concursos abertos
Concursos 2024
Fonte: Estratégia Concursos