• Nie Znaleziono Wyników

eXtensible Markup Language, cz. 2

N/A
N/A
Protected

Academic year: 2021

Share "eXtensible Markup Language, cz. 2"

Copied!
14
0
0

Pełen tekst

(1)

eXtensible Markup Language, cz. 2

Marcin Gryszkalis, mg@fork.pl

(2)

XML 2 - Poprawność składniowa

• Dokument XML musi być poprawny pod względem składniowym (syntaktycznym)

W specyfikacji oryginalnej: well-formed

• Poprawność składniowa jest warunkiem koniecznym dla dopuszczenia dalszego przetwarzania dokumentu XML

(3)

XML 2 – przykładowy dokument XML

<?xml version="1.0" encoding="ISO-8859-2"?>

<OSOBA>

<IMIE> Jan </IMIE>

<DRUGIEIMIE/>

<NAZWISKO>Kowalski</NAZWISKO>

<URODZONY>

<DATA format="dd.mm.rrrr">12.04.1980</DATA>

<MIEJSCE>

<MIASTO> Warszawa </MIASTO>

</MIEJSCE>

</URODZONY>

<PESEL>80041201322</PESEL>

<UWAGI><!-- tu wpisz uwagi -->

</UWAGI>

</OSOBA>

• deklaracja XML

• element

• atrybut

• znacznik początkowy

• znacznik końcowy

• element pusty

• treść (tekst)

• komentarz

(4)

XML 2 – Deklaracja XML

• Dokument XML powinien (nie musi) zaczynać się deklaracją XML, np.:

<?xml version=”1.0” encoding=”UTF-8” standalone=”yes” ?>

atrybut version służy odróżnieniu wersji standardu XML, w tej chwili 1.0 lub 1.1

atrybut encoding informuje o użytym schemacie kodowania (opcjonalny, domyślnie Unicode)

atrybut standalone (dopuszczalne wartości “yes” i “no”) określa czy istnieje zewnętrzny dokument DTD dla danego pliku

(opcjonalny, domyślnie “no”)

(5)

XML 2 – Elementy

• wyznaczane są za pomocą znaczników

znacznik otwierający element rozpoczyna się i kończy nawiasem trójkątnym, np. <nazwisko>

znacznik zamykający element dodatkowo zawiera symbol / zaraz za pierwszym nawiasem trójkątnym </nazwisko>

• element niepusty obowiązkowo składa się ze znacznika otwierającego i zamykającego

<nazwisko>Kowalski</nazwisko>

• element pusty może składać się z jednego znacznika

zawierającego znak / przed nawiasem kończącym znacznik:

postać zwykła: <drugie_imie></drugie_imie>

postać skrócona: <drugie_imie />

(6)

XML 2 – Elementy

• Elementy muszą być poprawnie zagnieżdżone, tak aby dokument posiadał strukturę hierarchiczną

• dobrze:

<a> <b> <c> </c> <c> </c> </b> </a>

• źle:

<a> <b> <c> </a> <c> </b>

(7)

XML 2 – Element główny

Element główny (root tag) jest to najbardziej zewnętrzny element dokumentu

wszystkie inne elementy znajdują się wewnątrz elementu głównego

na zewnątrz mogą znajdować się:

komentarze

deklaracja xml

instrukcje przetwarzania

(8)

XML 2 – Atrybuty

• atrybut to para nazwa=”wartość”

dołączona do znacznika otwierającego element (lub do znacznika elementu pustego)

• wartość zawsze ograniczona jest cudzysłowem “a” lub apostrofem 'a'

<lekcja początek=”8:15” koniec='9:00'>XML</lekcja>

<tekst język=”polski” />

• element może zawierać tylko jeden atrybut o danej nazwie

<tekst autor=”Kowalski” autor=”Nowak”>...</tekst>

(9)

XML 2 – Nazwy w XML-u

• Nazwy elementów i atrybutów podlegają ograniczeniom:

wielkość liter w nazwach jest rozróżniana

mogą zawierać dowolne litery i cyfry (dowolnych alfabetów, nie tylko łacińskiego) oraz trzy znaki interpunkcyjne: łącznik “-”, podkreślenie “_” i kropkę “.”

nie mogą zawierać innych znaków interpunkcyjnych (cudzysłowy, apostrofy, znak dolara, procent, średnik, ukośnik)

nie mogą zawierać białych znaków (odstęp, tabulator) dwukropek ma znaczenie specjalne w nazwach (patrz:

przestrzenie nazw, namespaces)

mogą rozpoczynać się tylko od liter lub podkreślenia (nie od cyfr, łącznika lub kropki)

(10)

XML 2 – Znaki specjalne

• Znaki “<”, “>” oraz cudzysłów, apostrof i znak ampersand “&”

są traktowane specjalnie

• Chcąc użyć ich jako znaków zwykłych w miejscach gdzie byłoby to niejednoznaczne, należy użyć predefiniowanych symboli (nazywanych encjami):

&gt; (> - greater than) &lt; (< - less than)

&quot; (“ - quote)

&apos; (' - apostrophe)

&amp; (& - ampersand)

(11)

XML 2 – Sekcja CDATA

• Większe fragmenty tekstu zawierające znaki specjane mogą być wstawiane za pomocą sekcji CDATA

<![CDATA[ inny tekst, może zawierać < > & i cudzysłowy ]]>

• w sekcji CDATA oczywiście nie może być symbolu zakończenia sekcji, tj. ]]>

(12)

XML 2 - Komentarze

• komentarze obejmują tekst od znaku <!-- do -->

<a>xxx</a> <!-- to jest komentarz -->

• podwójny łącznik nie może pojawić się wewnątrz komentarza

• komentarz może zawierać niezakodowane znaki specjalne (nie są one wtedy interpretowane)

<!-- <a>xxx</a> -->

• Komentarze nie mogą występować wewnątrz znaczników

<a <!-- test --> />

(13)

XML 2 – Instrukcje przetwarzania

• Zawierają instrukcje dla aplikacji przetwarzających dokument XML (np. przeglądarka)

• zaczynają się od <?nazwa i kończą ?>

• mogą zawierać atrybuty

• Przykład – zewnętrzny arkusz styli

<?xml-stylesheet href=”ark.css” type=”text/css” ?>

(14)

XML 2 – weryfikacja składni

• Przeglądarki rozumiejące XML (MSIE, Firefox, Opera)

• Edytory ze wsparciem dla XML-a

kxmleditor (KDE)

Microsoft XML Notepad (Windows) XML Fox (Windows)

• Inne narzędzia

xmllint (z libxml2, http://www.xmlsoft.org/) SAXCount (xerces-j, http://xerces.apache.org/)

Cytaty

Powiązane dokumenty

Kiedy mówimy o symetrii w języku potocznym, najczęściej myślimy o syme- trii zwierciadlanej, którą ma na przykład fi ołek czy trójkąt równoramienny (rys.  W.2a, W.6a).

Bezsprzecznie następca NFZ, chcąc niejako oczyścić się ze zobowiązań poprzednika, w pierwszej kolejności będzie dążył do zakończenia spraw toczących się przed sądem..

• Definicje typów mogą wystąpić globalnie (z atrybutem name) albo wewnątrz deklaracji opisywanego elementu (anonimowo, celem

(Przypominam! Od poniedziałku oceniam Waszą pracę. Wskazani uczniowi, gdy wykonają zadania, muszą niezwłocznie zrobić zdjęcie i przesłać przez Messengera, ale nie przez grupę,

(Jeśli przed nawiasem jest „+” lub nie ma żadnego znaku, to opuszczamy nawias nic nie robiąc. Jeśli przed nawiasem jest znak „–” to opuszczając nawias zmieniamy każdy znak

Jesteśmy Polką i Polakiem Dziewczynką fajną i chłopakiem Kochamy Polskę z całych sił. Chcemy byś również kochał ją i ty i ty Ciuchcia na

Jesteśmy Polką i Polakiem Dziewczynką fajną i chłopakiem Kochamy Polskę z całych sił?. Chcemy byś również kochał ją i ty i ty Ciuchcia na

Przede wszystkim trzeba pamiętać ,że dodajemy/odejmujemy od siebie tylko znaki podobne, czyli jednomiany, które mają takie