• Nie Znaleziono Wyników

Narzędzia informatyczne w językoznawstwie HTML i XHTML Marcin Junczys-Dowmunt

N/A
N/A
Protected

Academic year: 2021

Share "Narzędzia informatyczne w językoznawstwie HTML i XHTML Marcin Junczys-Dowmunt"

Copied!
47
0
0

Pełen tekst

(1)

Narzędzia informatyczne w językoznawstwie

HTML i XHTML

Marcin Junczys-Dowmunt junczys@amu.edu.pl

Zakład Logiki Stosowanej http://www.logic.amu.edu.pl

17. października 2007

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 1/17

(2)

Po co językoznawcom (X)HTML?

I Prawie cała widzialna część internetu opiera się na HTML i jego odmianach

I Wniosek z tego: prawie wszystkie dane lingwistyczne pochodzące z internetu będą osadzone w HTML

I Jeśli chcemy w jakikolwiek sposób przetwarzać informacje z internetu, nie obejdzie się bez podstawowych znajomości HTML (dlatego HTML dla językoznawców)

I Jeśli mamy zamiar umieszczać własne treści w internecie, to lepiej korzystać z XHTML niż HTML.

I Będziemy wtedy tworzyć strony bardziej przystosowane do przetwarzania automatycznego i świecić dobrym przykładem (dlatego XHTML)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 2/17

(3)

Po co językoznawcom (X)HTML?

I Prawie cała widzialna część internetu opiera się na HTML i jego odmianach

I Wniosek z tego: prawie wszystkie dane lingwistyczne pochodzące z internetu będą osadzone w HTML

I Jeśli chcemy w jakikolwiek sposób przetwarzać informacje z internetu, nie obejdzie się bez podstawowych znajomości HTML (dlatego HTML dla językoznawców)

I Jeśli mamy zamiar umieszczać własne treści w internecie, to lepiej korzystać z XHTML niż HTML.

I Będziemy wtedy tworzyć strony bardziej przystosowane do przetwarzania automatycznego i świecić dobrym przykładem (dlatego XHTML)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 2/17

(4)

Po co językoznawcom (X)HTML?

I Prawie cała widzialna część internetu opiera się na HTML i jego odmianach

I Wniosek z tego: prawie wszystkie dane lingwistyczne pochodzące z internetu będą osadzone w HTML

I Jeśli chcemy w jakikolwiek sposób przetwarzać informacje z internetu, nie obejdzie się bez podstawowych znajomości HTML (dlatego HTML dla językoznawców)

I Jeśli mamy zamiar umieszczać własne treści w internecie, to lepiej korzystać z XHTML niż HTML.

I Będziemy wtedy tworzyć strony bardziej przystosowane do przetwarzania automatycznego i świecić dobrym przykładem (dlatego XHTML)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 2/17

(5)

Po co językoznawcom (X)HTML?

I Prawie cała widzialna część internetu opiera się na HTML i jego odmianach

I Wniosek z tego: prawie wszystkie dane lingwistyczne pochodzące z internetu będą osadzone w HTML

I Jeśli chcemy w jakikolwiek sposób przetwarzać informacje z internetu, nie obejdzie się bez podstawowych znajomości HTML (dlatego HTML dla językoznawców)

I Jeśli mamy zamiar umieszczać własne treści w internecie, to lepiej korzystać z XHTML niż HTML.

I Będziemy wtedy tworzyć strony bardziej przystosowane do przetwarzania automatycznego i świecić dobrym przykładem (dlatego XHTML)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 2/17

(6)

Ale co to właściwie HTML?

Wikipedia (EN)

I HTML (ang. HyperText Markup Language, pl. hipertekstowy język znaczników) jest dominującym językiem dla stron internetowych

I Służy do opisu struktury informacji tekstowych w dokumencie

I oznacza wybrane części tekstu jako nagłówki, akapity, listy itp.

I wzbogaca tekst o formularze, obrazki i inne obiekty

I kojarzy ze sobą dokumenty powiązane tematycznie (odsyłacze)

I HTML jest zapisywany jako zwykły tekst za pomocą znaczników otoczonych ostrymi nawiasami

I Nazwa HTML jest nieraz stosowana jako hiperonim dla wszystkich innych pokrewnych formalizmów, w tym XHTML

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 3/17

(7)

Ale co to właściwie HTML?

Wikipedia (EN)

I HTML (ang. HyperText Markup Language, pl. hipertekstowy język znaczników) jest dominującym językiem dla stron internetowych

I Służy do opisu struktury informacji tekstowych w dokumencie

I oznacza wybrane części tekstu jako nagłówki, akapity, listy itp.

I wzbogaca tekst o formularze, obrazki i inne obiekty

I kojarzy ze sobą dokumenty powiązane tematycznie (odsyłacze)

I HTML jest zapisywany jako zwykły tekst za pomocą znaczników otoczonych ostrymi nawiasami

I Nazwa HTML jest nieraz stosowana jako hiperonim dla wszystkich innych pokrewnych formalizmów, w tym XHTML

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 3/17

(8)

Ale co to właściwie HTML?

Wikipedia (EN)

I HTML (ang. HyperText Markup Language, pl. hipertekstowy język znaczników) jest dominującym językiem dla stron internetowych

I Służy do opisu struktury informacji tekstowych w dokumencie

I oznacza wybrane części tekstu jako nagłówki, akapity, listy itp.

I wzbogaca tekst o formularze, obrazki i inne obiekty

I kojarzy ze sobą dokumenty powiązane tematycznie (odsyłacze)

I HTML jest zapisywany jako zwykły tekst za pomocą znaczników otoczonych ostrymi nawiasami

I Nazwa HTML jest nieraz stosowana jako hiperonim dla wszystkich innych pokrewnych formalizmów, w tym XHTML

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 3/17

(9)

Ale co to właściwie HTML?

Wikipedia (EN)

I HTML (ang. HyperText Markup Language, pl. hipertekstowy język znaczników) jest dominującym językiem dla stron internetowych

I Służy do opisu struktury informacji tekstowych w dokumencie

I oznacza wybrane części tekstu jako nagłówki, akapity, listy itp.

I wzbogaca tekst o formularze, obrazki i inne obiekty

I kojarzy ze sobą dokumenty powiązane tematycznie (odsyłacze)

I HTML jest zapisywany jako zwykły tekst za pomocą znaczników otoczonych ostrymi nawiasami

I Nazwa HTML jest nieraz stosowana jako hiperonim dla wszystkich innych pokrewnych formalizmów, w tym XHTML

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 3/17

(10)

Historia HTML

1989 Tim Berners-Lee (CERN) rozwija pierwszy internetowy system hipertekstowy

1990 Powstaje W3C (World Wide Web Consortium) 1993 Specyfikacja SGML

1995 Pierwsza oficjalna wersja: HTML 2

01 1997 HTML 3.2 próba uwzględnienia konsekwencji wojny przeglądarek

12 1997 HTML 4.0 pierwsze czystki

1999 HTML 4.01 jak na razie ostatnia wersja HTML 2000 XHTML 1.0 czyli uzgodznienie HTML 4.01 z XML 2001 XHTML 1.1 ostatnia oficjalna wersja

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 4/17

(11)

Struktura dokumentu HTML (1)

Znaczniki HTML składają się rożnych rodzajów jednostek, najważniejsze to:

I elementy (główne znaczniki)

I atrybuty (metadane dot. znaczników)

I dane tekstowe (tekst na stronie)

I encje (znaki szczególne, np. jawne spacje)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 5/17

(12)

Struktura dokumentu HTML (1)

Znaczniki HTML składają się rożnych rodzajów jednostek, najważniejsze to:

I elementy (główne znaczniki)

I atrybuty (metadane dot. znaczników)

I dane tekstowe (tekst na stronie)

I encje (znaki szczególne, np. jawne spacje)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 5/17

(13)

Struktura dokumentu HTML (1)

Znaczniki HTML składają się rożnych rodzajów jednostek, najważniejsze to:

I elementy (główne znaczniki)

I atrybuty (metadane dot. znaczników)

I dane tekstowe (tekst na stronie)

I encje (znaki szczególne, np. jawne spacje)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 5/17

(14)

Struktura dokumentu HTML (1)

Znaczniki HTML składają się rożnych rodzajów jednostek, najważniejsze to:

I elementy (główne znaczniki)

I atrybuty (metadane dot. znaczników)

I dane tekstowe (tekst na stronie)

I encje (znaki szczególne, np. jawne spacje)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 5/17

(15)

Struktura dokumentu HTML (1)

Znaczniki HTML składają się rożnych rodzajów jednostek, najważniejsze to:

I elementy (główne znaczniki)

I atrybuty (metadane dot. znaczników)

I dane tekstowe (tekst na stronie)

I encje (znaki szczególne, np. jawne spacje)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 5/17

(16)

Struktura dokumentu HTML (2)

Elementy zwykle składają się z trzech częsci:

I znacznik początkowy (w postaci <znacznik>)

I zawartości elementu (tekst lub inne elementy)

I znacznik końcowy (w postaci </znacznik>)

Niektóre elementy można opisać dokładniej za pomocą atrybutów

I atrybuty umieszczamy w znaczniku początkowym (np.

<znacznik atrybut1="wartość1" atrybut2="wartość2" ... atrybutN="wartośćN">)

I znaczniki końcowe raczej nie mogą zwierać atrybutów

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 6/17

(17)

Struktura dokumentu HTML (2)

Elementy zwykle składają się z trzech częsci:

I znacznik początkowy (w postaci <znacznik>)

I zawartości elementu (tekst lub inne elementy)

I znacznik końcowy (w postaci </znacznik>)

Niektóre elementy można opisać dokładniej za pomocą atrybutów

I atrybuty umieszczamy w znaczniku początkowym (np.

<znacznik atrybut1="wartość1" atrybut2="wartość2"

... atrybutN="wartośćN">)

I znaczniki końcowe raczej nie mogą zwierać atrybutów

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 6/17

(18)

Struktura dokumentu HTML (3)

Ogólna struktura dokumentu HTML:

I element główny każdego dokumentu HTML to html

I element główny zawiera dwa kolejne elementy:

I head (nagłówek dokumentu)

I body (treść dokumentu)

I na początku dokumentu powinna się znaleźć informacja o typie dokumentu

<!DOCTYPE html PUBLIC ... >

<html>

<head> ... </head>

<body> ... </body>

</html>

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 7/17

(19)

Mały przykład dokumentu HTML

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"

"http://www.w3.org/TR/html401/loose.dtd">

<html>

<head>

<meta http-equiv="Content-Type"

content="text/html; charset=UTF-8">

<title>Tytuł dokumentu</title>

</head>

<body background="white" text="black">

<h1>To jest dokument <font color="red">HTML</font></h1>

<p>A tutaj mamy jakiś przykładowy akapit, który służy jedynie celom poznawczym. <br>

<a href="http://www.ij.amu.edu.pl">link do strony instytutu</a>

<p> To drugi akapit, który zawiera kilka tzw.

<i>encji</i>: <br> \&amp; \&nbsp; \&Ouml; &szlig;

</body>

</html>

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 8/17

(20)

XHMTL

I XHMTL to eXtensible HyperText Markup Language

I Jest rozwinięciem standardu HTML 4.01

I Można powiedzieć, że jest przecięciem HTML 4.01 i XML (oba języki są podzbiorami SGML)

I XHTML jest lepszy pod względem automatycznego przetwarzania1 (bardziej rygorystyczna składnia)

I Pozwala na korzystanie z różnych rozszerzeń XML, np. MathML, SVG itp. 2

1Każdy standardowy parser XML poradzi sobie z XHTML ale niekoniecznie z HTML

2To akurat zależy niestety w znacznym stopniu od przeglądarki

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 9/17

(21)

XHMTL

I XHMTL to eXtensible HyperText Markup Language

I Jest rozwinięciem standardu HTML 4.01

I Można powiedzieć, że jest przecięciem HTML 4.01 i XML (oba języki są podzbiorami SGML)

I XHTML jest lepszy pod względem automatycznego przetwarzania1 (bardziej rygorystyczna składnia)

I Pozwala na korzystanie z różnych rozszerzeń XML, np. MathML, SVG itp. 2

1Każdy standardowy parser XML poradzi sobie z XHTML ale niekoniecznie z HTML

2To akurat zależy niestety w znacznym stopniu od przeglądarki

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 9/17

(22)

XHMTL

I XHMTL to eXtensible HyperText Markup Language

I Jest rozwinięciem standardu HTML 4.01

I Można powiedzieć, że jest przecięciem HTML 4.01 i XML (oba języki są podzbiorami SGML)

I XHTML jest lepszy pod względem automatycznego przetwarzania1 (bardziej rygorystyczna składnia)

I Pozwala na korzystanie z różnych rozszerzeń XML, np. MathML, SVG itp. 2

1Każdy standardowy parser XML poradzi sobie z XHTML ale niekoniecznie z HTML

2To akurat zależy niestety w znacznym stopniu od przeglądarki

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 9/17

(23)

XHMTL

I XHMTL to eXtensible HyperText Markup Language

I Jest rozwinięciem standardu HTML 4.01

I Można powiedzieć, że jest przecięciem HTML 4.01 i XML (oba języki są podzbiorami SGML)

I XHTML jest lepszy pod względem automatycznego przetwarzania1 (bardziej rygorystyczna składnia)

I Pozwala na korzystanie z różnych rozszerzeń XML, np.

MathML, SVG itp. 2

1Każdy standardowy parser XML poradzi sobie z XHTML ale niekoniecznie z HTML

2To akurat zależy niestety w znacznym stopniu od przeglądarki

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 9/17

(24)

HTML, XHTML i XML

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 10/17

(25)

Aspekt przetwarzania XHTML

I Przeglądarki przetwarzające HTML wewnętrznie korygują błedy i niedociągniecia

I XHTML wymaga pełnej zgodności ze specyfikacją XML, inaczej nie jest możliwe wyświetlenie dokumentu

I Pozorna niedogodność jest tak naprawdę zaletą: wymusza większą staraność przy tworzeniu stron internetowych

I Możliwość walidacji stron

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 11/17

(26)

Aspekt przetwarzania XHTML

I Przeglądarki przetwarzające HTML wewnętrznie korygują błedy i niedociągniecia

I XHTML wymaga pełnej zgodności ze specyfikacją XML, inaczej nie jest możliwe wyświetlenie dokumentu

I Pozorna niedogodność jest tak naprawdę zaletą: wymusza większą staraność przy tworzeniu stron internetowych

I Możliwość walidacji stron

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 11/17

(27)

Aspekt przetwarzania XHTML

I Przeglądarki przetwarzające HTML wewnętrznie korygują błedy i niedociągniecia

I XHTML wymaga pełnej zgodności ze specyfikacją XML, inaczej nie jest możliwe wyświetlenie dokumentu

I Pozorna niedogodność jest tak naprawdę zaletą: wymusza większą staraność przy tworzeniu stron internetowych

I Możliwość walidacji stron

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 11/17

(28)

Aspekt przetwarzania XHTML

I Przeglądarki przetwarzające HTML wewnętrznie korygują błedy i niedociągniecia

I XHTML wymaga pełnej zgodności ze specyfikacją XML, inaczej nie jest możliwe wyświetlenie dokumentu

I Pozorna niedogodność jest tak naprawdę zaletą: wymusza większą staraność przy tworzeniu stron internetowych

I Możliwość walidacji stron

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 11/17

(29)

XHTML w porównaniu do HTML (1)

I Każdemu znacznikowi otwierającemu odpowiada znacznik zamykający (np. <li> ... </li>)

I Puste elementy są także zamykane (np. zamiast <br> stosujemy <br />)

I Poprawne zagnieżdzanie (np. zamiast <p>tekst

<em>wyróżniony</p></em> - <p>tekst

<em>wyróżniony</em></p>)

I Nazwy elementów i atrybutów pisane małymi literami

I Wartości artrybutów w cudzysłowie (np. <td rowspan="3">)

I Niedozwolona minimalizacja elementów (np. zamiast

<textarea readonly> - <textarea readonly="readonly">)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 12/17

(30)

XHTML w porównaniu do HTML (1)

I Każdemu znacznikowi otwierającemu odpowiada znacznik zamykający (np. <li> ... </li>)

I Puste elementy są także zamykane (np. zamiast <br>

stosujemy <br />)

I Poprawne zagnieżdzanie (np. zamiast <p>tekst

<em>wyróżniony</p></em> - <p>tekst

<em>wyróżniony</em></p>)

I Nazwy elementów i atrybutów pisane małymi literami

I Wartości artrybutów w cudzysłowie (np. <td rowspan="3">)

I Niedozwolona minimalizacja elementów (np. zamiast

<textarea readonly> - <textarea readonly="readonly">)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 12/17

(31)

XHTML w porównaniu do HTML (1)

I Każdemu znacznikowi otwierającemu odpowiada znacznik zamykający (np. <li> ... </li>)

I Puste elementy są także zamykane (np. zamiast <br>

stosujemy <br />)

I Poprawne zagnieżdzanie (np. zamiast <p>tekst

<em>wyróżniony</p></em> - <p>tekst

<em>wyróżniony</em></p>)

I Nazwy elementów i atrybutów pisane małymi literami

I Wartości artrybutów w cudzysłowie (np. <td rowspan="3">)

I Niedozwolona minimalizacja elementów (np. zamiast

<textarea readonly> - <textarea readonly="readonly">)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 12/17

(32)

XHTML w porównaniu do HTML (1)

I Każdemu znacznikowi otwierającemu odpowiada znacznik zamykający (np. <li> ... </li>)

I Puste elementy są także zamykane (np. zamiast <br>

stosujemy <br />)

I Poprawne zagnieżdzanie (np. zamiast <p>tekst

<em>wyróżniony</p></em> - <p>tekst

<em>wyróżniony</em></p>)

I Nazwy elementów i atrybutów pisane małymi literami

I Wartości artrybutów w cudzysłowie (np. <td rowspan="3">)

I Niedozwolona minimalizacja elementów (np. zamiast

<textarea readonly> - <textarea readonly="readonly">)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 12/17

(33)

XHTML w porównaniu do HTML (1)

I Każdemu znacznikowi otwierającemu odpowiada znacznik zamykający (np. <li> ... </li>)

I Puste elementy są także zamykane (np. zamiast <br>

stosujemy <br />)

I Poprawne zagnieżdzanie (np. zamiast <p>tekst

<em>wyróżniony</p></em> - <p>tekst

<em>wyróżniony</em></p>)

I Nazwy elementów i atrybutów pisane małymi literami

I Wartości artrybutów w cudzysłowie (np. <td rowspan="3">)

I Niedozwolona minimalizacja elementów (np. zamiast

<textarea readonly> - <textarea readonly="readonly">)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 12/17

(34)

XHTML w porównaniu do HTML (1)

I Każdemu znacznikowi otwierającemu odpowiada znacznik zamykający (np. <li> ... </li>)

I Puste elementy są także zamykane (np. zamiast <br>

stosujemy <br />)

I Poprawne zagnieżdzanie (np. zamiast <p>tekst

<em>wyróżniony</p></em> - <p>tekst

<em>wyróżniony</em></p>)

I Nazwy elementów i atrybutów pisane małymi literami

I Wartości artrybutów w cudzysłowie (np. <td rowspan="3">)

I Niedozwolona minimalizacja elementów (np. zamiast

<textarea readonly> - <textarea readonly="readonly">)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 12/17

(35)

XHTML w porównaniu do HTML (2)

I Główny element hmtl musi zawierać atrybut xmlns (np.

<html xmlns="http://www.w3.org/1999/xhtml"

xml:lang="pl">)

I Dokument rozpoczyna się od (opcjonalnej) deklaracji XML, np. <?xml version="1.0" encoding="iso-8859-2"?>

I Należy zastsować odpowiednią definicję typu dokumentu (np. dla XHMTL 1.0 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"

"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 13/17

(36)

XHTML w porównaniu do HTML (2)

I Główny element hmtl musi zawierać atrybut xmlns (np.

<html xmlns="http://www.w3.org/1999/xhtml"

xml:lang="pl">)

I Dokument rozpoczyna się od (opcjonalnej) deklaracji XML, np. <?xml version="1.0" encoding="iso-8859-2"?>

I Należy zastsować odpowiednią definicję typu dokumentu (np. dla XHMTL 1.0 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"

"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 13/17

(37)

XHTML w porównaniu do HTML (2)

I Główny element hmtl musi zawierać atrybut xmlns (np.

<html xmlns="http://www.w3.org/1999/xhtml"

xml:lang="pl">)

I Dokument rozpoczyna się od (opcjonalnej) deklaracji XML, np. <?xml version="1.0" encoding="iso-8859-2"?>

I Należy zastsować odpowiednią definicję typu dokumentu (np.

dla XHMTL 1.0 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"

"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 13/17

(38)

Przykład dokumentu XHTML 1.0

<?xml version="1.0" encoding="ISO-8859-2"?>

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"

"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">

<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="pl">

<head>

<title>Przykład dokumentu zgodnego z XHTML 1.0 Strict</title>

<link rel="stylesheet" type="text/css" href="style.css" />

</head>

<body>

<p>To jest przykład.</p>

</body>

</html>

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 14/17

(39)

Walidacja dokumentów (X)HTML

Każdy dokument XHTML musi spełniać dwa rodzaje poprawności:

I Poprawność składniową (well-formedness) - zgodność z podstawowymi regułami składni XML

I Poprawność strukturalną (validity) - zgodność z daną definicją typu dokumentu (DTD)

Poprawność składniowa jest sprawdzana przez dowolny parser XML, w tym np. przeglądarka Firefox. Jęsli występuje bład, to parser ma obowiązek nie wyświetlić dokumentu.

Poprawność strukturalna jest sprawdzana przez tzw. walidatory. Walidator porównuje dokument z podaną definicją typu

dokumentu.

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 15/17

(40)

Walidacja dokumentów (X)HTML

Każdy dokument XHTML musi spełniać dwa rodzaje poprawności:

I Poprawność składniową (well-formedness) - zgodność z podstawowymi regułami składni XML

I Poprawność strukturalną (validity) - zgodność z daną definicją typu dokumentu (DTD)

Poprawność składniowa jest sprawdzana przez dowolny parser XML, w tym np. przeglądarka Firefox. Jęsli występuje bład, to parser ma obowiązek nie wyświetlić dokumentu.

Poprawność strukturalna jest sprawdzana przez tzw. walidatory. Walidator porównuje dokument z podaną definicją typu

dokumentu.

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 15/17

(41)

Walidacja dokumentów (X)HTML

Każdy dokument XHTML musi spełniać dwa rodzaje poprawności:

I Poprawność składniową (well-formedness) - zgodność z podstawowymi regułami składni XML

I Poprawność strukturalną (validity) - zgodność z daną definicją typu dokumentu (DTD)

Poprawność składniowa jest sprawdzana przez dowolny parser XML, w tym np. przeglądarka Firefox. Jęsli występuje bład, to parser ma obowiązek nie wyświetlić dokumentu.

Poprawność strukturalna jest sprawdzana przez tzw. walidatory. Walidator porównuje dokument z podaną definicją typu

dokumentu.

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 15/17

(42)

Walidacja dokumentów (X)HTML

Każdy dokument XHTML musi spełniać dwa rodzaje poprawności:

I Poprawność składniową (well-formedness) - zgodność z podstawowymi regułami składni XML

I Poprawność strukturalną (validity) - zgodność z daną definicją typu dokumentu (DTD)

Poprawność składniowa jest sprawdzana przez dowolny parser XML, w tym np. przeglądarka Firefox. Jęsli występuje bład, to parser ma obowiązek nie wyświetlić dokumentu.

Poprawność strukturalna jest sprawdzana przez tzw. walidatory. Walidator porównuje dokument z podaną definicją typu

dokumentu.

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 15/17

(43)

Walidacja dokumentów (X)HTML

Każdy dokument XHTML musi spełniać dwa rodzaje poprawności:

I Poprawność składniową (well-formedness) - zgodność z podstawowymi regułami składni XML

I Poprawność strukturalną (validity) - zgodność z daną definicją typu dokumentu (DTD)

Poprawność składniowa jest sprawdzana przez dowolny parser XML, w tym np. przeglądarka Firefox. Jęsli występuje bład, to parser ma obowiązek nie wyświetlić dokumentu.

Poprawność strukturalna jest sprawdzana przez tzw. walidatory.

Walidator porównuje dokument z podaną definicją typu dokumentu.

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 15/17

(44)

Semantic (X)HTML - Idealizacja

I Semantic (X)HTML to nie tyle standard co pewien styl tworzenia stron

I Dążymy do seperacji treści od formatu

I Rezygnujemy z elementów lub atrybutów służących tylko do formatowania, np. <font>, <marque> itp.

I Przykład: Różnica między <i> a <em>

I Nadajemy dokumentom strukturę logiczną

I Formatowanie odbywa się na innym poziomie, np. CSS (Cascading Style Sheets)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 16/17

(45)

Semantic (X)HTML - Idealizacja

I Semantic (X)HTML to nie tyle standard co pewien styl tworzenia stron

I Dążymy do seperacji treści od formatu

I Rezygnujemy z elementów lub atrybutów służących tylko do formatowania, np. <font>, <marque> itp.

I Przykład: Różnica między <i> a <em>

I Nadajemy dokumentom strukturę logiczną

I Formatowanie odbywa się na innym poziomie, np. CSS (Cascading Style Sheets)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 16/17

(46)

Semantic (X)HTML - Idealizacja

I Semantic (X)HTML to nie tyle standard co pewien styl tworzenia stron

I Dążymy do seperacji treści od formatu

I Rezygnujemy z elementów lub atrybutów służących tylko do formatowania, np. <font>, <marque> itp.

I Przykład: Różnica między <i> a <em>

I Nadajemy dokumentom strukturę logiczną

I Formatowanie odbywa się na innym poziomie, np. CSS (Cascading Style Sheets)

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 16/17

(47)

Przydatne linki

Specyfikacja HTML 4.01 http://www.w3.org/TR/html4/

Specyfikacja XHTML 1.0 http://www.w3.org/TR/xhtml1/

Specyfikacja XHTML 1.1 http://www.w3.org/TR/xhtml11/

Walidator W3C http://validator.w3.org

Kurs HTML http://webmaster.helion.pl/kurshtml/

Skrót HTML http://www.w3schools.com/html/html quick.asp Kurs XHTML http://kurs.browsehappy.pl

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 17/17

Cytaty

Powiązane dokumenty

I Słowo kluczowe sub poprzedza nazwę funkcji, którą ustalamy sami; nazwy powinny kojarzyć się działaniem tworzonej funkcji. I Polecenie return wewnętrz funkcji, natychmiast

◮ Hasz jest strukturą podobną do tablicy, ale zamiast indeksów liczbowych hasz używa kluczy.?. Co to

Marcin Junczys-Dowmunt Narzędzia informatyczne w językoznawstwie 18/24.. póki tablica @pokoj zawiera więcej niż

I Parser strumieniowy udostępnia dane zanim sprawdzi poprawność składniową dokumentu. I Wymagania pamięciowe takich parserów są niskie i możemy przetwarzać wielkie dokumenty

I Cała struktura danych jest przechowywana w pamięci, w przypadku dużych dokumentów XML może to stanowić poważny problem.. Struktura danych może zajmować do 30 razy tyle pamięci

I Wszystkie dane wyjściowe konwertujemy po zakończeniu przetwarzania z kodowania wewnętrznego Perla do kodowania

Najpierw wykonamy nasz program z poziomu wiersza poleceń komendą (o ile znajdujemy się w tym samym katalogu) perl hello.pl. Marcin Junczys-Dowmunt Narzędzia informatyczne

Każde narzędzie informatyczne działające na danych lingwistycznych musi brać pod uwagę następujące aspekty:. ◮ Wielojęzyczność