XML vs. XHTML
Extensible Markup Language (znany również jako XML) to zestaw reguł. Reguły te są specyficzne dla dokumentów kodowanych elektronicznie. Głównym celem XML jest podkreślenie prostoty, ogólności i użyteczności w Internecie. XML jest notowany jako format danych tekstowych, który ma obsługę Unicode, aby można go było łatwo odczytać we wszystkich językach. Chociaż głównym celem projektu XML jest skoncentrowanie się na dokumentach, często jest on również używany do reprezentowania dowolnych struktur danych (na przykład usług sieciowych). W tej chwili istnieje mnóstwo interfejsów programistycznych, z których programiści mogą korzystać w celu uzyskania dostępu do danych XML. Istnieje również wiele systemów schematów zaprojektowanych specjalnie z myślą o pomocy w definiowaniu języków opartych na XML.
Extensible Hypertext Markup Language (znany również jako XHTML) jest częścią rodziny języków znaczników XML. W rzeczywistości symuluje lub po prostu działa jako rozszerzenie hipertekstowego języka znaczników (lub HTML). XHTML działa jako aplikacja z rodziny XML i jest bardziej restrykcyjnym podzbiorem SGML. W wyniku dobrze uformowanej natury dokumentów XHTML możliwe jest ich analizowanie za pomocą parsera XML - co dodatkowo odróżnia XHTML od HTML.
Dokument XML składa się wyłącznie ze znaków znalezionych w Unicode. Istnieje kilka znaków kontrolnych, które są wyłączone z Unicode; jednak te, które znajdują się w Unicode, mogą stać się zawartością w dokumencie XML. Istnieje wiele udogodnień, które identyfikują kodowanie znaków Unicode w dokumencie XML. Istnieją również udogodnienia, które wyrażają te postacie, które nie mogą być użyte. Unicode jest kodowany w bajtach w celu przechowywania lub przesyłania - te przetłumaczone wyrażenia Unicode są znane jako kodowanie. XML wykorzystuje dowolne, jeśli nie wszystkie, kodowania zdefiniowane w Unicode, a także szereg różnych kodowań, których znaki pojawiają się w Unicode. Zapewnia mechanizm, który pozwala procesorowi XML określić, które kodowanie jest w użyciu.
Istnieją trzy konkretne wersje XHTML: XHTML 1.0 Strict, który zawiera elementy i cechy, które nie są oznaczone jako przestarzałe w HTML 4.01; XHTML 1.0 Transitional, który zawiera elementy specyficzne dla prezentacji (na przykład „font” i „strike”); oraz Zestaw ramek XHTML 1.0, który umożliwia zdefiniowanie dokumentów zestawu ramek. XHTML może być również zmodularyzowany, co zapewnia abstrakcyjną kolekcję atrybutów, które XHTML można podzielić i rozszerzyć. Jest to po prostu sposób na wsparcie XHTML w rozszerzeniu jego zakresu na inne wybitne platformy (na przykład urządzenia mobilne i telewizję internetową).
Streszczenie:
1. XML to zestaw reguł kodowania dokumentów; XHTML jest XML-owym odpowiednikiem HTML, który jest bardziej restrykcyjnym podzbiorem SGML.
2. XML składa się całkowicie z Unicode; XHTML występuje w trzech wersjach: XHTML 1.0 Strict, XHTML 1.0 Transitional i XHTML 1.0 Frameset.