A weblap szerkezete Ami a HTML-dokumentum felépítését illeti, idáig csak arról volt szó, hogy a dokumentum megjeleníteni kívánt tartalmát tegyük a <HTML><BODY>…</BODY></HTML> kódpárok közé. Bár működött, ez egy leegyszerűsített változat volt; valójában egy rendesen megírt weblap szerkezete ennél bonyolultabb. (Hogy erről mindeddig hallgattam, az egyetlen oka az volt, hogy ha véletlenül kezdő vagy, idő előtt ne ijesszen meg, még mennyi tudnivaló van akár a leegyszerűbb tartalmú HTML-dokumentum megírása körül is.) Egy HTML-dokumentum felépítése nagy vonalakban a következő:
A dokumentum típusa: <!DOCTYPE> A <!DOCTYPE> tulajdonképpen nem HTML-kód, hanem SGML-kód. A <!DOCTYPE> deklaráció minden szintaktikailag helyes HTML-dokumentum kötelező kezdő eleme. Egyébként csak azért lehet elhagyni, mert a legtöbb böngésző nem kívánja meg ennek az értéknek a megadását; ha hiányzik, helyette az alapértelmezett értéket feltételezi, ami viszont mivel könnyen téves lehet, a továbbiakban megjelenítési hibákat eredményezhet. Tekintsük a teljes kódot (a 4.0-s, 3.2-es és a 2.0-s HTML verzióknak megfelelően több lehetőség van):
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN"> <!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN"> A <!DOCTYPE> a dokumentumban használt HTML-verziót határozza meg az SGML-deklarációval: lényege, hogy közli a böngészővel, a HTML-validáló eszközökkel — például a World Wide Web Consortium (röviden W3C) HTML Validation Service-szel — és más szoftverekkel a dokumentumban használt HTML-verziót. A <!DOCTYPE> a következő attribútumokból épül fel: <HTML PUBLIC "verziónév" "url">
www.htmlhelp.com/reference/html40/html/doctype.html A dokumentum maga: <HTML>...</HTML> A <!DOCTYPE> deklaráció a HTML-dokumentum kezdő eleme, és az ezután következő teljes tartalmat a <HTML>…</HTML> kódpár zárja közre. E kódpár tartalma két fő részre oszlik, ezek:
|