Caracteristici generale ale limbajului HTML

HTML (Hypertext Markup Language) este un limbaj creat în scopul de a descrie, în mod text, formatul paginilor Web; fisierele create în acest limbaj vor fi interpretate de navigatoare, care vor afisa paginile în forma dorită (cu texte formatate, liste, tabele, formule, imagini, hiperlegături, obiecte multimedia etc.). HTML a apărut ca o aplicatie ISO standard (apartine standardului SGML - Standard Generalized Markup Language, specializat pentru hipertext si adaptat la Web).

Asa cum se poate deduce din numele limbajului, HTML descrie caracteristicile de format ale elementelor incluse prin procedee de marcare. Acestea pot fi asemănate intuitiv cu marcajele folosite în tipografie pentru a indica scrierea unui text cu un anumit tip de caractere. Fiecare element va fi introdus între două marcaje ("tags", în limba engleză) - de început si sfârsit - (uzual) de forma <marcaj> … </marcaj>. Caracterele speciale de delimitare a marcajelor "<", ">" permit deosebirea acestora de textul propriu-zis. De exemplu, pentru textele aldine (îngrosate), marcajul de început este <B> iar de sfârsit - </B>.

În informatică, limbajele de marcare sunt foarte convenabile fiindcă comenzile lor pot fi interpretate simplu. LaTeX-ul, de exemplu, este tot un limbaj de marcare; prin interpretarea fisierelor .tex descrise în acest limbaj se va genera formatul dorit al documentelor pe diverse tipuri de sisteme de calcul (în cazul, LaTeX-ului, se obtine uzual format PostScript sau PDF). În schimb, procesoarele de documente uzuale nu au un limbaj de marcare standardizat, care să ofere compatibilitate între diverse tipuri de calculatoare si sisteme de operare. Astfel, se poate spune că avantajele aplicării limbajelor de marcare constau în portabilitate si flexibilitate: fisierele create cu ajutorul lor pot fi transferate pe orice tip de sistem, unde vor fi interpretate cu ajutorul unor programe specifice.

De fapt, procesoarele de texte uzuale folosesc adesea procedee de marcare pentru formatări (de exemplu, formatările de tip caracter din Word); în acest caz însă, caracterele de control introduse sunt ascunse iar rezultatul editării este direct vizibil ("What You See Is What You Get"). În schimb, în limbajele de marcare - inclusiv HTML - marcajele sunt introduse în text, astfel încât acestea sunt exclusiv succesiuni de caractere (litere, cifre, caractere speciale) - fisiere de tip text.

Referitor la legătura dintre procesoarele de documente uzuale si limbajul HTML, mai trebuie mentionat faptul că ultimele versiuni ale editoarelor de documente oferă facilităti de salvare în format HTML - de exemplu, Word, începând cu versiunea Microsoft Office '97. Mai mult, toate produsele incluse în această gamă dedicată biroticii (MS Office) oferă compatibilitate cu formatul HTML.

Procesele de standardizare si de includere a comenzilor de marcare în fisierele HTML permit navigatoarelor să citească si să formateze paginile Web, lucru foarte important în conditiile în care ele contin nu numai texte alb-negru, ci si culori, imagini, hiperlegături, diverse obiecte. Practic, marcajele HTML asigură controlul asupra modului de afisare a obiectelor corespunzătoare în cadrul programelor de vizualizare a documentelor HTML - navigatoarele.

Limbajul HTML a evoluat în versiuni succesive, odată cu evolutia protocolului HTTP si a programelor de navigare. Astfel, HTML 1.0 era compatibil cu Mosaic, primul program de navigare, dar după aparitia unor navigatoare noi, a fost necesară introducerea unui standard oficial Internet pentru construirea paginilor (HTML 2.0) si extinderea sa cu noi facilităti: formule matematice, tabele, moduri avansate de descriere a organizării paginilor (începând cu HTML 3.0).

Standardizarea oficială a limbajului HTML a fost realizată de consortiul WWW si dezvoltată de diversi producători de soft (unii dintre acestia urmăresc chiar promovarea navigatoarelor proprii prin introducerea unor particularităti în formatele oficiale).

Cronologia introducerii în primele trei versiuni ale limbajului HTML a diverselor tipuri de obiecte [Tan97] poate fi urmărită în tabelul următor.

Tipul obiectului HTML 1.0 HTML 2.0 HTML 3.0
Hiperlegături Da Da Da
Imagini Da Da Da
Liste Da Da Da
Imagini de tip hartă Nu Da Da
Formulare Nu Da Da
Ecuatii / formule Nu Nu Da
Bare de instrumente Nu Nu Da
Tabele Nu Nu Da

Paginile HTML se pot crea cu orice editor de texte de către utilizatorii care cunosc limbajul HTML sau, mai simplu, se pot utiliza editoare speciale, în care obiectele se introduc interactiv iar codul HTML se generează automat. Având în vedere că si în acest caz este utilă cunoasterea marcajelor generate pentru corectarea eventualelor erori (mai ales în cazul link-urilor), vom prezenta în continuare entitătile care se pot introduce în paginile HTML si marcajele caracteristice acestora: Elementele limbajului HTML