HTML 레퍼런스

HTML은 Hypertext Markup Language의 약자로서 인터넷 초기에 하이퍼텍스트(hypertext)를 만들기 위해 탄생했다. 그 당시에 기술적인 목표는 방대한 자료에 대하여 네트워크에 의한 빠른 접근성이었다. 초기의 HTML은 이러한 목적을 충족시켜 주었고 인터넷의 탄생과 발전을 통해 오늘날 대표적인 정보(콘텐츠) 유통 방식으로 자리매김하게 되었다.

기술적인 관점으로만 본다면 HTML은 마크업(markup) 언어이다. 일반적인 마크업 언어(markup language)의 정의에 의하면 HTML 마크업 언어는 데이터를 표현하는 데 사용된다. 즉 데이터를 태그(tag)라는 표현 수단을 통해 표시하는 방법을 정의한다. HTML은 태그(tag)에 의한 콘텐츠의 표시 정의가 대부분이다 보니 HTML과 태그(tag)를 같은 개념으로 받아 들이는 경우가 많다. 하지만 태그(tag)는 HTML로 구현하는 콘텐츠의 기술적인 표현 수단이므로 구분이 필요해 보인다.

사실 오늘날은 HTML을 단순히 텍스트나 이미지 등을 표현하는 마크업 언어로만 보지 않는다. 역할적인 관점에서 본다면 HTML은 다양한 웹 기술을 잘 융합해 최종적으로 빌드되는 결과물이라고 보는 편이 타당하다. 이를 뒤받침하는 근거로 'HTML 5'라는 기술적인 명칭을 들 수 있다. 'HTML 5'는 HTML 마크업 언어의 버전을 의미하는 레이블이지만 실제로는 웹 기술이 혁신적으로 발전했다는 의미로 받아 들여지고 있다.

정확히는 HTML 5는 W3C에서 제정한 새로운 표준 버전을 나타낸다. 역사적인 관점에서 본다면 자바스크립트(JavaScript)만큼 우여곡절을 가지고 있다. HTML 4 시점에는 지금은 흔하게 이름을 찾아보기 힘든 XML이라는 마크업 언어가 있었다. 서로가 비슷한 DNA를 가지고 있었지만 데이터 표현이라는 측면에서는 XML이 기술적으로 우세했다.(필자 관점) 그래서 W3C는 HTML 4 차기 버전의 컨셉트를 XML 기반으로 잡아 XHTML이라는 새로운 버전을 발표했다. 그러나 XHTML의 까다로운 코드 작성 규칙은 개발자에게 외면되었고 W3C 입장에서는 난처한 상황이 발생했다.

이러한 흐름 속에서 W3C 밖에서 움직이기 시작했다. 지금의 '모질라 재단'과 '오페라 소프트웨어'의 구성원들이 WHATWG이라는 단체를 만들어 독자적인 표준 정립을 시도했다. W3C와 정면 충돌하는 상황이 발생한 것이다. 이후에 WHATWG는 웹이 그동안 가지고 있던 정적인 기반에서 웹 기술을 사용한 응용 프로그램(application program) 개발이라는 방향성을 가진 Web Application 1.0이라는 표준을 정립했다.

결국 W3C는 XML 기반의 XHTML 개발이 실패했음을 인정하고 2007년부터 WHATWG와 협업하여 새로운 HTML 표준 작업을 시작했다. 그리고 새롭게 설계된 HTML 5가 마침내 등장하게 되었다. 그후 HTML 5.1, HTML 5.2로 업데이트 되었는데 이때까지도 겉으로 보기에는 두 단체가 협업을 하는 모양새이었지만 실상은 각자의 기조에 따라 표준 사양을 업데이트하는 불편한 관계였던 것으로 보인다. 다시 말해 WHATWG는 W3C와 협업해서 새로운 HTML 5 사양을 개발했지만 HTML과 Web Application 1.0을 합친 표준안 작업을 자체적으로 진행했던 것이다. 아마도 비대해진 W3C의 느린 의사결정 방식과 보수적인 접근에서 WHATWG는 실망감을 가지지 않았나 싶다. 

이러한 상황에서 정확한 배경은 모르겠지만 최종적으로 W3C는 WHATWG에서 발표한 표준안으로 단일화하겠다는 대승적인 결정을 하게된다. 그래서 새롭게 등장한 현재의 HTML 표준 사양의 명칭이 HTML Living Standard이다. 명칭에서 보듯히 앞으로는 별도의 버전 레이블이 없이 항상 새롭게 업데이트되는 방식을 취하고 있다.

2021년 W3C는 직접 주도한 HTML 표준화 작업을 모두 폐기했다. 따라서 더이상 HTML 5는 존재하지 않는 것이다.

데브딕은 WHATWG의 표준 사양을 기준으로 HTML 레퍼런스를 작업했다.