HTML sang XML: Mở rộng ngôn ngữ đánh dấu
Phần lớn những người trong ngành công nghiệp máy tính biết HTML (Ngôn ngữ đánh dấu siêu văn bản) là gì. Nó đã xuất hiện từ rất lâu và đã được sử dụng rộng rãi trong thiết kế trang web, mặc dù rất hiếm khi thấy các trang web được viết bằng HTML, nhưng nó được coi là kiến thức cơ bản cho toàn bộ quá trình tạo trang web.
XML (Ngôn ngữ đánh dấu mở rộng), mặt khác là một công nghệ gần đây và ít được biết đến hơn so với HTML. XML được tạo ra vào năm 1996 bởi một nhóm gồm 11 người dưới dạng thích ứng của SGML (Ngôn ngữ đánh dấu tổng quát hóa tiêu chuẩn) để sử dụng trong World Wide Web. XML là một ngôn ngữ đánh dấu có cấu trúc chặt chẽ và chặt chẽ hơn so với HTML cho phép người dùng tạo các định nghĩa và mã được mô đun hóa của riêng họ. Nó được tạo ra để tạo ra một thông số kỹ thuật được tiêu chuẩn hóa để tạo các ngôn ngữ đánh dấu tùy chỉnh mà hiện được gọi là phương ngữ XML. Nó có thể không rõ ràng ngay lập tức nhưng các ngôn ngữ đánh dấu tùy chỉnh như HTML, RSS và Atom đều được xây dựng từ XML như một phương pháp tăng khả năng sử dụng của internet.
Do XML được điều chỉnh từ SGML, nó chứa rất nhiều mã và kỹ thuật có nguồn gốc từ SGML như tính nghiêm ngặt của nó và cái gọi là sự hình thành tốt. Các đặc điểm mở rộng ngay cả đến hậu duệ của XML. Một số quy tắc phải luôn được xem xét khi tạo mã dựa trên XML. Thậm chí còn có một tuyên bố được hình thành rõ ràng với mỗi tài liệu để nêu rõ loại tài liệu đó là gì và việc xử lý nên dựa trên quy tắc nào. Điều này rất khác so với mã hóa rất thoải mái được sử dụng trong HTML.
Khi bạn xử lý một trang HTML, bạn sẽ có một số loại kết quả bất kể đầu vào là gì. Bộ xử lý HTML cố gắng hiểu ý nghĩa của những gì trong tài liệu và tạo ra một đầu ra mà nó cho là tốt nhất đại diện cho dữ liệu đầu vào. Điều này không đúng với XML. XML sử dụng một cơ chế xử lý lỗi được coi là "hà khắc". Bất cứ khi nào bộ xử lý XML gặp phải thứ gì đó mà nó không thể hiểu được, nó chỉ tạo một báo cáo lỗi và chấm dứt xử lý tệp. Điều đó khiến bạn có một hộp lỗi và không có kết quả nào giống như trong HTML.
Để đặt nó trong phối cảnh, HTML là một ngôn ngữ đánh dấu được sử dụng để nhanh chóng và dễ dàng hiển thị một số cách xuất. Nó không liên quan đến tính chính xác của đầu vào và chỉ cố gắng tạo đầu ra dựa trên tệp đầu vào. Mặt khác, XML là một ngôn ngữ đánh dấu rất nghiêm ngặt thường không được sử dụng để tạo nội dung. Công dụng chính của nó là như một công cụ để tạo các ngôn ngữ đánh dấu khác tạo ra nội dung cần thiết.