超文本表達語言

超文本表達語言

超文本表達語言,即為超文本標記語言,簡稱為HTML。超級文本標記語言是標準通用標記語言下的一個套用,也是一種規範,一種標準,它通過標記符號來標記要顯示的網頁中的各個部分。

基本信息

定義

超文本表達語言,即為超文本標記語言,簡稱為HTML。超級文本標記語言是標準通用標記語言下的一個套用,也是一種規範,一種標準,它通過標記符號來標記要顯示的網頁中的各個部分。網頁檔案本身是一種文本檔案,通過在文本檔案中添加標記符,可以告訴瀏覽器如何顯示其中的內容(如:文字如何處理,畫面如何安排,圖片如何顯示等)。瀏覽器按順序閱讀網頁檔案,然後根據標記符解釋和顯示其標記的內容,對書寫出錯的標記將不指出其錯誤,且不停止其解釋執行過程,編制者只能通過顯示效果來分析出錯原因和出錯部位。但需要注意的是,對於不同的瀏覽器,對同一標記符可能會有不完全相同的解釋,因而可能會有不同的顯示效果。

特點

超文本表達語言文檔製作不是很複雜,但功能強大,支持不同數據格式的檔案鑲入,這也是全球資訊網盛行的原因之一,其主要特點如下:

簡易性:超文本表達語言版本升級採用超集方式,從而更加靈活方便。

可擴展性:超文本表達語言的廣泛套用帶來了加強功能,增加標識符等要求,超文本表達語言採取子類元素的方式,為系統擴展帶來保證。

平台無關性:雖然個人計算機大行其道,但使用MAC等其他機器的大有人在,超文本表達語言可以使用在廣泛的平台上,這也是全球資訊網盛行的另一個原因。

通用性:HTML是網路的通用語言。一種簡單、通用的全置標記語言。它允許網頁製作人建立文本與圖片相結合的複雜頁面,這些頁面可以被網上任何其他人瀏覽到,無論使用的是什麼類型的電腦或瀏覽器。

結構

一個網頁對應多個HTML檔案,超文本標記語言檔案以.html(磁碟作業系統DOS限制的外語縮寫)為擴展名或.html(外語縮寫)為擴展名。可以使用任何能夠生成TXT類型源檔案的文本編輯器來產生超文本標記語言檔案,只用修改檔案後綴即可。標準的超文本標記語言檔案都具有一個基本的整體結構,標記一般都是成對出現(部分標記除外例如:<br/>),即超文本標記語言檔案的開頭與結尾標誌和超文本標記語言的頭部與實體兩大部分。有三個雙標記符用於頁面整體結構的確認。

標記符<html>,說明該檔案是用超文本標記語言(本標籤的中文全稱)來描述的,它是檔案的開頭;而</html>,則表示該檔案的結尾,它們是超文本標記語言檔案的開始標記和結尾標記。

歷史

超文本表達語言(第一版)——在1993年6月作為網際網路工程工作小組(IETF)工作草案發布(並非標準):

HTML 2.0——1995年11月作為RFC 1866發布,在RFC 2854於2000年6月發布之後被宣布已經過時

HTML 3.2——1997年1月14日,W3C推薦標準

HTML 4.0——1997年12月18日,W3C推薦標準

HTML 4.01(微小改進)——1999年12月24日,W3C推薦標準

HTML 5——2014年10月28日,W3C推薦標準[4] (詳見本處參考資料)

ISO/IEC 15445:2000(“ISO HTML”)——2000年5月15日發布,基於嚴格的HTML 4.01語法,是國際標準化組織和國際電工委員會的標準。

Wijmo是基於HTML5、jQuery、CSS3和SVG的一個控制項包,能夠滿足構建當今Web系統的需求。基於Wijmo,您的系統運行將更加快速和流暢,外觀也會更加引人入勝。Wijmo中所有新的控制項都是在符合最新的UI設計潮流的基礎上,對新的以及改良後的主題進行封裝。優美的、專業的控制項外觀會讓您的應用程式引人注目。比如 ComponentOne Studio for ASP .NET Wijmo 控制項包內置的6個主題,同時可以使用jQuery UI項目提供的 30 多個主題,甚至可以使用 ThemeRoller 創建屬於您自己的系統主題。

HTML沒有1.0版本是因為當時有很多不同的版本。有些人認為蒂姆·伯納斯-李的版本應該算初版,這個版本沒有IMG元素。當時被稱為HTML+的後續版的開發工作於1993年開始,最初是被設計成為“HTML的一個超集”。第一個正式規範為了和當時的各種HTML標準區分開來,使用了2.0作為其版本號。HTML+的發展繼續下去,但是它從未成為標準。

HTML3.0規範是由當時剛成立的W3C於1995年3月提出,提供了很多新的特性,例如表格、文字繞排和複雜數學元素的顯示。雖然它是被設計用來兼容2.0版本的,但是實現這個標準的工作在當時過於複雜,在草案於1995年9月過期時,標準開發也因為缺乏瀏覽器支持而中止了。3.1版從未被正式提出,而下一個被提出的版本是開發代號為Wilbur的HTML 3.2,去掉了大部分3.0中的新特性,但是加入了很多特定瀏覽器,例如Netscape和Mosaic的元素和屬性。HTML對數學公式的支持最後成為另外一個標準MathML。

HTML 4.0同樣也加入了很多特定瀏覽器的元素和屬性,但是同時也開始“清理”這個標準,把一些元素和屬性標記為過時,建議不再使用它們。HTML的未來和CSS結合會更好。

HTML 5草案的前身名為Web Applications 1.0。於2004年被WHATWG提出,於2007年被W3C接納,並成立了新的HTML工作團隊。在2008年1月22日,第一份正式草案發布。

XHTML1.0——發布於2000年1月26日,是W3C推薦標準,後來經過修訂於2002年8月1日重新發布。

XHTML 1.1,於2001年5月31日發布,W3C推薦標準。

XHTML 2.0,W3C工作草案。

XHTML 5,從XHTML 1.x的更新版,基於HTML 5草案。

HTML4.01 是常見的版本。

要求

在編輯超文本表達語言檔案和使用有關標記符時有一些約定或默認的要求。

文本表達語言源程式的檔案擴展名默認使用htm(磁碟作業系統DOS限制的外語縮寫為擴展名)或html(外語縮寫為擴展名),以便於作業系統或程式辨認,除自定義的漢字擴展名。在使用文本編輯器時,注意修改擴展名。而常用的圖像檔案的擴展名為gif和jpg。

超文本表達語言源程式為文本檔案,其列寬可不受限制,即多個標記可寫成一行,甚至整個檔案可寫成一行;若寫成多行,瀏覽器一般忽略檔案中的回車符(標記指定除外);對檔案中的空格通常也不按源程式中的效果顯示。完整的空格可使用特殊符號(實體符)“(注意此字母必須小寫,方可空格)”表示非換行空格;表示檔案路徑時使用符號“/”分隔,檔案名稱及路徑描述可用雙引號也可不用引號括起。

標記符中的標記元素用尖括弧括起來,帶斜槓的元素表示該標記說明結束;大多數標記符必須成對使用,以表示作用的起始和結束;標記元素忽略大小寫,即其作用相同,但完整的空格可使用特殊符號“(注意此字母必須小寫,方可空格)”;許多標記元素具有屬性說明,可用參數對元素作進一步的限定,多個參數或屬性項說明次序不限,其間用空格分隔即可;一個標記元素的內容可以寫成多行。

標記符號,包括尖括弧、標記元素、屬性項等必須使用半角的西文字元,而不能使用全形字元。

HTML注釋由"<!--"號開始,由符號”-->“結束結束,例如<!--注釋內容-->。注釋內容可插入文本中任何位置。任何標記若在其最前插入驚嘆號,即被標識為注釋,不予顯示。

加密

根據超文本表達檔案的結構便知道,在超文本表達檔案中信息加密主要有兩種策略,即在數據元素中信息加密和在標籤中信息加密。在數據元素中信息加密的方法依賴於數據的類型是文字、圖像、聲音、腳本語言程式等而不同。如果元素類型是文本的話,則可套用基於普通純文本的加密方法,如替換法。標籤雖然是純文本,但由於是程式指令,有固定的諸多語法規則和約束,不能隨便照搬基於普通純文本的加密方法,而是需要特殊考慮。標籤只是控制數據在瀏覽器上的表現形式,而不會顯示出來。如果能夠基於標籤信息加密,其隱蔽性將會比較好。目前已提出的基於超文本檔案的加密方法有:

1、在網頁結束標記或者在每行的行尾插入空格或Tab鍵信息加密,插入一個空格代表0,插入一個Tab代表1。像著名的水印軟體 Wbstego、Stegano、Invisible Secret 等都是利用這種方法。之所以可以這樣信息加密,是因為瀏覽器會對超文本標記語言檔案中多餘的空格忽略掉,從而插入空格或 Tab後不改變顯示的結果。可以通過連續插入任意多個符號使得加密的容量可以任意大,這是其優點;其缺點是每插入一個位元組的信息,檔案大小需增加八個位元組;另外,雖然信息加密後的檔案瀏覽的結果不會改變,用記事本這樣的編輯軟體打開也不容易看出差別(但仔細看還是能看出這些不必要的空白符號的存在),但是當檔案以二進制格式打開時其多餘的空格符號一覽無遺。

2、修改標記名稱字元的大小寫,用大寫表示1,小寫表示0來信息加密。例如以大寫標記名稱、超文本標記語言、代表1,以小寫的標記名稱、超文本標記語言、代表0。這樣,一個標記可加密1bit信息。方法2克服了方法1的缺點,具有較好的隱蔽性和抗攻擊性 。

相關詞條

熱門詞條

聯絡我們