信息熵

信息熵

信息是個很抽象的概念。人們常常說信息很多,或者信息較少,但卻很難說清楚信息到底有多少。比如一本五十萬字的中文書到底有多少信息量。直到1948年,香農提出了“信息熵”的概念,才解決了對信息的量化度量問題。信息熵這個詞是C.E.香農從熱力學中借用過來的。熱力學中的熱熵是表示分子狀態混亂程度的物理量。香農用信息熵的概念來描述信源的不確定度。資訊理論之父克勞德·艾爾伍德·香農第一次用數學語言闡明了機率與信息冗餘度的關係。

理論提出

資訊理論之父 C. E. Shannon 在 1948 年發表的論文“通信的數學理論( A Mathematical Theory of Communication )”中, Shannon 指出,任何信息都存在冗餘,冗餘大小與信息中每個符號(數字、字母或單詞)的出現機率或者說不確定性有關。

Shannon 借鑑了熱力學的概念,把信息中排除了冗餘後的平均信息量稱為“信息熵”,並給出了計算信息熵的數學表達式。

基本內容

通常,一個信源傳送出什麼符號是不確定的,衡量它可以根據其出現的機率來度量。機率大,出現機會多,不確定性小;反之就大。

信息熵信息熵

不確定性函式f是機率P的單調遞降函式;兩個獨立符號所產生的不確定性應等於各自不確定性之和,即f(P,P)=f(P)+f(P),這稱為可加性。同時滿足這兩個條件的函式f是對數函式,即

信息熵信息熵

在信源中,考慮的不是某一單個符號發生的不確定性,而是要考慮這個信源所有可能發生情況的平均不確定性。若信源符號有n種取值:U…U…U,對應機率為:P…Pi…P,且各種符號的出現彼此獨立。這時,信源的平均不確定性應當為單個符號不確定性-logP的統計平均值(E),可稱為信息熵,即

,式中對數一般取2為底,單位為比特。但是,也可以取其它對數底,採用其它相應的單位,它們間可用換底公式換算。

最簡單的單符號信源僅取0和1兩個元素,即二元信源,其機率為P和Q=1-P,該信源的熵即為如圖1所示。

由圖可見,離散信源的信息熵具有:①非負性,即收到一個信源符號所獲得的信息量應為正值,H(U)≥0;②對稱性,即對稱於P=0.5(③確定性,H(1,0)=0,即P=0或P=1已是確定狀態,所得信息量為零;④極值性,當P=0.5時,H(U)最大;而且H(U)是P的上凸函式。

圖1   二元信源的熵圖1 二元信源的熵

對連續信源,仙農給出了形式上類似於離散信源的連續熵,

雖然連續熵H(U)仍具有可加性,但不具有信息的非負性,已不同於離散信源。H(U)不代表連續信源的信息量。連續信源取值無限,信息量是無限大,而H(U)是一個有限的相對值,又稱相對熵。但是,在取兩熵的差值為互信息時,它仍具有非負性。這與力學中勢能的定義相仿。

信息含義

現代定義

信息是。【逆維納信息定義】

信息是確定性的增加。【逆香農信息定義】

信息是事物現象及其屬性標識的集合。【2002年】

最初定義

信息理論的鼻祖之一Claude E. Shannon把信息(熵)定義為離散隨機事件的出現機率。

所謂信息熵,是一個數學上頗為抽象的概念,在這裡不妨把信息熵理解成某種特定信息的出現機率。而信息熵和熱力學熵是緊密相關的。根據Charles H. Bennett對Maxwell's Demon的重新解釋,對信息的銷毀是一個不可逆過程,所以銷毀信息是符合熱力學第二定律的。而產生信息,則是為系統引入負(熱力學)熵的過程。所以信息熵的符號與熱力學熵應該是相反的。

一般而言,當一種信息出現機率更高的時候,表明它被傳播得更廣泛,或者說,被引用的程度更高。我們可以認為,從信息傳播的角度來看,信息熵可以表示信息的價值。這樣子我們就有一個衡量信息價值高低的標準,可以做出關於知識流通問題的更多推論。

計算公式

H(x) = E[I(xi)] = E[ log(2,1/p(xi)) ] = -∑p(xi)log(2,p(xi)) (i=1,2,..n)

其中,x表示隨機變數,與之相對應的是所有可能輸出的集合,定義為符號集,隨機變數的輸出用x表示。P(x)表示輸出機率函式。變數的不確定性越大,熵也就越大,把它搞清楚所需要的信息量也就越大.

《博弈聖經》

信息熵:信息的基本作用就是消除人們對事物的不確定性。多數粒子組合之後,在它似像非像的形態上押上有價值的數碼,具體地說,這就是一個在博弈對局中現象信息的混亂。

香農指出,它的準確信息量應該是

-(p1*log(2,p1) + p2 * log(2,p2) +...+p32 *log(2,p32)),

信息熵信息熵

其中,p1,p2 ,...,p32 分別是這 32 個球隊奪冠的機率。香農把它稱為“信息熵” (Entropy),一般用符號 H 表示,單位是比特。

有興趣的讀者可以推算一下當 32 個球隊奪冠機率相同時,對應的信息熵等於五比特。有數學基礎的讀者還可以證明上面公式的值不可能大於五。對於任意一個隨機變數 X(比如得冠軍的球隊),它的熵定義如下:

變數的不確定性越大,熵也就越大,把它搞清楚所需要的信息量也就越大。

信息熵是資訊理論中用於度量信息量的一個概念。一個系統越是有序,信息熵就越低;

反之,一個系統越是混亂,信息熵就越高。所以,信息熵也可以說是系統有序化程度的一個度量。

熵的概念源自熱物理學。

假定有兩種氣體a、b,當兩種氣體完全混合時,可以達到熱物理學中的穩定狀態,此時熵最高。如果要實現反向過程,即將a、b完全分離,在封閉的系統中是沒有可能的。只有外部干預(信息),也即系統外部加入某種有序化的東西(能量),使得a、b分離。這時,系統進入另一種穩定狀態,此時,信息熵最低。熱物理學證明,在一個封閉的系統中,熵總是增大,直至最大。若使系統的熵減少(使系統更加有序化),必須有外部能量的干預。

信息熵的計算是非常複雜的。而具有多重前置條件的信息,更是幾乎不能計算的。所以在現實世界中信息的價值大多是不能被計算出來的。但因為信息熵和熱力學熵的緊密相關性,所以信息熵是可以在衰減的過程中被測定出來的。因此信息的價值是通過信息的傳遞體現出來的。在沒有引入附加價值(負熵)的情況下,傳播得越廣、流傳時間越長的信息越有價值。

熵首先是物理學裡的名詞。

在傳播中是指信息的不確定性,一則高信息度的信息熵是很低的,低信息度的熵則高。具體說來,凡是導致隨機事件集合的肯定性,組織性,法則性或有序性等增加或減少的活動過程,都可以用信息熵的改變數這個統一的標尺來度量。

傳播學辭彙

5W傳播模式 | IIP指數 | 《人類傳播理論》 | 《傳媒符號學:後麥克盧漢的理論轉向》 | 《後工業社會》 | 《媒介研究:文本、機構與客群》 | 《帝國與傳播》 | 《理解媒介》 | 《電視導播學》 | 丁曉正 | 上線效果 | 兩級傳播模式 | 個人差異論 | 個人社會化 | 中國人物傳播研究中心 | 中國新聞傳播學高影響論文評介 | 書籍設計與印刷工藝 | 二級傳播理論 | 交往理性 | 人內傳播 | 人物傳播學 | 傳播學 | 人際傳播 | 伊里調查 | 傳媒產業 | 傳播制度 | 傳播功能 | 傳播單位 | 傳播史 | 傳播學基礎 | 傳播學引論 | 傳播學批判學派 | 傳播學概論 | 傳播學經驗學派 | 傳播學論壇 | 傳播技巧 | 傳播效果 | 傳播模式 | 傳播流 | 傳播渠道 | 傳播障礙 | 傳者 | 伯明罕學派 | 使用與滿足模式 | 使用與滿足理論 | 依賴論 | 保羅·拉扎斯菲爾德 | 信息 | 信息匱乏 | 信息溝 | 信息熵 | 信息爆炸 | 信息超高速公路 | 信息過載 | 信源 | 傾向性解讀 | 假寐效果 | 充欲主義 | 克勞德·香農 | 共同意義空間 | 內容分析法 | 內爆 | 冗餘信息 | 冷媒介與熱媒介 | 分層抽樣法 | 創新理論 | 刺激理論 | 勸服傳播 | 加布里埃爾·塔爾德 | 中國組織人事報 | 單向傳播 | 單向度人 | 南京大學廣告與傳播學系 | 卡爾·霍夫蘭 | 卡爾•霍夫蘭 | 雙向傳播 | 反向社會化 | 反抗式解讀 | 客群 | 客群商品論 | 受傳者 | 口傳系統 | 口碑傳播 | 口語傳播 | 同時傳輸制 | 後援會 | 吳飛[著名傳播學者] | 周勝林 | 周郵報 | 哈羅德·拉斯韋爾 | 國際傳播 | 國際傳播學 | 國際傳播:延續與變革 | 國際輿論 | 地球村 | 培養理論 | 多元無知效應 | 大眾傳媒與民主政治 | 大眾傳播 | 大眾傳播研究方法 | 奧斯古德模式 | 麥克盧漢 | 威爾伯·施拉姆 | 媒介事件 | 媒介依賴論 | 媒介即訊息 | 媒介奇觀 | 媒介控制 | 媒介理論 | 媒介生態環境 | 媒介研究的進路:經典文獻讀本 | 媒介組織 | 媒體奇觀 | 子彈論 | 守門人 | 守門人理論 | 容器人 | 導語 | 居延安 | 工具說 | 市民新聞 | 廣告效果評估 | 廣播電視集團 | 庫爾特·盧因 | 庫爾特•勒溫 | 廉價報紙 | 強大效果模式 | 心理圖像理論 | 意見領袖 | 所羅門控制實驗 | 托馬斯公理 | 批判學派 | 把關人 | 報導思想 | 拉斯韋爾模式 | 擬像理論 | 控制論 | 控制試驗法 | 政治傳播學引論 | 文化行為模式 | 文化規範論 | 新媒介 | 新聞傳媒專業 | 新聞戰 | 新聞控制 | 新聞洞 | 新聞道德 | 施拉姆大眾傳播模式 | 無知之幕 | 最合適效果跨度 | 有效傳播 | 有效信息 | 有效效果模式 | 有限效果 | 有限效果模式 | 有限效果論 | 機械性噪音 | 李卓鈞 | 李金銓 | 楊宇時 | 標題新聞 | 欒軼玫 | 框架理論 | 欣賞指數 | 武漢大學傳播學複習精編 | 民主參與理論 | 民族志傳播學 | 污名化 | 沉默的螺鏇 | 沉默的螺鏇模式 | 沉默螺鏇 | 涵養分析 | 王彥琦 | 王文宏 | 用信息顛覆世界 | 電子傳播 | 電子空間 | 電視文化 | 皮下注射論 | 知溝理論 | 知識溝 | 知識鴻溝 | 社會分化論 | 社會市場學 | 社會責任理論 | 官方自媒體 | 窄眾化 | 符號學噪音 | 第三人效果 | 第三者效果 | 第二傳播 | 精心的可能性模式 | 精確新聞學 | 紐科姆模式 | 組織傳播 | 編碼 | 網路傳播學 | 網路輿論操控食物鏈 | 群體傳播 | 群體感染 | 蒲公英式傳播 | 視界政體 | 議程設定 | 議程設定模式 | 議題設定 | 語彙 | 語言符號 | 說服性傳播 | 新世界信息秩序 | 豆瓣,流行的密碼 | 象徵符 | 貝羅傳播模式 | 賴利夫婦模式 | 超真實 | 跨媒介傳播 | 跨界傳播五維理論 | 適度效果模式 | 選擇性接觸 | 選擇性接觸假說 | 選擇性理解 | 鐵砂船 | 長陽南曲 | 閱聽大眾 | 陳艷紅 | 霍夫蘭與耶魯學派 | 非典流言 | 韋斯特利一麥克萊恩模式 | 順序傳輸制 | 香農一韋弗模式 | 馬特拉 | 魔彈效果論 | 魔彈理論 | 魔彈論 | 麥克布萊德報告 | 麻辣書生 | 艦隊街 | 社會流瀑效應 | 身勢學 | 多倫多學派 | 電子烏托邦 | 李南田 | 社會認同 | 韋爾伯·施拉姆 | 訊息 | 新聞內參 | 社會共識 | 伊里研究 | N級傳播 | IPP指數 | 象徵性現實 | 語義空間 | 選擇性認知 | 大眾報紙 | 社會雷達 | 兩極傳播 | 他律性慾望主義 | 傳播學政治經濟學派 | 先有傾向 | 華爾街日報體 | 社會順從理論 | 南京政治學院新聞系 | 媒介行銷 | 金定海 | 自由至上主義 | 蘇維埃-全權主義 | 田野調查法 | 張樹庭 | 大眾傳播功能失調 | 媒介環境 | 中國傳播學會 | 社會新聞 | 媒介霸權理論 | 文化規範理論 | “5W”傳播模式 | 電子烏托邦思想 | 國際戰略傳播學會 | 霍桑實驗 | 紐科姆的對稱模式 | 象徵性互動理論 | 周裕瓊 | 閔大洪 | 餘明陽 | 公共輿論 | 涵化理論 | 傳媒接近權 | 中國政法大學新聞與傳播學院 | 自我互動 | 董天策 | 趙為學 | 議程安排 | 孫宇科 | 拉斯韋爾 | 說服研究 | 尉天驕 | KDKA廣播電台 | 體育傳播學 | 詹成大 | 蘇振東 | 夏德元 | 靶子論 | 健康傳播 | 公共領域 | 《第二傳播》 | 教育體系 | 整合行銷傳播球 | 海南大學傳播學研究中心 | 擬劇論 | 尹章池 | 媒介技術決定論 | 傳播過程 | 預言的自我實現 | 內向傳播 | 群體動力學 | 個性化檢索 | 盧因 | 群體暗示 | 群體意識 | 傳播隔閡 | 餘霞 | 霍夫蘭 | 金兼斌 | 獵奇新聞 | RTBF | 南都全媒體 | 恐懼訴求 | 徐敬宏 | 擬態環境環境化 | 培養分析 | 操作化 | “假寐效果” | 文化指標 | 自然化 | 發展傳播學 | 伊萊休•卡茨 | 傳播效果研究 | 頻道專業化 | 頻道分眾化 | 信息吸盤理論 | 媒體素養 | 權力的媒介 | 范龍 | 兩級傳播論 | 警鐘效果 | 情境決定論 | 擬態環境 | 媒介依存症 | 大眾文化 | 自我傳播 | 多元主義 | 傳播媒介 | 傳播學專業 | 接種免疫論 | 傳播學理論基礎與實戰練習 | 縱合傳播 | CNN效應 | 一面提示 | 文化傳播 | 輿情 | 網路輿情

相關搜尋

熱門詞條

聯絡我們