ACR[自動內容識別]

ACR[自動內容識別]

ACR (Automatic Content Recognition) ,自動內容識別,是一種利用計算機算法直接識別多媒體內容(音頻、視頻、圖像)的技術,識別算法的輸入可以是多媒體檔案,也可以是通過麥克風、攝像頭採集的原始數據,然後在海量多媒體資料庫中進行特徵比對、搜尋,從而得到匹配結果。

ACR技術提供了一種新穎、便捷的搜尋和獲取信息的方式,用戶無需任何手動輸入,便可立即獲得其感興趣的多媒體內容的相關信息。目前已廣泛套用於圖像識別,音視頻識別,電視節目多屏互動 ,電視、廣播內容自動監測,多媒體著作權檢測,電視廣告多屏同步等多個領域。

工作原理

ACR技術的工作原理與文字搜尋引擎類似,需要收集海量的圖像、音頻、視頻資源,並持續更新,然後通過數位訊號處理技術,提取多媒體資源的數字特徵,並進行索引、存儲,構建索引資料庫和搜尋引擎。

ACR搜尋引擎接收到查詢請求時,對請求中包含的多媒體數據片段採用相同的處理過程,提取相同格式的數字特徵,然後在索引資料庫中查找、過濾、計算相似度,找到與未知片段最為相似的多媒體資源,當相似度達到一定置信度時,認為找到匹配結果。

常見技術及套用

數字指紋

數字指紋是指從多媒體資源本身提取可近似作為其唯一標識的數字特徵。不應考慮內容的格式、編碼、比特率、壓縮率等方面的區別,只考慮內容傳達的信息是否相同或十分類似。

以上特點使得數字指紋技術的套用範圍十分廣泛,目前音頻指紋的套用市場發展較快,如音樂識別(Shazam),著作權檢測(YouTube),電視互動(新浪微博),多屏互動(Facebook)等。

數字水印

數字水印技術的原理類似二維碼,需要改變多媒體資源的內容,按照一定規則,向其中插入人類不可感知的信息,然後再通過檢測預設的規則來提取其代表的信息,水印技術耗費資源少,但需要解決引入噪音控制的問題。

水印技術的特點,使其是適用於某些特定場景,如聲波支付(支付寶)。

技術平台

目前,國際ACR技術市場發展迅速,各有所長,正在推動網際網路消費市場的技術轉型,知名的公司有:

•ACRCloud

•Audible Magic

•Civolution

•Digimarc

•Gracenote

•Shazam

相關詞條

相關搜尋

熱門詞條

聯絡我們