聚類假設

聚類假設是指處在相同聚類(cluster)中的示例有較大的可能擁有相同的標記。 根據該假設,決策邊界就應該儘量通過數據較為稀疏的地方,從而避免把稠密的聚類中的數據點分到決策邊界兩側。 在這一假設下,大量未標記示例的作用就是幫助探明示例空間中數據分布的稠密和稀疏區域,從而指導學習算法對利用有標記示例學習到的決策邊界進行調整,使其儘量通過數據分布的稀疏區域。

半監督學習中兩種假設之一,另外一種假設是流形假設
聚類假設是指處在相同聚類(cluster)中的示例有較大的可能擁有相同的標記。根據該假設,決策邊界就應該盡量通過數據較為稀疏的地方,從而避免把稠密的聚類中的數據點分到決策邊界兩側。在這一假設下,大量未標記示例的作用就是幫助探明示例空間中數據分布的稠密和稀疏區域,從而指導學習算法對利用有標記示例學習到的決策邊界進行調整,使其儘量通過數據分布的稀疏區域。

相關詞條

熱門詞條

聯絡我們