rosetta

rosetta

rosetta是基於粗糙集理論框架的表格邏輯數據工具。

基本信息

簡介

它提供了多種數據預處理功能,如決策表補齊、決策表離散化等及其算法,同時提供了粗糙集中常見的約簡和規則的獲取算法,支持從數據預處理到預測和分析規則的全過程,是一個很好的粗糙集理論軟體和實驗平台。

特點

Rosetta的定位是一個用於簡化模型的通用型工具,而不是針對某一特定領域。

Rosetta平台的可操作性強,便於數據瀏覽。它的界面具有面向對象的特點,每個可操作的對象在界面上都用單獨的項目表示,每個項目包含一些與上下文相關的選單。

它的核心計算功能可用命令行執行,適用於Perl或Python代碼調用。

功能

最近核心計算可能提供的一些功能:

·導入/導出

- 通過ODBC實現DBMS之間的部分整合;

- 將規則、知識最小表示(reduct)、表格、圖例和其他對象轉化為多種格式,包括XML,C++和Prolog。

·預處理

- 填充決策表(decision table)中缺失的數據;

- 數據屬性的離散化。

·計算

- 支持監督學習和非監督學習;

- 支持用戶自定義的區分概念(notions of discernibility)

- 對多種的區分性,有效的生成精確或近似的知識最小表示

- 用知識的最小表示產生if-then規則和描述模式

- 代碼運行

- 支持交叉驗證(cross-validation)

·後處理:

Rosetta的工作空間示意圖 Rosetta的工作空間示意圖

- 先進的知識最小表示和規則過濾功能

·驗證和分析

- 合成規則在未知樣本中的套用

- 生成混淆矩陣(confusion matrices)、ROC曲線和校準曲線(calibration curves)

- 根據高級質量度量,對每個規則進行評估

- 提供統計假設檢驗工具

·其它

- 利用容差關係(tolerance relations)進行聚類

- 計算分割(partitions)和可變精確度的近似粗糙集

- 支持隨機觀察取樣

- 代碼開源

- 完備的說明文檔

相關詞條

相關搜尋

熱門詞條

聯絡我們