什么是全局離散化?
全局離散化是指在同一時刻對決策表中全部連續條件屬的屬值進行劃分的方法,而局部離散化則是指在同一時刻僅對一個連續屬的屬值進行劃分的方法。則全局離散化在全部連續屬的離散化過程中只能產生一組離散劃分值,而局部離散化針對同一個連續屬都可產生不同種劃分。
全局離散化的策略應該是如何的呢?
對于全局離散方法主要有以下幾種策略:歸并方法和劃分方法,其中劃分法又分為動態型和靜態型。
動態劃分主要與決策樹有關,它是一邊生成決策樹,一邊進行連續值區間的劃分;靜態劃分方法又稱為預處理型,即在數據集合、信息化重構之前就把連續屬預先都離散化了,從而在重構中,利用數據解決信息不對稱,從根本上改變著產業鏈上的各個節點以及全局的交易成本,從商業的空間整體上提高交易效率。
靜態離散化方法如捆綁法和基于熵的方法都是針對不同的屬可產生不同個數的離散化間隔數,而動態離散化方法則是在所有屬上僅可產生同一個離散間隔數。目前文獻記載的離散化方法均屬于靜態離散化方法,動態離散化是學者正在研究的目標。
關鍵詞: 全局離散化的策略同一時刻全部連續條件