决策树中的信息商与信息增益 熵(entropy) 熵是数据集合不确定性(amount of uncertainty)的度量方法。 S,数据集。 在分离数据集的迭代过程中,数据集会逐渐变小,分离出来的数据集都是原数据集的子集。 X,数据集中的类别集合。 p(x),数据集S中类别为x的元素所...