技术
聚类是把一组样品按照相似性划分为若干类别,使属于同一类别的样品之间的距离尽可能小,而不同类别样品间的距离尽可能大,按照相似性进行聚合。
贝叶斯聚类算法是一个典型的聚类式的层次聚类算法,使用后验概率作为最大化的目标函数,有非常好的聚类效果。
本果公司使用聚类分析来做网络舆情监控的专题、热点事件、重点人及重点组织的处理。通过聚类分析,把不同类型的网络信息聚合在一起,用于分析各类别的传播热度。