• 专利基本信息
  • 发明 2017105480723 基于Spark平台采用两次评价的加权选择集成三支聚类方法 2021

    已下证 数据处理 数据挖掘 企业数据管理 三支决策 大数据 3人

    G06K9/62

    • 联系人列表
    • 12-05
    • 10-15
    • 08-26

    免责声明:以上消息未经人工确认,本平台不担保其真实性和有效性,交易前请仔细核实。

    • 专利摘要

    本发明请求保护一种基于Spark平台采用两次评价的加权选择集成三支聚类方法,主要包括如下步骤:步骤1,对大数据集进行分区和管理并生成对应的弹性分布式数据集(RDD);步骤2,使用基于Spark的K‑Means聚类算法对每个分区数据进行聚类,生成多个不同的聚类成员;步骤3,通过两次评价,构造新的评价函数以及加权选择策略,对聚类成员进行选择,删除聚类效果不佳的聚类结果,构成新的聚类成员;步骤4,将聚类成员进行集成,构造一个加权的投票矩阵,根据三支决策规则进行聚类划分,得到最终的三支聚类结果。本发明大幅减少了算法运行时间,提高了算法效率。

    • 专利生命周期
    专利申请:2017-07-06
    授权缴费截止日:2025-08-06
    专利授权日:2021-02-09 00:00:00.0
    最近更新时间:2024-12-24