• 专利基本信息
  • 发明 2018111467754 基于补集特征的贝叶斯文档分类方法、装置、设备及介质 2020

    已下证 ┣申请日2018 9 29 ┣申请日2018/9/29 申请日期9/29 1人

    G06F16/35 G06K9/62

    • 联系人列表
    • 12-16

    免责声明:以上消息未经人工确认,本平台不担保其真实性和有效性,交易前请仔细核实。

    • 专利摘要

    本发明实施例公开了一种基于补集特征的贝叶斯文档分类方法、装置、设备及介质,所述方法包括:对待分类文档进行分词处理,并确定所述待分类文档的特征词;基于预先标注好类别的文档语料计算所述待分类文档中每个特征词的权重;根据所述权重基于待分类文档的补集特征计算所述待分类文档中每个特征词属于各类别的最大似然概率;根据所述最大似然概率确定所述待分类文档的归属类别。通过采用上述技术方案,有效解决了由于样本类别数量不均衡导致的文档分类结果不准确的问题,提高了文档分类的准确度。

    • 专利生命周期
    专利申请:2018-09-29
    专利授权日:2020-10-16 00:00:00.0
    最近更新时间:2024-12-25