• 专利基本信息
  • 发明 2019108291614 一种基于词语特征值的法律专有领域词发现方法及装置 2023

    已下证 人工智能 自然语言 文本处理 语言分析 4人

    G06F40/242 G06F40/289

    • 联系人列表
    • 12-05
    • 10-15
    • 09-25
    • 08-26

    免责声明:以上消息未经人工确认,本平台不担保其真实性和有效性,交易前请仔细核实。

    • 专利摘要

    本发明请求保护一种基于词语特征值的法律专有领域词发现方法,其包括以下步骤:首先读入待分词操作的法律领域文本数据集,根据明显的分隔符对输入的初始文本数据集进行粗切分得到一系列的短字符串,构成短字符串集;然后利用基于词典的正向最大匹配算法将短字符串集切分成多个散串及散词,通过分析法律领域专有词的构词规则,将这些散词散串进行合并提取,放入到候选分词词串集;执行基于词语特征值的法律专有领域词发现算法,计算候选分词词串集中的每个候选分词词串的词语特征值,当候选分词词串的词语特征值大于设定的阈值时,就加入到分词结果中,否则就舍弃该词串,最后完成分词,本发明提升了法律领域文档中分词工作的准确度。

    • 专利生命周期
    专利申请:2019-09-03
    授权缴费截止日:2024-10-08
    专利授权日:2023-03-31 00:00:00.0
    最近更新时间:2024-12-24