发明 2022107257069 多特征融合的英文科技文献关键词提取方法 2024
已下证 大数据语言模型 搜索引擎 智慧软件 【大数据语言模型 搜索引擎 智慧软件】 1人
G06F40/284 G06F40/216 G06F40/242 G06F16/31 G06F16/35 G06N3/044 G06N3/09
免责声明:以上消息未经人工确认,本平台不担保其真实性和有效性,交易前请仔细核实。
本申请多特征融合的英文科技文献关键词提取方法,创造性的提出不再选取备选词,而是将关键词提取过程当作对关键词主题序列标示的过程,采用深度网络学习模型进行有监督的序列标示,模型针对科技文献特征,对语料中的文本进行多特征分词,将文本切分成单词集合,对所有的单词进行特征主题处理,通过标示好关键词位置标示文件对这些单词做序列标示处理,将词和特征都表示成向量的形式拼接起来作为输入,通过将单词的标示结果也以向量的形式传递给深度网络学习模型中进行训练,采用训练完成的模型来进行关键词抽取,英文科技文献关键词提取效率和精度大幅提高,并对模型的提取结果实时评估,不断修正后关键词提取的效果更好。