• 专利基本信息
  • 发明 202010143782X 神经网络模型的量化方法和装置 2024

    已下证 人工智能 数据存储 神经网络 神经网络结构搜索 数据处理 1人

    G06N3/0495 G06N3/08

    • 联系人列表
    • 02-21

    免责声明:以上消息未经人工确认,本平台不担保其真实性和有效性,交易前请仔细核实。

    • 专利摘要

    本公开涉及人工智能领域。本公开的实施例公开了神经网络模型的量化方法和装置。该方法包括:获取神经网络模型的参数的初始位宽以及目标量化位宽;构建量化位宽序列,通过执行多次拟量化操作更新量化位宽序列;按照更新后的量化位宽序列对神经网络模型进行逐级量化;拟量化操作包括:获取起点位宽对应的第一量化后模型、采用中间位宽对待量化模型进行量化得到的第二量化后模型;响应于确定第一量化后模型的参数分布与第二量化后模型的参数分布之间的差异在预设的分布差异区间内,将中间位宽插入量化位宽序列中,将中间位宽更新为新的起点位宽,将第二量化后模型更新为新的待量化模型,执行下一次拟量化操作。该方法可以减少模型的量化损失。

    • 专利生命周期
    专利申请:2020-03-04
    专利授权日:2024-08-02 00:00:00.0
    最近更新时间:2025-03-10