首页
热点
百科
娱乐
科技
资讯
药品
美容
时尚
登录
标签
数值
大模型训练开销还能更小!微软推出首个FP4训练框架,训练效果与BF16相当
首个FP4精度的大模型训练框架来了,来自微软研究院! 为了实现FP4精度训练,研究团队采用了定制化的FP4矩阵乘法(GeMM)CUDA内核。在系统的其他部分,如非矩阵乘操作的计算、Loss Scaling…
数值
方法
矩阵
量化
模型
fjmyhfvclm
4月前
102
0
«
1
2