算子的相关文章 - 环球财经网

大模型推理，得讲性价比

三分之一个世纪前，加拿大学者们提出了经典的MoE模型神经网络结构，在人类探索AI的「石器时代」中，为后世留下了变革的火种。近十年前，美国硅谷的互联网巨擎在理论和工程等方面，突破了MoE模型的原始架构，让这个原本被置于学术高阁的理念，化身成为了随后AI竞争的导火索。如今，后发优势再一次来到了大洋此岸，...

爆改大模型训练，华为打出昇腾+鲲鹏组合拳

三分之一个世纪前，加拿大学者们提出了经典的MoE模型神经网络结构，在人类探索AI的「石器时代」中，为后世留下了变革的火种。近十年前，美国硅谷的互联网巨擎在理论和工程等方面，突破了MoE模型的原始架构，让这个原本被置于学术高阁的理念，化身成为了随后AI竞争的导火索。如今，后发优势再一次来到了大洋此岸，...

华为的三个黑科技，要颠覆AI计算？

没有人不在期待大模型能够成为下一个电动车，作为代表中国的新兴产业，在世界范围内掀起狂澜。然而主流的MoE架构大模型，却苦于其结构上的“先天不足”：巨大的硬件成本与多重拖累效率的环节，使得中国企业在这场芯片堆砌与效率挖掘的苦径上难以提速。作为智能基础设施提供商，华为在这场战役中另辟蹊径，利用其在数学算...

推理性能PK，华为+DeepSeek >英伟达？

环球财经网注：“大模型江湖，落地为王。”这句话的含金量还在提升。随着DeepSeek V3/R1在春节期间一夜爆火，基于超大规模MoE（Mixture of Experts）架构的大模型正在从训练开发转向推理应用的落地。对于MoE推理部署来说，效率一直是一个痛点。谁能将部署计算效率提升至最高，才能真...

« 2025年7月 »
一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

控制面板

您好，欢迎到访网站！

网站分类

最近发表

最新留言

文章归档

友情链接