刚刚,中国台湾大学体育场,欢呼阵阵如同演唱会,但这次“摇滚巨星”,其实是英伟达创始人黄仁勋,再次回到学校,带来Computex重磅演讲,以及英伟达的新一代GPU。
无心号四卷带您了解
是的,英伟达新架构Blackwell宣布不过3个月,老黄就把后三代路线图全公开了:
- 2025年Blackwell Ultra,2026年新架构Rubin,2027年Rubin Ultra。
好好好,像做iPhone一样造芯片。
到这一代Blackwell为止,英伟达已经把AI模型有效扩展到万亿参数。(还给token定了个译名:词元)。
- 1.8万亿参数GPT4的训练能耗,8年降低至原来的1/350。
推理能耗,8年降低至原来的1/45000。
看着这一波亮相和剧透,网友真相了:英伟达没有竞争对手,而是选择将摩尔定律放在地上摩擦……
ComputeX前夜,老黄一开场就展开了一波隐形卖货,他自称不太准确的“CEO数学”:
- 买得越多,省得越多……
The more you buy, the more you save.
除此之外,还有一些新产品亮相,包括能够模拟气冲的天气预测模型CorriDiff、数字人微服务、BlackWell系统、Spectrum-X、机器人平台Isaac……
好了话不多说,这就来看看老黄这次到底搞了哪些事情
“AI Factory Is generating”
谈到当前新的产业革命,老黄表示:新的计算时代正在开始;而AI Factory正在诞生。
他在现场展示了BlackWell系统。
3月份GTC大会上还遮遮掩掩地说是GPT-MoE-1.8T模型,这下彻底摊牌了:GPT-4参数就是1.8T。
AI加速每个应用程序
AI对于企业的影响,老黄认为AI加速每一个应用程序。他首先谈到了NIM推理微服务,这是一个帮助开发者或者企业轻松构建AI应用,简化大模型部署程序。
不管是聊天机器人、还是生活/驾驶助手等,部署时间都能从几周缩短到几分钟。
此次在这个NIM中还有上新,也就是ACE 生成式AI微服务,数字人AI技术套件。
除了原有自动语音识别、文本到语音的转换和翻译、Nemotron语言模型、 Audio2Face等套件,还增加了两个技术:
一个是可以基于音轨生成身体姿势Audio2Gesture;
一个Nemotron-3 4.5B,这是英伟达首款SLM(小爱语言模型),专为低延迟端侧设备而生。
∂接下来,这一数字人微服务将部署在一亿台RTX AI PC上面。
当前英伟达在新的合作伙伴,比如华硕、MSI的加入下,已经拥有超过200种RTX AI PC型号。
还推出了RTX AI Toolkit,一个工具和SDK集合,帮助Windows开发者定制优化本地部署模型。
同Mac相比,部署了RTX的Windows的Stable Diffusion推理速度是Mac的7倍。
用于机器人开发的技术平台Isaac
这次一同亮相的,还有用于机器人开发的技术平台,NVIDIA Isaac。
为啥搞这玩意儿呢,老黄给出的理由是这样的:
- 机器人时代已经到来。
有朝一日,所有会移动的东西,都将实现自主化。
本文内容由互联网用户自发贡献,该文观点仅代表作者本人。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 97552693@qq.com 举报,一经查实,本站将立刻删除。本文链接:https://hbwxh.com/n/12249.html