CUDA Tile和cuTile Python打通了这个瓶颈。英伟达在开发者博客中提到,一个15行的Python内核性能可以媲美200行手动优化的CUDA C++代码。
开发者必须手工管理成千上万条线程的索引、内存布局和同步,仿佛一个交响乐指挥需要亲自调试每一件乐器的音准。这种复杂性将大多数开发者挡在门外,只有少数高性能计算专家才能驾驭。
机器之心报道机器之心编辑部几个小时前,NVIDIA CUDA Toolkit 13.1 正式发布,英伟达官方表示:「这是 20 年来最大的一次更新。」这个自 2006 年 CUDA 平台诞生以来规模最大、最全面的更新包括:NVIDIA CUDA ...
在科技的快速发展中,NVIDIA再次以其创新力引领潮流。12月7日,NVIDIA正式推出了CUDA 13.1,这是自2006年CUDA平台诞生以来的最大升级。这次更新不仅是功能上的增强,更是GPU编程范式的一次重大革新,带来了全新的CUDATile编程模型。
CUDA 13.1的意义,不仅在于新增功能或优化性能,更在于为构建新一代高层、跨架构的GPU计算库和框架奠定了基础,通过引入Tile IR和高层抽象,NVIDIA在硬件和软件之间增加了一个更厚的中间层。
NVIDIA 在2025年GTC大会上宣布了一项具有里程碑意义的技术更新:CUDA并行计算平台正式支持原生Python编程。这一突破性进展将 ...
很少有人像他一样,在 通用CPU、移动SoC、车载SoC、AI加速器 上都做过一线设计和架构决策。近几年他频繁在TSMC、三星等论坛谈未来工艺与架构,被称为「半导体设计传奇」。
IT之家 12 月 7 日消息,英伟达本周四发布了全新的 CUDA 13.1,这是自 2006 年 CUDA 平台问世以来规模最大的一次功能扩展更新。 英伟达介绍称,本次更新的重点在于引入了一种名为 CUDA Tile 的全新 GPU 编程方式,旨在让更广泛的开发者群体能够更轻松地运用强大的 AI 与加速计算能力。
【TechWeb】NVIDIA日前正式推出CUDA 13.1版本,官方称其为自2006年平台诞生以来最大、最全面的升级。此次更新的核心在于引入了革命性的CUDA Tile编程模型,标志着GPU编程范式迈向一个更高抽象层级的新阶段。
NVIDIA近日宣布推出CUDA 13.1版本,这一更新被官方誉为自2006年CUDA平台问世以来最具突破性的升级。其核心亮点在于引入了名为CUDA Tile的全新编程模型,将GPU编程的抽象层级提升至全新高度,为开发者开辟了更高效的并行计算路径。
雷锋网 AI 开发者按:近日,NVIDIA 开源了适用于 Python 的视频处理框架「VideoProcessingFramework(VPF)」。该框架为开发人员提供了一个简单但功能强大的 Python 工具,可用于硬件加速的视频编码、解码和处理类等任务。 同时,由于 Python 绑定下的 C ++代码,它使开发 ...
NVIDIA近日正式推出CUDA Toolkit 13.1版本,官方宣称这是该平台自2006年问世以来最具颠覆性的重大更新。此次升级引入基于分块(Tile)的编程模型、Green Context运行时API支持、cuBLAS库性能优化等核心功能,为GPU编程带来全新范式。 最引人注目的CUDA ...