Desde el nacimiento de la plataforma CUDA en 2006, por fin hemos presenciado su avance más significativo.
Ahora llega CUDA Tile: un modelo de programación basado en tiles completamente nuevo. Permite a los desarrolladores escribir algoritmos en un nivel de abstracción superior, sin tener que lidiar con los detalles de bajo nivel del hardware especializado como los tensor cores.
Para los escenarios que requieren computación masivamente paralela, esta actualización podría cambiar las reglas del juego por completo. La complejidad del hardware queda oculta, mientras que la eficiencia en el desarrollo puede alcanzar su máximo potencial.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
12 me gusta
Recompensa
12
4
Republicar
Compartir
Comentar
0/400
MondayYoloFridayCry
· 12-05 19:57
Dios mío, por fin no tengo que pelearme más con los núcleos tensoriales, ¡qué liberación!
Ver originalesResponder0
CountdownToBroke
· 12-05 19:57
Hermano, esto sí que está bien, por fin ya no tengo que sufrir más con esas cosas horribles de los tensor cores.
Ver originalesResponder0
nft_widow
· 12-05 19:38
卧槽终于来了,等了这么久
Responder0
BankruptWorker
· 12-05 19:38
Ahora podré perder mucho menos pelo; por fin no tendré que sufrir más con los tensor cores.
Desde el nacimiento de la plataforma CUDA en 2006, por fin hemos presenciado su avance más significativo.
Ahora llega CUDA Tile: un modelo de programación basado en tiles completamente nuevo. Permite a los desarrolladores escribir algoritmos en un nivel de abstracción superior, sin tener que lidiar con los detalles de bajo nivel del hardware especializado como los tensor cores.
Para los escenarios que requieren computación masivamente paralela, esta actualización podría cambiar las reglas del juego por completo. La complejidad del hardware queda oculta, mientras que la eficiencia en el desarrollo puede alcanzar su máximo potencial.