Bien d'accord en ce qui concerne la bande passante, je pensais plutôt au problème de garder les caches synchrones entre cores et avec la mémoire centrale.
Problème que les GPU n'ont pas car ils font bien la différence entre entrées read-only (streams de vertices, textures... ) et render targets de sortie et écrivent dans des macroblocs qui ne s'intersectent pas. Bref ils ont la belle vie.
Alors que j'espère que Larrabee permettra de bosser sur des données en mémoire centrale in-place sans 12 tonnes de setup et d'adaptations.
Ceci dit la solution la plus sensible serait de pouvoir locker les caches sur les cores, ça serait facile à utiliser ET performant
Mais bon peut-être que je rêve et que ce sera moins general purpose que je ne l'imagine.