Crunchez vos adresses URL
|
Calculez la conso électrique de votre PC
|
Hébergez vos photos
Page 9 sur 19 PremièrePremière 1234567891011121314151617 ... DernièreDernière
Affichage des résultats 241 à 270 sur 567

Discussion: Intel et Larrabee

  1. #241
    C'est possible que Polaris risque d'aller dans la trappe à iAPX 432, tout dépend si Intel refait la même connerie ou s'il dispense un compilateur relativement simple : est-ce le cas ? (bon, je ne crois pas vu ta réponse nette et précise )

  2. #242
    Polaris n'est pas fait pour executer du code compile, et aucun humain n'a envie de se taper les problemes de routing associe au reseau en grille a la main, tout scheduler a la main etc... Un processeur, meme graphique c'est un peu plus que des unites de calcul et un reseau d'interconnection, dans Polaris il manque la moitie utile du processeur, celle qui le rend utilisable par du soft (meme compare a un DSP).
    fefe - Dillon Y'Bon

  3. #243
    Citation Envoyé par fefe Voir le message
    dans Polaris il manque la moitie utile du processeur, celle qui le rend utilisable par du soft (meme compare a un DSP).
    Tu veux dire "inutilisable" ?

  4. #244
    A-t-il jamais été question de faire de Polaris un produit ? Je croyais que c'était juste un démonstrateur.

  5. #245
    Citation Envoyé par Childerik Voir le message
    Tu veux dire "inutilisable" ?
    il manque la moitié qui le rend utilisable... Du coup il est inutilisable... faut lire
    Suite à une suggestion, je vais utiliser cette signature pour des canards en manque de ranking pro. Ou des quotes idiots.

  6. #246
    Citation Envoyé par Neo_13 Voir le message
    il manque la moitié qui le rend utilisable... Du coup il est inutilisable... faut lire
    Je m'excuse, je n'avais pas mes lunettes
    Dernière modification par Childerik ; 25/11/2008 à 14h49.

  7. #247
    Citation Envoyé par newbie06 Voir le message
    A-t-il jamais été question de faire de Polaris un produit ? Je croyais que c'était juste un démonstrateur.
    Tu as tout bon.
    fefe - Dillon Y'Bon

  8. #248
    Les dernières news de Hiroshige Goto disent des trucs intéressants...

    • http://pc.watch.impress.co.jp/docs/2.../kaigai470.htm et
      http://pc.watch.impress.co.jp/docs/2.../kaigai472.htm

      En résumé, en extrapolant sur les sous-entendus de Pat et les anciennes présentations d'Intel, on peut s'attendre à ce que Larrabee soit intégré un jour dans les CPU desktop/serveur :
      - soit en bloc tel quel pour former une archi hétérogène,
      - soit juste les unités vectorielles, le jeu d'instruction et éventuellement l'interconnect seraient intégrés dans le CPU. Ou vu autrement on change les Pentiums de LRB en cores de Haswell (et en en mettant un peu moins)...

      (Le but serait probablement de faire tourner les applis graphiques et celles développées pour Larrabee raisonnablement rapidement sur du milieu de gamme sans GPU/LRB, pas de remplacer le GPU...)

      Un effet de bord serait qu'AVX aurait une durée de vie égale à celle de MMX...

    • http://pc.watch.impress.co.jp/docs/2.../kaigai474.htm

      Une utilisation intéressante du contrôle des threads en soft et du swizzle : faire migrer dynamiquement les tâches d'un thread SIMD à un autre en fonction des branchements pris...


    Edit : Google Translate a fait des progrès récemment non?
    http://translate.google.com/translat...-8&sl=ja&tl=en
    Dernière modification par Møgluglu ; 02/11/2008 à 18h55.

  9. #249
    C'est pas nouveau pour Larrabee, je me souviens d'avoir vu un slide d'Intel (je crois même que c'était sur CPC) où on voyait un montage photo d'un futur die hypothétique avec ~8 cores type Nehalem entourés de plein de cores type Larrabee.

  10. #250
    Ouais mais là ce n'est plus un multi-core hétérogène style Cell qui est évoqué, mais des fat-cores x86 conventionnels avec juste le jeu d'instruction Larrabee en plus.

    Donc l'unification entre les MMX/SSE/AVX et les langages GPU. Ça justifierait un peu plus le choix du x86 pour Larrabee.

  11. #251
    Apres tout LRB utilise un P54C qui n'est qu'un core x86 parmi d'autres. Il y a beaucoup d'autres options qui offrent peut etre des caracteristiques meilleures en terme de performances/conso/cout. Au hasard un des nombreux cores derives de l'architecture P6 augmente d'un VPU ou meme pourquoi pas un Atom ou un 80386 ?
    fefe - Dillon Y'Bon

  12. #252
    un Atom comme brique de Larabee ... c'était pas le plan initial ? :-)

  13. #253
    Il aurait du l'appeler "Molecule" en faite.

  14. #254
    Je crois qu'on t'as entendu. Voici un supercalculateur basé sur des Atom sous le nom de code "Project Molecule"
    http://techon.nikkeibp.co.jp/english...081121/161590/

  15. #255
    fefe - Dillon Y'Bon

  16. #256
    C'est pertinent comme choix de monter des supercalculateurs basés sur Atom ?

    L'argument de la taille du cluster ne tient pas à mon avis, ils pourraient concevoir une carte basée sur un penryn qui ferait à peu près la même taille. Atom aurait été sur un SoC, OK, mais la, quand on voit la photo, ca ne semble pas particulièrement plus compact que ce qu'on pourrait faire avec un CPU mobile, voire de bureau.
    Pour la dissipation, avec le WC, ca permet de déporter le problème.

    L'argument de la conso, mouais, OK ca consomme moins, mais en penryn energy efficient, on doit pouvoir atteindre un meilleur ratio perf/conso sur ce genre d'application ?

    Après, reste le prix. Je pense que c'est sur ça que l'Atom peut se démarquer (surtout si on le compare à des modèles EE).

    Les arguments de SGI (memory bandwith, etc) tiennent surtout du fait qu'il ont fortement augmenté le nombre de CPU, j'aurais bien aimé avoir les chiffres d'un blade avec le même nombre de CPU, mais avec des penryn mobile/EE.

  17. #257
    Citation Envoyé par Yasko Voir le message
    L'argument de la conso, mouais, OK ca consomme moins, mais en penryn energy efficient, on doit pouvoir atteindre un meilleur ratio perf/conso sur ce genre d'application ?
    Le TDP du 330 c'est 8W, un core2 duo merom u7000 (2M cache, 1.33 GHz) 10W.
    Prix conseillés respectifs pour 1000 ??? (mais probablement moins de $100) et $289.

    Atom : http://ark.intel.com/ProductCollecti...familyID=29035
    Core2 Duo mobile : http://ark.intel.com/ProductCollecti...familyID=26548

  18. #258
    Ca me parait logique... C'était prévisible.

    Je suis pas sur que le PPC440 consomme moins pour plus de perfs, pourtant il anime blue gene l/2
    Suite à une suggestion, je vais utiliser cette signature pour des canards en manque de ranking pro. Ou des quotes idiots.

  19. #259
    Le meilleur rendement reste le CELL 65 nm apparemment, enfin d'après Green500
    D'un autre côté il est probable que Larrabee sera plus efficace que le CELL...

  20. #260
    la méthodo du green500 me parait pour le moins... foireuses

    Surtout quand on approxime le cluster à N x un node... le tout en Rpeak...

    Bref, je suis un vilain troll car je déteste le cell, et donc un bench qui le place devant est soit biaisé, soit non représentatif.
    Suite à une suggestion, je vais utiliser cette signature pour des canards en manque de ranking pro. Ou des quotes idiots.

  21. #261
    Citation Envoyé par Neo_13 Voir le message
    Bref, je suis un vilain troll car je déteste le cell, et donc un bench qui le place devant est soit biaisé, soit non représentatif.
    Et moi j'aime le CELL, et je peux être de mauvaise foi, on n'est pas rendu

  22. #262
    Sérieux, t'as lu la méthodo et ya rien qui te parait louche ? genre faire une moyenne sur un cluster sur base de Rpeak sur un seul noeud ?
    Suite à une suggestion, je vais utiliser cette signature pour des canards en manque de ranking pro. Ou des quotes idiots.

  23. #263
    Citation Envoyé par Neo_13 Voir le message
    Sérieux, t'as lu la méthodo et ya rien qui te parait louche ? genre faire une moyenne sur un cluster sur base de Rpeak sur un seul noeud ?
    Franchement, je n'ai pas vraiment creuse. Mon credo est assez simple : je n'ai aucune confiance dans quelque benchmark que ce soit ("Lies, Damn Lies, and Benchmarks"), on peut helas leur faire dire ce qu'on veut en variant quelques parametres, en faisant des moyennes, etc.

    De toute facon le Top500 est base sur Linpack, non ? C'est representatif de certains types de calcul, mais plutot limite (quoi que ca reste peut-etre la charge la plus elevee des supercalculateurs)...

    Je suis plus interesse par le maximum atteignable en passant un temps de malade sur le code (CELL par exemple). Et sinon je regarde un max de benchmarks faits par un max de personnes differentes, ce qui me permet de ne jamais conclure

  24. #264
    Citation Envoyé par newbie06 Voir le message
    Le TDP du 330 c'est 8W, un core2 duo merom u7000 (2M cache, 1.33 GHz) 10W.
    Prix conseillés respectifs pour 1000 ??? (mais probablement moins de $100) et $289.

    Atom : http://ark.intel.com/ProductCollecti...familyID=29035
    Core2 Duo mobile : http://ark.intel.com/ProductCollecti...familyID=26548

    On en avait parlé là:
    http://forum.canardpc.com/showpost.p...postcount=2422

  25. #265

  26. #266
    Citation Envoyé par newbie06 Voir le message
    Le TDP du 330 c'est 8W, un core2 duo merom u7000 (2M cache, 1.33 GHz) 10W.
    Prix conseillés respectifs pour 1000 ??? (mais probablement moins de $100) et $289.

    Atom : http://ark.intel.com/ProductCollecti...familyID=29035
    Core2 Duo mobile : http://ark.intel.com/ProductCollecti...familyID=26548
    Tu peux aussi prendre un Z540 a 2.4W, il en faut 2.8 pour atteindre le meme flop peak que ton u7000. Ca te fait un facteur 1.5 de flop/ W pour le CPU. Mais en pratique c'est plus le systeme que le CPU qui compte a ce niveau la cote power...

    Le probleme dans tout ca est que quoi que tu fasses la plateforme consommera plusieurs watts par core. La grande question est si ils utilisent des chipsets existants ou vont se faire un joli chipset proprietaire pour le machin.
    Si tu compares ton Z540 avec ton 7700 en peak flop/W le 540 est 1.5x plus efficace et, si ils ne font pas leur chipset et prennent de l'existant, d'un cote ils peuvent mettre poulsbo (2.3W), d'un autre un P965 mobile (8W http://www.intel.com/assets/pdf/datasheet/316273.pdf ). Donc si on refait les memes calculs on arrive a 1.35x.

    Maintenant si on regarde la taille des packages, sur une carte mere on doit reussir a rentrer ~4 combo cpu+chipset atom dans la meme surface que 1 core2+ chipset. Ca donne un avantage de 1.4x en densite.

    Je pars bien sur du principe que la memoire est de meme type pour tout le monde, ce qui n'est pas exactement le cas. En pratique avoir plus de core avec des besoins en bande passante inferieure permet de reduire frequence et voltage sur les dimms et au final grapiller encore un peu de power.

    Si on regarde le prix, l'avantage reste au systeme a base d'atom.

    Bien sur j'ai compare peak flop, ce qui est une assez bonne mesure pour linpak qui passe son temps a faire des produits matrices vecteur, blockes comme il faut pour les niveaux de cache donc la taille a peu d'importance. Apres ce qui compte c'est a quel point le reseau d'interconnection est bon et permet de scaler en fonction du nombre de cores. Avoir une machine plus dense permet pas mal d'economies sur le reseau d'interconnection, et je pense que c'est probablement la l'avantage majeur de leur systeme a base d'atom.

    Pour des applis qui sont moins dependantes de la performance peak, la difference de perf entre atom et core 2 devient plus importante, et il ne reste guere que l'avantage de la densite.
    fefe - Dillon Y'Bon

  27. #267
    Citation Envoyé par Yasko Voir le message
    C'est pertinent comme choix de monter des supercalculateurs basés sur Atom ?

    L'argument de la taille du cluster ne tient pas à mon avis, ils pourraient concevoir une carte basée sur un penryn qui ferait à peu près la même taille.
    Non, tu as vu la difference de taille du socket (des series Z)? Tu as un facteur 2 au minimum meme si tu redesigne tout pour la compacite, en pratique tu es plus pres de 4 si tu utilises des composants existant.


    Pour la dissipation, avec le WC, ca permet de déporter le problème.
    Quand tu depenses deja la moitie du cout de ton supercomputer pour le cooling, tu ne veux pas multiplier ce cout par 2 ou 3. Surtout que la maintenance d'un systeme de WC a cette echelle est pas facile ni donnee. La solution de dissipation par rack est probablement la meme entre atom et core 2 (a cause de l'augmentation de la densite avec les atom), donc au final si tu as moins de racks pour la meme performance tu depenses moins a refroidir.

    L'argument de la conso, mouais, OK ca consomme moins, mais en penryn energy efficient, on doit pouvoir atteindre un meilleur ratio perf/conso sur ce genre d'application ?
    Cf mes calculs approximatifs cis dessus: 30% de gain est loin d'etre negligeable a l'echelle d'un supercomputer.

    Les arguments de SGI (memory bandwith, etc) tiennent surtout du fait qu'il ont fortement augmenté le nombre de CPU, j'aurais bien aimé avoir les chiffres d'un blade avec le même nombre de CPU, mais avec des penryn mobile/EE.
    Tu ne peux pas mettre le meme nombre de penryn par blade... Donc leur argument tient a peu pres la route.
    fefe - Dillon Y'Bon

  28. #268
    Citation Envoyé par PeGGaaSuSS Voir le message
    Le premier transparent, j'ai cru qu'ils avaient pompe un slide du CELL (qui lui-meme avait du etre pompe ailleurs)
    On a une idee de la vitesse du ring bus ?

  29. #269
    Il manque le PPC a gauche
    fefe - Dillon Y'Bon

  30. #270
    Citation Envoyé par fefe Voir le message
    Non, tu as vu la difference de taille du socket (des series Z)? Tu as un facteur 2 au minimum meme si tu redesigne tout pour la compacite, en pratique tu es plus pres de 4 si tu utilises des composants existant.
    Oui, le socket de l'Atom est bien plus compact qu'un socket pour mobile ("Micro-FCPGA" après recherche). Ce qui m'a fait dire ça et c'est visible sur la photo, c'est que dans l'état actuel, le CPU n'occupe qu'une faible part sur une plateforme Atom (que ce soit en taille ou en conso), l'essentiel étant dédié au reste de la plateforme, le chipset pour l'essentiel.
    Une fois qu'Atom aura ses contrôleurs mémoire et bus externes intégrés, son avantage devrait être indiscutable (même si pour le coup, son socket devrait grossir), d'autant plus si dans l'état actuel, il a déjà un meilleur ratio flops/cm².
    Dernière modification par Yasko ; 25/11/2008 à 12h28.

Page 9 sur 19 PremièrePremière 1234567891011121314151617 ... DernièreDernière

Règles de messages

  • Vous ne pouvez pas créer de nouvelles discussions
  • Vous ne pouvez pas envoyer des réponses
  • Vous ne pouvez pas envoyer des pièces jointes
  • Vous ne pouvez pas modifier vos messages
  •