Crunchez vos adresses URL
|
Rejoignez notre discord
|
Hébergez vos photos
Page 2 sur 5 PremièrePremière 12345 DernièreDernière
Affichage des résultats 31 à 60 sur 131
  1. #31
    J'ai lu qu'il était partiellement synthétisable seulement. Je ne vais pas perdre mon temps à chercher, j'ai l'impression que toutes les infos sont floues et contradictoires de toute façon

  2. #32
    Je trouve Bobcat un peu décevant : http://www.anandtech.com/show/4023/t...-benchmarked/1
    Mais attendons d'en voir plus...

  3. #33
    C'est bien pour AMD, ils vont avoir une plateforme competitive pour netbooks maintenant, rien de phenomenal, mais des perfs CPU probablement au niveau de la prochaine generation d'Atom et des perfs GPU probablement au niveau de la prochaine generation (Sandy Bridge). Donc tant qu'ils arrivent avant ils se tailleront une belle part d'un marche ou ils etaient absents.
    fefe - Dillon Y'Bon

  4. #34

  5. #35
    Suite à l'ISSCC, quelques zolis dessins de Bulldozer chez Goto, dont des floorplans de la FPU avec légende (en anglais) :
    http://pc.watch.impress.co.jp/docs/c...04_430801.html

    L'article ne précise pas à quoi servent les 9 et 11 bits de marge dans les registres flottants. Les paris sont ouverts.

  6. #36
    La taille du décodeur et de la micro ROM est impressionnante...

    Pour les 9 et 11 bits, ça n'a aucun sens. C'est quoi "lower fp reg file" et "higher fp reg file" ? Lower part et higher part ? Donc on supposerait que c'est coupé en deux ? On pourrait imaginer que les bits en plus servent d'ID d'une forme ou d'une autre et qu'il en en faudrait 2 de plus pour le lower part qui en plus de faire des registres normaux ferait la stack 87 ? Ca me paraît idiot je vais me coucher

  7. #37
    Le decodeur fait aussi office de fetch, ca grossi un peu aussi quand tu dois gerer plus d'un thread.

    Edit: Des bits de guarde pour un FMA microcode (possiblement pour du flottants haute precision?) ? (je peux ajouter plus de parentheses et de points d'interrogation ??)
    Dernière modification par fefe ; 04/03/2011 à 08h27.
    fefe - Dillon Y'Bon

  8. #38
    Si j'ai bien compris, le FMA n'est pas microcodé et tout le pipe flottant tourne autour du fait qu'on a un FMA (genre la latence des FADD et FMUL est identique au FMA, soit 6 cycles). Puis les bits de garde, pourquoi il y en aurait plus pour les lower que pour les higher ? (d'autant que je ne pense pas qu'il y ait du FMA sur la stack 87 ).

    Quant au décodeur oui en effet. Et même si je trouve cette ROM bien grosse, ça reste quand même relativement petit par rapport au reste.

  9. #39
    Citation Envoyé par newbie06 Voir le message
    Pour les 9 et 11 bits, ça n'a aucun sens. C'est quoi "lower fp reg file" et "higher fp reg file" ? Lower part et higher part ? Donc on supposerait que c'est coupé en deux ?
    Oui, higher part pour traiter la partie haute des registres SSE et des demi-registres AVX, et lower part pour leur partie basse.
    Vu que la majorité des instructions n'implique pas de communication entre blocs de 64 bits, ça a un intérêt de splitter les registres pour les mettre plus près des unités de calcul. Et mettre l'unité qui fait les shuffles entre les deux.

    Du coup au niveau physique, ce n'est plus du SIMD-within-a-register, mais du vrai SIMD d'homme avec des PE séparés avec chacun leur banc de registre. (enfin de largeur 2 pour le moment )

    D'ailleurs, Intel fait un truc du même style avec AVX en 2x128-bit, non?
    Avec la circonstance aggravante qu'ils exposent ça plus ou moins au niveau architectural avec des instructions différentes pour les permute intra-blocs 128-bit et entre blocs 128-bit.

    On pourrait imaginer que les bits en plus servent d'ID d'une forme ou d'une autre et qu'il en en faudrait 2 de plus pour le lower part qui en plus de faire des registres normaux ferait la stack 87 ? Ca me paraît idiot je vais me coucher
    Oui, vu que la lower part gère le x87, ce n'est pas choquant qu'elle ait besoin de quelques bits de plus.

    Citation Envoyé par fefe Voir le message
    Edit: Des bits de guarde pour un FMA microcode (possiblement pour du flottants haute precision?) ? (je peux ajouter plus de parentheses et de points d'interrogation ??)
    Il faudrait beaucoup plus de bits de garde que ça pour un FMA microcodé : le double pour les mantisses pour le produit exact, +1 pour l'exposant pour la somme exacte des exposants. Au final si c'est pour doubler la largeur de tous les datapaths, autant payer un vrai FMA à 3 entrées.

    En fait la FPU du K7 avait bien des formats étendus dans les registres (multiplieur 76 bits pour les mantisses, pour un format d'environ 92 bits), pour la division en microcode.

    Sauf que depuis qu'ils ont un FMA, tout ça ne devrait plus servir. À part éventuellement quelques bits de garde pour l'exposant (comme sur IA-64).

    Sinon ça pourrait être des tags pour les nombres exceptionnels et les sous-normaux. Des PowerPC faisaient ça à une époque si je me rappelle bien. En SSE, c'est plus compliqué parce que les registres sont aliasés entre simple, double et entier, mais pas insurmontable a priori.

    Citation Envoyé par newbie06 Voir le message
    (d'autant que je ne pense pas qu'il y ait du FMA sur la stack 87 ).
    Si, il y en a qui ont osé commettre l'inimaginable:
    Spoiler Alert!
    VIA avec le Nano
    .
    Dans le contexte de la guéguerre entre Intel et AMD sur le nombre d'opérandes de l'instruction FMA, le coup de la stack x87 je trouve ça sublime.

  10. #40
    Dernière modification par Alexko ; 09/04/2011 à 12h31.
    Mon blog (absolument pas à jour) : Teχlog

  11. #41
    L'article de Franck :
    http://www.hardware.fr/articles/833-...bulldozer.html

    AMD évoque également la présence d'un trace-cache (un cache contenant des micro-instructions déjà décodées), permettant de diminuer les pénalités en cas d'erreur de prédiction de branchement. A noter qu'on retrouve la présence d'un tel cache dans le détecteur de boucles du Nehalem.
    Si je comprends bien ça ressemblerait donc plus à un loop buffer contenant des µops à la Nehalem qu'un vrai gros trace cache à la Netburst.

    Mais en quoi ça diminue la pénalité des erreurs de prédiction de branchement ? Le front-end fetche et décode les instructions des deux branches en parallèle pour remplir le trace cache ?

    Intéressant aussi, on a droit au retour de la vengeance du replay.

  12. #42
    C'est surtout sur Sandy Bridge que le cache de micro-op a fait son retour, non ? Et ma compréhension (limitée...) du loop buffer me fait penser que ça n'a rien à voir avec un trace cache. Bref, je ne vois pas en quoi en soit ça diminue la pénalité d'erreur de prédiction (faut aussi que je me couche, mon cerveau ne marche plus bien là).

  13. #43
    Bon eh bien BD est loin de casser des noisettes entre ses fesses. Le tout à comme une forte odeur de Netburst 2.0. Long pipe, archi des caches délirogène pour un CPU de 2010. Il faudrait également rappeler à AMD que depuis qu'Otellini à annoncé l'arret du P4 à genoux à l'IDF, le power, ça compte. Un point technique qui me turlupine : quelqu'un ici à une idée du fonctionnement du WCC (le Write Coealalalala Cache) ? L'espace de cache d'écriture censé interférer au niveau de la réplication dans le L2 des données du L1 en Write-through ? J'aimerais bien savoir une idée de la taille du WCC et des latences induites.

  14. #44
    Citation Envoyé par Doc TB Voir le message
    Bon eh bien BD est loin de casser des noisettes entre ses fesses. Le tout à comme une forte odeur de Netburst 2.0. Long pipe, archi des caches délirogène pour un CPU de 2010. Il faudrait également rappeler à AMD que depuis qu'Otellini à annoncé l'arret du P4 à genoux à l'IDF, le power, ça compte.
    A ce point-là ? C'est triste.

    Un point technique qui me turlupine : quelqu'un ici à une idée du fonctionnement du WCC (le Write Coealalalala Cache) ? L'espace de cache d'écriture censé interférer au niveau de la réplication dans le L2 des données du L1 en Write-through ? J'aimerais bien savoir une idée de la taille du WCC et des latences induites.
    4 KB, 4-way, "Software Optimization Guide for AMD Family 15h Processors", section 2.13.

  15. #45

  16. #46
    Les résultats sont si mauvais que ça ?
    Mon blog (absolument pas à jour) : Teχlog

  17. #47
    Ça dépend : le P4 avait des résultats mauvais à sa sortie ? Parfois oui, parfois non, selon les apps. Faut dire qu'un L1 de 16K en WT, fallait oser. Le probleme, c'est que le bullshit d'AMD sur le "First 8-Core CPU" va leur revenir dans la gueule à vitesse grand V. Les gens s'attendent à beaucoup pour un "8-Core", alors que si on leur avait dit la vérité, à savoir qu'il s'agit d'un 4-Core avec CMT, ils en auraient attendus moins.

  18. #48
    Malheureusement, qu'on compte 4 cores CMT ou 8, c'est quand même un die de 315 mm², bien plus gros que celui de Sandy Bridge, et sans IGP. Mais tu fais peut-être bien d'évoquer le Pentium 4. Après tout, c'est une architecture assez radicalement nouvelle, comme Netburst ; et à l'époque, le passage de Willamette à Northwood avait beaucoup amélioré les choses.
    Mon blog (absolument pas à jour) : Teχlog

  19. #49
    Dans un monde parfait, Piledriver est supposé être un « Enhanced Bulldozer ». Il n'y aura donc pas de révolution côté architecture, et il sera toujours gravé à 32 nanomètres.

    En face, Intel pense apparemment se défaire de Zambezi avec un simple i7-2700K. Il y'aura également le i7-3960X et ses petits frères, et quelques mois plus tard les Ivy Bridge.

    Tu vois ou je veux en venir ?

  20. #50
    Citation Envoyé par PeGGaaSuSS Voir le message
    Dans un monde parfait, Piledriver est supposé être un « Enhanced Bulldozer ». Il n'y aura donc pas de révolution côté architecture, et il sera toujours gravé à 32 nanomètres.

    En face, Intel pense apparemment se défaire de Zambezi avec un simple i7-2700K. Il y'aura également le i7-3960X et ses petits frères, et quelques mois plus tard les Ivy Bridge.

    Tu vois ou je veux en venir ?
    Non.

    Tout est question de prix. Bulldozer, c'est comme la TouchPad d'HP : à 399€, personne n'en voudra, à 99€, tout le monde se ruera dessus.

  21. #51
    En théorie, la comparaison est intéressante, sauf que HP a choisi ce prix pour liquider ses stocks. Et surtout, le moindre produit équivalent ou supérieur est quatre à cinq fois plus cher.

    La différence de rapport prix/performances, depuis à peu de chose près le lancement des premiers Phenom II, a toujours été trop faible à mon gout pour que ce soit vraiment intéressant d'opter pour de l'AMD.

    Pour limiter la casse financièrement, AMD a joué le coup du « un coeur de plus pour le même prix ». Quand tu vois leur part de marché depuis janvier 2009, clairement cette stratégie est un échec.

    Si les Zambezi talonnent vraiment Sandy Bridge, et qu'ils sont vraiment moins chers, peut-être qu'effectivement, ça pourrait être intéressant. Le problème c'est qu'aucune des informations qui ont fait surface depuis juin ne viennent pas confirmer cette théorie.

    Pour le marché mobile, les Llano ont effectivement l'air intéressant. Le problème est du côté des produits finis, et/ou de leur disponibilité. Il y a encore un mois en France, 99% des laptops en AMD c'était du premier prix. Même aux US ou il y a un peu plus de granularité, j'ai rien vu passer de vraiment attractif.

    En conclusion, la recette Radeon elle fonctionne parce que dans tous les cas, la GeForce équivalente est soit à portée de tir, soit derrière. Si Bulldozer peut en faire autant, nickel. Si ce n’est pas le cas...

  22. #52
    On commence à voir des prix...
    Ce genre de prix n'est pas bon signe... si ce CPU fonctionnait vraiment bien, les prix seraient plus élevés non?
    http://valid.x86-secret.com/cache/banner/313021.png

  23. #53
    Citation Envoyé par DJ_DaMS Voir le message
    On commence à voir des prix...
    Ce genre de prix n'est pas bon signe... si ce CPU fonctionnait vraiment bien, les prix seraient plus élevés non?
    Oui et non. Il est vrai que si Bulldozer était plus puissant, il serait proposé à un prix plus élevé, mais il ne faut pas oublier qu'AMD, en tant que « deuxième arrivée » sur le marché du haut de gamme, est contrainte d'anticiper la réaction d'Intel. Si AMD visait le même prix qu'un modèle Intel équivalent, Intel baisserait son prix de 10 % et ruinerait le lancement d'AMD. Donc il faut viser 10 à 15 % en-dessous des prix d'Intel.

    C'est une dynamique qu'on n'a malheureusement plus tellement coutume de voir sur le marché des processeurs, parce qu'AMD ne peut plus vraiment lutter depuis 2006 (Conroe), mais on observe fréquemment ce genre de chose sur les GPU.
    Mon blog (absolument pas à jour) : Teχlog

  24. #54
    Citation Envoyé par Alexko Voir le message
    Oui et non. Il est vrai que si Bulldozer était plus puissant, il serait proposé à un prix plus élevé, mais il ne faut pas oublier qu'AMD, en tant que « deuxième arrivée » sur le marché du haut de gamme, est contrainte d'anticiper la réaction d'Intel. Si AMD visait le même prix qu'un modèle Intel équivalent, Intel baisserait son prix de 10 % et ruinerait le lancement d'AMD. Donc il faut viser 10 à 15 % en-dessous des prix d'Intel.
    Intel proposant une gamme de CPU allant jusqu'à 500$ (j'écarte volontairement les modèles extrême à 900/1000$), il parait évidant qu'AMD ne peut pas lutter sur toute la gamme avec Zambezi, et ajuste donc les tarifs en fonction et délaissera encore le (très) haut de gamme. Quand la solution pour rendre un CPU intéressant est de le vendre à prix bas, c'est mauvais signe : tu fais ça quand tu peux pas faire autrement.
    Leur fameux "World's first native 8-core desktop" risque de peiner face aux quad du concurrent. Et le "power efficient design" de Zambezi risque d'être pas si bon qu'ils le prétendent. J'ai hâte de voir les tests dans 3 semaines.
    Dernière modification par Foudge ; 21/09/2011 à 22h49.

  25. #55
    Oui, si ces tarifs sont corrects, on peut attendre Zambezi au niveau d'un Core i7 à $300 grand maximum.
    Mon blog (absolument pas à jour) : Teχlog

  26. #56
    Ca fait pas bien cher pour un die de 315mm^2. J'espere pour eux qu'ils ont de bons yields parce que au final ils vendent un die 50% plus gros pour moins cher qu'Intel.

    Ce surcout tape directement dans les marges: 1/3 de moins de dies = 1/3 de moins d'argent pour le meme prix de fabrication. Le fait est que les marges brutes d'Intel sont souvent plus elevees que celles d'AMD (dans les 60% pour Intel contre dans les 40% pour AMD en prenant en compte la difference habituelle de prix entre les 2 marques). Si Intel vendait un die de la meme taille que Zambezi pour le prix de ses i7 ils diviseraient leurs marges par 2. Avec ces calculs on arrive vite a 10% ou 20% de marges pour Zambezi ce qui fait un peu peur. J'espere pour eux qu ils ecouleront l essentiel de leur production sur le marche des serveurs ou les marges sont nettement plus elevees.

    Pour les perfs j'attends de voir des mesures rigoureuses avant meme d'y reflechir .
    fefe - Dillon Y'Bon

  27. #57
    Citation Envoyé par fefe Voir le message
    Ca fait pas bien cher pour un die de 315mm^2. J'espere pour eux qu'ils ont de bons yields parce que au final ils vendent un die 50% plus gros pour moins cher qu'Intel.

    Ce surcout tape directement dans les marges: 1/3 de moins de dies = 1/3 de moins d'argent pour le meme prix de fabrication. Le fait est que les marges brutes d'Intel sont souvent plus elevees que celles d'AMD (dans les 60% pour Intel contre dans les 40% pour AMD en prenant en compte la difference habituelle de prix entre les 2 marques). Si Intel vendait un die de la meme taille que Zambezi pour le prix de ses i7 ils diviseraient leurs marges par 2. Avec ces calculs on arrive vite a 10% ou 20% de marges pour Zambezi ce qui fait un peu peur. J'espere pour eux qu ils ecouleront l essentiel de leur production sur le marche des serveurs ou les marges sont nettement plus elevees.

    Pour les perfs j'attends de voir des mesures rigoureuses avant meme d'y reflechir .
    Les rumeurs font état de yields autour de 50 % pour Llano (dixit Charlie) donc probablement moins pour Zambezi, qui est 40 % plus gros. Cela étant, AMD a un accord un peu spécial avec GloFo pour cette année, il me semble que seuls les « bons » dies sont facturés. Ça limite l'impact financier des mauvais yields, certes, mais ça ne supprime pas la contrainte de capacité qui en découle.

    Mais les 60 % de marge pour Intel c'est la marge brute moyenne, non ? J'imagine qu'elle est nettement plus élevée que ça pour le haut de gamme Sandy Bridge. D'ailleurs, le Core i5 2300 est actuellement listé à 177 $, contre 317 $ pour le Core i7 2600K, alors que c'est le même die ; et je doute qu'un Core i5 ait une marge inférieure à 40 %. C'est un peu ce qui sauve AMD, d'ailleurs, la volonté d'Intel de protéger ses marges plus que ses parts de marché — dans une certaine mesure, bien sûr.

    De mémoire, un wafer 40 nm coûtait environ 5000 $ il y a un an chez TSMC. En supposant un prix de 8000 $ pour un wafer 32 nm HK/MG SOI chez GloFo, et ~150 dies par wafer, ça fait 53 $ le die. Disons 75 $ parce que si AMD ne paie que les dies fonctionnels, le prix est peut-être un peu majoré pour compenser. Ajoutons généreusement 20 $ pour les tests et le packaging, ça fait une estimation de 95 $.

    Donc si les prix vont de 175 $ à 250 $, ça fait 46 à 62 % de marge. Pas génial, mais gérable, d'autant plus que mes estimations sont probablement assez pessimistes.
    Mon blog (absolument pas à jour) : Teχlog

  28. #58
    Citation Envoyé par Alexko Voir le message
    Les rumeurs font état de yields autour de 50 % pour Llano (dixit Charlie) donc probablement moins pour Zambezi, qui est 40 % plus gros.
    Il me semble que ce qui plombe le rendement des Llano c'est la partie GPU ; vu que le Zambezi en est dépourvu, et même s'il est plus gros, on peut espérer que les rendements n'en soit pas trop affectés.
    Et je me demande si Intel cherche à préserver ses marges ou s'il veut maintenir le marché en vie, en laissant un peu d'air à AMD, afin de ne pas aller au devant d'ennuis

  29. #59
    Citation Envoyé par Narm Voir le message
    Il me semble que ce qui plombe le rendement des Llano c'est la partie GPU ; vu que le Zambezi en est dépourvu, et même s'il est plus gros, on peut espérer que les rendements n'en soit pas trop affectés.
    Oui, mais je crois que ça vient de BS News, ça, non ? Enfin Charlie dément, et j'aurais tendance à le croire, notamment parce qu'il doit être un peu plus facile de s'appuyer sur la redondance pour un GPU. Enfin tout ça reste très spéculatif.

    Citation Envoyé par Narm Voir le message
    Et je me demande si Intel cherche à préserver ses marges ou s'il veut maintenir le marché en vie, en laissant un peu d'air à AMD, afin de ne pas aller au devant d'ennuis
    Bah ils ont déjà plus de 80 % de parts de marché. Même s'ils arrivaient à capturer tout le marché, ça ne représenterait même pas + 25 %. Est-ce que ça vaut le coup de casser les prix pour ça ?
    Mon blog (absolument pas à jour) : Teχlog

  30. #60
    Le fait de ne payer que les bons dies n'augmente pas les marges si le yield est correct en theorie, enfin c'est meme l'inverse ca les reduit. C'est juste une gestion du risque pour eviter une situation catastrophique pour AMD alors que le probleme est chez Glofo. Ce genre d'assurance se paye quand tout va bien donc quand le yield est eleve, au final tu payes plus cher.
    Oui je partais de la marge brute moyenne, et le die moyen de Sandy Bridge n'est certainement pas vendu 300$. MAis si tu parts du principe que AMD met un die concurent 50% plus gros au meme prix face a chacun des dies Sandy Bridge, mon analyse reste correcte. Au final si le marche achete la meme proportion de dies de chaque gamme chez AMD que chez Intel AMD se retrouve avec plus beaucoup de marges au final. Le probleme est qu'en general ils vendent plus de dies bas de gamme en proportion qu'Intel ce qui reduit encore les marges. Si tu ne fais que 40% a 60% sur tes dies haut de gamme que tu vends peu, il ne va pas te rester grand chose de profit sur le milieu de gamme...

    Bref, il n'y a que 2 choses qui peuvent permettre a AMD de faire de l'argent avec cette architecture:
    -si elle est vraiment bonne et leur permet de vendre une proportion plus importante de dies haut de gamme
    -si ils la shrink rapidement pour revenir a des couts raisonables (vu les prix annonces je parts du principe qu'ils seront au moins corrects d'un point de vue power/perf)

    Il faut voir que leur competition actuelle est un TOC d'Intel, c'est a dire des dies qui historiquement sont les moins profitables (ancien process plus de transistors pour les changements de microarchitecture). La periode de TOC est la periode ou Intel est generalement vulnerable d'un point de vue prix/profits et moins vulnerable du cote performance.

    Une fois le TIC sur le marche (Ivy Bridge) ils vont devoir se battre contre un processeur qui peut etre vendu entre 20 et 40% moins cher que le TOCK precedent, donc a moins d'etre meilleur en perf absolues ca va etre tres difficile de rendre ce processeur profitable si Intel decide de baisser les prix (en gros ce qui est bon pour le client est mauvais pour AMD donc AMD "beneficie" des politiques tarifaires d'Intel...).
    fefe - Dillon Y'Bon

Règles de messages

  • Vous ne pouvez pas créer de nouvelles discussions
  • Vous ne pouvez pas envoyer des réponses
  • Vous ne pouvez pas envoyer des pièces jointes
  • Vous ne pouvez pas modifier vos messages
  •