Crunchez vos adresses URL
|
Calculez la conso électrique de votre PC
|
Hébergez vos photos
Page 18 sur 18 PremièrePremière ... 8101112131415161718
Affichage des résultats 511 à 530 sur 530

Discussion: Intel et Larrabee

  1. #511

  2. #512
    Citation Envoyé par newbie06 Voir le message
    Han! Il y a un gars qui a fait ma filière d'école d'ingé qui bosse là bas maintenant, j'avais vite fait regardé le site mais je savais pas si c'était un truc legit.


  3. #513
    Oui, c'est legit : ils ont assez de cash pour survivre jusqu'à la fin du mois, et ce depuis plusieurs années. Le MPPA-256 (Andey) existe pour de vrai depuis 2 ans. La prochaine version Bostan qui est bien plus mieux devrait sortir incessamment sous peu. C'est un processeur embarqué plus qu'un Xeon Phi, la conso du chip à 288 cœurs est entre 5 et 10W.
    D'ailleurs il y a un topic dessus
    http://forum.canardpc.com/threads/75...itectures-VLIW

  4. #514
    Citation Envoyé par Møgluglu Voir le message
    Oui, c'est legit : ils ont assez de cash pour survivre jusqu'à la fin du mois, et ce depuis plusieurs années. Le MPPA-256 (Andey) existe pour de vrai depuis 2 ans. La prochaine version Bostan qui est bien plus mieux devrait sortir incessamment sous peu. C'est un processeur embarqué plus qu'un Xeon Phi, la conso du chip à 288 cœurs est entre 5 et 10W.
    D'ailleurs il y a un topic dessus
    http://forum.canardpc.com/threads/75...itectures-VLIW
    Fin du HS mais apparemment, il y a pas mal d'anciens Ensimag par là bas, ils ont aussi fait une conférence technologique en 2013 et ont pris des doctorants et/ou stagiaires de l'IMAG / VERIMAG chez eux. Je note et vais lire le topic linké .


  5. #515
    Après l'ISC Intel publie les infos sur Knights Landing, notamment l'Optimization Guide :
    https://software.intel.com/en-us/xeo...re-programming

    Confirmation que la latence de la MCDRAM est supérieure à la DDR.


    Vous avez bien mis des VZEROUPPER partout dans votre code comme on vous a dit ? Bah arrêtez tout :
    The Intel® Xeon Phi™ processor does not have the same restrictions on mixing SSE and AVX code that Xeon processors have. Because of this, insertion of VZEROUPPER* is almost always a mistake for the Intel® Xeon Phi™ processor.

  6. #516
    On te l'a dit c'est du x86, c'est magique ca marche partout, tout le temps. Pas besoin de recompiler, encore moins de toucher le code

    Je regardais ce matin ce guide et je me posais une question bete : l'exemple DGEMM a la fin utilise des prefetch L1. Est-ce uniquement pour chauffer les TLB en cas de cross 4 KB, ou bien une autre limitation du prefetch HW L1 ?

    PS - Le graphe sans legende sur les axes

  7. #517
    Oui, et d'après la section 6.4, le prefetcher hardware ne franchit jamais les limites de 4K, quelle que soit la taille des pages. Vu qu'avec des vecteurs de 512 bits on arrive assez vite à 4K, ça vaut le coup d'avoir un software prefetch qui va accéder le TLB et aider le prefetcher hardware à démarrer sur la page suivante.

  8. #518
    Citation Envoyé par Møgluglu Voir le message
    Oui, et d'après la section 6.4, le prefetcher hardware ne franchit jamais les limites de 4K, quelle que soit la taille des pages. Vu qu'avec des vecteurs de 512 bits on arrive assez vite à 4K, ça vaut le coup d'avoir un software prefetch qui va accéder le TLB et aider le prefetcher hardware à démarrer sur la page suivante.
    Je me demande ce qui empeche Intel de faire du prefetch cross page. Des ressources trop limitees dans le hardware de page table walk ? Ou bien ont-il estime que le retour sur investissement est trop mauvais ?

  9. #519
    Citation Envoyé par Møgluglu Voir le message
    Confirmation que la latence de la MCDRAM est supérieure à la DDR.
    Ca semble logique, non?
    C'est pas les mêmes caractéristiques attendues que pour la mémoire GPU (latence cachée par la multiplicité des threads) ?


    Edit: Ah ben merde

    http://www.ladepeche.fr/article/2016...-se-taire.html
    Licenciements chez Intel : les salariés priés de se taire
    Dernière modification par vectra ; 30/06/2016 à 11h46.

  10. #520
    Citation Envoyé par vectra Voir le message
    Ca semble logique, non?
    C'est pas les mêmes caractéristiques attendues que pour la mémoire GPU (latence cachée par la multiplicité des threads) ?


    Edit: Ah ben merde

    http://www.ladepeche.fr/article/2016...-se-taire.html
    Licenciements chez Intel : les salariés priés de se taire
    Ah ben dis donc je bosse juste en face de chez eux.

    A Toulouse c'est anciennement un site qui appartenait à Motorola, du coup c'est l'activité "téléphones portables" qui sent le sapin chez Intel.
    Citation Envoyé par Sidus Preclarum Voir le message
    Ben du caramel pas sucré alors...
    "Avant, j'étais dyslexique, masi aujorudh'ui je vasi meiux."

  11. #521
    Citation Envoyé par Lazyjoe Voir le message
    A Toulouse c'est anciennement un site qui appartenait à Motorola, du coup c'est l'activité "téléphones portables" qui sent le sapin chez Intel.
    Que l'activite chip telephone portable sent le sapin on le sait officiellement depuis des mois.

    Ce qui parait etrange c'est qu'Intel ferme des sites dont la specialite est le modem, activite qu'Intel n'abandonne pas. Peut-etre les employes recoivent-ils des propositions de relocalisation ?

  12. #522
    A priori ils y a une volonté de ramener les gens vers les gros centres, ce qui suggère que l'activité se déplace mais n'est pas abandonnée.
    Après, je ne sais pas ce que le management propose aux employés.
    On ne parlera jamais assez des RISC liés à la vente d'ARM.

  13. #523
    Tiens tiens: http://www.intel.com/content/dam/www...duct-brief.pdf

    On y apprend qu'en fait les frequences en charge d'AVX sont 200 Mhz en-dessous des frequences annoncees par Intel. Du coup les peaks DP donnes sont faux et aucun des KNL n'atteint 3 TFLOPS (enfin si de justesse pour le 7290).

    Je suis un peu surpris qu'Intel ait joue a ce jeu-la.

  14. #524
    Bah, 2,9952 TFLOPS, pour peu que tu aies une carte mère Asus avec les fréquences spéciales échantillon de presse, ça fait plus de 3.

  15. #525
    Citation Envoyé par Møgluglu Voir le message
    Bah, 2,9952 TFLOPS, pour peu que tu aies une carte mère Asus avec les fréquences spéciales échantillon de presse, ça fait plus de 3.
    Ouai mais c'est moche, Intel pretendait que le 7290 faisait 3.46 TFLOPS.

    Ca explique l'efficacite moyenne vue sur TOP500.

  16. #526
    Citation Envoyé par newbie06 Voir le message
    Tiens tiens: http://www.intel.com/content/dam/www...duct-brief.pdf

    On y apprend qu'en fait les frequences en charge d'AVX sont 200 Mhz en-dessous des frequences annoncees par Intel. Du coup les peaks DP donnes sont faux et aucun des KNL n'atteint 3 TFLOPS (enfin si de justesse pour le 7290).

    Je suis un peu surpris qu'Intel ait joue a ce jeu-la.
    C'était détaillé quelque part dans le test d'Anandtech qu'à partir de Skylake, Intel baisse les fréquences max lors de load à base d'AVX, et qu'ils arrivent maintenant à le faire coeur par coeur (un coeur à -200Mhz par rapport au max si il execute de l'AVX pendant que le reste est à fond). Et c'est donc aussi sur Xeon Phi KNL.

    EDIT : Je trouve plus sur anandtech, donc soit je l'ai revé (mais je pense pas) soit c'était pas sur skylake ou alors pas sur anandtech.

    EDIT2 : C'était pas à partir de Skylake mais Broadwell, et c'est cité sur la review de Broadwell-E :

    On Haswell, one AVX instruction on one core forced all cores on the same socket to slow down their clockspeed by around 2 to 4 speed bins (-200,-400 MHz) for at least 1 ms, as AVX has a higher power requirement that reduces how much a CPU can turbo. On Broadwell, only the cores that run AVX code will be reducing their clockspeed, allowing the other cores to run at higher speeds.
    http://www.anandtech.com/show/10158/...e5-v4-review/3

    Mais du coup sur une machine qui fait tourner du code avec de l'AVX tout le temps, ça réduit pas mal les perfs.

    En ésperant que sur KNL, c'est un coeur à la fois qui baisse de fréquence et pas les 72 coeurs quand il y en a un qui fait tourner de l'AVX.


  17. #527
    Citation Envoyé par gregounech Voir le message
    EDIT2 : C'était pas à partir de Skylake mais Broadwell, et c'est cité sur la review de Broadwell-E :

    http://www.anandtech.com/show/10158/...e5-v4-review/3
    Pour KNL, ils ont donne des chiffres qui etaient plus hauts, en accord avec une frequence de base maintenue, c'est bien le souci.

    Mais du coup sur une machine qui fait tourner du code avec de l'AVX tout le temps, ça réduit pas mal les perfs.

    En ésperant que sur KNL, c'est un coeur à la fois qui baisse de fréquence et pas les 72 coeurs quand il y en a un qui fait tourner de l'AVX.
    C'est du Turbo 2.0 pas 3.0, donc meme frequence pour tout le monde.

  18. #528
    Citation Envoyé par newbie06 Voir le message
    Pour KNL, ils ont donne des chiffres qui etaient plus hauts, en accord avec une frequence de base maintenue, c'est bien le souci.


    C'est du Turbo 2.0 pas 3.0, donc meme frequence pour tout le monde.
    Ah d'accord, je n'avais pas suivi, c'est bête.


  19. #529
    C'est pas comme si c'était un processeur fait pour faire tourner de l'AVX-512 sur tous les cores en même temps, non plus.

  20. #530
    Ca te fait pas rever 72 coeurs Silvermont sur une puce?

Règles de messages

  • Vous ne pouvez pas créer de nouvelles discussions
  • Vous ne pouvez pas envoyer des réponses
  • Vous ne pouvez pas envoyer des pièces jointes
  • Vous ne pouvez pas modifier vos messages
  •