CapFrameX est plutôt pas mal, il expose notamment la métrique GPU busy de PresentMon et permet d'enregistrer les données. C'est ce que j'utilise depuis pas mal de temps.
https://www.capframex.com/
Sinon autant utiliser directement l'interface graphique de PresentMon depuis les dernières versions, mais je n'ai pas testé.
C'est un outil open source d'Intel, il y a une présentation ici https://game.intel.com/us/stories/intel-presentmon/
https://github.com/GameTechDev/PresentMon d'ailleurs les outils d'AMD et Nvidia utilisent cette API, je suppose qu'ils participent aussi à son développement
En gros GPU Busy indique le temps qu'il faut au GPU pour rendre la frame, indépendamment du timing de l'affichage si on a un cap de FPS ou autre. En VR on a aussi ce genre de métriques depuis 2016, nécessaire parce que le frametime est fixe et strict (sinon).
Si le temps GPU Busy est identique au frametime d'affichage, c'est le GPU qui plafonne.
Ils en ont parlé chez Gamers Nexus notamment: présentation générale https://www.youtube.com/watch?v=5hAy5V91Hr4, présentation d'autres métriques qu'ils ont ajouté dans la version 2.0 https://www.youtube.com/watch?v=C_RO8bJop8o
Et ce qu'en pense Digital Foundry (plus intéressés par l'aspect moteur des jeux) https://www.youtube.com/watch?v=muwoYpF-MtY et exemple d'usage concret https://www.youtube.com/watch?v=ExEViJ5RcSI