Premium Reseller

Modele de toiture

Un noyau ou une application donné est alors caractérisé par un point donné par son intensité arithmétique i {displaystyle i} (sur l`axe x). La performance réalisable P {displaystyle P} est ensuite calculée en dessinant une ligne verticale qui frappe la courbe roofline. Donc. le noyau ou l`application est dit lié à la mémoire si I ≤ π/β {displaystyle Ileq pi/beta}. Inversement, si je ≥ π/β {displaystyle Igeq pi/beta}, le calcul est dit lié au calcul. [1] si l`hypothèse idéale que l`intensité arithmétique est uniquement une fonction du noyau est supprimée, et la topologie de cache-et donc manque de cache-est pris en compte, l`intensité arithmétique devient clairement dépendante d`une combinaison de noyau et Architecture. Cela peut entraîner une dégradation des performances en fonction de l`équilibre entre l`intensité arithmétique résultante et le point de crête. Contrairement aux plafonds «appropriés», les lignes qui en résultent sur le tracé de roofline sont des barrières verticales par lesquelles l`intensité arithmétique ne peut pas passer sans optimisation. Pour cette raison, ils sont référencés comme des murs de localité ou des murs d`intensité arithmétique.

3 Le tracé de roofline peut être élargi sur trois aspects différents: la communication, l`ajout des plafonds de bande passante; calcul, en ajoutant les plafonds dits «in-Core»; et localité, en ajoutant les murs de la localité. En outre, le modèle a été étendu pour mieux adapter les architectures spécifiques et les caractéristiques connexes, telles que les FPGAs. [11] un exemple de modèle de roofline avec des plafonds dans le noyau ajoutés, où les deux plafonds ajoutés représentent l`absence de parallélisme de niveau d`instruction et de parallélisme de niveau de tâche. Depuis son introduction [3], [4], le modèle a été étendu pour tenir compte d`un ensemble plus large de métriques et de goulets d`étranglement liés au matériel. Déjà disponible dans la littérature, il existe des extensions qui tiennent compte de l`impact de l`organisation NUMA de la mémoire [6], de l`exécution hors ordre [9], des latences de mémoire [9], [10] et de modéliser à un grain plus fin la hiérarchie du cache [5] [9] afin de mieux comprendre ce qui limite réellement les performances et piloter le processus d`optimisation. Le processus de modélisation du toit AppliCad 3-D et les caractéristiques permettent une entrée rapide et facile des plans de toiture les plus complexes, quelle que soit la créativité de l`architecte ou du concepteur. Des dormeurs complexes, de multiples hauteurs d`avant-toit, des tourelles et des vérandas sont facilement accessibles. Et quand un plan facile arrive, les outils d`entrée rapide AppliCad vous permettent de faire terminer le travail en quelques minutes. Il n`y a pas de toit que nous ne pouvons pas modéliser. Si elle peut être construite, alors nous avons les outils dans le processus de modélisation de toit pour le modéliser facilement. Le modèle de ligne de toit le plus basique peut être visualisé en traçant les performances en virgule flottante en fonction de la performance de la machine Peak [vague] [clarification nécessaire], de la bande passante maximale de la machine et de l`intensité arithmétique.

La courbe résultante est effectivement une performance liée sous laquelle le noyau ou les performances de l`application existe, et comprend deux plafonds de performance spécifiques à la plate-forme [clarification nécessaire]: un plafond dérivé de la bande passante mémoire et un dérivé de la performances maximales du processeur (voir figure à droite). Exemple d`un modèle roofline avec des plafonds de bande passante supplémentaires. Dans ce modèle, les deux plafonds supplémentaires représentent l`absence de prérécupération logicielle et l`organisation NUMA de la mémoire. Un exemple de modèle roofline avec des murs de localité. Le mur étiqueté comme 3 C désigne la présence des trois types de cache manque: obligatoire, la capacité et les échecs de conflit. Le mur étiqueté comme 2 C représentent la présence soit obligatoire et la capacité ou obligatoire et manque de conflit. Le dernier mur indique la présence de manque juste obligatoire. La ligne de toit naïve [3] est obtenue en appliquant une analyse simple liée et goulot d`étranglement. [8] dans cette formulation du modèle roofline, il n`y a que deux paramètres, les performances maximales et la bande passante maximale de l`architecture spécifique, et une variable, l`intensité arithmétique.