title image


Smiley an alle Beteiligten...
... ich habe den Code noch etwas optimieren können. Die Umstellung auf Integer war eher eine Verschlimmbesserung. Anscheinend ist es von Vorteil Integer und Float zu kombinieren sodaß ALU und FPU mehr oder weniger gleichzeitig genutzt werden können. Der Einsatz von Pointern auf die verwendeten Arrays brachte nochmal einen Performanceschub. Was ich nicht gedacht hätte war daß auch die Reihenfolge der Variablendeklarationen einen Einfluß hat. Scheint aber irgendwie mit den Cache-Lines der CPU zusammenzuhängen. Das brachte eine Verbesserung von 149 auf 145 Sekunden bei einer Teilrechnung. Insgesamt komme ich jetzt auf über 8 Mio. Berechnungen pro Sekunde.



Im Moment versuche ich mich gerade mit Intels VTune und Thread-Profiler, mal schauen ob ich damit noch Optimierungsmöglichkeiten herausfinde.



Grüße

Thinner

Das Gewissen verhindert nicht die Sünde. Es verdirbt nur die Freude daran.



geschrieben von

Login

E-Mail:
  

Passwort:
  

Beitrag anfügen

Symbol:
 
 
 
 
 
 
 
 
 
 
 
 
 

Überschrift: