Ну они разные бывают. Я например, использую коллгринд. Запускается
valgrind --tool=callgrind binaryExecutableName someBinaryExecutableParams
Потом то что получилось на выходе отправляю в KCachegrind и там уже все наглядно показывается, какой метод сколько отожрал времени и тд.