]> Git Repo - linux.git/commitdiff
perf/x86/intel/lbr: Limit LBR accesses to TOS in callstack mode
authorAndi Kleen <[email protected]>
Thu, 28 May 2015 04:13:18 +0000 (21:13 -0700)
committerIngo Molnar <[email protected]>
Tue, 4 Aug 2015 08:16:59 +0000 (10:16 +0200)
In callstack mode the LBR is not a ring buffer, but a stack that grows up
and down. This means in  this case we don't need to access all LBRs, only the
ones up to TOS. Do this optimization for the normal LBR read, and the context
switch save/restore code. For save/restore it can be done unconditionally, as
it only runs when call stack mode is active.

This recovers some of the cost of going to 32 LBRs on Skylake.

Signed-off-by: Andi Kleen <[email protected]>
Signed-off-by: Peter Zijlstra (Intel) <[email protected]>
Cc: Linus Torvalds <[email protected]>
Cc: Peter Zijlstra <[email protected]>
Cc: Thomas Gleixner <[email protected]>
Cc: [email protected]
Cc: [email protected]
Cc: [email protected]
Link: http://lkml.kernel.org/r/[email protected]
Signed-off-by: Ingo Molnar <[email protected]>
arch/x86/kernel/cpu/perf_event_intel_lbr.c

index a5bc424569b9aad9b36aee0b777f55a7299bad25..b2c9475b7ff24af15c08a68f1847eca336bbec97 100644 (file)
@@ -240,7 +240,7 @@ static void __intel_pmu_lbr_restore(struct x86_perf_task_context *task_ctx)
 
        mask = x86_pmu.lbr_nr - 1;
        tos = intel_pmu_lbr_tos();
-       for (i = 0; i < x86_pmu.lbr_nr; i++) {
+       for (i = 0; i < tos; i++) {
                lbr_idx = (tos - i) & mask;
                wrmsrl(x86_pmu.lbr_from + lbr_idx, task_ctx->lbr_from[i]);
                wrmsrl(x86_pmu.lbr_to + lbr_idx, task_ctx->lbr_to[i]);
@@ -263,7 +263,7 @@ static void __intel_pmu_lbr_save(struct x86_perf_task_context *task_ctx)
 
        mask = x86_pmu.lbr_nr - 1;
        tos = intel_pmu_lbr_tos();
-       for (i = 0; i < x86_pmu.lbr_nr; i++) {
+       for (i = 0; i < tos; i++) {
                lbr_idx = (tos - i) & mask;
                rdmsrl(x86_pmu.lbr_from + lbr_idx, task_ctx->lbr_from[i]);
                rdmsrl(x86_pmu.lbr_to + lbr_idx, task_ctx->lbr_to[i]);
@@ -425,8 +425,12 @@ static void intel_pmu_lbr_read_64(struct cpu_hw_events *cpuc)
        u64 tos = intel_pmu_lbr_tos();
        int i;
        int out = 0;
+       int num = x86_pmu.lbr_nr;
 
-       for (i = 0; i < x86_pmu.lbr_nr; i++) {
+       if (cpuc->lbr_sel->config & LBR_CALL_STACK)
+               num = tos;
+
+       for (i = 0; i < num; i++) {
                unsigned long lbr_idx = (tos - i) & mask;
                u64 from, to, mis = 0, pred = 0, in_tx = 0, abort = 0;
                int skip = 0;
This page took 0.055789 seconds and 4 git commands to generate.