options

Executable Output

Elapsed Matmul_Query: 590482 us
Elapsed Matmul_Key: 588490 us
Elapsed Matmul_Value: 0 us
Elapsed Transpose: 15117 us
Elapsed Matmul_QKt: 2604701 us
Elapsed Softmax: 265644 us
Elapsed Matmul_Output: 0 us
Validation results:
  Softmax (rows sum & D) : OK
  Output all finite: YES

* [MAQAO] Info: Dumping samples (host ip-172-31-9-132.ec2.internal, process 11428)
* [MAQAO] Info: Dumping source info for callchain nodes (host ip-172-31-9-132.ec2.internal, process 11428)
* [MAQAO] Info: Building/writing metadata (host ip-172-31-9-132.ec2.internal)
* [MAQAO] Info: Finished collect step (host ip-172-31-9-132.ec2.internal, process 11428)


Your experiment path is /home/eoseret/llm-attention/OV1_128_32_10K_G4_native/tools/lprof_run_0

To display your profiling results:
##################################################################################################################################
#    LEVEL    |     REPORT     |                                             COMMAND                                             #
##################################################################################################################################
#  Functions  |  Cluster-wide  |  maqao lprof -df xp=/home/eoseret/llm-attention/OV1_128_32_10K_G4_native/tools/lprof_run_0      #
#  Functions  |  Per-node      |  maqao lprof -df -dn xp=/home/eoseret/llm-attention/OV1_128_32_10K_G4_native/tools/lprof_run_0  #
#  Functions  |  Per-process   |  maqao lprof -df -dp xp=/home/eoseret/llm-attention/OV1_128_32_10K_G4_native/tools/lprof_run_0  #
#  Functions  |  Per-thread    |  maqao lprof -df -dt xp=/home/eoseret/llm-attention/OV1_128_32_10K_G4_native/tools/lprof_run_0  #
#  Loops      |  Cluster-wide  |  maqao lprof -dl xp=/home/eoseret/llm-attention/OV1_128_32_10K_G4_native/tools/lprof_run_0      #
#  Loops      |  Per-node      |  maqao lprof -dl -dn xp=/home/eoseret/llm-attention/OV1_128_32_10K_G4_native/tools/lprof_run_0  #
#  Loops      |  Per-process   |  maqao lprof -dl -dp xp=/home/eoseret/llm-attention/OV1_128_32_10K_G4_native/tools/lprof_run_0  #
#  Loops      |  Per-thread    |  maqao lprof -dl -dt xp=/home/eoseret/llm-attention/OV1_128_32_10K_G4_native/tools/lprof_run_0  #
##################################################################################################################################

×