Elapsed Matmul_Query: 590482 us
Elapsed Matmul_Key: 588490 us
Elapsed Matmul_Value: 0 us
Elapsed Transpose: 15117 us
Elapsed Matmul_QKt: 2604701 us
Elapsed Softmax: 265644 us
Elapsed Matmul_Output: 0 us
Validation results:
Softmax (rows sum & D) : OK
Output all finite: YES
* [MAQAO] Info: Dumping samples (host ip-172-31-9-132.ec2.internal, process 11428)
* [MAQAO] Info: Dumping source info for callchain nodes (host ip-172-31-9-132.ec2.internal, process 11428)
* [MAQAO] Info: Building/writing metadata (host ip-172-31-9-132.ec2.internal)
* [MAQAO] Info: Finished collect step (host ip-172-31-9-132.ec2.internal, process 11428)
Your experiment path is /home/eoseret/llm-attention/OV1_128_32_10K_G4_native/tools/lprof_run_0
To display your profiling results:
##################################################################################################################################
# LEVEL | REPORT | COMMAND #
##################################################################################################################################
# Functions | Cluster-wide | maqao lprof -df xp=/home/eoseret/llm-attention/OV1_128_32_10K_G4_native/tools/lprof_run_0 #
# Functions | Per-node | maqao lprof -df -dn xp=/home/eoseret/llm-attention/OV1_128_32_10K_G4_native/tools/lprof_run_0 #
# Functions | Per-process | maqao lprof -df -dp xp=/home/eoseret/llm-attention/OV1_128_32_10K_G4_native/tools/lprof_run_0 #
# Functions | Per-thread | maqao lprof -df -dt xp=/home/eoseret/llm-attention/OV1_128_32_10K_G4_native/tools/lprof_run_0 #
# Loops | Cluster-wide | maqao lprof -dl xp=/home/eoseret/llm-attention/OV1_128_32_10K_G4_native/tools/lprof_run_0 #
# Loops | Per-node | maqao lprof -dl -dn xp=/home/eoseret/llm-attention/OV1_128_32_10K_G4_native/tools/lprof_run_0 #
# Loops | Per-process | maqao lprof -dl -dp xp=/home/eoseret/llm-attention/OV1_128_32_10K_G4_native/tools/lprof_run_0 #
# Loops | Per-thread | maqao lprof -dl -dt xp=/home/eoseret/llm-attention/OV1_128_32_10K_G4_native/tools/lprof_run_0 #
##################################################################################################################################