Elapsed Matmul_Query: 756416 us
Elapsed Matmul_Key: 748277 us
Elapsed Matmul_Value: 0 us
Elapsed Transpose: 24548 us
Elapsed Matmul_QKt: 3420883 us
Elapsed Softmax: 206354 us
Elapsed Matmul_Output: 0 us
Validation results:
Softmax (rows sum & D) : OK
Output all finite: YES
* [MAQAO] Info: Dumping samples (host ip-172-31-38-240.ec2.internal, process 8087)
* [MAQAO] Info: Dumping source info for callchain nodes (host ip-172-31-38-240.ec2.internal, process 8087)
* [MAQAO] Info: Building/writing metadata (host ip-172-31-38-240.ec2.internal)
* [MAQAO] Info: Finished collect step (host ip-172-31-38-240.ec2.internal, process 8087)
Your experiment path is /home/eoseret/llm-attention/OV1_128_32_10K_G3_native/tools/lprof_run_0
To display your profiling results:
##################################################################################################################################
# LEVEL | REPORT | COMMAND #
##################################################################################################################################
# Functions | Cluster-wide | maqao lprof -df xp=/home/eoseret/llm-attention/OV1_128_32_10K_G3_native/tools/lprof_run_0 #
# Functions | Per-node | maqao lprof -df -dn xp=/home/eoseret/llm-attention/OV1_128_32_10K_G3_native/tools/lprof_run_0 #
# Functions | Per-process | maqao lprof -df -dp xp=/home/eoseret/llm-attention/OV1_128_32_10K_G3_native/tools/lprof_run_0 #
# Functions | Per-thread | maqao lprof -df -dt xp=/home/eoseret/llm-attention/OV1_128_32_10K_G3_native/tools/lprof_run_0 #
# Loops | Cluster-wide | maqao lprof -dl xp=/home/eoseret/llm-attention/OV1_128_32_10K_G3_native/tools/lprof_run_0 #
# Loops | Per-node | maqao lprof -dl -dn xp=/home/eoseret/llm-attention/OV1_128_32_10K_G3_native/tools/lprof_run_0 #
# Loops | Per-process | maqao lprof -dl -dp xp=/home/eoseret/llm-attention/OV1_128_32_10K_G3_native/tools/lprof_run_0 #
# Loops | Per-thread | maqao lprof -dl -dt xp=/home/eoseret/llm-attention/OV1_128_32_10K_G3_native/tools/lprof_run_0 #
##################################################################################################################################