* [MAQAO] Info: Detected 1 Lprof instances in ip-172-31-35-140.ec2.internal.
If this is incorrect, rerun with number-processes-per-node=X
{"n_kv_max": 16384, "n_batch": 2048, "n_ubatch": 512, "flash_attn": -1, "is_pp_shared": 0, "n_gpu_layers": -1, "n_threads": 1, "n_threads_batch": 1, "pp": 0, "tg": 128, "pl": 8, "n_kv": 1024, "t_pp": 0.000000, "speed_pp": nan, "t_tg": 227.581894, "speed_tg": 4.499479, "t": 227.581894, "speed": 4.499479}
Your experiment path is /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_0
To display your profiling results:
##########################################################################################################################################################################################################################################
# LEVEL | REPORT | COMMAND #
##########################################################################################################################################################################################################################################
# Functions | Cluster-wide | maqao lprof -df xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_0 #
# Functions | Per-node | maqao lprof -df -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_0 #
# Functions | Per-process | maqao lprof -df -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_0 #
# Functions | Per-thread | maqao lprof -df -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_0 #
# Loops | Cluster-wide | maqao lprof -dl xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_0 #
# Loops | Per-node | maqao lprof -dl -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_0 #
# Loops | Per-process | maqao lprof -dl -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_0 #
# Loops | Per-thread | maqao lprof -dl -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_0 #
##########################################################################################################################################################################################################################################
* [MAQAO] Info: Detected 1 Lprof instances in ip-172-31-35-140.ec2.internal.
If this is incorrect, rerun with number-processes-per-node=X
{"n_kv_max": 16384, "n_batch": 2048, "n_ubatch": 512, "flash_attn": -1, "is_pp_shared": 0, "n_gpu_layers": -1, "n_threads": 2, "n_threads_batch": 2, "pp": 0, "tg": 128, "pl": 8, "n_kv": 1024, "t_pp": 0.000000, "speed_pp": nan, "t_tg": 114.495514, "speed_tg": 8.943582, "t": 114.495514, "speed": 8.943582}
Your experiment path is /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_1
To display your profiling results:
##########################################################################################################################################################################################################################################
# LEVEL | REPORT | COMMAND #
##########################################################################################################################################################################################################################################
# Functions | Cluster-wide | maqao lprof -df xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_1 #
# Functions | Per-node | maqao lprof -df -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_1 #
# Functions | Per-process | maqao lprof -df -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_1 #
# Functions | Per-thread | maqao lprof -df -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_1 #
# Loops | Cluster-wide | maqao lprof -dl xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_1 #
# Loops | Per-node | maqao lprof -dl -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_1 #
# Loops | Per-process | maqao lprof -dl -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_1 #
# Loops | Per-thread | maqao lprof -dl -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_1 #
##########################################################################################################################################################################################################################################
* [MAQAO] Info: Detected 1 Lprof instances in ip-172-31-35-140.ec2.internal.
If this is incorrect, rerun with number-processes-per-node=X
{"n_kv_max": 16384, "n_batch": 2048, "n_ubatch": 512, "flash_attn": -1, "is_pp_shared": 0, "n_gpu_layers": -1, "n_threads": 4, "n_threads_batch": 4, "pp": 0, "tg": 128, "pl": 8, "n_kv": 1024, "t_pp": 0.000001, "speed_pp": 0.000000, "t_tg": 57.914219, "speed_tg": 17.681322, "t": 57.914219, "speed": 17.681322}
Your experiment path is /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_2
To display your profiling results:
##########################################################################################################################################################################################################################################
# LEVEL | REPORT | COMMAND #
##########################################################################################################################################################################################################################################
# Functions | Cluster-wide | maqao lprof -df xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_2 #
# Functions | Per-node | maqao lprof -df -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_2 #
# Functions | Per-process | maqao lprof -df -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_2 #
# Functions | Per-thread | maqao lprof -df -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_2 #
# Loops | Cluster-wide | maqao lprof -dl xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_2 #
# Loops | Per-node | maqao lprof -dl -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_2 #
# Loops | Per-process | maqao lprof -dl -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_2 #
# Loops | Per-thread | maqao lprof -dl -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_2 #
##########################################################################################################################################################################################################################################
* [MAQAO] Info: Detected 1 Lprof instances in ip-172-31-35-140.ec2.internal.
If this is incorrect, rerun with number-processes-per-node=X
{"n_kv_max": 16384, "n_batch": 2048, "n_ubatch": 512, "flash_attn": -1, "is_pp_shared": 0, "n_gpu_layers": -1, "n_threads": 8, "n_threads_batch": 8, "pp": 0, "tg": 128, "pl": 8, "n_kv": 1024, "t_pp": 0.000000, "speed_pp": nan, "t_tg": 29.657381, "speed_tg": 34.527660, "t": 29.657381, "speed": 34.527660}
Your experiment path is /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_3
To display your profiling results:
##########################################################################################################################################################################################################################################
# LEVEL | REPORT | COMMAND #
##########################################################################################################################################################################################################################################
# Functions | Cluster-wide | maqao lprof -df xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_3 #
# Functions | Per-node | maqao lprof -df -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_3 #
# Functions | Per-process | maqao lprof -df -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_3 #
# Functions | Per-thread | maqao lprof -df -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_3 #
# Loops | Cluster-wide | maqao lprof -dl xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_3 #
# Loops | Per-node | maqao lprof -dl -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_3 #
# Loops | Per-process | maqao lprof -dl -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_3 #
# Loops | Per-thread | maqao lprof -dl -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_3 #
##########################################################################################################################################################################################################################################
* [MAQAO] Info: Detected 1 Lprof instances in ip-172-31-35-140.ec2.internal.
If this is incorrect, rerun with number-processes-per-node=X
{"n_kv_max": 16384, "n_batch": 2048, "n_ubatch": 512, "flash_attn": -1, "is_pp_shared": 0, "n_gpu_layers": -1, "n_threads": 16, "n_threads_batch": 16, "pp": 0, "tg": 128, "pl": 8, "n_kv": 1024, "t_pp": 0.000001, "speed_pp": 0.000000, "t_tg": 15.764904, "speed_tg": 64.954407, "t": 15.764905, "speed": 64.954407}
Your experiment path is /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_4
To display your profiling results:
##########################################################################################################################################################################################################################################
# LEVEL | REPORT | COMMAND #
##########################################################################################################################################################################################################################################
# Functions | Cluster-wide | maqao lprof -df xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_4 #
# Functions | Per-node | maqao lprof -df -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_4 #
# Functions | Per-process | maqao lprof -df -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_4 #
# Functions | Per-thread | maqao lprof -df -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_4 #
# Loops | Cluster-wide | maqao lprof -dl xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_4 #
# Loops | Per-node | maqao lprof -dl -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_4 #
# Loops | Per-process | maqao lprof -dl -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_4 #
# Loops | Per-thread | maqao lprof -dl -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_4 #
##########################################################################################################################################################################################################################################
* [MAQAO] Info: Detected 1 Lprof instances in ip-172-31-35-140.ec2.internal.
If this is incorrect, rerun with number-processes-per-node=X
{"n_kv_max": 16384, "n_batch": 2048, "n_ubatch": 512, "flash_attn": -1, "is_pp_shared": 0, "n_gpu_layers": -1, "n_threads": 24, "n_threads_batch": 24, "pp": 0, "tg": 128, "pl": 8, "n_kv": 1024, "t_pp": 0.000000, "speed_pp": nan, "t_tg": 12.243090, "speed_tg": 83.639015, "t": 12.243090, "speed": 83.639015}
Your experiment path is /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_5
To display your profiling results:
##########################################################################################################################################################################################################################################
# LEVEL | REPORT | COMMAND #
##########################################################################################################################################################################################################################################
# Functions | Cluster-wide | maqao lprof -df xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_5 #
# Functions | Per-node | maqao lprof -df -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_5 #
# Functions | Per-process | maqao lprof -df -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_5 #
# Functions | Per-thread | maqao lprof -df -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_5 #
# Loops | Cluster-wide | maqao lprof -dl xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_5 #
# Loops | Per-node | maqao lprof -dl -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_5 #
# Loops | Per-process | maqao lprof -dl -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_5 #
# Loops | Per-thread | maqao lprof -dl -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_5 #
##########################################################################################################################################################################################################################################
* [MAQAO] Info: Detected 1 Lprof instances in ip-172-31-35-140.ec2.internal.
If this is incorrect, rerun with number-processes-per-node=X
{"n_kv_max": 16384, "n_batch": 2048, "n_ubatch": 512, "flash_attn": -1, "is_pp_shared": 0, "n_gpu_layers": -1, "n_threads": 32, "n_threads_batch": 32, "pp": 0, "tg": 128, "pl": 8, "n_kv": 1024, "t_pp": 0.000000, "speed_pp": nan, "t_tg": 9.999181, "speed_tg": 102.408386, "t": 9.999181, "speed": 102.408386}
Your experiment path is /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_6
To display your profiling results:
##########################################################################################################################################################################################################################################
# LEVEL | REPORT | COMMAND #
##########################################################################################################################################################################################################################################
# Functions | Cluster-wide | maqao lprof -df xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_6 #
# Functions | Per-node | maqao lprof -df -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_6 #
# Functions | Per-process | maqao lprof -df -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_6 #
# Functions | Per-thread | maqao lprof -df -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_6 #
# Loops | Cluster-wide | maqao lprof -dl xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_6 #
# Loops | Per-node | maqao lprof -dl -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_6 #
# Loops | Per-process | maqao lprof -dl -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_6 #
# Loops | Per-thread | maqao lprof -dl -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_6 #
##########################################################################################################################################################################################################################################
* [MAQAO] Info: Detected 1 Lprof instances in ip-172-31-35-140.ec2.internal.
If this is incorrect, rerun with number-processes-per-node=X
{"n_kv_max": 16384, "n_batch": 2048, "n_ubatch": 512, "flash_attn": -1, "is_pp_shared": 0, "n_gpu_layers": -1, "n_threads": 40, "n_threads_batch": 40, "pp": 0, "tg": 128, "pl": 8, "n_kv": 1024, "t_pp": 0.000000, "speed_pp": nan, "t_tg": 8.831709, "speed_tg": 115.945854, "t": 8.831709, "speed": 115.945854}
Your experiment path is /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_7
To display your profiling results:
##########################################################################################################################################################################################################################################
# LEVEL | REPORT | COMMAND #
##########################################################################################################################################################################################################################################
# Functions | Cluster-wide | maqao lprof -df xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_7 #
# Functions | Per-node | maqao lprof -df -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_7 #
# Functions | Per-process | maqao lprof -df -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_7 #
# Functions | Per-thread | maqao lprof -df -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_7 #
# Loops | Cluster-wide | maqao lprof -dl xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_7 #
# Loops | Per-node | maqao lprof -dl -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_7 #
# Loops | Per-process | maqao lprof -dl -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_7 #
# Loops | Per-thread | maqao lprof -dl -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_7 #
##########################################################################################################################################################################################################################################
* [MAQAO] Info: Detected 1 Lprof instances in ip-172-31-35-140.ec2.internal.
If this is incorrect, rerun with number-processes-per-node=X
{"n_kv_max": 16384, "n_batch": 2048, "n_ubatch": 512, "flash_attn": -1, "is_pp_shared": 0, "n_gpu_layers": -1, "n_threads": 48, "n_threads_batch": 48, "pp": 0, "tg": 128, "pl": 8, "n_kv": 1024, "t_pp": 0.000000, "speed_pp": nan, "t_tg": 8.007525, "speed_tg": 127.879707, "t": 8.007525, "speed": 127.879707}
Your experiment path is /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_8
To display your profiling results:
##########################################################################################################################################################################################################################################
# LEVEL | REPORT | COMMAND #
##########################################################################################################################################################################################################################################
# Functions | Cluster-wide | maqao lprof -df xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_8 #
# Functions | Per-node | maqao lprof -df -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_8 #
# Functions | Per-process | maqao lprof -df -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_8 #
# Functions | Per-thread | maqao lprof -df -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_8 #
# Loops | Cluster-wide | maqao lprof -dl xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_8 #
# Loops | Per-node | maqao lprof -dl -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_8 #
# Loops | Per-process | maqao lprof -dl -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_8 #
# Loops | Per-thread | maqao lprof -dl -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_8 #
##########################################################################################################################################################################################################################################
* [MAQAO] Info: Detected 1 Lprof instances in ip-172-31-35-140.ec2.internal.
If this is incorrect, rerun with number-processes-per-node=X
{"n_kv_max": 16384, "n_batch": 2048, "n_ubatch": 512, "flash_attn": -1, "is_pp_shared": 0, "n_gpu_layers": -1, "n_threads": 56, "n_threads_batch": 56, "pp": 0, "tg": 128, "pl": 8, "n_kv": 1024, "t_pp": 0.000000, "speed_pp": nan, "t_tg": 7.493059, "speed_tg": 136.659805, "t": 7.493059, "speed": 136.659805}
Your experiment path is /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_9
To display your profiling results:
##########################################################################################################################################################################################################################################
# LEVEL | REPORT | COMMAND #
##########################################################################################################################################################################################################################################
# Functions | Cluster-wide | maqao lprof -df xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_9 #
# Functions | Per-node | maqao lprof -df -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_9 #
# Functions | Per-process | maqao lprof -df -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_9 #
# Functions | Per-thread | maqao lprof -df -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_9 #
# Loops | Cluster-wide | maqao lprof -dl xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_9 #
# Loops | Per-node | maqao lprof -dl -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_9 #
# Loops | Per-process | maqao lprof -dl -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_9 #
# Loops | Per-thread | maqao lprof -dl -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_9 #
##########################################################################################################################################################################################################################################
* [MAQAO] Info: Detected 1 Lprof instances in ip-172-31-35-140.ec2.internal.
If this is incorrect, rerun with number-processes-per-node=X
{"n_kv_max": 16384, "n_batch": 2048, "n_ubatch": 512, "flash_attn": -1, "is_pp_shared": 0, "n_gpu_layers": -1, "n_threads": 64, "n_threads_batch": 64, "pp": 0, "tg": 128, "pl": 8, "n_kv": 1024, "t_pp": 0.000000, "speed_pp": nan, "t_tg": 6.968165, "speed_tg": 146.954041, "t": 6.968165, "speed": 146.954041}
Your experiment path is /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_10
To display your profiling results:
###########################################################################################################################################################################################################################################
# LEVEL | REPORT | COMMAND #
###########################################################################################################################################################################################################################################
# Functions | Cluster-wide | maqao lprof -df xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_10 #
# Functions | Per-node | maqao lprof -df -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_10 #
# Functions | Per-process | maqao lprof -df -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_10 #
# Functions | Per-thread | maqao lprof -df -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_10 #
# Loops | Cluster-wide | maqao lprof -dl xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_10 #
# Loops | Per-node | maqao lprof -dl -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_10 #
# Loops | Per-process | maqao lprof -dl -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_10 #
# Loops | Per-thread | maqao lprof -dl -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_10 #
###########################################################################################################################################################################################################################################
* [MAQAO] Info: Detected 1 Lprof instances in ip-172-31-35-140.ec2.internal.
If this is incorrect, rerun with number-processes-per-node=X
{"n_kv_max": 16384, "n_batch": 2048, "n_ubatch": 512, "flash_attn": -1, "is_pp_shared": 0, "n_gpu_layers": -1, "n_threads": 72, "n_threads_batch": 72, "pp": 0, "tg": 128, "pl": 8, "n_kv": 1024, "t_pp": 0.000001, "speed_pp": 0.000000, "t_tg": 7.679639, "speed_tg": 133.339600, "t": 7.679640, "speed": 133.339584}
Your experiment path is /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_11
To display your profiling results:
###########################################################################################################################################################################################################################################
# LEVEL | REPORT | COMMAND #
###########################################################################################################################################################################################################################################
# Functions | Cluster-wide | maqao lprof -df xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_11 #
# Functions | Per-node | maqao lprof -df -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_11 #
# Functions | Per-process | maqao lprof -df -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_11 #
# Functions | Per-thread | maqao lprof -df -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_11 #
# Loops | Cluster-wide | maqao lprof -dl xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_11 #
# Loops | Per-node | maqao lprof -dl -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_11 #
# Loops | Per-process | maqao lprof -dl -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_11 #
# Loops | Per-thread | maqao lprof -dl -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_11 #
###########################################################################################################################################################################################################################################
* [MAQAO] Info: Detected 1 Lprof instances in ip-172-31-35-140.ec2.internal.
If this is incorrect, rerun with number-processes-per-node=X
{"n_kv_max": 16384, "n_batch": 2048, "n_ubatch": 512, "flash_attn": -1, "is_pp_shared": 0, "n_gpu_layers": -1, "n_threads": 80, "n_threads_batch": 80, "pp": 0, "tg": 128, "pl": 8, "n_kv": 1024, "t_pp": 0.000000, "speed_pp": nan, "t_tg": 6.614780, "speed_tg": 154.804840, "t": 6.614780, "speed": 154.804840}
Your experiment path is /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_12
To display your profiling results:
###########################################################################################################################################################################################################################################
# LEVEL | REPORT | COMMAND #
###########################################################################################################################################################################################################################################
# Functions | Cluster-wide | maqao lprof -df xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_12 #
# Functions | Per-node | maqao lprof -df -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_12 #
# Functions | Per-process | maqao lprof -df -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_12 #
# Functions | Per-thread | maqao lprof -df -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_12 #
# Loops | Cluster-wide | maqao lprof -dl xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_12 #
# Loops | Per-node | maqao lprof -dl -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_12 #
# Loops | Per-process | maqao lprof -dl -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_12 #
# Loops | Per-thread | maqao lprof -dl -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_12 #
###########################################################################################################################################################################################################################################
* [MAQAO] Info: Detected 1 Lprof instances in ip-172-31-35-140.ec2.internal.
If this is incorrect, rerun with number-processes-per-node=X
{"n_kv_max": 16384, "n_batch": 2048, "n_ubatch": 512, "flash_attn": -1, "is_pp_shared": 0, "n_gpu_layers": -1, "n_threads": 88, "n_threads_batch": 88, "pp": 0, "tg": 128, "pl": 8, "n_kv": 1024, "t_pp": 0.000000, "speed_pp": nan, "t_tg": 7.216266, "speed_tg": 141.901642, "t": 7.216266, "speed": 141.901642}
Your experiment path is /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_13
To display your profiling results:
###########################################################################################################################################################################################################################################
# LEVEL | REPORT | COMMAND #
###########################################################################################################################################################################################################################################
# Functions | Cluster-wide | maqao lprof -df xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_13 #
# Functions | Per-node | maqao lprof -df -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_13 #
# Functions | Per-process | maqao lprof -df -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_13 #
# Functions | Per-thread | maqao lprof -df -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_13 #
# Loops | Cluster-wide | maqao lprof -dl xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_13 #
# Loops | Per-node | maqao lprof -dl -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_13 #
# Loops | Per-process | maqao lprof -dl -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_13 #
# Loops | Per-thread | maqao lprof -dl -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_13 #
###########################################################################################################################################################################################################################################
* [MAQAO] Info: Detected 1 Lprof instances in ip-172-31-35-140.ec2.internal.
If this is incorrect, rerun with number-processes-per-node=X
{"n_kv_max": 16384, "n_batch": 2048, "n_ubatch": 512, "flash_attn": -1, "is_pp_shared": 0, "n_gpu_layers": -1, "n_threads": 96, "n_threads_batch": 96, "pp": 0, "tg": 128, "pl": 8, "n_kv": 1024, "t_pp": 0.000000, "speed_pp": nan, "t_tg": 7.133768, "speed_tg": 143.542648, "t": 7.133768, "speed": 143.542648}
Your experiment path is /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_14
To display your profiling results:
###########################################################################################################################################################################################################################################
# LEVEL | REPORT | COMMAND #
###########################################################################################################################################################################################################################################
# Functions | Cluster-wide | maqao lprof -df xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_14 #
# Functions | Per-node | maqao lprof -df -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_14 #
# Functions | Per-process | maqao lprof -df -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_14 #
# Functions | Per-thread | maqao lprof -df -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_14 #
# Loops | Cluster-wide | maqao lprof -dl xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_14 #
# Loops | Per-node | maqao lprof -dl -dn xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_14 #
# Loops | Per-process | maqao lprof -dl -dp xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_14 #
# Loops | Per-thread | maqao lprof -dl -dt xp=/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-35-140.ec2.internal/Q8/TG/TG128_B8_Q8/llama.cpp/run/oneview_runs/multicore/gcc_1/maqao_2025-11-26_15-45-07/tools/lprof_npsu_run_14 #
###########################################################################################################################################################################################################################################