OV - Compare Loops

Loops

▶quants.c: 910 - 13.95 %

ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default						Run gcc_default						Run gcc_4
Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/arch/arm/quants.c: 910-948 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/simd-mappings.h: 51-51					Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/arch/arm/quants.c: 910-910 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/arch/arm/quants.c: 928-929 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/simd-mappings.h: 51-51 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 13617-13617 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 16103-16103 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 20765-20765 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 30781-30781 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 31056-31056 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 34664-34664					Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/arch/arm/quants.c: 910-910 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/arch/arm/quants.c: 928-929 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/simd-mappings.h: 51-51 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 13617-13617 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 16103-16103 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 20765-20765 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 30781-30781 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 31056-31056 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 34664-34664
2293	0.10	0.07	0.86	10.53	24.67	1955	0.09	0.08	4.68	16.22	25.68	1974	0.09	4.01	8.41	16.22	25.68

Sum on 1 analyzed binary loop (libggml-cpu.so - 2293)						Sum on 1 analyzed binary loop (libggml-cpu.so - 1955)						Sum on 1 analyzed binary loop (libggml-cpu.so - 1974)
Analysis					Count	Analysis					Count	Analysis					Count
Loop Computation Issues						Loop Computation Issues						Loop Computation Issues
Presence of a large number of scalar integer instructions						Presence of a large number of scalar integer instructions					1	Presence of a large number of scalar integer instructions					1
Data Access Issues						Data Access Issues						Data Access Issues
Presence of constant non-unit stride data access					1	Presence of constant non-unit stride data access					1	Presence of constant non-unit stride data access					1
Vectorization Roadblocks						Vectorization Roadblocks						Vectorization Roadblocks
Presence of constant non-unit stride data access					1	Presence of constant non-unit stride data access					1	Presence of constant non-unit stride data access					1

▶ops.cpp: 6210 - 0.67 %

ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default		Run gcc_default						Run gcc_4
Loop Source Regions		Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 6210-6211 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 6220-6230 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 6238-6245 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 6413-6413					Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 6211-6211 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 6223-6231
		789	0.02	0.01	0.36	2.33	10.1	814	0.01	0.15	0.31	0	12.76

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		Sum on 1 analyzed binary loop (libggml-cpu.so - 789)						Sum on 1 analyzed binary loop (libggml-cpu.so - 814)
Analysis	Count	Analysis					Count	Analysis					Count
		Loop Computation Issues						Loop Computation Issues
		Presence of expensive FP instructions					1	Presence of expensive FP instructions					1
		Presence of a large number of scalar integer instructions					1	Presence of a large number of scalar integer instructions					1
		Control Flow Issues						Control Flow Issues
		Presence of calls					1	Presence of calls					1
		Presence of more than 4 paths					1	Presence of more than 4 paths					0
		Vectorization Roadblocks						Vectorization Roadblocks
		Presence of calls					1	Presence of calls					1
		Presence of more than 4 paths					1	Presence of more than 4 paths					1

▶ops.cpp: 6238 - 0.44 %

ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default		Run gcc_default		Run gcc_4
Loop Source Regions		Loop Source Regions		Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 6238-6245
				838	0.01	0.21	0.44	0	14.18

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		Sum on 1 analyzed binary loop (libggml-cpu.so - 838)
Analysis	Count	Analysis	Count	Analysis					Count
				Loop Computation Issues
				Presence of expensive FP instructions					1
				Less than 10% of the FP ADD/SUB/MUL arithmetic operations are performed using FMA					1
				Control Flow Issues
				Presence of calls					1
				Data Access Issues
				Presence of constant non-unit stride data access					1
				Presence of indirect access					1
				Vectorization Roadblocks
				Presence of calls					1
				Presence of constant non-unit stride data access					1
				Presence of indirect access					1

▶vec.cpp: 385 - 0.25 %

ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Vector Length Use (%)
Run orig_default						Run gcc_default						Run gcc_4
Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/vec.cpp: 385-387 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/vec.h: 1008-1034					Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/vec.cpp: 385-387 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/vec.h: 1009-1023 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/vec.h: 1031-1034					Loop Source Regions
908	0.02	0.00	0.05	68.18	79.76	766	0.02	0.00	0.20	80	97.59

Sum on 1 analyzed binary loop (libggml-cpu.so - 908)						Sum on 1 analyzed binary loop (libggml-cpu.so - 766)						No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.
Analysis					Count	Analysis					Count	Analysis	Count
Loop Computation Issues						Loop Computation Issues
Presence of expensive FP instructions					1	Presence of expensive FP instructions					1
Data Access Issues						Data Access Issues
Presence of constant non-unit stride data access					1	Presence of constant non-unit stride data access					1
Vectorization Roadblocks						Vectorization Roadblocks
Presence of constant non-unit stride data access					1	Presence of constant non-unit stride data access					1

▶vec.cpp: 390 - 0.24 %

ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default		Run gcc_default		Run gcc_4
Loop Source Regions		Loop Source Regions		Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/vec.cpp: 390-390 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/vec.h: 1057-1057 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 786-786 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 814-814 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 1388-1388 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 1487-1487 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 1628-1628 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 2188-2188 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 2216-2216 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 10248-10248 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 10997-10997 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 12284-12284 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 15253-15253 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 15426-15426 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 16065-16065 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 21933-21933 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 25479-25479 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 26472-26472
				790	0.01	0.12	0.24	85.29	48.53

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		Sum on 1 analyzed binary loop (libggml-cpu.so - 790)
Analysis	Count	Analysis	Count	Analysis					Count
				Loop Computation Issues
				Presence of expensive FP instructions					1
				Data Access Issues
				Presence of constant non-unit stride data access					1
				Vectorization Roadblocks
				Presence of constant non-unit stride data access					1

▶binary-ops.cpp: 10 - 0.22 %

ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default						Run gcc_default						Run gcc_4
Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/binary-ops.cpp: 10-10 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/binary-ops.cpp: 31-32					Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/binary-ops.cpp: 10-10 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/binary-ops.cpp: 31-32					Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/binary-ops.cpp: 10-10 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/binary-ops.cpp: 31-32
433	0.01	0.00	0.01	0	12.5	410	0.01	0.00	0.07	25	50	416	0.01	0.06	0.13	25	50

Sum on 1 analyzed binary loop (libggml-cpu.so - 433)						Sum on 1 analyzed binary loop (libggml-cpu.so - 410)						Sum on 1 analyzed binary loop (libggml-cpu.so - 416)
Analysis					Count	Analysis					Count	Analysis					Count
Loop Computation Issues						Loop Computation Issues						Loop Computation Issues
Less than 10% of the FP ADD/SUB/MUL arithmetic operations are performed using FMA					1	Less than 10% of the FP ADD/SUB/MUL arithmetic operations are performed using FMA					1	Less than 10% of the FP ADD/SUB/MUL arithmetic operations are performed using FMA					1
Data Access Issues						Data Access Issues						Data Access Issues
Presence of constant non-unit stride data access					1	Presence of constant non-unit stride data access					1	Presence of constant non-unit stride data access					1
Vectorization Roadblocks						Vectorization Roadblocks						Vectorization Roadblocks
Presence of constant non-unit stride data access					1	Presence of constant non-unit stride data access					1	Presence of constant non-unit stride data access					1

▶<unknown>: 0 - 0.20 %

ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default						Run gcc_default						Run gcc_4
Loop Source Regions						Loop Source Regions						Loop Source Regions
2480	0.00	0.00	0.00	0	0	4140	0.00	0.00	0.00	0	0	4100	0.00	0.00	0.01	0	0
2473	0.00	0.00	0.00	0	0	4180	0.01	0.00	0.01	0	0	1677	0.00	0.00	0.01	0	0
1151	0.00	0.00	0.00	0	0	4127	0.00	0.00	0.00	0	0	3801	0.00	0.00	0.01	0	0
2801	0.00	0.00	0.00	0	0	4472	0.01	0.00	0.01	0	0	3973	0.00	0.00	0.01	0	0
2650	0.00	0.00	0.00	0	0	1626	0.01	0.00	0.01	0	0	877	0.00	0.00	0.01	0	0
2886	0.00	0.00	0.00	0	0	4130	0.00	0.00	0.00	0	0	1540	0.00	0.00	0.01	0	0
2767	0.02	0.00	0.00	0	0	4141	0.00	0.00	0.00	0	0
2764	0.01	0.00	0.00	0	0	56	0.01	0.00	0.01	0	0
2649	0.00	0.00	0.00	0	0	1932	0.00	0.00	0.00	0	0
314	0.02	0.00	0.00	0	0	368	0.00	0.00	0.00	0	0
2268	0.00	0.00	0.00	0	0	1468	0.00	0.00	0.00	0	0
65	0.01	0.00	0.00	0	0	53	0.00	0.00	0.00	0	0
396	0.00	0.00	0.00	0	0	1131	0.00	0.00	0.00	0	0
536	0.01	0.00	0.00	0	0	1195	0.00	0.00	0.00	0	0
538	0.01	0.00	0.01	0	0
431	0.00	0.00	0.00	0	0
1282	0.01	0.00	0.00	0	0
901	0.01	0.00	0.01	0	0
1753	0.01	0.00	0.01	0	0
66	0.01	0.00	0.01	0	0
1437	0.01	0.00	0.01	0	0
1756	0.00	0.00	0.00	0	0
1754	0.00	0.00	0.00	0	0

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.						No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.						No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.
Analysis					Count	Analysis					Count	Analysis					Count

▶ops.cpp: 4325 - 0.16 %

ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default						Run gcc_default						Run gcc_4
Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 4325-4326					Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 4325-4326					Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 4325-4326
1278	0.01	0.00	0.02	94.12	95.59	1132	0.01	0.00	0.07	0	13.28	1170	0.01	0.03	0.07	17.39	28.26

Sum on 1 analyzed binary loop (libggml-cpu.so - 1278)						Sum on 1 analyzed binary loop (libggml-cpu.so - 1132)						Sum on 1 analyzed binary loop (libggml-cpu.so - 1170)
Analysis					Count	Analysis					Count	Analysis					Count
Loop Computation Issues						Loop Computation Issues						Loop Computation Issues
Less than 10% of the FP ADD/SUB/MUL arithmetic operations are performed using FMA					1	Less than 10% of the FP ADD/SUB/MUL arithmetic operations are performed using FMA					1	Less than 10% of the FP ADD/SUB/MUL arithmetic operations are performed using FMA					1
Data Access Issues						Data Access Issues						Data Access Issues
Presence of constant non-unit stride data access					1	Presence of constant non-unit stride data access						Presence of constant non-unit stride data access					1
Vectorization Roadblocks						Vectorization Roadblocks						Vectorization Roadblocks
Presence of constant non-unit stride data access					1	Presence of constant non-unit stride data access						Presence of constant non-unit stride data access					1

▶vec.h: 486 - 0.14 %

ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default		Run gcc_default		Run gcc_4
Loop Source Regions		Loop Source Regions		Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/vec.h: 486-491 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/vec.h: 502-502 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 8853-8853 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 14177-14177
				1526	0.01	0.07	0.14	10	19.69

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		Sum on 1 analyzed binary loop (libggml-cpu.so - 1526)
Analysis	Count	Analysis	Count	Analysis					Count
				Loop Computation Issues
				Less than 10% of the FP ADD/SUB/MUL arithmetic operations are performed using FMA					1
				Presence of a large number of scalar integer instructions					1
				Control Flow Issues
				Presence of calls					1
				Vectorization Roadblocks
				Presence of calls					1
				Presence of more than 4 paths					1

▶binary-ops.cpp: 18 - 0.13 %

ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default		Run gcc_default						Run gcc_4
Loop Source Regions		Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/binary-ops.cpp: 18-18 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/binary-ops.cpp: 31-32					Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/binary-ops.cpp: 18-18 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/binary-ops.cpp: 31-32
		494	0.01	0.00	0.04	25	50	502	0.01	0.04	0.09	25	50

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		Sum on 1 analyzed binary loop (libggml-cpu.so - 494)						Sum on 1 analyzed binary loop (libggml-cpu.so - 502)
Analysis	Count	Analysis					Count	Analysis					Count
		Loop Computation Issues						Loop Computation Issues
		Less than 10% of the FP ADD/SUB/MUL arithmetic operations are performed using FMA					1	Less than 10% of the FP ADD/SUB/MUL arithmetic operations are performed using FMA					1
		Data Access Issues						Data Access Issues
		Presence of constant non-unit stride data access					1	Presence of constant non-unit stride data access					1
		Vectorization Roadblocks						Vectorization Roadblocks
		Presence of constant non-unit stride data access					1	Presence of constant non-unit stride data access					1

▶ggml-cpu.c: 3228 - 0.10 %

ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default						Run gcc_default						Run gcc_4
Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/./ggml-impl.h: 389-404 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ggml-cpu.c: 3228-3229					Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/./ggml-impl.h: 389-404 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ggml-cpu.c: 3228-3229					Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/./ggml-impl.h: 389-404 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ggml-cpu.c: 3228-3229
0	0.01	0.00	0.01	86.36	95.61	4	0.01	0.00	0.02	93.18	94.03	1	0.01	0.03	0.06	72.6	41.78

Sum on 1 analyzed binary loop (libggml-cpu.so - 0)						No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.						No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.
Analysis					Count	Analysis					Count	Analysis					Count
Loop Computation Issues
Less than 10% of the FP ADD/SUB/MUL arithmetic operations are performed using FMA					1
Data Access Issues
Presence of constant non-unit stride data access					1
Vectorization Roadblocks
Presence of constant non-unit stride data access					1

▶vec.h: 491 - 0.10 %

ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default		Run gcc_default		Run gcc_4
Loop Source Regions		Loop Source Regions		Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/vec.h: 491-491 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 16058-16058 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 26465-26465 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 31977-31977
				1518	0.01	0.05	0.10	27.59	50

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		Sum on 1 analyzed binary loop (libggml-cpu.so - 1518)
Analysis	Count	Analysis	Count	Analysis					Count
				Data Access Issues
				Presence of constant non-unit stride data access					1
				Vectorization Roadblocks
				Presence of constant non-unit stride data access					1

▶ops.cpp: 6446 - 0.05 %

ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default		Run gcc_default						Run gcc_4
Loop Source Regions		Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 6446-6447 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 6453-6456					Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 6446-6447 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 6453-6456
		799	0.01	0.00	0.02	37.5	40.63	848	0.01	0.02	0.03	37.5	40.63

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.						No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.
Analysis	Count	Analysis					Count	Analysis					Count

▶vec.h: 411 - 0.05 %

ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Vector Length Use (%)
Run orig_default		Run gcc_default						Run gcc_4
Loop Source Regions		Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/vec.h: 411-458					Loop Source Regions
		1470	0.01	0.00	0.05	100	100

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		Sum on 1 analyzed binary loop (libggml-cpu.so - 1470)						No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.
Analysis	Count	Analysis					Count	Analysis	Count
		Data Access Issues
		Presence of constant non-unit stride data access					1
		Vectorization Roadblocks
		Presence of constant non-unit stride data access					1

▶ops.cpp: 6220 - 0.05 %

ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Vector Length Use (%)
Run orig_default						Run gcc_default		Run gcc_4
Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 6220-6220 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 6229-6230 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 6238-6245					Loop Source Regions		Loop Source Regions
1432	0.02	0.00	0.05	0	13.17

Sum on 1 analyzed binary loop (libggml-cpu.so - 1432)						No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.
Analysis					Count	Analysis	Count	Analysis	Count
Loop Computation Issues
Presence of expensive FP instructions					1
Less than 10% of the FP ADD/SUB/MUL arithmetic operations are performed using FMA					1
Control Flow Issues
Presence of calls					1
Data Access Issues
Presence of constant non-unit stride data access					1
Vectorization Roadblocks
Presence of calls					1
Presence of constant non-unit stride data access					1

▶ops.cpp: 8787 - 0.05 %

ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default		Run gcc_default		Run gcc_4
Loop Source Regions		Loop Source Regions		Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/vec.h: 751-751 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/simd-mappings.h: 51-51 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 8787-8787 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 8817-8819 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 8825-8826 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 8841-8841
				1533	0.01	0.02	0.05	0	26.88

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.
Analysis	Count	Analysis	Count	Analysis					Count

▶vec.cpp: 311 - 0.05 %

ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default		Run gcc_default		Run gcc_4
Loop Source Regions		Loop Source Regions		Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/vec.cpp: 311-311 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 16058-16058 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 31977-31977
				782	0.00	0.02	0.05	52.63	50

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.
Analysis	Count	Analysis	Count	Analysis					Count

▶ggml-impl.h: 354 - 0.04 %

ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default		Run gcc_default		Run gcc_4
Loop Source Regions		Loop Source Regions		Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-quants.c: 408-412 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-impl.h: 354-361 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-impl.h: 369-377
				592	0.03	0.02	0.04	39.13	29.21

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.
Analysis	Count	Analysis	Count	Analysis					Count

▶hashtable.h: 2386 - 0.03 %

ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default		Run gcc_default		Run gcc_4
Loop Source Regions		Loop Source Regions		Loop Source Regions	/usr/include/c++/11/bits/hashtable_policy.h: 287-287 /usr/include/c++/11/bits/hashtable_policy.h: 434-434 /usr/include/c++/11/bits/hashtable.h: 2386-2391 /usr/include/c++/11/bits/hashtable.h: 2402-2403
				4247	0.02	0.02	0.03	0	25

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.
Analysis	Count	Analysis	Count	Analysis					Count

▶basic_string.h: 6237 - 0.03 %

ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default		Run gcc_default		Run gcc_4
Loop Source Regions		Loop Source Regions		Loop Source Regions	/usr/include/c++/11/bits/char_traits.h: 374-374 /usr/include/c++/11/bits/char_traits.h: 389-389 /usr/include/c++/11/bits/hashtable_policy.h: 434-434 /usr/include/c++/11/bits/hashtable_policy.h: 1251-1255 /usr/include/c++/11/bits/hashtable_policy.h: 1621-1621 /usr/include/c++/11/bits/hashtable.h: 1843-1843 /usr/include/c++/11/bits/basic_string.h: 6237-6237 /usr/include/c++/11/bits/stl_pair.h: 466-466 /usr/include/c++/11/bits/stl_function.h: 369-369
				4211	0.01	0.01	0.02	0	25
				4540	0.01	0.01	0.02	0	25

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.
Analysis	Count	Analysis	Count	Analysis					Count

▶vec.h: 677 - 0.03 %

ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default		Run gcc_default		Run gcc_4
Loop Source Regions		Loop Source Regions		Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/vec.h: 677-677 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 1487-1487 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 16065-16065 /usr/lib/gcc/aarch64-amazon-linux/11/include/arm_neon.h: 26472-26472
				1169	0.00	0.01	0.03	50	50

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.
Analysis	Count	Analysis	Count	Analysis					Count

▶vec.cpp: 231 - 0.02 %

ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Vector Length Use (%)
Run orig_default		Run gcc_default						Run gcc_4
Loop Source Regions		Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/vec.cpp: 231-262					Loop Source Regions
		763	0.01	0.00	0.02	100	100

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		Sum on 1 analyzed binary loop (libggml-cpu.so - 763)						No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.
Analysis	Count	Analysis					Count	Analysis	Count
		Data Access Issues
		Presence of constant non-unit stride data access					1
		Vectorization Roadblocks
		Presence of constant non-unit stride data access					1

▶ggml-cpu.c: 1193 - 0.02 %

ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default		Run gcc_default		Run gcc_4
Loop Source Regions		Loop Source Regions		Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ggml-cpu.c: 1193-1194
				63	0.00	0.01	0.02	0	22.4

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.
Analysis	Count	Analysis	Count	Analysis					Count

▶ggml-cpu.c: 1126 - 0.02 %

ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)
Run orig_default		Run gcc_default		Run gcc_4
Loop Source Regions		Loop Source Regions		Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ggml-cpu.c: 1126-1130 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ggml-cpu.c: 1142-1142 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ggml-cpu.c: 1371-1379 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ggml-cpu.c: 1386-1395
				55	0.00	0.01	0.02	0	23.99

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.
Analysis	Count	Analysis	Count	Analysis					Count

▶llama-vocab.cpp: 3216 - 0.01 %

ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Vector Length Use (%)
Run orig_default		Run gcc_default						Run gcc_4
Loop Source Regions		Loop Source Regions	/usr/include/c++/11/bits/hashtable_policy.h: 287-287 /usr/include/c++/11/bits/hashtable_policy.h: 1916-1916 /usr/include/c++/11/ext/new_allocator.h: 145-145 /usr/include/c++/11/bits/basic_string.h: 195-195 /usr/include/c++/11/bits/basic_string.h: 211-211 /usr/include/c++/11/bits/basic_string.h: 239-239 /usr/include/c++/11/bits/basic_string.h: 245-245 /home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/src/llama-vocab.cpp: 3216-3216					Loop Source Regions
		3732	0.01	0.00	0.01	0	25

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.						No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.
Analysis	Count	Analysis					Count	Analysis	Count

▶ops.cpp: 8825 - 0.01 %

ASM Loop ID	Vector Length Use (%)	ASM Loop ID	Max Time Over Threads (s)	Time w.r.t. Wall Time (s)	Cov (%)	Vect. Ratio (%)	Vector Length Use (%)	ASM Loop ID	Vector Length Use (%)
Run orig_default		Run gcc_default						Run gcc_4
Loop Source Regions		Loop Source Regions	/home/eoseret/Tools/QaaS/qaas_runs/ip-172-31-46-37.ec2.internal/176-409-4840/llama.cpp/build/llama.cpp/ggml/src/ggml-cpu/ops.cpp: 8825-8826					Loop Source Regions
		1463	0.01	0.00	0.01	0	0

No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.		No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.						No Optimizer analysis found for any assembly loop. More loops can be analyzed using option --optimizer-loop-count.
Analysis	Count	Analysis					Count	Analysis	Count

Report Configuration

Loops

▶quants.c: 910 - 13.95 %

▶ops.cpp: 6210 - 0.67 %

▶ops.cpp: 6238 - 0.44 %

▶vec.cpp: 385 - 0.25 %

▶vec.cpp: 390 - 0.24 %

▶binary-ops.cpp: 10 - 0.22 %

▶<unknown>: 0 - 0.20 %

▶ops.cpp: 4325 - 0.16 %

▶vec.h: 486 - 0.14 %

▶binary-ops.cpp: 18 - 0.13 %

▶ggml-cpu.c: 3228 - 0.10 %

▶vec.h: 491 - 0.10 %

▶ops.cpp: 6446 - 0.05 %

▶vec.h: 411 - 0.05 %

▶ops.cpp: 6220 - 0.05 %

▶ops.cpp: 8787 - 0.05 %

▶vec.cpp: 311 - 0.05 %

▶ggml-impl.h: 354 - 0.04 %

▶hashtable.h: 2386 - 0.03 %

▶basic_string.h: 6237 - 0.03 %

▶vec.h: 677 - 0.03 %

▶vec.cpp: 231 - 0.02 %

▶ggml-cpu.c: 1193 - 0.02 %

▶ggml-cpu.c: 1126 - 0.02 %

▶llama-vocab.cpp: 3216 - 0.01 %

▶ops.cpp: 8825 - 0.01 %