clang 22.0.0git
avx512vlcdintrin.h
Go to the documentation of this file.
1/*===---- avx512vlcdintrin.h - AVX512VL and AVX512CD intrinsics ------------===
2 *
3 * Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
4 * See https://llvm.org/LICENSE.txt for license information.
5 * SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
6 *
7 *===-----------------------------------------------------------------------===
8 */
9#ifndef __IMMINTRIN_H
10#error "Never use <avx512vlcdintrin.h> directly; include <immintrin.h> instead."
11#endif
12
13#ifndef __AVX512VLCDINTRIN_H
14#define __AVX512VLCDINTRIN_H
15
16/* Define the default attributes for the functions in this file. */
17#define __DEFAULT_FN_ATTRS128 \
18 __attribute__((__always_inline__, __nodebug__, \
19 __target__("avx512vl,avx512cd"), __min_vector_width__(128)))
20#define __DEFAULT_FN_ATTRS256 \
21 __attribute__((__always_inline__, __nodebug__, \
22 __target__("avx512vl,avx512cd"), __min_vector_width__(256)))
23
24#if defined(__cplusplus) && (__cplusplus >= 201103L)
25#define __DEFAULT_FN_ATTRS256_CONSTEXPR __DEFAULT_FN_ATTRS256 constexpr
26#define __DEFAULT_FN_ATTRS128_CONSTEXPR __DEFAULT_FN_ATTRS128 constexpr
27#else
28#define __DEFAULT_FN_ATTRS256_CONSTEXPR __DEFAULT_FN_ATTRS256
29#define __DEFAULT_FN_ATTRS128_CONSTEXPR __DEFAULT_FN_ATTRS128
30#endif
31
32static __inline__ __m128i __DEFAULT_FN_ATTRS128
34{
35 return (__m128i) _mm_set1_epi64x((long long) __A);
36}
37
38static __inline__ __m256i __DEFAULT_FN_ATTRS256
40{
41 return (__m256i) _mm256_set1_epi64x((long long)__A);
42}
43
44static __inline__ __m128i __DEFAULT_FN_ATTRS128
46{
47 return (__m128i) _mm_set1_epi32((int)__A);
48}
49
50static __inline__ __m256i __DEFAULT_FN_ATTRS256
52{
53 return (__m256i) _mm256_set1_epi32((int)__A);
54}
55
56
57static __inline__ __m128i __DEFAULT_FN_ATTRS128
58_mm_conflict_epi64 (__m128i __A)
59{
60 return (__m128i) __builtin_ia32_vpconflictdi_128 ((__v2di) __A);
61}
62
63static __inline__ __m128i __DEFAULT_FN_ATTRS128
64_mm_mask_conflict_epi64 (__m128i __W, __mmask8 __U, __m128i __A)
65{
66 return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
67 (__v2di)_mm_conflict_epi64(__A),
68 (__v2di)__W);
69}
70
71static __inline__ __m128i __DEFAULT_FN_ATTRS128
73{
74 return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
75 (__v2di)_mm_conflict_epi64(__A),
76 (__v2di)_mm_setzero_si128());
77}
78
79static __inline__ __m256i __DEFAULT_FN_ATTRS256
81{
82 return (__m256i) __builtin_ia32_vpconflictdi_256 ((__v4di) __A);
83}
84
85static __inline__ __m256i __DEFAULT_FN_ATTRS256
86_mm256_mask_conflict_epi64 (__m256i __W, __mmask8 __U, __m256i __A)
87{
88 return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
89 (__v4di)_mm256_conflict_epi64(__A),
90 (__v4di)__W);
91}
92
93static __inline__ __m256i __DEFAULT_FN_ATTRS256
95{
96 return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
97 (__v4di)_mm256_conflict_epi64(__A),
98 (__v4di)_mm256_setzero_si256());
99}
100
101static __inline__ __m128i __DEFAULT_FN_ATTRS128
103{
104 return (__m128i) __builtin_ia32_vpconflictsi_128 ((__v4si) __A);
105}
106
107static __inline__ __m128i __DEFAULT_FN_ATTRS128
108_mm_mask_conflict_epi32 (__m128i __W, __mmask8 __U, __m128i __A)
109{
110 return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
111 (__v4si)_mm_conflict_epi32(__A),
112 (__v4si)__W);
113}
114
115static __inline__ __m128i __DEFAULT_FN_ATTRS128
117{
118 return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
119 (__v4si)_mm_conflict_epi32(__A),
120 (__v4si)_mm_setzero_si128());
121}
122
123static __inline__ __m256i __DEFAULT_FN_ATTRS256
125{
126 return (__m256i) __builtin_ia32_vpconflictsi_256 ((__v8si) __A);
127}
128
129static __inline__ __m256i __DEFAULT_FN_ATTRS256
130_mm256_mask_conflict_epi32 (__m256i __W, __mmask8 __U, __m256i __A)
131{
132 return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
133 (__v8si)_mm256_conflict_epi32(__A),
134 (__v8si)__W);
135}
136
137static __inline__ __m256i __DEFAULT_FN_ATTRS256
139{
140 return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
141 (__v8si)_mm256_conflict_epi32(__A),
142 (__v8si)_mm256_setzero_si256());
143}
144
145static __inline__ __m128i __DEFAULT_FN_ATTRS128_CONSTEXPR
146_mm_lzcnt_epi32(__m128i __A) {
147 return (__m128i)__builtin_elementwise_ctlz((__v4si)__A,
148 (__v4si)_mm_set1_epi32(32));
149}
150
151static __inline__ __m128i __DEFAULT_FN_ATTRS128_CONSTEXPR
152_mm_mask_lzcnt_epi32(__m128i __W, __mmask8 __U, __m128i __A) {
153 return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
154 (__v4si)_mm_lzcnt_epi32(__A),
155 (__v4si)__W);
156}
157
158static __inline__ __m128i __DEFAULT_FN_ATTRS128_CONSTEXPR
160 return (__m128i)__builtin_ia32_selectd_128((__mmask8)__U,
161 (__v4si)_mm_lzcnt_epi32(__A),
162 (__v4si)_mm_setzero_si128());
163}
164
165static __inline__ __m256i __DEFAULT_FN_ATTRS256_CONSTEXPR
166_mm256_lzcnt_epi32(__m256i __A) {
167 return (__m256i)__builtin_elementwise_ctlz((__v8si)__A,
168 (__v8si)_mm256_set1_epi32(32));
169}
170
171static __inline__ __m256i __DEFAULT_FN_ATTRS256_CONSTEXPR
172_mm256_mask_lzcnt_epi32(__m256i __W, __mmask8 __U, __m256i __A) {
173 return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
174 (__v8si)_mm256_lzcnt_epi32(__A),
175 (__v8si)__W);
176}
177
178static __inline__ __m256i __DEFAULT_FN_ATTRS256_CONSTEXPR
180 return (__m256i)__builtin_ia32_selectd_256((__mmask8)__U,
181 (__v8si)_mm256_lzcnt_epi32(__A),
182 (__v8si)_mm256_setzero_si256());
183}
184
185static __inline__ __m128i __DEFAULT_FN_ATTRS128_CONSTEXPR
186_mm_lzcnt_epi64(__m128i __A) {
187 return (__m128i)__builtin_elementwise_ctlz(
188 (__v2di)__A, (__v2di)_mm_set1_epi64x((long long)64));
189}
190
191static __inline__ __m128i __DEFAULT_FN_ATTRS128_CONSTEXPR
192_mm_mask_lzcnt_epi64(__m128i __W, __mmask8 __U, __m128i __A) {
193 return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
194 (__v2di)_mm_lzcnt_epi64(__A),
195 (__v2di)__W);
196}
197
198static __inline__ __m128i __DEFAULT_FN_ATTRS128_CONSTEXPR
200 return (__m128i)__builtin_ia32_selectq_128((__mmask8)__U,
201 (__v2di)_mm_lzcnt_epi64(__A),
202 (__v2di)_mm_setzero_si128());
203}
204
205static __inline__ __m256i __DEFAULT_FN_ATTRS256_CONSTEXPR
206_mm256_lzcnt_epi64(__m256i __A) {
207 return (__m256i)__builtin_elementwise_ctlz(
208 (__v4di)__A, (__v4di)_mm256_set1_epi64x((long long)64));
209}
210
211static __inline__ __m256i __DEFAULT_FN_ATTRS256_CONSTEXPR
212_mm256_mask_lzcnt_epi64(__m256i __W, __mmask8 __U, __m256i __A) {
213 return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
214 (__v4di)_mm256_lzcnt_epi64(__A),
215 (__v4di)__W);
216}
217
218static __inline__ __m256i __DEFAULT_FN_ATTRS256_CONSTEXPR
220 return (__m256i)__builtin_ia32_selectq_256((__mmask8)__U,
221 (__v4di)_mm256_lzcnt_epi64(__A),
222 (__v4di)_mm256_setzero_si256());
223}
224
225#undef __DEFAULT_FN_ATTRS128
226#undef __DEFAULT_FN_ATTRS256
227#undef __DEFAULT_FN_ATTRS128_CONSTEXPR
228#undef __DEFAULT_FN_ATTRS256_CONSTEXPR
229
230#endif /* __AVX512VLCDINTRIN_H */
#define __DEFAULT_FN_ATTRS128
#define __DEFAULT_FN_ATTRS256
#define __DEFAULT_FN_ATTRS128_CONSTEXPR
Definition avx2intrin.h:30
#define __DEFAULT_FN_ATTRS256_CONSTEXPR
Definition avx2intrin.h:29
unsigned char __mmask8
unsigned short __mmask16
static __inline__ __m256i __DEFAULT_FN_ATTRS256_CONSTEXPR _mm256_lzcnt_epi64(__m256i __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS128_CONSTEXPR _mm_maskz_lzcnt_epi32(__mmask8 __U, __m128i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_mask_conflict_epi32(__m256i __W, __mmask8 __U, __m256i __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS128_CONSTEXPR _mm_maskz_lzcnt_epi64(__mmask8 __U, __m128i __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_maskz_conflict_epi32(__mmask8 __U, __m128i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS256_CONSTEXPR _mm256_lzcnt_epi32(__m256i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_conflict_epi32(__m256i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_maskz_conflict_epi32(__mmask8 __U, __m256i __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS128_CONSTEXPR _mm_mask_lzcnt_epi64(__m128i __W, __mmask8 __U, __m128i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_broadcastmb_epi64(__mmask8 __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_broadcastmb_epi64(__mmask8 __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_maskz_conflict_epi64(__mmask8 __U, __m256i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_conflict_epi64(__m256i __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS128_CONSTEXPR _mm_lzcnt_epi64(__m128i __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_mask_conflict_epi64(__m128i __W, __mmask8 __U, __m128i __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_maskz_conflict_epi64(__mmask8 __U, __m128i __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_conflict_epi64(__m128i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS256_CONSTEXPR _mm256_mask_lzcnt_epi64(__m256i __W, __mmask8 __U, __m256i __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_mask_conflict_epi32(__m128i __W, __mmask8 __U, __m128i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS256_CONSTEXPR _mm256_mask_lzcnt_epi32(__m256i __W, __mmask8 __U, __m256i __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS128_CONSTEXPR _mm_mask_lzcnt_epi32(__m128i __W, __mmask8 __U, __m128i __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_broadcastmw_epi32(__mmask16 __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS256_CONSTEXPR _mm256_maskz_lzcnt_epi32(__mmask8 __U, __m256i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_broadcastmw_epi32(__mmask16 __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS256_CONSTEXPR _mm256_maskz_lzcnt_epi64(__mmask8 __U, __m256i __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_conflict_epi32(__m128i __A)
static __inline__ __m128i __DEFAULT_FN_ATTRS128_CONSTEXPR _mm_lzcnt_epi32(__m128i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_mask_conflict_epi64(__m256i __W, __mmask8 __U, __m256i __A)
static __inline __m256i __DEFAULT_FN_ATTRS_CONSTEXPR _mm256_set1_epi32(int __i)
Constructs a 256-bit integer vector of [8 x i32], with each of the 32-bit integral vector elements se...
Definition avxintrin.h:4245
static __inline __m256i __DEFAULT_FN_ATTRS_CONSTEXPR _mm256_set1_epi64x(long long __q)
Constructs a 256-bit integer vector of [4 x i64], with each of the 64-bit integral vector elements se...
Definition avxintrin.h:4302
static __inline __m256i __DEFAULT_FN_ATTRS_CONSTEXPR _mm256_setzero_si256(void)
Constructs a 256-bit integer vector initialized to zero.
Definition avxintrin.h:4340
static __inline__ __m128i __DEFAULT_FN_ATTRS_CONSTEXPR _mm_setzero_si128(void)
Creates a 128-bit integer vector initialized to zero.
Definition emmintrin.h:3878
static __inline__ __m128i __DEFAULT_FN_ATTRS_CONSTEXPR _mm_set1_epi64x(long long __q)
Initializes both values in a 128-bit integer vector with the specified 64-bit integer value.
Definition emmintrin.h:3674
static __inline__ __m128i __DEFAULT_FN_ATTRS_CONSTEXPR _mm_set1_epi32(int __i)
Initializes all values in a 128-bit vector of [4 x i32] with the specified 32-bit value.
Definition emmintrin.h:3709