11#error "Never use <avx512bwintrin.h> directly; include <immintrin.h> instead."
14#ifndef __AVX512BWINTRIN_H
15#define __AVX512BWINTRIN_H
21#define __DEFAULT_FN_ATTRS512 \
22 __attribute__((__always_inline__, __nodebug__, __target__("avx512bw"), \
23 __min_vector_width__(512)))
24#define __DEFAULT_FN_ATTRS \
25 __attribute__((__always_inline__, __nodebug__, __target__("avx512bw")))
27#if defined(__cplusplus) && (__cplusplus >= 201103L)
28#define __DEFAULT_FN_ATTRS512_CONSTEXPR __DEFAULT_FN_ATTRS512 constexpr
29#define __DEFAULT_FN_ATTRS_CONSTEXPR __DEFAULT_FN_ATTRS constexpr
31#define __DEFAULT_FN_ATTRS512_CONSTEXPR __DEFAULT_FN_ATTRS512
32#define __DEFAULT_FN_ATTRS_CONSTEXPR __DEFAULT_FN_ATTRS
37 return __builtin_ia32_knotsi(__M);
42 return __builtin_ia32_knotdi(__M);
97 return (
unsigned char)__builtin_ia32_kortestcsi(__A, __B);
102 return (
unsigned char)__builtin_ia32_kortestzsi(__A, __B);
107 *__C = (
unsigned char)__builtin_ia32_kortestcsi(__A, __B);
108 return (
unsigned char)__builtin_ia32_kortestzsi(__A, __B);
113 return (
unsigned char)__builtin_ia32_kortestcdi(__A, __B);
118 return (
unsigned char)__builtin_ia32_kortestzdi(__A, __B);
123 *__C = (
unsigned char)__builtin_ia32_kortestcdi(__A, __B);
124 return (
unsigned char)__builtin_ia32_kortestzdi(__A, __B);
129 return (
unsigned char)__builtin_ia32_ktestcsi(__A, __B);
134 return (
unsigned char)__builtin_ia32_ktestzsi(__A, __B);
139 *__C = (
unsigned char)__builtin_ia32_ktestcsi(__A, __B);
140 return (
unsigned char)__builtin_ia32_ktestzsi(__A, __B);
145 return (
unsigned char)__builtin_ia32_ktestcdi(__A, __B);
150 return (
unsigned char)__builtin_ia32_ktestzdi(__A, __B);
155 *__C = (
unsigned char)__builtin_ia32_ktestcdi(__A, __B);
156 return (
unsigned char)__builtin_ia32_ktestzdi(__A, __B);
169#define _kshiftli_mask32(A, I) \
170 ((__mmask32)__builtin_ia32_kshiftlisi((__mmask32)(A), (unsigned int)(I)))
172#define _kshiftri_mask32(A, I) \
173 ((__mmask32)__builtin_ia32_kshiftrisi((__mmask32)(A), (unsigned int)(I)))
175#define _kshiftli_mask64(A, I) \
176 ((__mmask64)__builtin_ia32_kshiftlidi((__mmask64)(A), (unsigned int)(I)))
178#define _kshiftri_mask64(A, I) \
179 ((__mmask64)__builtin_ia32_kshiftridi((__mmask64)(A), (unsigned int)(I)))
183 return (
unsigned int)__builtin_ia32_kmovd((
__mmask32)__A);
188 return (
unsigned long long)__builtin_ia32_kmovq((
__mmask64)__A);
222#define _mm512_cmp_epi8_mask(a, b, p) \
223 ((__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)(__m512i)(a), \
224 (__v64qi)(__m512i)(b), (int)(p), \
227#define _mm512_mask_cmp_epi8_mask(m, a, b, p) \
228 ((__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)(__m512i)(a), \
229 (__v64qi)(__m512i)(b), (int)(p), \
232#define _mm512_cmp_epu8_mask(a, b, p) \
233 ((__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)(__m512i)(a), \
234 (__v64qi)(__m512i)(b), (int)(p), \
237#define _mm512_mask_cmp_epu8_mask(m, a, b, p) \
238 ((__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)(__m512i)(a), \
239 (__v64qi)(__m512i)(b), (int)(p), \
242#define _mm512_cmp_epi16_mask(a, b, p) \
243 ((__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)(__m512i)(a), \
244 (__v32hi)(__m512i)(b), (int)(p), \
247#define _mm512_mask_cmp_epi16_mask(m, a, b, p) \
248 ((__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)(__m512i)(a), \
249 (__v32hi)(__m512i)(b), (int)(p), \
252#define _mm512_cmp_epu16_mask(a, b, p) \
253 ((__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)(__m512i)(a), \
254 (__v32hi)(__m512i)(b), (int)(p), \
257#define _mm512_mask_cmp_epu16_mask(m, a, b, p) \
258 ((__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)(__m512i)(a), \
259 (__v32hi)(__m512i)(b), (int)(p), \
262#define _mm512_cmpeq_epi8_mask(A, B) \
263 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_EQ)
264#define _mm512_mask_cmpeq_epi8_mask(k, A, B) \
265 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_EQ)
266#define _mm512_cmpge_epi8_mask(A, B) \
267 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_GE)
268#define _mm512_mask_cmpge_epi8_mask(k, A, B) \
269 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_GE)
270#define _mm512_cmpgt_epi8_mask(A, B) \
271 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_GT)
272#define _mm512_mask_cmpgt_epi8_mask(k, A, B) \
273 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_GT)
274#define _mm512_cmple_epi8_mask(A, B) \
275 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_LE)
276#define _mm512_mask_cmple_epi8_mask(k, A, B) \
277 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_LE)
278#define _mm512_cmplt_epi8_mask(A, B) \
279 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_LT)
280#define _mm512_mask_cmplt_epi8_mask(k, A, B) \
281 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_LT)
282#define _mm512_cmpneq_epi8_mask(A, B) \
283 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_NE)
284#define _mm512_mask_cmpneq_epi8_mask(k, A, B) \
285 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_NE)
287#define _mm512_cmpeq_epu8_mask(A, B) \
288 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_EQ)
289#define _mm512_mask_cmpeq_epu8_mask(k, A, B) \
290 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_EQ)
291#define _mm512_cmpge_epu8_mask(A, B) \
292 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_GE)
293#define _mm512_mask_cmpge_epu8_mask(k, A, B) \
294 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_GE)
295#define _mm512_cmpgt_epu8_mask(A, B) \
296 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_GT)
297#define _mm512_mask_cmpgt_epu8_mask(k, A, B) \
298 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_GT)
299#define _mm512_cmple_epu8_mask(A, B) \
300 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_LE)
301#define _mm512_mask_cmple_epu8_mask(k, A, B) \
302 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_LE)
303#define _mm512_cmplt_epu8_mask(A, B) \
304 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_LT)
305#define _mm512_mask_cmplt_epu8_mask(k, A, B) \
306 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_LT)
307#define _mm512_cmpneq_epu8_mask(A, B) \
308 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_NE)
309#define _mm512_mask_cmpneq_epu8_mask(k, A, B) \
310 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_NE)
312#define _mm512_cmpeq_epi16_mask(A, B) \
313 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_EQ)
314#define _mm512_mask_cmpeq_epi16_mask(k, A, B) \
315 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_EQ)
316#define _mm512_cmpge_epi16_mask(A, B) \
317 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_GE)
318#define _mm512_mask_cmpge_epi16_mask(k, A, B) \
319 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_GE)
320#define _mm512_cmpgt_epi16_mask(A, B) \
321 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_GT)
322#define _mm512_mask_cmpgt_epi16_mask(k, A, B) \
323 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_GT)
324#define _mm512_cmple_epi16_mask(A, B) \
325 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_LE)
326#define _mm512_mask_cmple_epi16_mask(k, A, B) \
327 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_LE)
328#define _mm512_cmplt_epi16_mask(A, B) \
329 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_LT)
330#define _mm512_mask_cmplt_epi16_mask(k, A, B) \
331 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_LT)
332#define _mm512_cmpneq_epi16_mask(A, B) \
333 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_NE)
334#define _mm512_mask_cmpneq_epi16_mask(k, A, B) \
335 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_NE)
337#define _mm512_cmpeq_epu16_mask(A, B) \
338 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_EQ)
339#define _mm512_mask_cmpeq_epu16_mask(k, A, B) \
340 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_EQ)
341#define _mm512_cmpge_epu16_mask(A, B) \
342 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_GE)
343#define _mm512_mask_cmpge_epu16_mask(k, A, B) \
344 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_GE)
345#define _mm512_cmpgt_epu16_mask(A, B) \
346 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_GT)
347#define _mm512_mask_cmpgt_epu16_mask(k, A, B) \
348 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_GT)
349#define _mm512_cmple_epu16_mask(A, B) \
350 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_LE)
351#define _mm512_mask_cmple_epu16_mask(k, A, B) \
352 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_LE)
353#define _mm512_cmplt_epu16_mask(A, B) \
354 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_LT)
355#define _mm512_mask_cmplt_epu16_mask(k, A, B) \
356 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_LT)
357#define _mm512_cmpneq_epu16_mask(A, B) \
358 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_NE)
359#define _mm512_mask_cmpneq_epu16_mask(k, A, B) \
360 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_NE)
362static __inline__ __m512i
364 return (__m512i) ((__v64qu) __A + (__v64qu) __B);
369 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
376 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
383 return (__m512i) ((__v64qu) __A - (__v64qu) __B);
388 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
395 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
402 return (__m512i) ((__v32hu) __A + (__v32hu) __B);
407 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
414 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
421 return (__m512i) ((__v32hu) __A - (__v32hu) __B);
426 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
433 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
440 return (__m512i) ((__v32hu) __A * (__v32hu) __B);
445 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
452 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
459 return (__m512i) __builtin_ia32_selectb_512 ((
__mmask64) __U,
466 return (__m512i) __builtin_ia32_selectw_512 ((
__mmask32) __U,
473 return (__m512i)__builtin_elementwise_abs((__v64qs)__A);
478 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
485 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
492 return (__m512i)__builtin_elementwise_abs((__v32hi)__A);
497 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
504 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
511 return (__m512i)__builtin_ia32_packssdw512((__v16si)__A, (__v16si)__B);
517 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
524 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
531 return (__m512i)__builtin_ia32_packsswb512((__v32hi)__A, (__v32hi) __B);
537 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
545 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
552 return (__m512i)__builtin_ia32_packusdw512((__v16si) __A, (__v16si) __B);
558 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
566 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
573 return (__m512i)__builtin_ia32_packuswb512((__v32hi) __A, (__v32hi) __B);
579 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
587 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
594 return (__m512i)__builtin_elementwise_add_sat((__v64qs)__A, (__v64qs)__B);
599 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
606 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
613 return (__m512i)__builtin_elementwise_add_sat((__v32hi)__A, (__v32hi)__B);
619 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
627 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
634 return (__m512i)__builtin_elementwise_add_sat((__v64qu) __A, (__v64qu) __B);
640 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
648 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
655 return (__m512i)__builtin_elementwise_add_sat((__v32hu) __A, (__v32hu) __B);
660 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
667 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
674 return (__m512i)__builtin_ia32_pavgb512((__v64qu)__A, (__v64qu)__B);
679 return (__m512i)__builtin_ia32_selectb_512(
685 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
692 return (__m512i)__builtin_ia32_pavgw512((__v32hu)__A, (__v32hu)__B);
697 return (__m512i)__builtin_ia32_selectw_512(
703 return (__m512i)__builtin_ia32_selectw_512(
710 return (__m512i)__builtin_elementwise_max((__v64qs) __A, (__v64qs) __B);
715 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
722 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
729 return (__m512i)__builtin_elementwise_max((__v32hi) __A, (__v32hi) __B);
734 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
741 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
748 return (__m512i)__builtin_elementwise_max((__v64qu)__A, (__v64qu)__B);
753 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
760 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
767 return (__m512i)__builtin_elementwise_max((__v32hu)__A, (__v32hu)__B);
772 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
779 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
786 return (__m512i)__builtin_elementwise_min((__v64qs) __A, (__v64qs) __B);
791 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
798 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
805 return (__m512i)__builtin_elementwise_min((__v32hi) __A, (__v32hi) __B);
810 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
817 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
824 return (__m512i)__builtin_elementwise_min((__v64qu)__A, (__v64qu)__B);
829 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
836 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
843 return (__m512i)__builtin_elementwise_min((__v32hu)__A, (__v32hu)__B);
848 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
855 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
862 return (__m512i)__builtin_ia32_pshufb512((__v64qi)__A,(__v64qi)__B);
867 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
874 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
881 return (__m512i)__builtin_elementwise_sub_sat((__v64qs)__A, (__v64qs)__B);
887 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
895 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
902 return (__m512i)__builtin_elementwise_sub_sat((__v32hi)__A, (__v32hi)__B);
908 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
916 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
923 return (__m512i)__builtin_elementwise_sub_sat((__v64qu) __A, (__v64qu) __B);
929 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
937 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
944 return (__m512i)__builtin_elementwise_sub_sat((__v32hu) __A, (__v32hu) __B);
950 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
958 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
965 return (__m512i)__builtin_ia32_vpermi2varhi512((__v32hi)__A, (__v32hi)__I,
972 return (__m512i)__builtin_ia32_selectw_512(__U,
980 return (__m512i)__builtin_ia32_selectw_512(__U,
988 return (__m512i)__builtin_ia32_selectw_512(__U,
995 return (__m512i)__builtin_ia32_pmulhrsw512((__v32hi)__A, (__v32hi)__B);
1000 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1007 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1014 return (__m512i)__builtin_ia32_pmulhw512((__v32hi)__A, (__v32hi)__B);
1019 return (__m512i)__builtin_ia32_selectw_512(
1025 return (__m512i)__builtin_ia32_selectw_512(
1032 return (__m512i)__builtin_ia32_pmulhuw512((__v32hu)__A, (__v32hu)__B);
1037 return (__m512i)__builtin_ia32_selectw_512(
1043 return (__m512i)__builtin_ia32_selectw_512(
1050 return (__m512i)__builtin_ia32_pmaddubsw512((__v64qi)__X, (__v64qi)
__Y);
1056 return (__m512i)__builtin_ia32_selectw_512((
__mmask32) __U,
1063 return (__m512i)__builtin_ia32_selectw_512((
__mmask32) __U,
1070 return (__m512i)__builtin_ia32_pmaddwd512((__v32hi)__A, (__v32hi)__B);
1075 return (__m512i)__builtin_ia32_selectd_512((
__mmask16)__U,
1082 return (__m512i)__builtin_ia32_selectd_512((
__mmask16)__U,
1089 return (__m256i) __builtin_ia32_pmovswb512_mask ((__v32hi) __A,
1096 return (__m256i) __builtin_ia32_pmovswb512_mask ((__v32hi) __A,
1103 return (__m256i) __builtin_ia32_pmovswb512_mask ((__v32hi) __A,
1110 return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,
1117 return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,
1124 return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,
1131 return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,
1138 return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,
1145 return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,
1153 __builtin_ia32_pmovwb512mem_mask ((__v32qi *)
__P, (__v32hi) __A, __M);
1159 __builtin_ia32_pmovswb512mem_mask ((__v32qi *)
__P, (__v32hi) __A, __M);
1165 __builtin_ia32_pmovuswb512mem_mask ((__v32qi *)
__P, (__v32hi) __A, __M);
1170 return (__m512i)__builtin_shufflevector((__v64qi)__A, (__v64qi)__B,
1172 10, 64+10, 11, 64+11,
1173 12, 64+12, 13, 64+13,
1174 14, 64+14, 15, 64+15,
1175 24, 64+24, 25, 64+25,
1176 26, 64+26, 27, 64+27,
1177 28, 64+28, 29, 64+29,
1178 30, 64+30, 31, 64+31,
1179 40, 64+40, 41, 64+41,
1180 42, 64+42, 43, 64+43,
1181 44, 64+44, 45, 64+45,
1182 46, 64+46, 47, 64+47,
1183 56, 64+56, 57, 64+57,
1184 58, 64+58, 59, 64+59,
1185 60, 64+60, 61, 64+61,
1186 62, 64+62, 63, 64+63);
1191 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1198 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1205 return (__m512i)__builtin_shufflevector((__v32hi)__A, (__v32hi)__B,
1208 12, 32+12, 13, 32+13,
1209 14, 32+14, 15, 32+15,
1210 20, 32+20, 21, 32+21,
1211 22, 32+22, 23, 32+23,
1212 28, 32+28, 29, 32+29,
1213 30, 32+30, 31, 32+31);
1218 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1225 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1232 return (__m512i)__builtin_shufflevector((__v64qi)__A, (__v64qi)__B,
1237 16, 64+16, 17, 64+17,
1238 18, 64+18, 19, 64+19,
1239 20, 64+20, 21, 64+21,
1240 22, 64+22, 23, 64+23,
1241 32, 64+32, 33, 64+33,
1242 34, 64+34, 35, 64+35,
1243 36, 64+36, 37, 64+37,
1244 38, 64+38, 39, 64+39,
1245 48, 64+48, 49, 64+49,
1246 50, 64+50, 51, 64+51,
1247 52, 64+52, 53, 64+53,
1248 54, 64+54, 55, 64+55);
1253 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1260 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1267 return (__m512i)__builtin_shufflevector((__v32hi)__A, (__v32hi)__B,
1271 10, 32+10, 11, 32+11,
1272 16, 32+16, 17, 32+17,
1273 18, 32+18, 19, 32+19,
1274 24, 32+24, 25, 32+25,
1275 26, 32+26, 27, 32+27);
1280 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1287 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1296 return (__m512i)__builtin_convertvector((__v32qs)__A, __v32hi);
1301 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1308 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1315 return (__m512i)__builtin_convertvector((__v32qu)__A, __v32hi);
1320 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1327 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1332#define _mm512_shufflehi_epi16(A, imm) \
1333 ((__m512i)__builtin_ia32_pshufhw512((__v32hi)(__m512i)(A), (int)(imm)))
1335#define _mm512_mask_shufflehi_epi16(W, U, A, imm) \
1336 ((__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1337 (__v32hi)_mm512_shufflehi_epi16((A), \
1339 (__v32hi)(__m512i)(W)))
1341#define _mm512_maskz_shufflehi_epi16(U, A, imm) \
1342 ((__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1343 (__v32hi)_mm512_shufflehi_epi16((A), \
1345 (__v32hi)_mm512_setzero_si512()))
1347#define _mm512_shufflelo_epi16(A, imm) \
1348 ((__m512i)__builtin_ia32_pshuflw512((__v32hi)(__m512i)(A), (int)(imm)))
1351#define _mm512_mask_shufflelo_epi16(W, U, A, imm) \
1352 ((__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1353 (__v32hi)_mm512_shufflelo_epi16((A), \
1355 (__v32hi)(__m512i)(W)))
1358#define _mm512_maskz_shufflelo_epi16(U, A, imm) \
1359 ((__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1360 (__v32hi)_mm512_shufflelo_epi16((A), \
1362 (__v32hi)_mm512_setzero_si512()))
1367 return (__m512i)__builtin_ia32_psllv32hi((__v32hi) __A, (__v32hi) __B);
1373 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1381 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1389 return (__m512i)__builtin_ia32_psllw512((__v32hi) __A, (__v8hi) __B);
1395 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1403 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1410 return (__m512i)__builtin_ia32_psllwi512((__v32hi)__A, (
int)__B);
1416 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1423 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1428#define _mm512_bslli_epi128(a, imm) \
1429 ((__m512i)__builtin_ia32_pslldqi512_byteshift((__v64qi)(__m512i)(a), \
1435 return (__m512i)__builtin_ia32_psrlv32hi((__v32hi)__A, (__v32hi)__B);
1441 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1449 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1457 return (__m512i)__builtin_ia32_psrav32hi((__v32hi)__A, (__v32hi)__B);
1463 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1471 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1479 return (__m512i)__builtin_ia32_psraw512((__v32hi) __A, (__v8hi) __B);
1485 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1493 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1500 return (__m512i)__builtin_ia32_psrawi512((__v32hi)__A, (
int)__B);
1506 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1513 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1521 return (__m512i)__builtin_ia32_psrlw512((__v32hi) __A, (__v8hi) __B);
1527 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1535 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1542 return (__m512i)__builtin_ia32_psrlwi512((__v32hi)__A, (
int)__B);
1548 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1555 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1560#define _mm512_bsrli_epi128(a, imm) \
1561 ((__m512i)__builtin_ia32_psrldqi512_byteshift((__v64qi)(__m512i)(a), \
1567 return (__m512i) __builtin_ia32_selectw_512 ((
__mmask32) __U,
1574 return (__m512i) __builtin_ia32_selectw_512 ((
__mmask32) __U,
1581 return (__m512i) __builtin_ia32_selectb_512 ((
__mmask64) __U,
1589 return (__m512i) __builtin_ia32_selectb_512 ((
__mmask64) __U,
1597 return (__m512i) __builtin_ia32_selectb_512(__M,
1604 return (__m512i) __builtin_ia32_selectb_512(__M,
1624 struct __loadu_epi16 {
1627 return ((
const struct __loadu_epi16*)
__P)->__v;
1633 return (__m512i) __builtin_ia32_loaddquhi512_mask ((
const __v32hi *)
__P,
1641 return (__m512i) __builtin_ia32_loaddquhi512_mask ((
const __v32hi *)
__P,
1650 struct __loadu_epi8 {
1653 return ((
const struct __loadu_epi8*)
__P)->__v;
1659 return (__m512i) __builtin_ia32_loaddquqi512_mask ((
const __v64qi *)
__P,
1667 return (__m512i) __builtin_ia32_loaddquqi512_mask ((
const __v64qi *)
__P,
1676 struct __storeu_epi16 {
1679 ((
struct __storeu_epi16*)
__P)->
__v = __A;
1685 __builtin_ia32_storedquhi512_mask ((__v32hi *)
__P,
1693 struct __storeu_epi8 {
1696 ((
struct __storeu_epi8*)
__P)->
__v = __A;
1702 __builtin_ia32_storedquqi512_mask ((__v64qi *)
__P,
1765 return (
__mmask64) __builtin_ia32_cvtb2mask512 ((__v64qi) __A);
1771 return (
__mmask32) __builtin_ia32_cvtw2mask512 ((__v32hi) __A);
1777 return (__m512i) __builtin_ia32_cvtmask2b512 (__A);
1783 return (__m512i) __builtin_ia32_cvtmask2w512 (__A);
1788 return (__m512i)__builtin_shufflevector((__v16qi) __A, (__v16qi) __A,
1789 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
1790 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
1791 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
1792 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);
1798 return (__m512i)__builtin_ia32_selectb_512(__M,
1805 return (__m512i)__builtin_ia32_selectb_512(__M,
1813 return (__m512i) __builtin_ia32_selectw_512(__M,
1820 return (__m512i) __builtin_ia32_selectw_512(__M,
1827 return (__m512i)__builtin_shufflevector((__v8hi) __A, (__v8hi) __A,
1828 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
1829 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);
1835 return (__m512i)__builtin_ia32_selectw_512(__M,
1843 return (__m512i)__builtin_ia32_selectw_512(__M,
1850 return (__m512i)__builtin_ia32_permvarhi512((__v32hi)__B, (__v32hi)__A);
1855 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
1863 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
1868#define _mm512_alignr_epi8(A, B, N) \
1869 ((__m512i)__builtin_ia32_palignr512((__v64qi)(__m512i)(A), \
1870 (__v64qi)(__m512i)(B), (int)(N)))
1872#define _mm512_mask_alignr_epi8(W, U, A, B, N) \
1873 ((__m512i)__builtin_ia32_selectb_512((__mmask64)(U), \
1874 (__v64qi)_mm512_alignr_epi8((A), (B), (int)(N)), \
1875 (__v64qi)(__m512i)(W)))
1877#define _mm512_maskz_alignr_epi8(U, A, B, N) \
1878 ((__m512i)__builtin_ia32_selectb_512((__mmask64)(U), \
1879 (__v64qi)_mm512_alignr_epi8((A), (B), (int)(N)), \
1880 (__v64qi)(__m512i)_mm512_setzero_si512()))
1882#define _mm512_dbsad_epu8(A, B, imm) \
1883 ((__m512i)__builtin_ia32_dbpsadbw512((__v64qi)(__m512i)(A), \
1884 (__v64qi)(__m512i)(B), (int)(imm)))
1886#define _mm512_mask_dbsad_epu8(W, U, A, B, imm) \
1887 ((__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1888 (__v32hi)_mm512_dbsad_epu8((A), (B), (imm)), \
1889 (__v32hi)(__m512i)(W)))
1891#define _mm512_maskz_dbsad_epu8(U, A, B, imm) \
1892 ((__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1893 (__v32hi)_mm512_dbsad_epu8((A), (B), (imm)), \
1894 (__v32hi)_mm512_setzero_si512()))
1899 return (__m512i) __builtin_ia32_psadbw512 ((__v64qi) __A,
1903#undef __DEFAULT_FN_ATTRS512
1904#undef __DEFAULT_FN_ATTRS
1905#undef __DEFAULT_FN_ATTRS512_CONSTEXPR
1906#undef __DEFAULT_FN_ATTRS_CONSTEXPR
_Float16 __2f16 __attribute__((ext_vector_type(2)))
Zeroes the upper 128 bits (bits 255:128) of all YMM registers.
#define __DEFAULT_FN_ATTRS
#define __DEFAULT_FN_ATTRS_CONSTEXPR
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_unpacklo_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ unsigned char __DEFAULT_FN_ATTRS_CONSTEXPR _kortestc_mask64_u8(__mmask64 __A, __mmask64 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_sll_epi16(__mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_broadcastb_epi8(__m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_unpacklo_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_permutex2var_epi16(__mmask32 __U, __m512i __A, __m512i __I, __m512i __B)
#define _mm512_cmpeq_epi16_mask(A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_abs_epi16(__mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mullo_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_sub_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_permutex2var_epi16(__m512i __A, __mmask32 __U, __m512i __I, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _cvtu64_mask64(unsigned long long __A)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS_CONSTEXPR _kor_mask32(__mmask32 __A, __mmask32 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_max_epu8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_min_epu8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mulhi_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_adds_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_srlv_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_cvtepu8_epi16(__mmask32 __U, __m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_min_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_min_epu16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_packus_epi32(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_sub_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _load_mask32(__mmask32 *__A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_sllv_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_subs_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS512 _mm512_mask_cvtepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_blend_epi8(__mmask64 __U, __m512i __A, __m512i __W)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_unpacklo_epi16(__m512i __A, __m512i __B)
static __inline__ unsigned char __DEFAULT_FN_ATTRS_CONSTEXPR _ktestz_mask64_u8(__mmask64 __A, __mmask64 __B)
static __inline__ unsigned char __DEFAULT_FN_ATTRS_CONSTEXPR _ktest_mask64_u8(__mmask64 __A, __mmask64 __B, unsigned char *__C)
#define __DEFAULT_FN_ATTRS512_CONSTEXPR
static __inline__ __mmask32 __DEFAULT_FN_ATTRS_CONSTEXPR _kxnor_mask32(__mmask32 __A, __mmask32 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_max_epi16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_permutexvar_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_cvtepi8_epi16(__m512i __W, __mmask32 __U, __m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_mulhi_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_madd_epi16(__mmask16 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_srai_epi16(__m512i __A, unsigned int __B)
static __inline void __DEFAULT_FN_ATTRS512 _mm512_storeu_epi8(void *__P, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_add_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_avg_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_permutex2var_epi16(__m512i __A, __m512i __I, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_add_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_sub_epi8(__mmask64 __U, __m512i __A, __m512i __B)
#define _mm512_cmpeq_epi8_mask(A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_add_epi16(__m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS512 _mm512_mask_cvtsepi16_storeu_epi8(void *__P, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_subs_epu8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_mov_epi16(__m512i __W, __mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_sra_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_subs_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_shuffle_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_max_epi8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_sub_epi8(__m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS512 _mm512_mask_test_epi8_mask(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_packs_epi32(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
#define __DEFAULT_FN_ATTRS512
static __inline__ unsigned char __DEFAULT_FN_ATTRS_CONSTEXPR _ktestc_mask32_u8(__mmask32 __A, __mmask32 __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS512 _mm512_mask_testn_epi16_mask(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS512 _mm512_mask_cvtusepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_mulhi_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mulhrs_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_min_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_sll_epi16(__m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_sad_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_permutexvar_epi16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_srli_epi16(__m512i __W, __mmask32 __U, __m512i __A, unsigned int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_unpackhi_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_unpacklo_epi8(__m512i __A, __m512i __B)
static __inline__ unsigned char __DEFAULT_FN_ATTRS_CONSTEXPR _ktestc_mask64_u8(__mmask64 __A, __mmask64 __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS512 _mm512_mask_testn_epi8_mask(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS_CONSTEXPR _kxor_mask64(__mmask64 __A, __mmask64 __B)
#define _mm512_cmpneq_epi8_mask(A, B)
static __inline__ __m256i __DEFAULT_FN_ATTRS512 _mm512_maskz_cvtusepi16_epi8(__mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_broadcastb_epi8(__mmask64 __M, __m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_packus_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_sra_epi16(__m512i __A, __m128i __B)
static __inline__ void __DEFAULT_FN_ATTRS512 _mm512_mask_storeu_epi8(void *__P, __mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_mulhrs_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_mullo_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_abs_epi8(__mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_subs_epu16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_abs_epi8(__m512i __W, __mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_max_epu16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_set1_epi16(__mmask32 __M, short __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_subs_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS512 _mm512_test_epi16_mask(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_mov_epi8(__mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_min_epi8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ unsigned char __DEFAULT_FN_ATTRS_CONSTEXPR _kortest_mask64_u8(__mmask64 __A, __mmask64 __B, unsigned char *__C)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_adds_epu8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ unsigned char __DEFAULT_FN_ATTRS_CONSTEXPR _ktestz_mask32_u8(__mmask32 __A, __mmask32 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_srlv_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_shuffle_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_subs_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_packs_epi32(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_set1_epi8(__m512i __O, __mmask64 __M, char __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_add_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS512 _mm512_mask_storeu_epi16(void *__P, __mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_max_epi16(__m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS512 _mm512_cvtusepi16_epi8(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_broadcastw_epi16(__mmask32 __M, __m128i __A)
static __inline __mmask32 __DEFAULT_FN_ATTRS_CONSTEXPR _knot_mask32(__mmask32 __M)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_movm_epi16(__mmask32 __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_mulhi_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maddubs_epi16(__m512i __X, __m512i __Y)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_adds_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
#define _mm512_cmpneq_epi16_mask(A, B)
static __inline__ unsigned char __DEFAULT_FN_ATTRS_CONSTEXPR _kortest_mask32_u8(__mmask32 __A, __mmask32 __B, unsigned char *__C)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_sll_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_packus_epi32(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS_CONSTEXPR _kadd_mask32(__mmask32 __A, __mmask32 __B)
static __inline__ unsigned long long __DEFAULT_FN_ATTRS _cvtmask64_u64(__mmask64 __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_avg_epu8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_add_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS_CONSTEXPR _kandn_mask32(__mmask32 __A, __mmask32 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_cvtepu8_epi16(__m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_shuffle_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_movm_epi8(__mmask64 __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_loadu_epi8(__mmask64 __U, void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_slli_epi16(__mmask32 __U, __m512i __A, unsigned int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_subs_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_max_epu16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS512 _mm512_cvtsepi16_epi8(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_add_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_srav_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mulhi_epu16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_unpackhi_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_subs_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_avg_epu16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_max_epi8(__m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS_CONSTEXPR _kadd_mask64(__mmask64 __A, __mmask64 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_mulhrs_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_unpacklo_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS512 _mm512_movepi8_mask(__m512i __A)
static __inline void __DEFAULT_FN_ATTRS512 _mm512_storeu_epi16(void *__P, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_unpacklo_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_avg_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS _store_mask64(__mmask64 *__A, __mmask64 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_permutexvar_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_loadu_epi16(__m512i __W, __mmask32 __U, void const *__P)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS_CONSTEXPR _mm512_kunpackd(__mmask64 __A, __mmask64 __B)
unsigned long long __mmask64
static __inline __m512i __DEFAULT_FN_ATTRS512 _mm512_loadu_epi8(void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_unpackhi_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_adds_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_madd_epi16(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS _store_mask32(__mmask32 *__A, __mmask32 __B)
#define _mm512_mask_cmpeq_epi8_mask(k, A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_srav_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ unsigned char __DEFAULT_FN_ATTRS_CONSTEXPR _kortestz_mask64_u8(__mmask64 __A, __mmask64 __B)
#define _mm512_mask_cmpneq_epi16_mask(k, A, B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS512 _mm512_testn_epi16_mask(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_mullo_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_srai_epi16(__mmask32 __U, __m512i __A, unsigned int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_mov_epi8(__m512i __W, __mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_mov_epi16(__mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_srl_epi16(__mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_adds_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_sub_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS_CONSTEXPR _mm512_kunpackw(__mmask32 __A, __mmask32 __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS_CONSTEXPR _kand_mask32(__mmask32 __A, __mmask32 __B)
static __inline __m512i __DEFAULT_FN_ATTRS512 _mm512_loadu_epi16(void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_set1_epi16(__m512i __O, __mmask32 __M, short __A)
static __inline __mmask64 __DEFAULT_FN_ATTRS_CONSTEXPR _knot_mask64(__mmask64 __M)
static __inline__ __m256i __DEFAULT_FN_ATTRS512 _mm512_mask_cvtsepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_blend_epi16(__mmask32 __U, __m512i __A, __m512i __W)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_subs_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_adds_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_adds_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_subs_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_broadcastb_epi8(__m512i __O, __mmask64 __M, __m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_loadu_epi8(__m512i __W, __mmask64 __U, void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_slli_epi16(__m512i __W, __mmask32 __U, __m512i __A, unsigned int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_srl_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_max_epu8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_cvtepi8_epi16(__m256i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS512 _mm512_maskz_cvtsepi16_epi8(__mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_min_epu8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS_CONSTEXPR _kxor_mask32(__mmask32 __A, __mmask32 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_avg_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_adds_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_broadcastw_epi16(__m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_srli_epi16(__m512i __A, unsigned int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_mulhi_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS512 _mm512_mask_test_epi16_mask(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_adds_epu16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_abs_epi16(__m512i __A)
static __inline__ unsigned char __DEFAULT_FN_ATTRS_CONSTEXPR _kortestc_mask32_u8(__mmask32 __A, __mmask32 __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _cvtu32_mask32(unsigned int __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS512 _mm512_maskz_cvtepi16_epi8(__mmask32 __M, __m512i __A)
static __inline__ void __DEFAULT_FN_ATTRS512 _mm512_mask_cvtusepi16_storeu_epi8(void *__P, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_sra_epi16(__mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_unpackhi_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_srlv_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_unpackhi_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_abs_epi8(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask2_permutex2var_epi16(__m512i __A, __m512i __I, __mmask32 __U, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _load_mask64(__mmask64 *__A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_sllv_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS512 _mm512_cvtepi16_epi8(__m512i __A)
#define _mm512_mask_cmpeq_epi16_mask(k, A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_slli_epi16(__m512i __A, unsigned int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_broadcastw_epi16(__m512i __O, __mmask32 __M, __m128i __A)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS_CONSTEXPR _kor_mask64(__mmask64 __A, __mmask64 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_packs_epi32(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS_CONSTEXPR _kand_mask64(__mmask64 __A, __mmask64 __B)
#define _mm512_mask_cmpneq_epi8_mask(k, A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_min_epi16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_packus_epi16(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_loadu_epi16(__mmask32 __U, void const *__P)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS512 _mm512_testn_epi8_mask(__m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS_CONSTEXPR _kandn_mask64(__mmask64 __A, __mmask64 __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS512 _mm512_test_epi8_mask(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_packs_epi16(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_abs_epi16(__m512i __W, __mmask32 __U, __m512i __A)
static __inline__ unsigned char __DEFAULT_FN_ATTRS_CONSTEXPR _ktest_mask32_u8(__mmask32 __A, __mmask32 __B, unsigned char *__C)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS512 _mm512_movepi16_mask(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_subs_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_set1_epi8(__mmask64 __M, char __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_min_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_min_epi8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_sllv_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS_CONSTEXPR _kxnor_mask64(__mmask64 __A, __mmask64 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_packus_epi16(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ unsigned int __DEFAULT_FN_ATTRS _cvtmask32_u32(__mmask32 __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_madd_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_packs_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_max_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_subs_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_srl_epi16(__m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_max_epi8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_srli_epi16(__mmask32 __U, __m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_cvtepu8_epi16(__m512i __W, __mmask32 __U, __m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_adds_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_srai_epi16(__m512i __W, __mmask32 __U, __m512i __A, unsigned int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_adds_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_adds_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_srav_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_unpackhi_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_maddubs_epi16(__mmask32 __U, __m512i __X, __m512i __Y)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_avg_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ unsigned char __DEFAULT_FN_ATTRS_CONSTEXPR _kortestz_mask32_u8(__mmask32 __A, __mmask32 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_packs_epi16(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_min_epu16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_min_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_cvtepi8_epi16(__mmask32 __U, __m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_maddubs_epi16(__m512i __W, __mmask32 __U, __m512i __X, __m512i __Y)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_packus_epi32(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS512 _mm512_mask_cvtepi16_storeu_epi8(void *__P, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_max_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_min_epu16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_sub_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_max_epu16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_set1_epi8(char __w)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_and_epi32(__m512i __a, __m512i __b)
static __inline __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_setzero_si512(void)
static __inline __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_set1_epi16(short __w)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_undefined_si256(void)
Create a 256-bit integer vector with undefined values.
static __inline __m256i __DEFAULT_FN_ATTRS_CONSTEXPR _mm256_setzero_si256(void)
Constructs a 256-bit integer vector initialized to zero.
__inline unsigned int unsigned int unsigned int * __P
__inline unsigned int unsigned int __Y