11#error "Never use <avx512bwintrin.h> directly; include <immintrin.h> instead."
14#ifndef __AVX512BWINTRIN_H
15#define __AVX512BWINTRIN_H
21#define __DEFAULT_FN_ATTRS512 \
22 __attribute__((__always_inline__, __nodebug__, __target__("avx512bw"), \
23 __min_vector_width__(512)))
24#define __DEFAULT_FN_ATTRS \
25 __attribute__((__always_inline__, __nodebug__, __target__("avx512bw")))
27#if defined(__cplusplus) && (__cplusplus >= 201103L)
28#define __DEFAULT_FN_ATTRS512_CONSTEXPR __DEFAULT_FN_ATTRS512 constexpr
29#define __DEFAULT_FN_ATTRS_CONSTEXPR __DEFAULT_FN_ATTRS constexpr
31#define __DEFAULT_FN_ATTRS512_CONSTEXPR __DEFAULT_FN_ATTRS512
32#define __DEFAULT_FN_ATTRS_CONSTEXPR __DEFAULT_FN_ATTRS
38 return __builtin_ia32_knotsi(__M);
42 return __builtin_ia32_knotdi(__M);
103 return (
unsigned char)__builtin_ia32_kortestcsi(__A, __B);
109 return (
unsigned char)__builtin_ia32_kortestzsi(__A, __B);
114 *__C = (
unsigned char)__builtin_ia32_kortestcsi(__A, __B);
115 return (
unsigned char)__builtin_ia32_kortestzsi(__A, __B);
120 return (
unsigned char)__builtin_ia32_kortestcdi(__A, __B);
125 return (
unsigned char)__builtin_ia32_kortestzdi(__A, __B);
130 *__C = (
unsigned char)__builtin_ia32_kortestcdi(__A, __B);
131 return (
unsigned char)__builtin_ia32_kortestzdi(__A, __B);
137 return (
unsigned char)__builtin_ia32_ktestcsi(__A, __B);
143 return (
unsigned char)__builtin_ia32_ktestzsi(__A, __B);
148 *__C = (
unsigned char)__builtin_ia32_ktestcsi(__A, __B);
149 return (
unsigned char)__builtin_ia32_ktestzsi(__A, __B);
154 return (
unsigned char)__builtin_ia32_ktestcdi(__A, __B);
159 return (
unsigned char)__builtin_ia32_ktestzdi(__A, __B);
164 *__C = (
unsigned char)__builtin_ia32_ktestcdi(__A, __B);
165 return (
unsigned char)__builtin_ia32_ktestzdi(__A, __B);
179#define _kshiftli_mask32(A, I) \
180 ((__mmask32)__builtin_ia32_kshiftlisi((__mmask32)(A), (unsigned int)(I)))
182#define _kshiftri_mask32(A, I) \
183 ((__mmask32)__builtin_ia32_kshiftrisi((__mmask32)(A), (unsigned int)(I)))
185#define _kshiftli_mask64(A, I) \
186 ((__mmask64)__builtin_ia32_kshiftlidi((__mmask64)(A), (unsigned int)(I)))
188#define _kshiftri_mask64(A, I) \
189 ((__mmask64)__builtin_ia32_kshiftridi((__mmask64)(A), (unsigned int)(I)))
193 return (
unsigned int)__builtin_ia32_kmovd((
__mmask32)__A);
198 return (
unsigned long long)__builtin_ia32_kmovq((
__mmask64)__A);
232#define _mm512_cmp_epi8_mask(a, b, p) \
233 ((__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)(__m512i)(a), \
234 (__v64qi)(__m512i)(b), (int)(p), \
237#define _mm512_mask_cmp_epi8_mask(m, a, b, p) \
238 ((__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)(__m512i)(a), \
239 (__v64qi)(__m512i)(b), (int)(p), \
242#define _mm512_cmp_epu8_mask(a, b, p) \
243 ((__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)(__m512i)(a), \
244 (__v64qi)(__m512i)(b), (int)(p), \
247#define _mm512_mask_cmp_epu8_mask(m, a, b, p) \
248 ((__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)(__m512i)(a), \
249 (__v64qi)(__m512i)(b), (int)(p), \
252#define _mm512_cmp_epi16_mask(a, b, p) \
253 ((__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)(__m512i)(a), \
254 (__v32hi)(__m512i)(b), (int)(p), \
257#define _mm512_mask_cmp_epi16_mask(m, a, b, p) \
258 ((__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)(__m512i)(a), \
259 (__v32hi)(__m512i)(b), (int)(p), \
262#define _mm512_cmp_epu16_mask(a, b, p) \
263 ((__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)(__m512i)(a), \
264 (__v32hi)(__m512i)(b), (int)(p), \
267#define _mm512_mask_cmp_epu16_mask(m, a, b, p) \
268 ((__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)(__m512i)(a), \
269 (__v32hi)(__m512i)(b), (int)(p), \
272#define _mm512_cmpeq_epi8_mask(A, B) \
273 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_EQ)
274#define _mm512_mask_cmpeq_epi8_mask(k, A, B) \
275 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_EQ)
276#define _mm512_cmpge_epi8_mask(A, B) \
277 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_GE)
278#define _mm512_mask_cmpge_epi8_mask(k, A, B) \
279 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_GE)
280#define _mm512_cmpgt_epi8_mask(A, B) \
281 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_GT)
282#define _mm512_mask_cmpgt_epi8_mask(k, A, B) \
283 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_GT)
284#define _mm512_cmple_epi8_mask(A, B) \
285 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_LE)
286#define _mm512_mask_cmple_epi8_mask(k, A, B) \
287 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_LE)
288#define _mm512_cmplt_epi8_mask(A, B) \
289 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_LT)
290#define _mm512_mask_cmplt_epi8_mask(k, A, B) \
291 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_LT)
292#define _mm512_cmpneq_epi8_mask(A, B) \
293 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_NE)
294#define _mm512_mask_cmpneq_epi8_mask(k, A, B) \
295 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_NE)
297#define _mm512_cmpeq_epu8_mask(A, B) \
298 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_EQ)
299#define _mm512_mask_cmpeq_epu8_mask(k, A, B) \
300 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_EQ)
301#define _mm512_cmpge_epu8_mask(A, B) \
302 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_GE)
303#define _mm512_mask_cmpge_epu8_mask(k, A, B) \
304 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_GE)
305#define _mm512_cmpgt_epu8_mask(A, B) \
306 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_GT)
307#define _mm512_mask_cmpgt_epu8_mask(k, A, B) \
308 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_GT)
309#define _mm512_cmple_epu8_mask(A, B) \
310 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_LE)
311#define _mm512_mask_cmple_epu8_mask(k, A, B) \
312 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_LE)
313#define _mm512_cmplt_epu8_mask(A, B) \
314 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_LT)
315#define _mm512_mask_cmplt_epu8_mask(k, A, B) \
316 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_LT)
317#define _mm512_cmpneq_epu8_mask(A, B) \
318 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_NE)
319#define _mm512_mask_cmpneq_epu8_mask(k, A, B) \
320 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_NE)
322#define _mm512_cmpeq_epi16_mask(A, B) \
323 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_EQ)
324#define _mm512_mask_cmpeq_epi16_mask(k, A, B) \
325 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_EQ)
326#define _mm512_cmpge_epi16_mask(A, B) \
327 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_GE)
328#define _mm512_mask_cmpge_epi16_mask(k, A, B) \
329 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_GE)
330#define _mm512_cmpgt_epi16_mask(A, B) \
331 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_GT)
332#define _mm512_mask_cmpgt_epi16_mask(k, A, B) \
333 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_GT)
334#define _mm512_cmple_epi16_mask(A, B) \
335 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_LE)
336#define _mm512_mask_cmple_epi16_mask(k, A, B) \
337 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_LE)
338#define _mm512_cmplt_epi16_mask(A, B) \
339 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_LT)
340#define _mm512_mask_cmplt_epi16_mask(k, A, B) \
341 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_LT)
342#define _mm512_cmpneq_epi16_mask(A, B) \
343 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_NE)
344#define _mm512_mask_cmpneq_epi16_mask(k, A, B) \
345 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_NE)
347#define _mm512_cmpeq_epu16_mask(A, B) \
348 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_EQ)
349#define _mm512_mask_cmpeq_epu16_mask(k, A, B) \
350 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_EQ)
351#define _mm512_cmpge_epu16_mask(A, B) \
352 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_GE)
353#define _mm512_mask_cmpge_epu16_mask(k, A, B) \
354 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_GE)
355#define _mm512_cmpgt_epu16_mask(A, B) \
356 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_GT)
357#define _mm512_mask_cmpgt_epu16_mask(k, A, B) \
358 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_GT)
359#define _mm512_cmple_epu16_mask(A, B) \
360 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_LE)
361#define _mm512_mask_cmple_epu16_mask(k, A, B) \
362 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_LE)
363#define _mm512_cmplt_epu16_mask(A, B) \
364 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_LT)
365#define _mm512_mask_cmplt_epu16_mask(k, A, B) \
366 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_LT)
367#define _mm512_cmpneq_epu16_mask(A, B) \
368 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_NE)
369#define _mm512_mask_cmpneq_epu16_mask(k, A, B) \
370 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_NE)
374 return (__m512i) ((__v64qu) __A + (__v64qu) __B);
379 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
386 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
393 return (__m512i) ((__v64qu) __A - (__v64qu) __B);
398 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
405 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
412 return (__m512i) ((__v32hu) __A + (__v32hu) __B);
417 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
424 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
431 return (__m512i) ((__v32hu) __A - (__v32hu) __B);
436 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
443 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
450 return (__m512i) ((__v32hu) __A * (__v32hu) __B);
455 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
462 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
470 return (__m512i) __builtin_ia32_selectb_512 ((
__mmask64) __U,
478 return (__m512i) __builtin_ia32_selectw_512 ((
__mmask32) __U,
485 return (__m512i)__builtin_elementwise_abs((__v64qs)__A);
490 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
497 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
504 return (__m512i)__builtin_elementwise_abs((__v32hi)__A);
509 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
516 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
524 return (__m512i)__builtin_ia32_packssdw512((__v16si)__A, (__v16si)__B);
530 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
538 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
546 return (__m512i)__builtin_ia32_packsswb512((__v32hi)__A, (__v32hi) __B);
552 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
560 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
568 return (__m512i)__builtin_ia32_packusdw512((__v16si) __A, (__v16si) __B);
574 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
582 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
590 return (__m512i)__builtin_ia32_packuswb512((__v32hi) __A, (__v32hi) __B);
596 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
604 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
611 return (__m512i)__builtin_elementwise_add_sat((__v64qs)__A, (__v64qs)__B);
617 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
625 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
632 return (__m512i)__builtin_elementwise_add_sat((__v32hi)__A, (__v32hi)__B);
638 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
646 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
653 return (__m512i)__builtin_elementwise_add_sat((__v64qu) __A, (__v64qu) __B);
659 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
667 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
674 return (__m512i)__builtin_elementwise_add_sat((__v32hu) __A, (__v32hu) __B);
680 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
688 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
695 return (__m512i)__builtin_ia32_pavgb512((__v64qu)__A, (__v64qu)__B);
700 return (__m512i)__builtin_ia32_selectb_512(
706 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
713 return (__m512i)__builtin_ia32_pavgw512((__v32hu)__A, (__v32hu)__B);
718 return (__m512i)__builtin_ia32_selectw_512(
724 return (__m512i)__builtin_ia32_selectw_512(
731 return (__m512i)__builtin_elementwise_max((__v64qs) __A, (__v64qs) __B);
736 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
743 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
750 return (__m512i)__builtin_elementwise_max((__v32hi) __A, (__v32hi) __B);
755 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
762 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
769 return (__m512i)__builtin_elementwise_max((__v64qu)__A, (__v64qu)__B);
774 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
781 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
788 return (__m512i)__builtin_elementwise_max((__v32hu)__A, (__v32hu)__B);
793 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
800 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
807 return (__m512i)__builtin_elementwise_min((__v64qs) __A, (__v64qs) __B);
812 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
819 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
826 return (__m512i)__builtin_elementwise_min((__v32hi) __A, (__v32hi) __B);
831 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
838 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
845 return (__m512i)__builtin_elementwise_min((__v64qu)__A, (__v64qu)__B);
850 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
857 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
864 return (__m512i)__builtin_elementwise_min((__v32hu)__A, (__v32hu)__B);
869 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
876 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
884 return (__m512i)__builtin_ia32_pshufb512((__v64qi)__A,(__v64qi)__B);
890 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
898 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
905 return (__m512i)__builtin_elementwise_sub_sat((__v64qs)__A, (__v64qs)__B);
911 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
919 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
926 return (__m512i)__builtin_elementwise_sub_sat((__v32hi)__A, (__v32hi)__B);
932 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
940 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
947 return (__m512i)__builtin_elementwise_sub_sat((__v64qu) __A, (__v64qu) __B);
953 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
961 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
968 return (__m512i)__builtin_elementwise_sub_sat((__v32hu) __A, (__v32hu) __B);
974 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
982 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
990 return (__m512i)__builtin_ia32_vpermi2varhi512((__v32hi)__A, (__v32hi)__I,
998 return (__m512i)__builtin_ia32_selectw_512(__U,
1007 return (__m512i)__builtin_ia32_selectw_512(__U,
1016 return (__m512i)__builtin_ia32_selectw_512(__U,
1024 return (__m512i)__builtin_ia32_pmulhrsw512((__v32hi)__A, (__v32hi)__B);
1030 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1038 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1045 return (__m512i)__builtin_ia32_pmulhw512((__v32hi)__A, (__v32hi)__B);
1050 return (__m512i)__builtin_ia32_selectw_512(
1056 return (__m512i)__builtin_ia32_selectw_512(
1063 return (__m512i)__builtin_ia32_pmulhuw512((__v32hu)__A, (__v32hu)__B);
1068 return (__m512i)__builtin_ia32_selectw_512(
1074 return (__m512i)__builtin_ia32_selectw_512(
1081 return (__m512i)__builtin_ia32_pmaddubsw512((__v64qi)__X, (__v64qi)
__Y);
1087 return (__m512i)__builtin_ia32_selectw_512((
__mmask32) __U,
1094 return (__m512i)__builtin_ia32_selectw_512((
__mmask32) __U,
1101 return (__m512i)__builtin_ia32_pmaddwd512((__v32hi)__A, (__v32hi)__B);
1106 return (__m512i)__builtin_ia32_selectd_512((
__mmask16)__U,
1113 return (__m512i)__builtin_ia32_selectd_512((
__mmask16)__U,
1120 return (__m256i) __builtin_ia32_pmovswb512_mask ((__v32hi) __A,
1127 return (__m256i) __builtin_ia32_pmovswb512_mask ((__v32hi) __A,
1134 return (__m256i) __builtin_ia32_pmovswb512_mask ((__v32hi) __A,
1141 return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,
1148 return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,
1155 return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,
1162 return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,
1169 return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,
1176 return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,
1184 __builtin_ia32_pmovwb512mem_mask ((__v32qi *)
__P, (__v32hi) __A, __M);
1190 __builtin_ia32_pmovswb512mem_mask ((__v32qi *)
__P, (__v32hi) __A, __M);
1196 __builtin_ia32_pmovuswb512mem_mask ((__v32qi *)
__P, (__v32hi) __A, __M);
1201 return (__m512i)__builtin_shufflevector((__v64qi)__A, (__v64qi)__B,
1203 10, 64+10, 11, 64+11,
1204 12, 64+12, 13, 64+13,
1205 14, 64+14, 15, 64+15,
1206 24, 64+24, 25, 64+25,
1207 26, 64+26, 27, 64+27,
1208 28, 64+28, 29, 64+29,
1209 30, 64+30, 31, 64+31,
1210 40, 64+40, 41, 64+41,
1211 42, 64+42, 43, 64+43,
1212 44, 64+44, 45, 64+45,
1213 46, 64+46, 47, 64+47,
1214 56, 64+56, 57, 64+57,
1215 58, 64+58, 59, 64+59,
1216 60, 64+60, 61, 64+61,
1217 62, 64+62, 63, 64+63);
1222 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1229 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1236 return (__m512i)__builtin_shufflevector((__v32hi)__A, (__v32hi)__B,
1239 12, 32+12, 13, 32+13,
1240 14, 32+14, 15, 32+15,
1241 20, 32+20, 21, 32+21,
1242 22, 32+22, 23, 32+23,
1243 28, 32+28, 29, 32+29,
1244 30, 32+30, 31, 32+31);
1249 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1256 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1263 return (__m512i)__builtin_shufflevector((__v64qi)__A, (__v64qi)__B,
1268 16, 64+16, 17, 64+17,
1269 18, 64+18, 19, 64+19,
1270 20, 64+20, 21, 64+21,
1271 22, 64+22, 23, 64+23,
1272 32, 64+32, 33, 64+33,
1273 34, 64+34, 35, 64+35,
1274 36, 64+36, 37, 64+37,
1275 38, 64+38, 39, 64+39,
1276 48, 64+48, 49, 64+49,
1277 50, 64+50, 51, 64+51,
1278 52, 64+52, 53, 64+53,
1279 54, 64+54, 55, 64+55);
1284 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1291 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1298 return (__m512i)__builtin_shufflevector((__v32hi)__A, (__v32hi)__B,
1302 10, 32+10, 11, 32+11,
1303 16, 32+16, 17, 32+17,
1304 18, 32+18, 19, 32+19,
1305 24, 32+24, 25, 32+25,
1306 26, 32+26, 27, 32+27);
1311 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1318 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1327 return (__m512i)__builtin_convertvector((__v32qs)__A, __v32hi);
1333 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1341 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1348 return (__m512i)__builtin_convertvector((__v32qu)__A, __v32hi);
1354 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1362 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1368#define _mm512_shufflehi_epi16(A, imm) \
1369 ((__m512i)__builtin_ia32_pshufhw512((__v32hi)(__m512i)(A), (int)(imm)))
1371#define _mm512_mask_shufflehi_epi16(W, U, A, imm) \
1372 ((__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1373 (__v32hi)_mm512_shufflehi_epi16((A), \
1375 (__v32hi)(__m512i)(W)))
1377#define _mm512_maskz_shufflehi_epi16(U, A, imm) \
1378 ((__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1379 (__v32hi)_mm512_shufflehi_epi16((A), \
1381 (__v32hi)_mm512_setzero_si512()))
1383#define _mm512_shufflelo_epi16(A, imm) \
1384 ((__m512i)__builtin_ia32_pshuflw512((__v32hi)(__m512i)(A), (int)(imm)))
1387#define _mm512_mask_shufflelo_epi16(W, U, A, imm) \
1388 ((__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1389 (__v32hi)_mm512_shufflelo_epi16((A), \
1391 (__v32hi)(__m512i)(W)))
1394#define _mm512_maskz_shufflelo_epi16(U, A, imm) \
1395 ((__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1396 (__v32hi)_mm512_shufflelo_epi16((A), \
1398 (__v32hi)_mm512_setzero_si512()))
1403 return (__m512i)__builtin_ia32_psllv32hi((__v32hi) __A, (__v32hi) __B);
1409 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1417 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1425 return (__m512i)__builtin_ia32_psllw512((__v32hi) __A, (__v8hi) __B);
1431 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1439 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1446 return (__m512i)__builtin_ia32_psllwi512((__v32hi)__A, (
int)__B);
1452 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1459 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1464#define _mm512_bslli_epi128(a, imm) \
1465 ((__m512i)__builtin_ia32_pslldqi512_byteshift((__v8di)(__m512i)(a), (int)(imm)))
1470 return (__m512i)__builtin_ia32_psrlv32hi((__v32hi)__A, (__v32hi)__B);
1476 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1484 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1492 return (__m512i)__builtin_ia32_psrav32hi((__v32hi)__A, (__v32hi)__B);
1498 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1506 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1514 return (__m512i)__builtin_ia32_psraw512((__v32hi) __A, (__v8hi) __B);
1520 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1528 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1535 return (__m512i)__builtin_ia32_psrawi512((__v32hi)__A, (
int)__B);
1541 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1548 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1556 return (__m512i)__builtin_ia32_psrlw512((__v32hi) __A, (__v8hi) __B);
1562 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1570 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1577 return (__m512i)__builtin_ia32_psrlwi512((__v32hi)__A, (
int)__B);
1583 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1590 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1595#define _mm512_bsrli_epi128(a, imm) \
1596 ((__m512i)__builtin_ia32_psrldqi512_byteshift((__v8di)(__m512i)(a), (int)(imm)))
1601 return (__m512i) __builtin_ia32_selectw_512 ((
__mmask32) __U,
1609 return (__m512i) __builtin_ia32_selectw_512 ((
__mmask32) __U,
1617 return (__m512i) __builtin_ia32_selectb_512 ((
__mmask64) __U,
1625 return (__m512i) __builtin_ia32_selectb_512 ((
__mmask64) __U,
1633 return (__m512i) __builtin_ia32_selectb_512(__M,
1641 return (__m512i) __builtin_ia32_selectb_512(__M,
1662 struct __loadu_epi16 {
1665 return ((
const struct __loadu_epi16*)
__P)->__v;
1671 return (__m512i) __builtin_ia32_loaddquhi512_mask ((
const __v32hi *)
__P,
1679 return (__m512i) __builtin_ia32_loaddquhi512_mask ((
const __v32hi *)
__P,
1688 struct __loadu_epi8 {
1691 return ((
const struct __loadu_epi8*)
__P)->__v;
1697 return (__m512i) __builtin_ia32_loaddquqi512_mask ((
const __v64qi *)
__P,
1705 return (__m512i) __builtin_ia32_loaddquqi512_mask ((
const __v64qi *)
__P,
1714 struct __storeu_epi16 {
1717 ((
struct __storeu_epi16*)
__P)->
__v = __A;
1723 __builtin_ia32_storedquhi512_mask ((__v32hi *)
__P,
1731 struct __storeu_epi8 {
1734 ((
struct __storeu_epi8*)
__P)->
__v = __A;
1740 __builtin_ia32_storedquqi512_mask ((__v64qi *)
__P,
1803 return (
__mmask64) __builtin_ia32_cvtb2mask512 ((__v64qi) __A);
1809 return (
__mmask32) __builtin_ia32_cvtw2mask512 ((__v32hi) __A);
1815 return (__m512i) __builtin_ia32_cvtmask2b512 (__A);
1821 return (__m512i) __builtin_ia32_cvtmask2w512 (__A);
1826 return (__m512i)__builtin_shufflevector((__v16qi) __A, (__v16qi) __A,
1827 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
1828 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
1829 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
1830 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);
1836 return (__m512i)__builtin_ia32_selectb_512(__M,
1844 return (__m512i)__builtin_ia32_selectb_512(__M,
1852 return (__m512i) __builtin_ia32_selectw_512(__M,
1860 return (__m512i) __builtin_ia32_selectw_512(__M,
1867 return (__m512i)__builtin_shufflevector((__v8hi) __A, (__v8hi) __A,
1868 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
1869 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);
1875 return (__m512i)__builtin_ia32_selectw_512(__M,
1883 return (__m512i)__builtin_ia32_selectw_512(__M,
1891 return (__m512i)__builtin_ia32_permvarhi512((__v32hi)__B, (__v32hi)__A);
1898 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
1907 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
1912#define _mm512_alignr_epi8(A, B, N) \
1913 ((__m512i)__builtin_ia32_palignr512((__v64qi)(__m512i)(A), \
1914 (__v64qi)(__m512i)(B), (int)(N)))
1916#define _mm512_mask_alignr_epi8(W, U, A, B, N) \
1917 ((__m512i)__builtin_ia32_selectb_512((__mmask64)(U), \
1918 (__v64qi)_mm512_alignr_epi8((A), (B), (int)(N)), \
1919 (__v64qi)(__m512i)(W)))
1921#define _mm512_maskz_alignr_epi8(U, A, B, N) \
1922 ((__m512i)__builtin_ia32_selectb_512((__mmask64)(U), \
1923 (__v64qi)_mm512_alignr_epi8((A), (B), (int)(N)), \
1924 (__v64qi)(__m512i)_mm512_setzero_si512()))
1926#define _mm512_dbsad_epu8(A, B, imm) \
1927 ((__m512i)__builtin_ia32_dbpsadbw512((__v64qi)(__m512i)(A), \
1928 (__v64qi)(__m512i)(B), (int)(imm)))
1930#define _mm512_mask_dbsad_epu8(W, U, A, B, imm) \
1931 ((__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1932 (__v32hi)_mm512_dbsad_epu8((A), (B), (imm)), \
1933 (__v32hi)(__m512i)(W)))
1935#define _mm512_maskz_dbsad_epu8(U, A, B, imm) \
1936 ((__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1937 (__v32hi)_mm512_dbsad_epu8((A), (B), (imm)), \
1938 (__v32hi)_mm512_setzero_si512()))
1943 return (__m512i) __builtin_ia32_psadbw512 ((__v64qi) __A,
1947#undef __DEFAULT_FN_ATTRS512
1948#undef __DEFAULT_FN_ATTRS
1949#undef __DEFAULT_FN_ATTRS512_CONSTEXPR
1950#undef __DEFAULT_FN_ATTRS_CONSTEXPR
_Float16 __2f16 __attribute__((ext_vector_type(2)))
Zeroes the upper 128 bits (bits 255:128) of all YMM registers.
#define __DEFAULT_FN_ATTRS
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_unpackhi_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_sll_epi16(__mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_broadcastb_epi8(__m128i __A)
#define _mm512_cmpeq_epi16_mask(A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_abs_epi16(__mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mullo_epi16(__m512i __A, __m512i __B)
static __inline__ unsigned char __DEFAULT_FN_ATTRS _kortest_mask64_u8(__mmask64 __A, __mmask64 __B, unsigned char *__C)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_subs_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_permutex2var_epi16(__mmask32 __U, __m512i __A, __m512i __I, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_madd_epi16(__mmask16 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _cvtu64_mask64(unsigned long long __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_max_epu8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_min_epu8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_kunpackw(__mmask32 __A, __mmask32 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mulhi_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_adds_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_adds_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_subs_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_srlv_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_sub_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_min_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_adds_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_min_epu16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _load_mask32(__mmask32 *__A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_sllv_epi16(__m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS512 _mm512_mask_cvtepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_unpacklo_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_broadcastw_epi16(__m512i __O, __mmask32 __M, __m128i __A)
#define __DEFAULT_FN_ATTRS512_CONSTEXPR
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _kand_mask64(__mmask64 __A, __mmask64 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_max_epi16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_shuffle_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_mulhi_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_set1_epi8(__m512i __O, __mmask64 __M, char __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_permutexvar_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_srai_epi16(__m512i __A, unsigned int __B)
static __inline void __DEFAULT_FN_ATTRS512 _mm512_storeu_epi8(void *__P, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask2_permutex2var_epi16(__m512i __A, __m512i __I, __mmask32 __U, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_avg_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_cvtepi8_epi16(__mmask32 __U, __m256i __A)
#define _mm512_cmpeq_epi8_mask(A, B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _kandn_mask32(__mmask32 __A, __mmask32 __B)
static __inline__ unsigned char __DEFAULT_FN_ATTRS _ktestc_mask32_u8(__mmask32 __A, __mmask32 __B)
static __inline__ void __DEFAULT_FN_ATTRS512 _mm512_mask_cvtsepi16_storeu_epi8(void *__P, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_broadcastw_epi16(__mmask32 __M, __m128i __A)
static __inline__ unsigned char __DEFAULT_FN_ATTRS _ktest_mask32_u8(__mmask32 __A, __mmask32 __B, unsigned char *__C)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_sra_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_set1_epi16(__mmask32 __M, short __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_subs_epu8(__m512i __A, __m512i __B)
static __inline__ unsigned char __DEFAULT_FN_ATTRS _ktestc_mask64_u8(__mmask64 __A, __mmask64 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_max_epi8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_packus_epi32(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_add_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_sub_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS512 _mm512_mask_test_epi8_mask(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ unsigned char __DEFAULT_FN_ATTRS _kortestz_mask64_u8(__mmask64 __A, __mmask64 __B)
#define __DEFAULT_FN_ATTRS512
static __inline__ __mmask32 __DEFAULT_FN_ATTRS512 _mm512_mask_testn_epi16_mask(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS512 _mm512_mask_cvtusepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_mulhi_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_min_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_sll_epi16(__m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_sad_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_permutexvar_epi16(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _kand_mask32(__mmask32 __A, __mmask32 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_sub_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_srli_epi16(__m512i __W, __mmask32 __U, __m512i __A, unsigned int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_unpacklo_epi8(__m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS512 _mm512_mask_testn_epi8_mask(__mmask64 __U, __m512i __A, __m512i __B)
#define _mm512_cmpneq_epi8_mask(A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_subs_epu8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS512 _mm512_maskz_cvtusepi16_epi8(__mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mulhrs_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_sra_epi16(__m512i __A, __m128i __B)
static __inline__ void __DEFAULT_FN_ATTRS512 _mm512_mask_storeu_epi8(void *__P, __mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_mullo_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_abs_epi8(__mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_subs_epu16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_abs_epi8(__m512i __W, __mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_max_epu16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_sub_epi16(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS512 _mm512_test_epi16_mask(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_mov_epi8(__m512i __W, __mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_min_epi8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_add_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_srlv_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_subs_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_subs_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS512 _mm512_mask_storeu_epi16(void *__P, __mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_max_epi16(__m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS512 _mm512_cvtusepi16_epi8(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_movm_epi16(__mmask32 __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_mulhi_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _kadd_mask32(__mmask32 __A, __mmask32 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_mulhrs_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _kor_mask64(__mmask64 __A, __mmask64 __B)
#define _mm512_cmpneq_epi16_mask(A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_sll_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_shuffle_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_permutex2var_epi16(__m512i __A, __mmask32 __U, __m512i __I, __m512i __B)
static __inline__ unsigned long long __DEFAULT_FN_ATTRS _cvtmask64_u64(__mmask64 __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_avg_epu8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_packus_epi32(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_cvtepu8_epi16(__m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_movm_epi8(__mmask64 __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_loadu_epi8(__mmask64 __U, void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_slli_epi16(__mmask32 __U, __m512i __A, unsigned int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_max_epu16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS512 _mm512_cvtsepi16_epi8(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_madd_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_srav_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_set1_epi8(__mmask64 __M, char __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mulhi_epu16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_permutexvar_epi16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_unpackhi_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_add_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_adds_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_avg_epu16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_max_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_sub_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS512 _mm512_movepi8_mask(__m512i __A)
static __inline void __DEFAULT_FN_ATTRS512 _mm512_storeu_epi16(void *__P, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_maddubs_epi16(__m512i __W, __mmask32 __U, __m512i __X, __m512i __Y)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_avg_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS _store_mask64(__mmask64 *__A, __mmask64 __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _kandn_mask64(__mmask64 __A, __mmask64 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_adds_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_permutex2var_epi16(__m512i __A, __m512i __I, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_packs_epi32(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_packus_epi16(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_loadu_epi16(__m512i __W, __mmask32 __U, void const *__P)
static __inline__ unsigned char __DEFAULT_FN_ATTRS _kortestc_mask64_u8(__mmask64 __A, __mmask64 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_cvtepi8_epi16(__m512i __W, __mmask32 __U, __m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_unpacklo_epi8(__mmask64 __U, __m512i __A, __m512i __B)
unsigned long long __mmask64
static __inline __m512i __DEFAULT_FN_ATTRS512 _mm512_loadu_epi8(void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_unpackhi_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_unpackhi_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_subs_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_subs_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_kunpackd(__mmask64 __A, __mmask64 __B)
static __inline__ void __DEFAULT_FN_ATTRS _store_mask32(__mmask32 *__A, __mmask32 __B)
#define _mm512_mask_cmpeq_epi8_mask(k, A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_srav_epi16(__mmask32 __U, __m512i __A, __m512i __B)
#define _mm512_mask_cmpneq_epi16_mask(k, A, B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS512 _mm512_testn_epi16_mask(__m512i __A, __m512i __B)
static __inline__ unsigned char __DEFAULT_FN_ATTRS _ktestz_mask32_u8(__mmask32 __A, __mmask32 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_mullo_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maddubs_epi16(__m512i __X, __m512i __Y)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_srai_epi16(__mmask32 __U, __m512i __A, unsigned int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_subs_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _kxor_mask32(__mmask32 __A, __mmask32 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_srl_epi16(__mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _kor_mask32(__mmask32 __A, __mmask32 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_packs_epi32(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline __m512i __DEFAULT_FN_ATTRS512 _mm512_loadu_epi16(void const *__P)
static __inline__ __m256i __DEFAULT_FN_ATTRS512 _mm512_mask_cvtsepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_unpackhi_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_adds_epi8(__m512i __A, __m512i __B)
static __inline __mmask32 __DEFAULT_FN_ATTRS _knot_mask32(__mmask32 __M)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_mulhrs_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_loadu_epi8(__m512i __W, __mmask64 __U, void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_slli_epi16(__m512i __W, __mmask32 __U, __m512i __A, unsigned int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_srl_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_max_epu8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_cvtepi8_epi16(__m256i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS512 _mm512_maskz_cvtsepi16_epi8(__mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_maddubs_epi16(__mmask32 __U, __m512i __X, __m512i __Y)
static __inline__ unsigned char __DEFAULT_FN_ATTRS _ktestz_mask64_u8(__mmask64 __A, __mmask64 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_min_epu8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_adds_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_packus_epi16(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_avg_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_packs_epi32(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_unpacklo_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_broadcastw_epi16(__m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_srli_epi16(__m512i __A, unsigned int __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _kxor_mask64(__mmask64 __A, __mmask64 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_mulhi_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_broadcastb_epi8(__m512i __O, __mmask64 __M, __m128i __A)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS512 _mm512_mask_test_epi16_mask(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_adds_epu16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_abs_epi16(__m512i __A)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _cvtu32_mask32(unsigned int __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS512 _mm512_maskz_cvtepi16_epi8(__mmask32 __M, __m512i __A)
static __inline__ void __DEFAULT_FN_ATTRS512 _mm512_mask_cvtusepi16_storeu_epi8(void *__P, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_sra_epi16(__mmask32 __U, __m512i __A, __m128i __B)
static __inline__ unsigned char __DEFAULT_FN_ATTRS _ktest_mask64_u8(__mmask64 __A, __mmask64 __B, unsigned char *__C)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_srlv_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_packus_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_unpackhi_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_sub_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_abs_epi8(__m512i __A)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _load_mask64(__mmask64 *__A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_broadcastb_epi8(__mmask64 __M, __m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_sllv_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS512 _mm512_cvtepi16_epi8(__m512i __A)
#define _mm512_mask_cmpeq_epi16_mask(k, A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_slli_epi16(__m512i __A, unsigned int __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _kxnor_mask32(__mmask32 __A, __mmask32 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_set1_epi16(__m512i __O, __mmask32 __M, short __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_blend_epi16(__mmask32 __U, __m512i __A, __m512i __W)
static __inline__ unsigned char __DEFAULT_FN_ATTRS _kortestc_mask32_u8(__mmask32 __A, __mmask32 __B)
#define _mm512_mask_cmpneq_epi8_mask(k, A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_subs_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_shuffle_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_min_epi16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _kadd_mask64(__mmask64 __A, __mmask64 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_loadu_epi16(__mmask32 __U, void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_cvtepu8_epi16(__m512i __W, __mmask32 __U, __m256i __A)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS512 _mm512_testn_epi8_mask(__m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS512 _mm512_test_epi8_mask(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_abs_epi16(__m512i __W, __mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_packs_epi16(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_unpacklo_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS512 _mm512_movepi16_mask(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_subs_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_add_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_min_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_packus_epi32(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_min_epi8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_sllv_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ unsigned char __DEFAULT_FN_ATTRS _kortest_mask32_u8(__mmask32 __A, __mmask32 __B, unsigned char *__C)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_adds_epu8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _kxnor_mask64(__mmask64 __A, __mmask64 __B)
static __inline__ unsigned int __DEFAULT_FN_ATTRS _cvtmask32_u32(__mmask32 __A)
static __inline__ unsigned char __DEFAULT_FN_ATTRS _kortestz_mask32_u8(__mmask32 __A, __mmask32 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_adds_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_max_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_blend_epi8(__mmask64 __U, __m512i __A, __m512i __W)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_srl_epi16(__m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_max_epi8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_maskz_srli_epi16(__mmask32 __U, __m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_adds_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_unpacklo_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_packs_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_srai_epi16(__m512i __W, __mmask32 __U, __m512i __A, unsigned int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_mov_epi16(__m512i __W, __mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_add_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_cvtepu8_epi16(__mmask32 __U, __m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_adds_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_srav_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_add_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_avg_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline __mmask64 __DEFAULT_FN_ATTRS _knot_mask64(__mmask64 __M)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_mask_madd_epi16(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_min_epu16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_min_epu8(__m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS512 _mm512_mask_cvtepi16_storeu_epi8(void *__P, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_max_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_packs_epi16(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_mov_epi16(__mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_maskz_mov_epi8(__mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_min_epu16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_mask_max_epu16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_set1_epi8(char __w)
static __inline__ __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_and_epi32(__m512i __a, __m512i __b)
static __inline __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_setzero_si512(void)
static __inline __m512i __DEFAULT_FN_ATTRS512_CONSTEXPR _mm512_set1_epi16(short __w)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_undefined_si256(void)
Create a 256-bit integer vector with undefined values.
static __inline __m256i __DEFAULT_FN_ATTRS_CONSTEXPR _mm256_setzero_si256(void)
Constructs a 256-bit integer vector initialized to zero.
__inline unsigned int unsigned int unsigned int * __P
__inline unsigned int unsigned int __Y