clang  12.0.0git
avx512vlvnniintrin.h
Go to the documentation of this file.
1 /*===------------- avx512vlvnniintrin.h - VNNI intrinsics ------------------===
2  *
3  *
4  * Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
5  * See https://llvm.org/LICENSE.txt for license information.
6  * SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
7  *
8  *===-----------------------------------------------------------------------===
9  */
10 #ifndef __IMMINTRIN_H
11 #error "Never use <avx512vlvnniintrin.h> directly; include <immintrin.h> instead."
12 #endif
13 
14 #ifndef __AVX512VLVNNIINTRIN_H
15 #define __AVX512VLVNNIINTRIN_H
16 
17 /* Define the default attributes for the functions in this file. */
18 #define __DEFAULT_FN_ATTRS128 __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512vnni"), __min_vector_width__(128)))
19 #define __DEFAULT_FN_ATTRS256 __attribute__((__always_inline__, __nodebug__, __target__("avx512vl,avx512vnni"), __min_vector_width__(256)))
20 
21 
22 static __inline__ __m256i __DEFAULT_FN_ATTRS256
23 _mm256_dpbusd_epi32(__m256i __S, __m256i __A, __m256i __B)
24 {
25  return (__m256i)__builtin_ia32_vpdpbusd256((__v8si)__S, (__v8si)__A,
26  (__v8si)__B);
27 }
28 
29 static __inline__ __m256i __DEFAULT_FN_ATTRS256
30 _mm256_mask_dpbusd_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
31 {
32  return (__m256i)__builtin_ia32_selectd_256(__U,
33  (__v8si)_mm256_dpbusd_epi32(__S, __A, __B),
34  (__v8si)__S);
35 }
36 
37 static __inline__ __m256i __DEFAULT_FN_ATTRS256
38 _mm256_maskz_dpbusd_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
39 {
40  return (__m256i)__builtin_ia32_selectd_256(__U,
41  (__v8si)_mm256_dpbusd_epi32(__S, __A, __B),
42  (__v8si)_mm256_setzero_si256());
43 }
44 
45 static __inline__ __m256i __DEFAULT_FN_ATTRS256
46 _mm256_dpbusds_epi32(__m256i __S, __m256i __A, __m256i __B)
47 {
48  return (__m256i)__builtin_ia32_vpdpbusds256((__v8si)__S, (__v8si)__A,
49  (__v8si)__B);
50 }
51 
52 static __inline__ __m256i __DEFAULT_FN_ATTRS256
53 _mm256_mask_dpbusds_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
54 {
55  return (__m256i)__builtin_ia32_selectd_256(__U,
56  (__v8si)_mm256_dpbusds_epi32(__S, __A, __B),
57  (__v8si)__S);
58 }
59 
60 static __inline__ __m256i __DEFAULT_FN_ATTRS256
61 _mm256_maskz_dpbusds_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
62 {
63  return (__m256i)__builtin_ia32_selectd_256(__U,
64  (__v8si)_mm256_dpbusds_epi32(__S, __A, __B),
65  (__v8si)_mm256_setzero_si256());
66 }
67 
68 static __inline__ __m256i __DEFAULT_FN_ATTRS256
69 _mm256_dpwssd_epi32(__m256i __S, __m256i __A, __m256i __B)
70 {
71  return (__m256i)__builtin_ia32_vpdpwssd256((__v8si)__S, (__v8si)__A,
72  (__v8si)__B);
73 }
74 
75 static __inline__ __m256i __DEFAULT_FN_ATTRS256
76 _mm256_mask_dpwssd_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
77 {
78  return (__m256i)__builtin_ia32_selectd_256(__U,
79  (__v8si)_mm256_dpwssd_epi32(__S, __A, __B),
80  (__v8si)__S);
81 }
82 
83 static __inline__ __m256i __DEFAULT_FN_ATTRS256
84 _mm256_maskz_dpwssd_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
85 {
86  return (__m256i)__builtin_ia32_selectd_256(__U,
87  (__v8si)_mm256_dpwssd_epi32(__S, __A, __B),
88  (__v8si)_mm256_setzero_si256());
89 }
90 
91 static __inline__ __m256i __DEFAULT_FN_ATTRS256
92 _mm256_dpwssds_epi32(__m256i __S, __m256i __A, __m256i __B)
93 {
94  return (__m256i)__builtin_ia32_vpdpwssds256((__v8si)__S, (__v8si)__A,
95  (__v8si)__B);
96 }
97 
98 static __inline__ __m256i __DEFAULT_FN_ATTRS256
99 _mm256_mask_dpwssds_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
100 {
101  return (__m256i)__builtin_ia32_selectd_256(__U,
102  (__v8si)_mm256_dpwssds_epi32(__S, __A, __B),
103  (__v8si)__S);
104 }
105 
106 static __inline__ __m256i __DEFAULT_FN_ATTRS256
107 _mm256_maskz_dpwssds_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
108 {
109  return (__m256i)__builtin_ia32_selectd_256(__U,
110  (__v8si)_mm256_dpwssds_epi32(__S, __A, __B),
111  (__v8si)_mm256_setzero_si256());
112 }
113 
114 static __inline__ __m128i __DEFAULT_FN_ATTRS128
115 _mm_dpbusd_epi32(__m128i __S, __m128i __A, __m128i __B)
116 {
117  return (__m128i)__builtin_ia32_vpdpbusd128((__v4si)__S, (__v4si)__A,
118  (__v4si)__B);
119 }
120 
121 static __inline__ __m128i __DEFAULT_FN_ATTRS128
122 _mm_mask_dpbusd_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
123 {
124  return (__m128i)__builtin_ia32_selectd_128(__U,
125  (__v4si)_mm_dpbusd_epi32(__S, __A, __B),
126  (__v4si)__S);
127 }
128 
129 static __inline__ __m128i __DEFAULT_FN_ATTRS128
130 _mm_maskz_dpbusd_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
131 {
132  return (__m128i)__builtin_ia32_selectd_128(__U,
133  (__v4si)_mm_dpbusd_epi32(__S, __A, __B),
134  (__v4si)_mm_setzero_si128());
135 }
136 
137 static __inline__ __m128i __DEFAULT_FN_ATTRS128
138 _mm_dpbusds_epi32(__m128i __S, __m128i __A, __m128i __B)
139 {
140  return (__m128i)__builtin_ia32_vpdpbusds128((__v4si)__S, (__v4si)__A,
141  (__v4si)__B);
142 }
143 
144 static __inline__ __m128i __DEFAULT_FN_ATTRS128
145 _mm_mask_dpbusds_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
146 {
147  return (__m128i)__builtin_ia32_selectd_128(__U,
148  (__v4si)_mm_dpbusds_epi32(__S, __A, __B),
149  (__v4si)__S);
150 }
151 
152 static __inline__ __m128i __DEFAULT_FN_ATTRS128
153 _mm_maskz_dpbusds_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
154 {
155  return (__m128i)__builtin_ia32_selectd_128(__U,
156  (__v4si)_mm_dpbusds_epi32(__S, __A, __B),
157  (__v4si)_mm_setzero_si128());
158 }
159 
160 static __inline__ __m128i __DEFAULT_FN_ATTRS128
161 _mm_dpwssd_epi32(__m128i __S, __m128i __A, __m128i __B)
162 {
163  return (__m128i)__builtin_ia32_vpdpwssd128((__v4si)__S, (__v4si)__A,
164  (__v4si)__B);
165 }
166 
167 static __inline__ __m128i __DEFAULT_FN_ATTRS128
168 _mm_mask_dpwssd_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
169 {
170  return (__m128i)__builtin_ia32_selectd_128(__U,
171  (__v4si)_mm_dpwssd_epi32(__S, __A, __B),
172  (__v4si)__S);
173 }
174 
175 static __inline__ __m128i __DEFAULT_FN_ATTRS128
176 _mm_maskz_dpwssd_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
177 {
178  return (__m128i)__builtin_ia32_selectd_128(__U,
179  (__v4si)_mm_dpwssd_epi32(__S, __A, __B),
180  (__v4si)_mm_setzero_si128());
181 }
182 
183 static __inline__ __m128i __DEFAULT_FN_ATTRS128
184 _mm_dpwssds_epi32(__m128i __S, __m128i __A, __m128i __B)
185 {
186  return (__m128i)__builtin_ia32_vpdpwssds128((__v4si)__S, (__v4si)__A,
187  (__v4si)__B);
188 }
189 
190 static __inline__ __m128i __DEFAULT_FN_ATTRS128
191 _mm_mask_dpwssds_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
192 {
193  return (__m128i)__builtin_ia32_selectd_128(__U,
194  (__v4si)_mm_dpwssds_epi32(__S, __A, __B),
195  (__v4si)__S);
196 }
197 
198 static __inline__ __m128i __DEFAULT_FN_ATTRS128
199 _mm_maskz_dpwssds_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
200 {
201  return (__m128i)__builtin_ia32_selectd_128(__U,
202  (__v4si)_mm_dpwssds_epi32(__S, __A, __B),
203  (__v4si)_mm_setzero_si128());
204 }
205 
206 #undef __DEFAULT_FN_ATTRS128
207 #undef __DEFAULT_FN_ATTRS256
208 
209 #endif
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_maskz_dpwssds_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_maskz_dpbusds_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
unsigned char __mmask8
Definition: avx512fintrin.h:37
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_dpwssd_epi32(__m256i __S, __m256i __A, __m256i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_maskz_dpwssds_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_dpbusds_epi32(__m256i __S, __m256i __A, __m256i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_maskz_dpbusd_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_dpwssd_epi32(__m128i __S, __m128i __A, __m128i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_dpwssds_epi32(__m256i __S, __m256i __A, __m256i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_mask_dpwssds_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_dpbusd_epi32(__m128i __S, __m128i __A, __m128i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_dpbusd_epi32(__m256i __S, __m256i __A, __m256i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_maskz_dpwssd_epi32(__mmask8 __U, __m128i __S, __m128i __A, __m128i __B)
#define __DEFAULT_FN_ATTRS128
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_mask_dpwssds_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_mask_dpwssd_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_mask_dpbusd_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_mask_dpbusds_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_maskz_dpwssd_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_setzero_si128(void)
Creates a 128-bit integer vector initialized to zero.
Definition: emmintrin.h:3977
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_maskz_dpbusds_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_mask_dpbusds_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_mask_dpwssd_epi32(__m128i __S, __mmask8 __U, __m128i __A, __m128i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_mask_dpbusd_epi32(__m256i __S, __mmask8 __U, __m256i __A, __m256i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_dpwssds_epi32(__m128i __S, __m128i __A, __m128i __B)
static __inline __m256i __DEFAULT_FN_ATTRS _mm256_setzero_si256(void)
Constructs a 256-bit integer vector initialized to zero.
Definition: avxintrin.h:4281
static __inline__ __m128i __DEFAULT_FN_ATTRS128 _mm_dpbusds_epi32(__m128i __S, __m128i __A, __m128i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS256 _mm256_maskz_dpbusd_epi32(__mmask8 __U, __m256i __S, __m256i __A, __m256i __B)
#define __DEFAULT_FN_ATTRS256