doxygen/CGHLSLBuiltins_8cpp_source.html

//===------- CGHLSLBuiltins.cpp - Emit LLVM Code for HLSL builtins --------===//

//

// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

// See https://llvm.org/LICENSE.txt for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

//===----------------------------------------------------------------------===//

//

// This contains code to emit HLSL Builtin calls as LLVM code.

//

//===----------------------------------------------------------------------===//


#include "CGBuiltin.h"

#include "CGHLSLRuntime.h"

#include "CodeGenFunction.h"


using namespace clang;

using namespace CodeGen;

using namespace llvm;


static Value *handleAsDoubleBuiltin(CodeGenFunction &CGF, const CallExpr *E) {

  assert((E->getArg(0)->getType()->hasUnsignedIntegerRepresentation() &&

          E->getArg(1)->getType()->hasUnsignedIntegerRepresentation()) &&

         "asdouble operands types mismatch");

  Value *OpLowBits = CGF.EmitScalarExpr(E->getArg(0));

  Value *OpHighBits = CGF.EmitScalarExpr(E->getArg(1));


  llvm::Type *ResultType = CGF.DoubleTy;

  int N = 1;

  if (auto *VTy = E->getArg(0)->getType()->getAs<clang::VectorType>()) {

    N = VTy->getNumElements();

    ResultType = llvm::FixedVectorType::get(CGF.DoubleTy, N);

  }


  if (CGF.CGM.getTarget().getTriple().isDXIL())

    return CGF.Builder.CreateIntrinsic(

        /*ReturnType=*/ResultType, Intrinsic::dx_asdouble,

        {OpLowBits, OpHighBits}, nullptr, "hlsl.asdouble");


  if (!E->getArg(0)->getType()->isVectorType()) {

    OpLowBits = CGF.Builder.CreateVectorSplat(1, OpLowBits);

    OpHighBits = CGF.Builder.CreateVectorSplat(1, OpHighBits);

  }


  llvm::SmallVector<int> Mask;

  for (int i = 0; i < N; i++) {

    Mask.push_back(i);

    Mask.push_back(i + N);

  }


  Value *BitVec = CGF.Builder.CreateShuffleVector(OpLowBits, OpHighBits, Mask);


  return CGF.Builder.CreateBitCast(BitVec, ResultType);

}


static Value *handleHlslClip(const CallExpr *E, CodeGenFunction *CGF) {

  Value *Op0 = CGF->EmitScalarExpr(E->getArg(0));


  Constant *FZeroConst = ConstantFP::getZero(CGF->FloatTy);

  Value *CMP;

  Value *LastInstr;


  if (const auto *VecTy = E->getArg(0)->getType()->getAs<clang::VectorType>()) {

    FZeroConst = ConstantVector::getSplat(

        ElementCount::getFixed(VecTy->getNumElements()), FZeroConst);

    auto *FCompInst = CGF->Builder.CreateFCmpOLT(Op0, FZeroConst);

    CMP = CGF->Builder.CreateIntrinsic(

        CGF->Builder.getInt1Ty(), CGF->CGM.getHLSLRuntime().getAnyIntrinsic(),

        {FCompInst});

  } else {

    CMP = CGF->Builder.CreateFCmpOLT(Op0, FZeroConst);

  }


  if (CGF->CGM.getTarget().getTriple().isDXIL()) {

    LastInstr = CGF->Builder.CreateIntrinsic(Intrinsic::dx_discard, {CMP});

  } else if (CGF->CGM.getTarget().getTriple().isSPIRV()) {

    BasicBlock *LT0 = CGF->createBasicBlock("lt0", CGF->CurFn);

    BasicBlock *End = CGF->createBasicBlock("end", CGF->CurFn);


    CGF->Builder.CreateCondBr(CMP, LT0, End);


    CGF->Builder.SetInsertPoint(LT0);


    CGF->Builder.CreateIntrinsic(Intrinsic::spv_discard, {});


    LastInstr = CGF->Builder.CreateBr(End);

    CGF->Builder.SetInsertPoint(End);

  } else {

    llvm_unreachable("Backend Codegen not supported.");

  }


  return LastInstr;

}


static Value *handleHlslSplitdouble(const CallExpr *E, CodeGenFunction *CGF) {

  Value *Op0 = CGF->EmitScalarExpr(E->getArg(0));

  const auto *OutArg1 = dyn_cast<HLSLOutArgExpr>(E->getArg(1));

  const auto *OutArg2 = dyn_cast<HLSLOutArgExpr>(E->getArg(2));


  CallArgList Args;

  LValue Op1TmpLValue =

      CGF->EmitHLSLOutArgExpr(OutArg1, Args, OutArg1->getType());

  LValue Op2TmpLValue =

      CGF->EmitHLSLOutArgExpr(OutArg2, Args, OutArg2->getType());


  if (CGF->getTarget().getCXXABI().areArgsDestroyedLeftToRightInCallee())

    Args.reverseWritebacks();


  Value *LowBits = nullptr;

  Value *HighBits = nullptr;


  if (CGF->CGM.getTarget().getTriple().isDXIL()) {

    llvm::Type *RetElementTy = CGF->Int32Ty;

    if (auto *Op0VecTy = E->getArg(0)->getType()->getAs<clang::VectorType>())

      RetElementTy = llvm::VectorType::get(

          CGF->Int32Ty, ElementCount::getFixed(Op0VecTy->getNumElements()));

    auto *RetTy = llvm::StructType::get(RetElementTy, RetElementTy);


    CallInst *CI = CGF->Builder.CreateIntrinsic(

        RetTy, Intrinsic::dx_splitdouble, {Op0}, nullptr, "hlsl.splitdouble");


    LowBits = CGF->Builder.CreateExtractValue(CI, 0);

    HighBits = CGF->Builder.CreateExtractValue(CI, 1);

  } else {

    // For Non DXIL targets we generate the instructions.


    if (!Op0->getType()->isVectorTy()) {

      FixedVectorType *DestTy = FixedVectorType::get(CGF->Int32Ty, 2);

      Value *Bitcast = CGF->Builder.CreateBitCast(Op0, DestTy);


      LowBits = CGF->Builder.CreateExtractElement(Bitcast, (uint64_t)0);

      HighBits = CGF->Builder.CreateExtractElement(Bitcast, 1);

    } else {

      int NumElements = 1;

      if (const auto *VecTy =

              E->getArg(0)->getType()->getAs<clang::VectorType>())

        NumElements = VecTy->getNumElements();


      FixedVectorType *Uint32VecTy =

          FixedVectorType::get(CGF->Int32Ty, NumElements * 2);

      Value *Uint32Vec = CGF->Builder.CreateBitCast(Op0, Uint32VecTy);

      if (NumElements == 1) {

        LowBits = CGF->Builder.CreateExtractElement(Uint32Vec, (uint64_t)0);

        HighBits = CGF->Builder.CreateExtractElement(Uint32Vec, 1);

      } else {

        SmallVector<int> EvenMask, OddMask;

        for (int I = 0, E = NumElements; I != E; ++I) {

          EvenMask.push_back(I * 2);

          OddMask.push_back(I * 2 + 1);

        }

        LowBits = CGF->Builder.CreateShuffleVector(Uint32Vec, EvenMask);

        HighBits = CGF->Builder.CreateShuffleVector(Uint32Vec, OddMask);

      }

    }

  }

  CGF->Builder.CreateStore(LowBits, Op1TmpLValue.getAddress());

  auto *LastInst =

      CGF->Builder.CreateStore(HighBits, Op2TmpLValue.getAddress());

  CGF->EmitWritebacks(Args);

  return LastInst;

}


static Value *handleElementwiseF16ToF32(CodeGenFunction &CGF,

                                        const CallExpr *E) {

  Value *Op0 = CGF.EmitScalarExpr(E->getArg(0));

  QualType Op0Ty = E->getArg(0)->getType();

  llvm::Type *ResType = CGF.FloatTy;

  uint64_t NumElements = 0;

  if (Op0->getType()->isVectorTy()) {

    NumElements =

        E->getArg(0)->getType()->castAs<clang::VectorType>()->getNumElements();

    ResType =

        llvm::VectorType::get(ResType, ElementCount::getFixed(NumElements));

  }

  if (!Op0Ty->hasUnsignedIntegerRepresentation())

    llvm_unreachable(

        "f16tof32 operand must have an unsigned int representation");


  if (CGF.CGM.getTriple().isDXIL())

    return CGF.Builder.CreateIntrinsic(ResType, Intrinsic::dx_legacyf16tof32,

                                       ArrayRef<Value *>{Op0}, nullptr,

                                       "hlsl.f16tof32");


  if (CGF.CGM.getTriple().isSPIRV()) {

    // We use the SPIRV UnpackHalf2x16 operation to avoid the need for the

    // Int16 and Float16 capabilities

    auto UnpackType =

        llvm::VectorType::get(CGF.FloatTy, ElementCount::getFixed(2));

    if (NumElements == 0) {

      // a scalar input - simply extract the first element of the unpacked

      // vector

      Value *Unpack = CGF.Builder.CreateIntrinsic(

          UnpackType, Intrinsic::spv_unpackhalf2x16, ArrayRef<Value *>{Op0});

      return CGF.Builder.CreateExtractElement(Unpack, (uint64_t)0);

    } else {

      // a vector input - build a congruent output vector by iterating through

      // the input vector calling unpackhalf2x16 for each element

      Value *Result = PoisonValue::get(ResType);

      for (uint64_t i = 0; i < NumElements; i++) {

        Value *InVal = CGF.Builder.CreateExtractElement(Op0, i);

        Value *Unpack = CGF.Builder.CreateIntrinsic(

            UnpackType, Intrinsic::spv_unpackhalf2x16,

            ArrayRef<Value *>{InVal});

        Value *Res = CGF.Builder.CreateExtractElement(Unpack, (uint64_t)0);

        Result = CGF.Builder.CreateInsertElement(Result, Res, i);

      }

      return Result;

    }

  }


  llvm_unreachable("Intrinsic F16ToF32 not supported by target architecture");

}


static Value *emitBufferStride(CodeGenFunction *CGF, const Expr *HandleExpr,

                               LValue &Stride) {

  // Figure out the stride of the buffer elements from the handle type.

  auto *HandleTy =

      cast<HLSLAttributedResourceType>(HandleExpr->getType().getTypePtr());

  QualType ElementTy = HandleTy->getContainedType();

  Value *StrideValue = CGF->getTypeSize(ElementTy);

  return CGF->Builder.CreateStore(StrideValue, Stride.getAddress());

}


// Return dot product intrinsic that corresponds to the QT scalar type


static Intrinsic::ID getDotProductIntrinsic(CGHLSLRuntime &RT, QualType QT) {

  if (QT->isFloatingType())

    return RT.getFDotIntrinsic();

  if (QT->isSignedIntegerType())

    return RT.getSDotIntrinsic();

  assert(QT->isUnsignedIntegerType());

  return RT.getUDotIntrinsic();

}


static Intrinsic::ID getFirstBitHighIntrinsic(CGHLSLRuntime &RT, QualType QT) {

  if (QT->hasSignedIntegerRepresentation()) {

    return RT.getFirstBitSHighIntrinsic();

  }


  assert(QT->hasUnsignedIntegerRepresentation());

  return RT.getFirstBitUHighIntrinsic();

}


// Return wave active sum that corresponds to the QT scalar type


static Intrinsic::ID getWaveActiveSumIntrinsic(llvm::Triple::ArchType Arch,

                                               CGHLSLRuntime &RT, QualType QT) {

  switch (Arch) {

  case llvm::Triple::spirv:

    return Intrinsic::spv_wave_reduce_sum;

  case llvm::Triple::dxil: {

    if (QT->isUnsignedIntegerType())

      return Intrinsic::dx_wave_reduce_usum;

    return Intrinsic::dx_wave_reduce_sum;

  }

  default:

    llvm_unreachable("Intrinsic WaveActiveSum"

                     " not supported by target architecture");

  }

}


// Return wave active max that corresponds to the QT scalar type


static Intrinsic::ID getWaveActiveMaxIntrinsic(llvm::Triple::ArchType Arch,

                                               CGHLSLRuntime &RT, QualType QT) {

  switch (Arch) {

  case llvm::Triple::spirv:

    if (QT->isUnsignedIntegerType())

      return Intrinsic::spv_wave_reduce_umax;

    return Intrinsic::spv_wave_reduce_max;

  case llvm::Triple::dxil: {

    if (QT->isUnsignedIntegerType())

      return Intrinsic::dx_wave_reduce_umax;

    return Intrinsic::dx_wave_reduce_max;

  }

  default:

    llvm_unreachable("Intrinsic WaveActiveMax"

                     " not supported by target architecture");

  }

}


// Return wave active min that corresponds to the QT scalar type


static Intrinsic::ID getWaveActiveMinIntrinsic(llvm::Triple::ArchType Arch,

                                               CGHLSLRuntime &RT, QualType QT) {

  switch (Arch) {

  case llvm::Triple::spirv:

    if (QT->isUnsignedIntegerType())

      return Intrinsic::spv_wave_reduce_umin;

    return Intrinsic::spv_wave_reduce_min;

  case llvm::Triple::dxil: {

    if (QT->isUnsignedIntegerType())

      return Intrinsic::dx_wave_reduce_umin;

    return Intrinsic::dx_wave_reduce_min;

  }

  default:

    llvm_unreachable("Intrinsic WaveActiveMin"

                     " not supported by target architecture");

  }

}


// Returns the mangled name for a builtin function that the SPIR-V backend

// will expand into a spec Constant.


static std::string getSpecConstantFunctionName(clang::QualType SpecConstantType,

                                               ASTContext &Context) {

  // The parameter types for our conceptual intrinsic function.

  QualType ClangParamTypes[] = {Context.IntTy, SpecConstantType};


  // Create a temporary FunctionDecl for the builtin fuction. It won't be

  // added to the AST.

  FunctionProtoType::ExtProtoInfo EPI;

  QualType FnType =

      Context.getFunctionType(SpecConstantType, ClangParamTypes, EPI);

  DeclarationName FuncName = &Context.Idents.get("__spirv_SpecConstant");

  FunctionDecl *FnDeclForMangling = FunctionDecl::Create(

      Context, Context.getTranslationUnitDecl(), SourceLocation(),

      SourceLocation(), FuncName, FnType, /*TSI=*/nullptr, SC_Extern);


  // Attach the created parameter declarations to the function declaration.

  SmallVector<ParmVarDecl *, 2> ParamDecls;

  for (QualType ParamType : ClangParamTypes) {

    ParmVarDecl *PD = ParmVarDecl::Create(

        Context, FnDeclForMangling, SourceLocation(), SourceLocation(),

        /*IdentifierInfo*/ nullptr, ParamType, /*TSI*/ nullptr, SC_None,

        /*DefaultArg*/ nullptr);

    ParamDecls.push_back(PD);

  }

  FnDeclForMangling->setParams(ParamDecls);


  // Get the mangled name.

  std::string Name;

  llvm::raw_string_ostream MangledNameStream(Name);

  std::unique_ptr<MangleContext> Mangler(Context.createMangleContext());

  Mangler->mangleName(FnDeclForMangling, MangledNameStream);

  MangledNameStream.flush();


  return Name;

}


Value *CodeGenFunction::EmitHLSLBuiltinExpr(unsigned BuiltinID,

                                            const CallExpr *E,

                                            ReturnValueSlot ReturnValue) {

  if (!getLangOpts().HLSL)

    return nullptr;


  switch (BuiltinID) {

  case Builtin::BI__builtin_hlsl_adduint64: {

    Value *OpA = EmitScalarExpr(E->getArg(0));

    Value *OpB = EmitScalarExpr(E->getArg(1));

    QualType Arg0Ty = E->getArg(0)->getType();

    uint64_t NumElements = Arg0Ty->castAs<VectorType>()->getNumElements();

    assert(Arg0Ty == E->getArg(1)->getType() &&

           "AddUint64 operand types must match");

    assert(Arg0Ty->hasIntegerRepresentation() &&

           "AddUint64 operands must have an integer representation");

    assert((NumElements == 2 || NumElements == 4) &&

           "AddUint64 operands must have 2 or 4 elements");


    llvm::Value *LowA;

    llvm::Value *HighA;

    llvm::Value *LowB;

    llvm::Value *HighB;


    // Obtain low and high words of inputs A and B

    if (NumElements == 2) {

      LowA = Builder.CreateExtractElement(OpA, (uint64_t)0, "LowA");

      HighA = Builder.CreateExtractElement(OpA, (uint64_t)1, "HighA");

      LowB = Builder.CreateExtractElement(OpB, (uint64_t)0, "LowB");

      HighB = Builder.CreateExtractElement(OpB, (uint64_t)1, "HighB");

    } else {

      LowA = Builder.CreateShuffleVector(OpA, {0, 2}, "LowA");

      HighA = Builder.CreateShuffleVector(OpA, {1, 3}, "HighA");

      LowB = Builder.CreateShuffleVector(OpB, {0, 2}, "LowB");

      HighB = Builder.CreateShuffleVector(OpB, {1, 3}, "HighB");

    }


    // Use an uadd_with_overflow to compute the sum of low words and obtain a

    // carry value

    llvm::Value *Carry;

    llvm::Value *LowSum = EmitOverflowIntrinsic(

        *this, Intrinsic::uadd_with_overflow, LowA, LowB, Carry);

    llvm::Value *ZExtCarry =

        Builder.CreateZExt(Carry, HighA->getType(), "CarryZExt");


    // Sum the high words and the carry

    llvm::Value *HighSum = Builder.CreateAdd(HighA, HighB, "HighSum");

    llvm::Value *HighSumPlusCarry =

        Builder.CreateAdd(HighSum, ZExtCarry, "HighSumPlusCarry");


    if (NumElements == 4) {

      return Builder.CreateShuffleVector(LowSum, HighSumPlusCarry, {0, 2, 1, 3},

                                         "hlsl.AddUint64");

    }


    llvm::Value *Result = PoisonValue::get(OpA->getType());

    Result = Builder.CreateInsertElement(Result, LowSum, (uint64_t)0,

                                         "hlsl.AddUint64.upto0");

    Result = Builder.CreateInsertElement(Result, HighSumPlusCarry, (uint64_t)1,

                                         "hlsl.AddUint64");

    return Result;

  }

  case Builtin::BI__builtin_hlsl_resource_getpointer: {

    Value *HandleOp = EmitScalarExpr(E->getArg(0));

    Value *IndexOp = EmitScalarExpr(E->getArg(1));


    llvm::Type *RetTy = ConvertType(E->getType());

    return Builder.CreateIntrinsic(

        RetTy, CGM.getHLSLRuntime().getCreateResourceGetPointerIntrinsic(),

        ArrayRef<Value *>{HandleOp, IndexOp});

  }

  case Builtin::BI__builtin_hlsl_resource_load_with_status: {

    Value *HandleOp = EmitScalarExpr(E->getArg(0));

    Value *IndexOp = EmitScalarExpr(E->getArg(1));


    // Get the *address* of the status argument to write to it by reference

    LValue StatusLVal = EmitLValue(E->getArg(2));

    Address StatusAddr = StatusLVal.getAddress();


    QualType HandleTy = E->getArg(0)->getType();

    const HLSLAttributedResourceType *RT =

        HandleTy->getAs<HLSLAttributedResourceType>();

    assert(CGM.getTarget().getTriple().getArch() == llvm::Triple::dxil &&

           "Only DXIL currently implements load with status");


    Intrinsic::ID IntrID = RT->getAttrs().RawBuffer

                               ? llvm::Intrinsic::dx_resource_load_rawbuffer

                               : llvm::Intrinsic::dx_resource_load_typedbuffer;


    llvm::Type *DataTy = ConvertType(E->getType());

    llvm::Type *RetTy = llvm::StructType::get(Builder.getContext(),

                                              {DataTy, Builder.getInt1Ty()});


    SmallVector<Value *, 3> Args;

    Args.push_back(HandleOp);

    Args.push_back(IndexOp);


    if (RT->getAttrs().RawBuffer) {

      Value *Offset = Builder.getInt32(0);

      Args.push_back(Offset);

    }


    // The load intrinsics give us a (T value, i1 status) pair -

    // shepherd these into the return value and out reference respectively.

    Value *ResRet =

        Builder.CreateIntrinsic(RetTy, IntrID, Args, {}, "ld.struct");

    Value *LoadedValue = Builder.CreateExtractValue(ResRet, {0}, "ld.value");

    Value *StatusBit = Builder.CreateExtractValue(ResRet, {1}, "ld.status");

    Value *ExtendedStatus =

        Builder.CreateZExt(StatusBit, Builder.getInt32Ty(), "ld.status.ext");

    Builder.CreateStore(ExtendedStatus, StatusAddr);


    return LoadedValue;

  }

  case Builtin::BI__builtin_hlsl_resource_uninitializedhandle: {

    llvm::Type *HandleTy = CGM.getTypes().ConvertType(E->getType());

    return llvm::PoisonValue::get(HandleTy);

  }

  case Builtin::BI__builtin_hlsl_resource_handlefrombinding: {

    llvm::Type *HandleTy = CGM.getTypes().ConvertType(E->getType());

    Value *RegisterOp = EmitScalarExpr(E->getArg(1));

    Value *SpaceOp = EmitScalarExpr(E->getArg(2));

    Value *RangeOp = EmitScalarExpr(E->getArg(3));

    Value *IndexOp = EmitScalarExpr(E->getArg(4));

    Value *Name = EmitScalarExpr(E->getArg(5));

    llvm::Intrinsic::ID IntrinsicID =

        CGM.getHLSLRuntime().getCreateHandleFromBindingIntrinsic();

    SmallVector<Value *> Args{SpaceOp, RegisterOp, RangeOp, IndexOp, Name};

    return Builder.CreateIntrinsic(HandleTy, IntrinsicID, Args);

  }

  case Builtin::BI__builtin_hlsl_resource_handlefromimplicitbinding: {

    llvm::Type *HandleTy = CGM.getTypes().ConvertType(E->getType());

    Value *OrderID = EmitScalarExpr(E->getArg(1));

    Value *SpaceOp = EmitScalarExpr(E->getArg(2));

    Value *RangeOp = EmitScalarExpr(E->getArg(3));

    Value *IndexOp = EmitScalarExpr(E->getArg(4));

    Value *Name = EmitScalarExpr(E->getArg(5));

    llvm::Intrinsic::ID IntrinsicID =

        CGM.getHLSLRuntime().getCreateHandleFromImplicitBindingIntrinsic();

    SmallVector<Value *> Args{OrderID, SpaceOp, RangeOp, IndexOp, Name};

    return Builder.CreateIntrinsic(HandleTy, IntrinsicID, Args);

  }

  case Builtin::BI__builtin_hlsl_resource_counterhandlefromimplicitbinding: {

    Value *MainHandle = EmitScalarExpr(E->getArg(0));

    if (!CGM.getTriple().isSPIRV())

      return MainHandle;


    llvm::Type *HandleTy = CGM.getTypes().ConvertType(E->getType());

    Value *OrderID = EmitScalarExpr(E->getArg(1));

    Value *SpaceOp = EmitScalarExpr(E->getArg(2));

    llvm::Intrinsic::ID IntrinsicID =

        llvm::Intrinsic::spv_resource_counterhandlefromimplicitbinding;

    SmallVector<Value *> Args{MainHandle, OrderID, SpaceOp};

    return Builder.CreateIntrinsic(HandleTy, IntrinsicID, Args);

  }

  case Builtin::BI__builtin_hlsl_resource_nonuniformindex: {

    Value *IndexOp = EmitScalarExpr(E->getArg(0));

    llvm::Type *RetTy = ConvertType(E->getType());

    return Builder.CreateIntrinsic(

        RetTy, CGM.getHLSLRuntime().getNonUniformResourceIndexIntrinsic(),

        ArrayRef<Value *>{IndexOp});

  }

  case Builtin::BI__builtin_hlsl_resource_getdimensions_x: {

    Value *Handle = EmitScalarExpr(E->getArg(0));

    LValue Dim = EmitLValue(E->getArg(1));

    llvm::Type *RetTy = llvm::Type::getInt32Ty(getLLVMContext());

    Value *DimValue = Builder.CreateIntrinsic(

        RetTy, CGM.getHLSLRuntime().getGetDimensionsXIntrinsic(),

        ArrayRef<Value *>{Handle});

    return Builder.CreateStore(DimValue, Dim.getAddress());

  }

  case Builtin::BI__builtin_hlsl_resource_getstride: {

    LValue Stride = EmitLValue(E->getArg(1));

    return emitBufferStride(this, E->getArg(0), Stride);

  }

  case Builtin::BI__builtin_hlsl_all: {

    Value *Op0 = EmitScalarExpr(E->getArg(0));

    return Builder.CreateIntrinsic(

        /*ReturnType=*/llvm::Type::getInt1Ty(getLLVMContext()),

        CGM.getHLSLRuntime().getAllIntrinsic(), ArrayRef<Value *>{Op0}, nullptr,

        "hlsl.all");

  }

  case Builtin::BI__builtin_hlsl_and: {

    Value *Op0 = EmitScalarExpr(E->getArg(0));

    Value *Op1 = EmitScalarExpr(E->getArg(1));

    return Builder.CreateAnd(Op0, Op1, "hlsl.and");

  }

  case Builtin::BI__builtin_hlsl_or: {

    Value *Op0 = EmitScalarExpr(E->getArg(0));

    Value *Op1 = EmitScalarExpr(E->getArg(1));

    return Builder.CreateOr(Op0, Op1, "hlsl.or");

  }

  case Builtin::BI__builtin_hlsl_any: {

    Value *Op0 = EmitScalarExpr(E->getArg(0));

    return Builder.CreateIntrinsic(

        /*ReturnType=*/llvm::Type::getInt1Ty(getLLVMContext()),

        CGM.getHLSLRuntime().getAnyIntrinsic(), ArrayRef<Value *>{Op0}, nullptr,

        "hlsl.any");

  }

  case Builtin::BI__builtin_hlsl_asdouble:

    return handleAsDoubleBuiltin(*this, E);

  case Builtin::BI__builtin_hlsl_elementwise_clamp: {

    Value *OpX = EmitScalarExpr(E->getArg(0));

    Value *OpMin = EmitScalarExpr(E->getArg(1));

    Value *OpMax = EmitScalarExpr(E->getArg(2));


    QualType Ty = E->getArg(0)->getType();

    if (auto *VecTy = Ty->getAs<VectorType>())

      Ty = VecTy->getElementType();


    Intrinsic::ID Intr;

    if (Ty->isFloatingType()) {

      Intr = CGM.getHLSLRuntime().getNClampIntrinsic();

    } else if (Ty->isUnsignedIntegerType()) {

      Intr = CGM.getHLSLRuntime().getUClampIntrinsic();

    } else {

      assert(Ty->isSignedIntegerType());

      Intr = CGM.getHLSLRuntime().getSClampIntrinsic();

    }

    return Builder.CreateIntrinsic(

        /*ReturnType=*/OpX->getType(), Intr,

        ArrayRef<Value *>{OpX, OpMin, OpMax}, nullptr, "hlsl.clamp");

  }

  case Builtin::BI__builtin_hlsl_crossf16:

  case Builtin::BI__builtin_hlsl_crossf32: {

    Value *Op0 = EmitScalarExpr(E->getArg(0));

    Value *Op1 = EmitScalarExpr(E->getArg(1));

    assert(E->getArg(0)->getType()->hasFloatingRepresentation() &&

           E->getArg(1)->getType()->hasFloatingRepresentation() &&

           "cross operands must have a float representation");

    // make sure each vector has exactly 3 elements

    assert(

        E->getArg(0)->getType()->castAs<VectorType>()->getNumElements() == 3 &&

        E->getArg(1)->getType()->castAs<VectorType>()->getNumElements() == 3 &&

        "input vectors must have 3 elements each");

    return Builder.CreateIntrinsic(

        /*ReturnType=*/Op0->getType(), CGM.getHLSLRuntime().getCrossIntrinsic(),

        ArrayRef<Value *>{Op0, Op1}, nullptr, "hlsl.cross");

  }

  case Builtin::BI__builtin_hlsl_dot: {

    Value *Op0 = EmitScalarExpr(E->getArg(0));

    Value *Op1 = EmitScalarExpr(E->getArg(1));

    llvm::Type *T0 = Op0->getType();

    llvm::Type *T1 = Op1->getType();


    // If the arguments are scalars, just emit a multiply

    if (!T0->isVectorTy() && !T1->isVectorTy()) {

      if (T0->isFloatingPointTy())

        return Builder.CreateFMul(Op0, Op1, "hlsl.dot");


      if (T0->isIntegerTy())

        return Builder.CreateMul(Op0, Op1, "hlsl.dot");


      llvm_unreachable(

          "Scalar dot product is only supported on ints and floats.");

    }

    // For vectors, validate types and emit the appropriate intrinsic

    assert(CGM.getContext().hasSameUnqualifiedType(E->getArg(0)->getType(),

                                                   E->getArg(1)->getType()) &&

           "Dot product operands must have the same type.");


    auto *VecTy0 = E->getArg(0)->getType()->castAs<VectorType>();

    assert(VecTy0 && "Dot product argument must be a vector.");


    return Builder.CreateIntrinsic(

        /*ReturnType=*/T0->getScalarType(),

        getDotProductIntrinsic(CGM.getHLSLRuntime(), VecTy0->getElementType()),

        ArrayRef<Value *>{Op0, Op1}, nullptr, "hlsl.dot");

  }

  case Builtin::BI__builtin_hlsl_dot4add_i8packed: {

    Value *X = EmitScalarExpr(E->getArg(0));

    Value *Y = EmitScalarExpr(E->getArg(1));

    Value *Acc = EmitScalarExpr(E->getArg(2));


    Intrinsic::ID ID = CGM.getHLSLRuntime().getDot4AddI8PackedIntrinsic();

    // Note that the argument order disagrees between the builtin and the

    // intrinsic here.

    return Builder.CreateIntrinsic(

        /*ReturnType=*/Acc->getType(), ID, ArrayRef<Value *>{Acc, X, Y},

        nullptr, "hlsl.dot4add.i8packed");

  }

  case Builtin::BI__builtin_hlsl_dot4add_u8packed: {

    Value *X = EmitScalarExpr(E->getArg(0));

    Value *Y = EmitScalarExpr(E->getArg(1));

    Value *Acc = EmitScalarExpr(E->getArg(2));


    Intrinsic::ID ID = CGM.getHLSLRuntime().getDot4AddU8PackedIntrinsic();

    // Note that the argument order disagrees between the builtin and the

    // intrinsic here.

    return Builder.CreateIntrinsic(

        /*ReturnType=*/Acc->getType(), ID, ArrayRef<Value *>{Acc, X, Y},

        nullptr, "hlsl.dot4add.u8packed");

  }

  case Builtin::BI__builtin_hlsl_elementwise_firstbithigh: {

    Value *X = EmitScalarExpr(E->getArg(0));


    return Builder.CreateIntrinsic(

        /*ReturnType=*/ConvertType(E->getType()),

        getFirstBitHighIntrinsic(CGM.getHLSLRuntime(), E->getArg(0)->getType()),

        ArrayRef<Value *>{X}, nullptr, "hlsl.firstbithigh");

  }

  case Builtin::BI__builtin_hlsl_elementwise_firstbitlow: {

    Value *X = EmitScalarExpr(E->getArg(0));


    return Builder.CreateIntrinsic(

        /*ReturnType=*/ConvertType(E->getType()),

        CGM.getHLSLRuntime().getFirstBitLowIntrinsic(), ArrayRef<Value *>{X},

        nullptr, "hlsl.firstbitlow");

  }

  case Builtin::BI__builtin_hlsl_lerp: {

    Value *X = EmitScalarExpr(E->getArg(0));

    Value *Y = EmitScalarExpr(E->getArg(1));

    Value *S = EmitScalarExpr(E->getArg(2));

    if (!E->getArg(0)->getType()->hasFloatingRepresentation())

      llvm_unreachable("lerp operand must have a float representation");

    return Builder.CreateIntrinsic(

        /*ReturnType=*/X->getType(), CGM.getHLSLRuntime().getLerpIntrinsic(),

        ArrayRef<Value *>{X, Y, S}, nullptr, "hlsl.lerp");

  }

  case Builtin::BI__builtin_hlsl_normalize: {

    Value *X = EmitScalarExpr(E->getArg(0));


    assert(E->getArg(0)->getType()->hasFloatingRepresentation() &&

           "normalize operand must have a float representation");


    return Builder.CreateIntrinsic(

        /*ReturnType=*/X->getType(),

        CGM.getHLSLRuntime().getNormalizeIntrinsic(), ArrayRef<Value *>{X},

        nullptr, "hlsl.normalize");

  }

  case Builtin::BI__builtin_hlsl_elementwise_degrees: {

    Value *X = EmitScalarExpr(E->getArg(0));


    assert(E->getArg(0)->getType()->hasFloatingRepresentation() &&

           "degree operand must have a float representation");


    return Builder.CreateIntrinsic(

        /*ReturnType=*/X->getType(), CGM.getHLSLRuntime().getDegreesIntrinsic(),

        ArrayRef<Value *>{X}, nullptr, "hlsl.degrees");

  }

  case Builtin::BI__builtin_hlsl_elementwise_f16tof32: {

    return handleElementwiseF16ToF32(*this, E);

  }

  case Builtin::BI__builtin_hlsl_elementwise_frac: {

    Value *Op0 = EmitScalarExpr(E->getArg(0));

    if (!E->getArg(0)->getType()->hasFloatingRepresentation())

      llvm_unreachable("frac operand must have a float representation");

    return Builder.CreateIntrinsic(

        /*ReturnType=*/Op0->getType(), CGM.getHLSLRuntime().getFracIntrinsic(),

        ArrayRef<Value *>{Op0}, nullptr, "hlsl.frac");

  }

  case Builtin::BI__builtin_hlsl_elementwise_isinf: {

    Value *Op0 = EmitScalarExpr(E->getArg(0));

    llvm::Type *Xty = Op0->getType();

    llvm::Type *retType = llvm::Type::getInt1Ty(this->getLLVMContext());

    if (Xty->isVectorTy()) {

      auto *XVecTy = E->getArg(0)->getType()->castAs<VectorType>();

      retType = llvm::VectorType::get(

          retType, ElementCount::getFixed(XVecTy->getNumElements()));

    }

    if (!E->getArg(0)->getType()->hasFloatingRepresentation())

      llvm_unreachable("isinf operand must have a float representation");

    return Builder.CreateIntrinsic(

        retType, CGM.getHLSLRuntime().getIsInfIntrinsic(),

        ArrayRef<Value *>{Op0}, nullptr, "hlsl.isinf");

  }

  case Builtin::BI__builtin_hlsl_elementwise_isnan: {

    Value *Op0 = EmitScalarExpr(E->getArg(0));

    llvm::Type *Xty = Op0->getType();

    llvm::Type *retType = llvm::Type::getInt1Ty(this->getLLVMContext());

    if (Xty->isVectorTy()) {

      auto *XVecTy = E->getArg(0)->getType()->castAs<VectorType>();

      retType = llvm::VectorType::get(

          retType, ElementCount::getFixed(XVecTy->getNumElements()));

    }

    if (!E->getArg(0)->getType()->hasFloatingRepresentation())

      llvm_unreachable("isnan operand must have a float representation");

    return Builder.CreateIntrinsic(

        retType, CGM.getHLSLRuntime().getIsNaNIntrinsic(),

        ArrayRef<Value *>{Op0}, nullptr, "hlsl.isnan");

  }

  case Builtin::BI__builtin_hlsl_mad: {

    Value *M = EmitScalarExpr(E->getArg(0));

    Value *A = EmitScalarExpr(E->getArg(1));

    Value *B = EmitScalarExpr(E->getArg(2));

    if (E->getArg(0)->getType()->hasFloatingRepresentation())

      return Builder.CreateIntrinsic(

          /*ReturnType*/ M->getType(), Intrinsic::fmuladd,

          ArrayRef<Value *>{M, A, B}, nullptr, "hlsl.fmad");


    if (E->getArg(0)->getType()->hasSignedIntegerRepresentation()) {

      if (CGM.getTarget().getTriple().getArch() == llvm::Triple::dxil)

        return Builder.CreateIntrinsic(

            /*ReturnType*/ M->getType(), Intrinsic::dx_imad,

            ArrayRef<Value *>{M, A, B}, nullptr, "dx.imad");


      Value *Mul = Builder.CreateNSWMul(M, A);

      return Builder.CreateNSWAdd(Mul, B);

    }

    assert(E->getArg(0)->getType()->hasUnsignedIntegerRepresentation());

    if (CGM.getTarget().getTriple().getArch() == llvm::Triple::dxil)

      return Builder.CreateIntrinsic(

          /*ReturnType=*/M->getType(), Intrinsic::dx_umad,

          ArrayRef<Value *>{M, A, B}, nullptr, "dx.umad");


    Value *Mul = Builder.CreateNUWMul(M, A);

    return Builder.CreateNUWAdd(Mul, B);

  }

  case Builtin::BI__builtin_hlsl_elementwise_rcp: {

    Value *Op0 = EmitScalarExpr(E->getArg(0));

    if (!E->getArg(0)->getType()->hasFloatingRepresentation())

      llvm_unreachable("rcp operand must have a float representation");

    llvm::Type *Ty = Op0->getType();

    llvm::Type *EltTy = Ty->getScalarType();

    Constant *One = Ty->isVectorTy()

                        ? ConstantVector::getSplat(

                              ElementCount::getFixed(

                                  cast<FixedVectorType>(Ty)->getNumElements()),

                              ConstantFP::get(EltTy, 1.0))

                        : ConstantFP::get(EltTy, 1.0);

    return Builder.CreateFDiv(One, Op0, "hlsl.rcp");

  }

  case Builtin::BI__builtin_hlsl_elementwise_rsqrt: {

    Value *Op0 = EmitScalarExpr(E->getArg(0));

    if (!E->getArg(0)->getType()->hasFloatingRepresentation())

      llvm_unreachable("rsqrt operand must have a float representation");

    return Builder.CreateIntrinsic(

        /*ReturnType=*/Op0->getType(), CGM.getHLSLRuntime().getRsqrtIntrinsic(),

        ArrayRef<Value *>{Op0}, nullptr, "hlsl.rsqrt");

  }

  case Builtin::BI__builtin_hlsl_elementwise_saturate: {

    Value *Op0 = EmitScalarExpr(E->getArg(0));

    assert(E->getArg(0)->getType()->hasFloatingRepresentation() &&

           "saturate operand must have a float representation");

    return Builder.CreateIntrinsic(

        /*ReturnType=*/Op0->getType(),

        CGM.getHLSLRuntime().getSaturateIntrinsic(), ArrayRef<Value *>{Op0},

        nullptr, "hlsl.saturate");

  }

  case Builtin::BI__builtin_hlsl_select: {

    Value *OpCond = EmitScalarExpr(E->getArg(0));

    RValue RValTrue = EmitAnyExpr(E->getArg(1));

    Value *OpTrue =

        RValTrue.isScalar()

            ? RValTrue.getScalarVal()

            : Builder.CreateLoad(RValTrue.getAggregateAddress(), "true_val");

    RValue RValFalse = EmitAnyExpr(E->getArg(2));

    Value *OpFalse =

        RValFalse.isScalar()

            ? RValFalse.getScalarVal()

            : Builder.CreateLoad(RValFalse.getAggregateAddress(), "false_val");

    if (auto *VTy = E->getType()->getAs<VectorType>()) {

      if (!OpTrue->getType()->isVectorTy())

        OpTrue =

            Builder.CreateVectorSplat(VTy->getNumElements(), OpTrue, "splat");

      if (!OpFalse->getType()->isVectorTy())

        OpFalse =

            Builder.CreateVectorSplat(VTy->getNumElements(), OpFalse, "splat");

    }


    Value *SelectVal =

        Builder.CreateSelect(OpCond, OpTrue, OpFalse, "hlsl.select");

    if (!RValTrue.isScalar())

      Builder.CreateStore(SelectVal, ReturnValue.getAddress(),

                          ReturnValue.isVolatile());


    return SelectVal;

  }

  case Builtin::BI__builtin_hlsl_step: {

    Value *Op0 = EmitScalarExpr(E->getArg(0));

    Value *Op1 = EmitScalarExpr(E->getArg(1));

    assert(E->getArg(0)->getType()->hasFloatingRepresentation() &&

           E->getArg(1)->getType()->hasFloatingRepresentation() &&

           "step operands must have a float representation");

    return Builder.CreateIntrinsic(

        /*ReturnType=*/Op0->getType(), CGM.getHLSLRuntime().getStepIntrinsic(),

        ArrayRef<Value *>{Op0, Op1}, nullptr, "hlsl.step");

  }

  case Builtin::BI__builtin_hlsl_wave_active_all_true: {

    Value *Op = EmitScalarExpr(E->getArg(0));

    assert(Op->getType()->isIntegerTy(1) &&

           "Intrinsic WaveActiveAllTrue operand must be a bool");


    Intrinsic::ID ID = CGM.getHLSLRuntime().getWaveActiveAllTrueIntrinsic();

    return EmitRuntimeCall(

        Intrinsic::getOrInsertDeclaration(&CGM.getModule(), ID), {Op});

  }

  case Builtin::BI__builtin_hlsl_wave_active_any_true: {

    Value *Op = EmitScalarExpr(E->getArg(0));

    assert(Op->getType()->isIntegerTy(1) &&

           "Intrinsic WaveActiveAnyTrue operand must be a bool");


    Intrinsic::ID ID = CGM.getHLSLRuntime().getWaveActiveAnyTrueIntrinsic();

    return EmitRuntimeCall(

        Intrinsic::getOrInsertDeclaration(&CGM.getModule(), ID), {Op});

  }

  case Builtin::BI__builtin_hlsl_wave_active_ballot: {

    Value *Op = EmitScalarExpr(E->getArg(0));

    assert(Op->getType()->isIntegerTy(1) &&

           "Intrinsic WaveActiveBallot operand must be a bool");


    Intrinsic::ID ID = CGM.getHLSLRuntime().getWaveActiveBallotIntrinsic();

    return EmitRuntimeCall(

        Intrinsic::getOrInsertDeclaration(&CGM.getModule(), ID), {Op});

  }

  case Builtin::BI__builtin_hlsl_wave_active_count_bits: {

    Value *OpExpr = EmitScalarExpr(E->getArg(0));

    Intrinsic::ID ID = CGM.getHLSLRuntime().getWaveActiveCountBitsIntrinsic();

    return EmitRuntimeCall(

        Intrinsic::getOrInsertDeclaration(&CGM.getModule(), ID),

        ArrayRef{OpExpr});

  }

  case Builtin::BI__builtin_hlsl_wave_active_sum: {

    // Due to the use of variadic arguments, explicitly retreive argument

    Value *OpExpr = EmitScalarExpr(E->getArg(0));

    Intrinsic::ID IID = getWaveActiveSumIntrinsic(

        getTarget().getTriple().getArch(), CGM.getHLSLRuntime(),

        E->getArg(0)->getType());


    return EmitRuntimeCall(Intrinsic::getOrInsertDeclaration(

                               &CGM.getModule(), IID, {OpExpr->getType()}),

                           ArrayRef{OpExpr}, "hlsl.wave.active.sum");

  }

  case Builtin::BI__builtin_hlsl_wave_active_max: {

    // Due to the use of variadic arguments, explicitly retreive argument

    Value *OpExpr = EmitScalarExpr(E->getArg(0));

    Intrinsic::ID IID = getWaveActiveMaxIntrinsic(

        getTarget().getTriple().getArch(), CGM.getHLSLRuntime(),

        E->getArg(0)->getType());


    return EmitRuntimeCall(Intrinsic::getOrInsertDeclaration(

                               &CGM.getModule(), IID, {OpExpr->getType()}),

                           ArrayRef{OpExpr}, "hlsl.wave.active.max");

  }

  case Builtin::BI__builtin_hlsl_wave_active_min: {

    // Due to the use of variadic arguments, explicitly retreive argument

    Value *OpExpr = EmitScalarExpr(E->getArg(0));

    Intrinsic::ID IID = getWaveActiveMinIntrinsic(

        getTarget().getTriple().getArch(), CGM.getHLSLRuntime(),

        E->getArg(0)->getType());


    return EmitRuntimeCall(Intrinsic::getOrInsertDeclaration(

                               &CGM.getModule(), IID, {OpExpr->getType()}),

                           ArrayRef{OpExpr}, "hlsl.wave.active.min");

  }

  case Builtin::BI__builtin_hlsl_wave_get_lane_index: {

    // We don't define a SPIR-V intrinsic, instead it is a SPIR-V built-in

    // defined in SPIRVBuiltins.td. So instead we manually get the matching name

    // for the DirectX intrinsic and the demangled builtin name

    switch (CGM.getTarget().getTriple().getArch()) {

    case llvm::Triple::dxil:

      return EmitRuntimeCall(Intrinsic::getOrInsertDeclaration(

          &CGM.getModule(), Intrinsic::dx_wave_getlaneindex));

    case llvm::Triple::spirv:

      return EmitRuntimeCall(CGM.CreateRuntimeFunction(

          llvm::FunctionType::get(IntTy, {}, false),

          "__hlsl_wave_get_lane_index", {}, false, true));

    default:

      llvm_unreachable(

          "Intrinsic WaveGetLaneIndex not supported by target architecture");

    }

  }

  case Builtin::BI__builtin_hlsl_wave_is_first_lane: {

    Intrinsic::ID ID = CGM.getHLSLRuntime().getWaveIsFirstLaneIntrinsic();

    return EmitRuntimeCall(

        Intrinsic::getOrInsertDeclaration(&CGM.getModule(), ID));

  }

  case Builtin::BI__builtin_hlsl_wave_get_lane_count: {

    Intrinsic::ID ID = CGM.getHLSLRuntime().getWaveGetLaneCountIntrinsic();

    return EmitRuntimeCall(

        Intrinsic::getOrInsertDeclaration(&CGM.getModule(), ID));

  }

  case Builtin::BI__builtin_hlsl_wave_read_lane_at: {

    // Due to the use of variadic arguments we must explicitly retreive them and

    // create our function type.

    Value *OpExpr = EmitScalarExpr(E->getArg(0));

    Value *OpIndex = EmitScalarExpr(E->getArg(1));

    return EmitRuntimeCall(

        Intrinsic::getOrInsertDeclaration(

            &CGM.getModule(), CGM.getHLSLRuntime().getWaveReadLaneAtIntrinsic(),

            {OpExpr->getType()}),

        ArrayRef{OpExpr, OpIndex}, "hlsl.wave.readlane");

  }

  case Builtin::BI__builtin_hlsl_elementwise_sign: {

    auto *Arg0 = E->getArg(0);

    Value *Op0 = EmitScalarExpr(Arg0);

    llvm::Type *Xty = Op0->getType();

    llvm::Type *retType = llvm::Type::getInt32Ty(this->getLLVMContext());

    if (Xty->isVectorTy()) {

      auto *XVecTy = Arg0->getType()->castAs<VectorType>();

      retType = llvm::VectorType::get(

          retType, ElementCount::getFixed(XVecTy->getNumElements()));

    }

    assert((Arg0->getType()->hasFloatingRepresentation() ||

            Arg0->getType()->hasIntegerRepresentation()) &&

           "sign operand must have a float or int representation");


    if (Arg0->getType()->hasUnsignedIntegerRepresentation()) {

      Value *Cmp = Builder.CreateICmpEQ(Op0, ConstantInt::get(Xty, 0));

      return Builder.CreateSelect(Cmp, ConstantInt::get(retType, 0),

                                  ConstantInt::get(retType, 1), "hlsl.sign");

    }


    return Builder.CreateIntrinsic(

        retType, CGM.getHLSLRuntime().getSignIntrinsic(),

        ArrayRef<Value *>{Op0}, nullptr, "hlsl.sign");

  }

  case Builtin::BI__builtin_hlsl_elementwise_radians: {

    Value *Op0 = EmitScalarExpr(E->getArg(0));

    assert(E->getArg(0)->getType()->hasFloatingRepresentation() &&

           "radians operand must have a float representation");

    return Builder.CreateIntrinsic(

        /*ReturnType=*/Op0->getType(),

        CGM.getHLSLRuntime().getRadiansIntrinsic(), ArrayRef<Value *>{Op0},

        nullptr, "hlsl.radians");

  }

  case Builtin::BI__builtin_hlsl_buffer_update_counter: {

    Value *ResHandle = EmitScalarExpr(E->getArg(0));

    Value *Offset = EmitScalarExpr(E->getArg(1));

    Value *OffsetI8 = Builder.CreateIntCast(Offset, Int8Ty, true);

    return Builder.CreateIntrinsic(

        /*ReturnType=*/Offset->getType(),

        CGM.getHLSLRuntime().getBufferUpdateCounterIntrinsic(),

        ArrayRef<Value *>{ResHandle, OffsetI8}, nullptr);

  }

  case Builtin::BI__builtin_hlsl_elementwise_splitdouble: {


    assert((E->getArg(0)->getType()->hasFloatingRepresentation() &&

            E->getArg(1)->getType()->hasUnsignedIntegerRepresentation() &&

            E->getArg(2)->getType()->hasUnsignedIntegerRepresentation()) &&

           "asuint operands types mismatch");

    return handleHlslSplitdouble(E, this);

  }

  case Builtin::BI__builtin_hlsl_elementwise_clip:

    assert(E->getArg(0)->getType()->hasFloatingRepresentation() &&

           "clip operands types mismatch");

    return handleHlslClip(E, this);

  case Builtin::BI__builtin_hlsl_group_memory_barrier_with_group_sync: {

    Intrinsic::ID ID =

        CGM.getHLSLRuntime().getGroupMemoryBarrierWithGroupSyncIntrinsic();

    return EmitRuntimeCall(

        Intrinsic::getOrInsertDeclaration(&CGM.getModule(), ID));

  }

  case Builtin::BI__builtin_hlsl_elementwise_ddx_coarse: {

    Value *Op0 = EmitScalarExpr(E->getArg(0));

    if (!E->getArg(0)->getType()->hasFloatingRepresentation())

      llvm_unreachable("ddx_coarse operand must have a float representation");

    Intrinsic::ID ID = CGM.getHLSLRuntime().getDdxCoarseIntrinsic();

    return Builder.CreateIntrinsic(/*ReturnType=*/Op0->getType(), ID,

                                   ArrayRef<Value *>{Op0}, nullptr,

                                   "hlsl.ddx.coarse");

  }

  case Builtin::BI__builtin_hlsl_elementwise_ddy_coarse: {

    Value *Op0 = EmitScalarExpr(E->getArg(0));

    if (!E->getArg(0)->getType()->hasFloatingRepresentation())

      llvm_unreachable("ddy_coarse operand must have a float representation");

    Intrinsic::ID ID = CGM.getHLSLRuntime().getDdyCoarseIntrinsic();

    return Builder.CreateIntrinsic(/*ReturnType=*/Op0->getType(), ID,

                                   ArrayRef<Value *>{Op0}, nullptr,

                                   "hlsl.ddy.coarse");

  }

  case Builtin::BI__builtin_hlsl_elementwise_ddx_fine: {

    Value *Op0 = EmitScalarExpr(E->getArg(0));

    if (!E->getArg(0)->getType()->hasFloatingRepresentation())

      llvm_unreachable("ddx_fine operand must have a float representation");

    Intrinsic::ID ID = CGM.getHLSLRuntime().getDdxFineIntrinsic();

    return Builder.CreateIntrinsic(/*ReturnType=*/Op0->getType(), ID,

                                   ArrayRef<Value *>{Op0}, nullptr,

                                   "hlsl.ddx.fine");

  }

  case Builtin::BI__builtin_hlsl_elementwise_ddy_fine: {

    Value *Op0 = EmitScalarExpr(E->getArg(0));

    if (!E->getArg(0)->getType()->hasFloatingRepresentation())

      llvm_unreachable("ddy_fine operand must have a float representation");

    Intrinsic::ID ID = CGM.getHLSLRuntime().getDdyFineIntrinsic();

    return Builder.CreateIntrinsic(/*ReturnType=*/Op0->getType(), ID,

                                   ArrayRef<Value *>{Op0}, nullptr,

                                   "hlsl.ddy.fine");

  }

  case Builtin::BI__builtin_get_spirv_spec_constant_bool:

  case Builtin::BI__builtin_get_spirv_spec_constant_short:

  case Builtin::BI__builtin_get_spirv_spec_constant_ushort:

  case Builtin::BI__builtin_get_spirv_spec_constant_int:

  case Builtin::BI__builtin_get_spirv_spec_constant_uint:

  case Builtin::BI__builtin_get_spirv_spec_constant_longlong:

  case Builtin::BI__builtin_get_spirv_spec_constant_ulonglong:

  case Builtin::BI__builtin_get_spirv_spec_constant_half:

  case Builtin::BI__builtin_get_spirv_spec_constant_float:

  case Builtin::BI__builtin_get_spirv_spec_constant_double: {

    llvm::Function *SpecConstantFn = getSpecConstantFunction(E->getType());

    llvm::Value *SpecId = EmitScalarExpr(E->getArg(0));

    llvm::Value *DefaultVal = EmitScalarExpr(E->getArg(1));

    llvm::Value *Args[] = {SpecId, DefaultVal};

    return Builder.CreateCall(SpecConstantFn, Args);

  }

  }

  return nullptr;

}


llvm::Function *clang::CodeGen::CodeGenFunction::getSpecConstantFunction(

    const clang::QualType &SpecConstantType) {


  // Find or create the declaration for the function.

  llvm::Module *M = &CGM.getModule();

  std::string MangledName =

      getSpecConstantFunctionName(SpecConstantType, getContext());

  llvm::Function *SpecConstantFn = M->getFunction(MangledName);


  if (!SpecConstantFn) {

    llvm::Type *IntType = ConvertType(getContext().IntTy);

    llvm::Type *RetTy = ConvertType(SpecConstantType);

    llvm::Type *ArgTypes[] = {IntType, RetTy};

    llvm::FunctionType *FnTy = llvm::FunctionType::get(RetTy, ArgTypes, false);

    SpecConstantFn = llvm::Function::Create(

        FnTy, llvm::GlobalValue::ExternalLinkage, MangledName, M);

  }

  return SpecConstantFn;

}


AttrFeatureKind::Arch
@ Arch
Definition LoongArch.cpp:404

EmitOverflowIntrinsic
llvm::Value * EmitOverflowIntrinsic(CodeGenFunction &CGF, const Intrinsic::ID IntrinsicID, llvm::Value *X, llvm::Value *Y, llvm::Value *&Carry)
Emit a call to llvm.
Definition CGBuiltin.cpp:843

CGBuiltin.h

getWaveActiveSumIntrinsic
static Intrinsic::ID getWaveActiveSumIntrinsic(llvm::Triple::ArchType Arch, CGHLSLRuntime &RT, QualType QT)
Definition CGHLSLBuiltins.cpp:244

getWaveActiveMaxIntrinsic
static Intrinsic::ID getWaveActiveMaxIntrinsic(llvm::Triple::ArchType Arch, CGHLSLRuntime &RT, QualType QT)
Definition CGHLSLBuiltins.cpp:261

getDotProductIntrinsic
static Intrinsic::ID getDotProductIntrinsic(CGHLSLRuntime &RT, QualType QT)
Definition CGHLSLBuiltins.cpp:225

getSpecConstantFunctionName
static std::string getSpecConstantFunctionName(clang::QualType SpecConstantType, ASTContext &Context)
Definition CGHLSLBuiltins.cpp:300

getWaveActiveMinIntrinsic
static Intrinsic::ID getWaveActiveMinIntrinsic(llvm::Triple::ArchType Arch, CGHLSLRuntime &RT, QualType QT)
Definition CGHLSLBuiltins.cpp:280

handleHlslSplitdouble
static Value * handleHlslSplitdouble(const CallExpr *E, CodeGenFunction *CGF)
Definition CGHLSLBuiltins.cpp:95

emitBufferStride
static Value * emitBufferStride(CodeGenFunction *CGF, const Expr *HandleExpr, LValue &Stride)
Definition CGHLSLBuiltins.cpp:214

getFirstBitHighIntrinsic
static Intrinsic::ID getFirstBitHighIntrinsic(CGHLSLRuntime &RT, QualType QT)
Definition CGHLSLBuiltins.cpp:234

handleElementwiseF16ToF32
static Value * handleElementwiseF16ToF32(CodeGenFunction &CGF, const CallExpr *E)
Definition CGHLSLBuiltins.cpp:163

handleAsDoubleBuiltin
static Value * handleAsDoubleBuiltin(CodeGenFunction &CGF, const CallExpr *E)
Definition CGHLSLBuiltins.cpp:21

handleHlslClip
static Value * handleHlslClip(const CallExpr *E, CodeGenFunction *CGF)
Definition CGHLSLBuiltins.cpp:56

CGHLSLRuntime.h

CodeGenFunction.h

X
#define X(type, name)
Definition Value.h:97

clang::ASTContext
Holds long-lived AST nodes (such as types and decls) that can be referred to throughout the semantic ...
Definition ASTContext.h:220

clang::CallExpr
CallExpr - Represents a function call (C99 6.5.2.2, C++ [expr.call]).
Definition Expr.h:2943

clang::CallExpr::getArg
Expr * getArg(unsigned Arg)
getArg - Return the specified argument.
Definition Expr.h:3147

clang::CodeGen::Address
Like RawAddress, an abstract representation of an aligned address, but the pointer contained in this ...
Definition Address.h:128

clang::CodeGen::CGBuilderTy::CreateStore
llvm::StoreInst * CreateStore(llvm::Value *Val, Address Addr, bool IsVolatile=false)
Definition CGBuilder.h:140

clang::CodeGen::CGHLSLRuntime
Definition CGHLSLRuntime.h:117

clang::CodeGen::CallArgList
CallArgList - Type for representing both the value and type of arguments in a call.
Definition CGCall.h:274

clang::CodeGen::CallArgList::reverseWritebacks
void reverseWritebacks()
Definition CGCall.h:356

clang::CodeGen::CodeGenFunction
CodeGenFunction - This class organizes the per-function state that is used while generating LLVM code...
Definition CodeGenFunction.h:247

clang::CodeGen::CodeGenFunction::ConvertType
llvm::Type * ConvertType(QualType T)
Definition CodeGenFunction.cpp:240

clang::CodeGen::CodeGenFunction::createBasicBlock
llvm::BasicBlock * createBasicBlock(const Twine &name="", llvm::Function *parent=nullptr, llvm::BasicBlock *before=nullptr)
createBasicBlock - Create an LLVM basic block.
Definition CodeGenFunction.h:2617

clang::CodeGen::CodeGenFunction::getLangOpts
const LangOptions & getLangOpts() const
Definition CodeGenFunction.h:2162

clang::CodeGen::CodeGenFunction::getTarget
const TargetInfo & getTarget() const
Definition CodeGenFunction.h:2192

clang::CodeGen::CodeGenFunction::getSpecConstantFunction
llvm::Function * getSpecConstantFunction(const clang::QualType &SpecConstantType)
Definition CGHLSLBuiltins.cpp:1035

clang::CodeGen::CodeGenFunction::EmitHLSLOutArgExpr
LValue EmitHLSLOutArgExpr(const HLSLOutArgExpr *E, CallArgList &Args, QualType Ty)
Definition CGExpr.cpp:6120

clang::CodeGen::CodeGenFunction::EmitWritebacks
void EmitWritebacks(const CallArgList &Args)
EmitWriteback - Emit callbacks for function.
Definition CGCall.cpp:4882

clang::CodeGen::CodeGenFunction::getTypeSize
llvm::Value * getTypeSize(QualType Ty)
Returns calculated size of the specified type.
Definition CGStmtOpenMP.cpp:385

clang::CodeGen::CodeGenFunction::Builder
CGBuilderTy Builder
Definition CodeGenFunction.h:286

clang::CodeGen::CodeGenFunction::getContext
ASTContext & getContext() const
Definition CodeGenFunction.h:2149

clang::CodeGen::CodeGenFunction::EmitAnyExpr
RValue EmitAnyExpr(const Expr *E, AggValueSlot aggSlot=AggValueSlot::ignored(), bool ignoreResult=false)
EmitAnyExpr - Emit code to compute the specified expression which can have any type.
Definition CGExpr.cpp:267

clang::CodeGen::CodeGenFunction::EmitRuntimeCall
llvm::CallInst * EmitRuntimeCall(llvm::FunctionCallee callee, const Twine &name="")

clang::CodeGen::CodeGenFunction::CGM
CodeGenModule & CGM
Definition CodeGenFunction.h:278

clang::CodeGen::CodeGenFunction::EmitScalarExpr
llvm::Value * EmitScalarExpr(const Expr *E, bool IgnoreResultAssign=false)
EmitScalarExpr - Emit the computation of the specified expression of LLVM scalar type,...
Definition CGExprScalar.cpp:5985

clang::CodeGen::CodeGenFunction::CurFn
llvm::Function * CurFn
Definition CodeGenFunction.h:347

clang::CodeGen::CodeGenFunction::ReturnValue
Address ReturnValue
ReturnValue - The temporary alloca to hold the return value.
Definition CodeGenFunction.h:404

clang::CodeGen::CodeGenFunction::EmitLValue
LValue EmitLValue(const Expr *E, KnownNonNull_t IsKnownNonNull=NotKnownNonNull)
EmitLValue - Emit code to compute a designator that specifies the location of the expression.
Definition CGExpr.cpp:1691

clang::CodeGen::CodeGenFunction::getLLVMContext
llvm::LLVMContext & getLLVMContext()
Definition CodeGenFunction.h:2193

clang::CodeGen::CodeGenFunction::EmitHLSLBuiltinExpr
llvm::Value * EmitHLSLBuiltinExpr(unsigned BuiltinID, const CallExpr *E, ReturnValueSlot ReturnValue)
Definition CGHLSLBuiltins.cpp:336

clang::CodeGen::CodeGenModule::getHLSLRuntime
CGHLSLRuntime & getHLSLRuntime()
Return a reference to the configured HLSL runtime.
Definition CodeGenModule.h:770

clang::CodeGen::CodeGenModule::getTarget
const TargetInfo & getTarget() const
Definition CodeGenModule.h:865

clang::CodeGen::CodeGenModule::getTriple
const llvm::Triple & getTriple() const
Definition CodeGenModule.h:866

clang::CodeGen::LValue
LValue - This represents an lvalue references.
Definition CGValue.h:183

clang::CodeGen::LValue::getAddress
Address getAddress() const
Definition CGValue.h:373

clang::CodeGen::RValue
RValue - This trivial value class is used to represent the result of an expression that is evaluated.
Definition CGValue.h:42

clang::CodeGen::RValue::isScalar
bool isScalar() const
Definition CGValue.h:64

clang::CodeGen::RValue::getAggregateAddress
Address getAggregateAddress() const
getAggregateAddr() - Return the Value* of the address of the aggregate.
Definition CGValue.h:84

clang::CodeGen::RValue::getScalarVal
llvm::Value * getScalarVal() const
getScalarVal() - Return the Value* of this scalar value.
Definition CGValue.h:72

clang::CodeGen::ReturnValueSlot
ReturnValueSlot - Contains the address where the return value of a function can be stored,...
Definition CGCall.h:379

clang::DeclarationName
The name of a declaration.
Definition DeclarationName.h:144

clang::Expr
This represents one expression.
Definition Expr.h:112

clang::Expr::getType
QualType getType() const
Definition Expr.h:144

clang::FunctionDecl
Represents a function declaration or definition.
Definition Decl.h:2000

clang::FunctionDecl::Create
static FunctionDecl * Create(ASTContext &C, DeclContext *DC, SourceLocation StartLoc, SourceLocation NLoc, DeclarationName N, QualType T, TypeSourceInfo *TInfo, StorageClass SC, bool UsesFPIntrin=false, bool isInlineSpecified=false, bool hasWrittenPrototype=true, ConstexprSpecKind ConstexprKind=ConstexprSpecKind::Unspecified, const AssociatedConstraint &TrailingRequiresClause={})
Definition Decl.h:2189

clang::ParmVarDecl
Represents a parameter to a function.
Definition Decl.h:1790

clang::ParmVarDecl::Create
static ParmVarDecl * Create(ASTContext &C, DeclContext *DC, SourceLocation StartLoc, SourceLocation IdLoc, const IdentifierInfo *Id, QualType T, TypeSourceInfo *TInfo, StorageClass S, Expr *DefArg)
Definition Decl.cpp:2957

clang::QualType
A (possibly-)qualified type.
Definition TypeBase.h:937

clang::QualType::getTypePtr
const Type * getTypePtr() const
Retrieves a pointer to the underlying (unqualified) type.
Definition TypeBase.h:8292

clang::SourceLocation
Encodes a location in the source.
Definition SourceLocation.h:90

clang::TargetCXXABI::areArgsDestroyedLeftToRightInCallee
bool areArgsDestroyedLeftToRightInCallee() const
Are arguments to a call destroyed left to right in the callee?
Definition TargetCXXABI.h:188

clang::TargetInfo::getTriple
const llvm::Triple & getTriple() const
Returns the target triple of the primary target.
Definition TargetInfo.h:1316

clang::TargetInfo::getCXXABI
TargetCXXABI getCXXABI() const
Get the C++ ABI currently in use.
Definition TargetInfo.h:1388

clang::Type::isSignedIntegerType
bool isSignedIntegerType() const
Return true if this is an integer type that is signed, according to C99 6.2.5p4 [char,...
Definition Type.cpp:2206

clang::Type::hasIntegerRepresentation
bool hasIntegerRepresentation() const
Determine whether this type has an integer representation of some sort, e.g., it is an integer type o...
Definition Type.cpp:2067

clang::Type::castAs
const T * castAs() const
Member-template castAs<specific type>.
Definition TypeBase.h:9178

clang::Type::hasUnsignedIntegerRepresentation
bool hasUnsignedIntegerRepresentation() const
Determine whether this type has an unsigned integer representation of some sort, e....
Definition Type.cpp:2292

clang::Type::hasSignedIntegerRepresentation
bool hasSignedIntegerRepresentation() const
Determine whether this type has an signed integer representation of some sort, e.g....
Definition Type.cpp:2244

clang::Type::hasFloatingRepresentation
bool hasFloatingRepresentation() const
Determine whether this type has a floating-point representation of some sort, e.g....
Definition Type.cpp:2313

clang::Type::isVectorType
bool isVectorType() const
Definition TypeBase.h:8668

clang::Type::isFloatingType
bool isFloatingType() const
Definition Type.cpp:2305

clang::Type::isUnsignedIntegerType
bool isUnsignedIntegerType() const
Return true if this is an integer type that is unsigned, according to C99 6.2.5p6 [which returns true...
Definition Type.cpp:2254

clang::Type::getAs
const T * getAs() const
Member-template getAs<specific type>'.
Definition TypeBase.h:9111

clang::Value
Definition Value.h:95

clang::Value::getType
QualType getType() const
Definition Value.cpp:237

clang::VectorType
Represents a GCC generic vector type.
Definition TypeBase.h:4176

clang::VectorType::getNumElements
unsigned getNumElements() const
Definition TypeBase.h:4191

llvm::ArrayRef
Definition LLVM.h:31

llvm::SmallVector
Definition LLVM.h:35

clang::CodeGen
Definition CGFunctionInfo.h:28

clang
The JSON file list parser is used to communicate input to InstallAPI.
Definition CalledOnceCheck.h:17

clang::HLSL
@ HLSL
Definition LangStandard.h:66

clang::SC_Extern
@ SC_Extern
Definition Specifiers.h:251

clang::SC_None
@ SC_None
Definition Specifiers.h:250

clang::ObjCSubstitutionContext::Result
@ Result
The result type of a method or function.
Definition TypeBase.h:905

clang::OpenACCGangKind::Dim
@ Dim
dim:
Definition OpenACCKinds.h:610

clang::cast
U cast(CodeGen::Address addr)
Definition Address.h:327

llvm
Diagnostic wrappers for TextAPI types for error reporting.
Definition Dominators.h:30

clang::CodeGen::CodeGenTypeCache::Int8Ty
llvm::IntegerType * Int8Ty
i8, i16, i32, and i64
Definition CodeGenTypeCache.h:37

clang::CodeGen::CodeGenTypeCache::DoubleTy
llvm::Type * DoubleTy
Definition CodeGenTypeCache.h:39

clang::CodeGen::CodeGenTypeCache::Int32Ty
llvm::IntegerType * Int32Ty
Definition CodeGenTypeCache.h:37

clang::CodeGen::CodeGenTypeCache::IntTy
llvm::IntegerType * IntTy
int
Definition CodeGenTypeCache.h:42

clang::CodeGen::CodeGenTypeCache::FloatTy
llvm::Type * FloatTy
Definition CodeGenTypeCache.h:39

clang::FunctionProtoType::ExtProtoInfo
Extra information about a function prototype.
Definition TypeBase.h:5354