doxygen/Basic_2Cuda_8cpp_source.html

#include "clang/Basic/Cuda.h"


#include "llvm/ADT/StringRef.h"

#include "llvm/ADT/Twine.h"

#include "llvm/Support/ErrorHandling.h"

#include "llvm/Support/VersionTuple.h"


namespace clang {


struct CudaVersionMapEntry {

  const char *Name;

  CudaVersion Version;

  llvm::VersionTuple TVersion;

};

#define CUDA_ENTRY(major, minor)                                               \

  {                                                                            \

    #major "." #minor, CudaVersion::CUDA_##major##minor,                       \

        llvm::VersionTuple(major, minor)                                       \

  }


static const CudaVersionMapEntry CudaNameVersionMap[] = {

    CUDA_ENTRY(7, 0),

    CUDA_ENTRY(7, 5),

    CUDA_ENTRY(8, 0),

    CUDA_ENTRY(9, 0),

    CUDA_ENTRY(9, 1),

    CUDA_ENTRY(9, 2),

    CUDA_ENTRY(10, 0),

    CUDA_ENTRY(10, 1),

    CUDA_ENTRY(10, 2),

    CUDA_ENTRY(11, 0),

    CUDA_ENTRY(11, 1),

    CUDA_ENTRY(11, 2),

    CUDA_ENTRY(11, 3),

    CUDA_ENTRY(11, 4),

    CUDA_ENTRY(11, 5),

    CUDA_ENTRY(11, 6),

    CUDA_ENTRY(11, 7),

    CUDA_ENTRY(11, 8),

    CUDA_ENTRY(12, 0),

    CUDA_ENTRY(12, 1),

    CUDA_ENTRY(12, 2),

    CUDA_ENTRY(12, 3),

    CUDA_ENTRY(12, 4),

    CUDA_ENTRY(12, 5),

    CUDA_ENTRY(12, 6),

    {"", CudaVersion::NEW, llvm::VersionTuple(std::numeric_limits<int>::max())},

    {"unknown", CudaVersion::UNKNOWN, {}} // End of list tombstone.

};

#undef CUDA_ENTRY


const char *CudaVersionToString(CudaVersion V) {

  for (auto *I = CudaNameVersionMap; I->Version != CudaVersion::UNKNOWN; ++I)

    if (I->Version == V)

      return I->Name;


  return CudaVersionToString(CudaVersion::UNKNOWN);

}


CudaVersion CudaStringToVersion(const llvm::Twine &S) {

  std::string VS = S.str();

  for (auto *I = CudaNameVersionMap; I->Version != CudaVersion::UNKNOWN; ++I)

    if (I->Name == VS)

      return I->Version;

  return CudaVersion::UNKNOWN;

}


CudaVersion ToCudaVersion(llvm::VersionTuple Version) {

  for (auto *I = CudaNameVersionMap; I->Version != CudaVersion::UNKNOWN; ++I)

    if (I->TVersion == Version)

      return I->Version;

  return CudaVersion::UNKNOWN;

}


namespace {

struct OffloadArchToStringMap {

  OffloadArch arch;

  const char *arch_name;

  const char *virtual_arch_name;

};

} // namespace


#define SM2(sm, ca) {OffloadArch::SM_##sm, "sm_" #sm, ca}

#define SM(sm) SM2(sm, "compute_" #sm)

#define GFX(gpu) {OffloadArch::GFX##gpu, "gfx" #gpu, "compute_amdgcn"}

static const OffloadArchToStringMap arch_names[] = {

    // clang-format off

    {OffloadArch::UNUSED, "", ""},

    SM2(20, "compute_20"), SM2(21, "compute_20"), // Fermi

    SM(30), {OffloadArch::SM_32_, "sm_32", "compute_32"}, SM(35), SM(37),  // Kepler

    SM(50), SM(52), SM(53),          // Maxwell

    SM(60), SM(61), SM(62),          // Pascal

    SM(70), SM(72),                  // Volta

    SM(75),                          // Turing

    SM(80), SM(86),                  // Ampere

    SM(87),                          // Jetson/Drive AGX Orin

    SM(89),                          // Ada Lovelace

    SM(90),                          // Hopper

    SM(90a),                         // Hopper

    SM(100),                         // Blackwell

    GFX(600),  // gfx600

    GFX(601),  // gfx601

    GFX(602),  // gfx602

    GFX(700),  // gfx700

    GFX(701),  // gfx701

    GFX(702),  // gfx702

    GFX(703),  // gfx703

    GFX(704),  // gfx704

    GFX(705),  // gfx705

    GFX(801),  // gfx801

    GFX(802),  // gfx802

    GFX(803),  // gfx803

    GFX(805),  // gfx805

    GFX(810),  // gfx810

    {OffloadArch::GFX9_GENERIC, "gfx9-generic", "compute_amdgcn"},

    GFX(900),  // gfx900

    GFX(902),  // gfx902

    GFX(904),  // gfx903

    GFX(906),  // gfx906

    GFX(908),  // gfx908

    GFX(909),  // gfx909

    GFX(90a),  // gfx90a

    GFX(90c),  // gfx90c

    {OffloadArch::GFX9_4_GENERIC, "gfx9-4-generic", "compute_amdgcn"},

    GFX(940),  // gfx940

    GFX(941),  // gfx941

    GFX(942),  // gfx942

    GFX(950),  // gfx950

    {OffloadArch::GFX10_1_GENERIC, "gfx10-1-generic", "compute_amdgcn"},

    GFX(1010), // gfx1010

    GFX(1011), // gfx1011

    GFX(1012), // gfx1012

    GFX(1013), // gfx1013

    {OffloadArch::GFX10_3_GENERIC, "gfx10-3-generic", "compute_amdgcn"},

    GFX(1030), // gfx1030

    GFX(1031), // gfx1031

    GFX(1032), // gfx1032

    GFX(1033), // gfx1033

    GFX(1034), // gfx1034

    GFX(1035), // gfx1035

    GFX(1036), // gfx1036

    {OffloadArch::GFX11_GENERIC, "gfx11-generic", "compute_amdgcn"},

    GFX(1100), // gfx1100

    GFX(1101), // gfx1101

    GFX(1102), // gfx1102

    GFX(1103), // gfx1103

    GFX(1150), // gfx1150

    GFX(1151), // gfx1151

    GFX(1152), // gfx1152

    GFX(1153), // gfx1153

    {OffloadArch::GFX12_GENERIC, "gfx12-generic", "compute_amdgcn"},

    GFX(1200), // gfx1200

    GFX(1201), // gfx1201

    {OffloadArch::AMDGCNSPIRV, "amdgcnspirv", "compute_amdgcn"},

    {OffloadArch::Generic, "generic", ""},

    // clang-format on

};

#undef SM

#undef SM2

#undef GFX


const char *OffloadArchToString(OffloadArch A) {

  auto result = std::find_if(

      std::begin(arch_names), std::end(arch_names),

      [A](const OffloadArchToStringMap &map) { return A == map.arch; });

  if (result == std::end(arch_names))

    return "unknown";

  return result->arch_name;

}


const char *OffloadArchToVirtualArchString(OffloadArch A) {

  auto result = std::find_if(

      std::begin(arch_names), std::end(arch_names),

      [A](const OffloadArchToStringMap &map) { return A == map.arch; });

  if (result == std::end(arch_names))

    return "unknown";

  return result->virtual_arch_name;

}


OffloadArch StringToOffloadArch(llvm::StringRef S) {

  auto result = std::find_if(

      std::begin(arch_names), std::end(arch_names),

      [S](const OffloadArchToStringMap &map) { return S == map.arch_name; });

  if (result == std::end(arch_names))

    return OffloadArch::UNKNOWN;

  return result->arch;

}


CudaVersion MinVersionForOffloadArch(OffloadArch A) {

  if (A == OffloadArch::UNKNOWN)

    return CudaVersion::UNKNOWN;


  // AMD GPUs do not depend on CUDA versions.

  if (IsAMDOffloadArch(A))

    return CudaVersion::CUDA_70;


  switch (A) {

  case OffloadArch::SM_20:

  case OffloadArch::SM_21:

  case OffloadArch::SM_30:

  case OffloadArch::SM_32_:

  case OffloadArch::SM_35:

  case OffloadArch::SM_37:

  case OffloadArch::SM_50:

  case OffloadArch::SM_52:

  case OffloadArch::SM_53:

    return CudaVersion::CUDA_70;

  case OffloadArch::SM_60:

  case OffloadArch::SM_61:

  case OffloadArch::SM_62:

    return CudaVersion::CUDA_80;

  case OffloadArch::SM_70:

    return CudaVersion::CUDA_90;

  case OffloadArch::SM_72:

    return CudaVersion::CUDA_91;

  case OffloadArch::SM_75:

    return CudaVersion::CUDA_100;

  case OffloadArch::SM_80:

    return CudaVersion::CUDA_110;

  case OffloadArch::SM_86:

    return CudaVersion::CUDA_111;

  case OffloadArch::SM_87:

    return CudaVersion::CUDA_114;

  case OffloadArch::SM_89:

  case OffloadArch::SM_90:

    return CudaVersion::CUDA_118;

  case OffloadArch::SM_90a:

    return CudaVersion::CUDA_120;

  case OffloadArch::SM_100:

    return CudaVersion::NEW; // TODO: use specific CUDA version once it's

                             // public.

  default:

    llvm_unreachable("invalid enum");

  }

}


CudaVersion MaxVersionForOffloadArch(OffloadArch A) {

  // AMD GPUs do not depend on CUDA versions.

  if (IsAMDOffloadArch(A))

    return CudaVersion::NEW;


  switch (A) {

  case OffloadArch::UNKNOWN:

    return CudaVersion::UNKNOWN;

  case OffloadArch::SM_20:

  case OffloadArch::SM_21:

    return CudaVersion::CUDA_80;

  case OffloadArch::SM_30:

  case OffloadArch::SM_32_:

    return CudaVersion::CUDA_102;

  case OffloadArch::SM_35:

  case OffloadArch::SM_37:

    return CudaVersion::CUDA_118;

  default:

    return CudaVersion::NEW;

  }

}


bool CudaFeatureEnabled(llvm::VersionTuple Version, CudaFeature Feature) {

  return CudaFeatureEnabled(ToCudaVersion(Version), Feature);

}


bool CudaFeatureEnabled(CudaVersion Version, CudaFeature Feature) {

  switch (Feature) {

  case CudaFeature::CUDA_USES_NEW_LAUNCH:

    return Version >= CudaVersion::CUDA_92;

  case CudaFeature::CUDA_USES_FATBIN_REGISTER_END:

    return Version >= CudaVersion::CUDA_101;

  }

  llvm_unreachable("Unknown CUDA feature.");

}

} // namespace clang

V
#define V(N, I)
Definition: ASTContext.h:3453

arch_name
const char * arch_name
Definition: Cuda.cpp:78

SM2
#define SM2(sm, ca)
Definition: Cuda.cpp:83

GFX
#define GFX(gpu)
Definition: Cuda.cpp:85

arch
OffloadArch arch
Definition: Cuda.cpp:77

SM
#define SM(sm)
Definition: Cuda.cpp:84

virtual_arch_name
const char * virtual_arch_name
Definition: Cuda.cpp:79

CUDA_ENTRY
#define CUDA_ENTRY(major, minor)
Definition: Cuda.cpp:15

c
__device__ __2f16 float c
Definition: __clang_hip_libdevice_declares.h:304

Cuda.h

clang
The JSON file list parser is used to communicate input to InstallAPI.
Definition: CalledOnceCheck.h:17

clang::arch_names
static const OffloadArchToStringMap arch_names[]
Definition: Cuda.cpp:86

clang::MaxVersionForOffloadArch
CudaVersion MaxVersionForOffloadArch(OffloadArch A)
Get the latest CudaVersion that supports the given OffloadArch.
Definition: Cuda.cpp:237

clang::IsAMDOffloadArch
static bool IsAMDOffloadArch(OffloadArch A)
Definition: Cuda.h:157

clang::OffloadArch
OffloadArch
Definition: Cuda.h:56

clang::OffloadArch::GFX10_1_GENERIC
@ GFX10_1_GENERIC

clang::OffloadArch::GFX11_GENERIC
@ GFX11_GENERIC

clang::OffloadArch::SM_21
@ SM_21

clang::OffloadArch::AMDGCNSPIRV
@ AMDGCNSPIRV

clang::OffloadArch::SM_72
@ SM_72

clang::OffloadArch::UNUSED
@ UNUSED

clang::OffloadArch::SM_61
@ SM_61

clang::OffloadArch::GFX9_4_GENERIC
@ GFX9_4_GENERIC

clang::OffloadArch::UNKNOWN
@ UNKNOWN

clang::OffloadArch::SM_52
@ SM_52

clang::OffloadArch::SM_50
@ SM_50

clang::OffloadArch::SM_75
@ SM_75

clang::OffloadArch::SM_89
@ SM_89

clang::OffloadArch::SM_53
@ SM_53

clang::OffloadArch::SM_35
@ SM_35

clang::OffloadArch::SM_60
@ SM_60

clang::OffloadArch::GFX12_GENERIC
@ GFX12_GENERIC

clang::OffloadArch::Generic
@ Generic

clang::OffloadArch::SM_20
@ SM_20

clang::OffloadArch::SM_86
@ SM_86

clang::OffloadArch::SM_87
@ SM_87

clang::OffloadArch::SM_62
@ SM_62

clang::OffloadArch::SM_80
@ SM_80

clang::OffloadArch::SM_100
@ SM_100

clang::OffloadArch::GFX10_3_GENERIC
@ GFX10_3_GENERIC

clang::OffloadArch::SM_90
@ SM_90

clang::OffloadArch::SM_30
@ SM_30

clang::OffloadArch::SM_70
@ SM_70

clang::OffloadArch::SM_90a
@ SM_90a

clang::OffloadArch::SM_37
@ SM_37

clang::OffloadArch::GFX9_GENERIC
@ GFX9_GENERIC

clang::OffloadArch::SM_32_
@ SM_32_

clang::ToCudaVersion
CudaVersion ToCudaVersion(llvm::VersionTuple)
Definition: Cuda.cpp:68

clang::CudaStringToVersion
CudaVersion CudaStringToVersion(const llvm::Twine &S)
Definition: Cuda.cpp:60

clang::CudaFeatureEnabled
bool CudaFeatureEnabled(llvm::VersionTuple, CudaFeature)
Definition: Cuda.cpp:259

clang::CudaVersionToString
const char * CudaVersionToString(CudaVersion V)
Definition: Cuda.cpp:52

clang::CudaNameVersionMap
static const CudaVersionMapEntry CudaNameVersionMap[]
Definition: Cuda.cpp:21

clang::OffloadArchToVirtualArchString
const char * OffloadArchToVirtualArchString(OffloadArch A)
Definition: Cuda.cpp:171

clang::StringToOffloadArch
OffloadArch StringToOffloadArch(llvm::StringRef S)
Definition: Cuda.cpp:180

clang::CudaVersion
CudaVersion
Definition: Cuda.h:20

clang::CudaVersion::CUDA_100
@ CUDA_100

clang::CudaVersion::NEW
@ NEW

clang::CudaVersion::CUDA_90
@ CUDA_90

clang::CudaVersion::CUDA_91
@ CUDA_91

clang::CudaVersion::UNKNOWN
@ UNKNOWN

clang::CudaVersion::CUDA_80
@ CUDA_80

clang::CudaVersion::CUDA_120
@ CUDA_120

clang::CudaVersion::CUDA_102
@ CUDA_102

clang::CudaVersion::CUDA_70
@ CUDA_70

clang::CudaVersion::CUDA_110
@ CUDA_110

clang::CudaVersion::CUDA_114
@ CUDA_114

clang::CudaVersion::CUDA_111
@ CUDA_111

clang::CudaVersion::CUDA_101
@ CUDA_101

clang::CudaVersion::CUDA_118
@ CUDA_118

clang::CudaVersion::CUDA_92
@ CUDA_92

clang::CudaFeature
CudaFeature
Definition: Cuda.h:175

clang::CudaFeature::CUDA_USES_NEW_LAUNCH
@ CUDA_USES_NEW_LAUNCH

clang::CudaFeature::CUDA_USES_FATBIN_REGISTER_END
@ CUDA_USES_FATBIN_REGISTER_END

clang::OffloadArchToString
const char * OffloadArchToString(OffloadArch A)
Definition: Cuda.cpp:162

clang::MinVersionForOffloadArch
CudaVersion MinVersionForOffloadArch(OffloadArch A)
Get the earliest CudaVersion that supports the given OffloadArch.
Definition: Cuda.cpp:189

clang::CudaVersionMapEntry
Definition: Cuda.cpp:10

clang::CudaVersionMapEntry::TVersion
llvm::VersionTuple TVersion
Definition: Cuda.cpp:13

clang::CudaVersionMapEntry::Name
const char * Name
Definition: Cuda.cpp:11

clang::CudaVersionMapEntry::Version
CudaVersion Version
Definition: Cuda.cpp:12