d9/d10/genn__cuda__backend_2backend_8h_source.html

 #pragma once

 // Standard C++ includes
 #include <algorithm>
 #include <array>
 #include <functional>
 #include <map>
 #include <string>

 // CUDA includes
 #include <cuda.h>
 #include <cuda_runtime.h>

 // GeNN includes
 #include "backendExport.h"

 // GeNN code generator includes
 #include "code_generator/backendBase.h"
 #include "code_generator/codeStream.h"
 #include "code_generator/substitutions.h"

 // Forward declarations
 namespace filesystem
 {
     class path;
 }

 //--------------------------------------------------------------------------
 // CodeGenerator::CUDA::DeviceSelectMethod
 //--------------------------------------------------------------------------
 namespace CodeGenerator
 {
 namespace CUDA
 {
 enum class DeviceSelect
 {
     OPTIMAL,
     MOST_MEMORY,
     MANUAL,
 };

 //--------------------------------------------------------------------------
 // CodeGenerator::CUDA::BlockSizeSelect
 //--------------------------------------------------------------------------
 enum class BlockSizeSelect
 {
     OCCUPANCY,
     MANUAL,
 };

 //--------------------------------------------------------------------------
 // Kernel
 //--------------------------------------------------------------------------
 enum Kernel
 {
     KernelNeuronUpdate,
     KernelPresynapticUpdate,
     KernelPostsynapticUpdate,
     KernelSynapseDynamicsUpdate,
     KernelInitialize,
     KernelInitializeSparse,
     KernelPreNeuronReset,
     KernelPreSynapseReset,
     KernelMax
 };

 //--------------------------------------------------------------------------
 // Type definitions
 //--------------------------------------------------------------------------
 using KernelBlockSize = std::array<size_t, KernelMax>;

 //--------------------------------------------------------------------------
 // CodeGenerator::CUDA::Preferences
 //--------------------------------------------------------------------------
 struct Preferences : public PreferencesBase
 {
     Preferences()
     {
         std::fill(manualBlockSizes.begin(), manualBlockSizes.end(), 32);
     }

     bool showPtxInfo = false;

     DeviceSelect deviceSelectMethod = DeviceSelect::OPTIMAL;

     unsigned int manualDeviceID = 0;

     BlockSizeSelect blockSizeSelectMethod = BlockSizeSelect::OCCUPANCY;

     KernelBlockSize manualBlockSizes;

     std::string userNvccFlags = "";
 };

 //--------------------------------------------------------------------------
 // CodeGenerator::CUDA::Backend
 //--------------------------------------------------------------------------
 class BACKEND_EXPORT Backend : public BackendBase
 {
 public:
     Backend(const KernelBlockSize &kernelBlockSizes, const Preferences &preferences, int localHostID, int device);

     //--------------------------------------------------------------------------
     // CodeGenerator::Backends:: virtuals
     //--------------------------------------------------------------------------
     virtual void genNeuronUpdate(CodeStream &os, const ModelSpecInternal &model, NeuronGroupSimHandler simHandler, NeuronGroupHandler wuVarUpdateHandler) const override;

     virtual void genSynapseUpdate(CodeStream &os, const ModelSpecInternal &model,
                                   SynapseGroupHandler wumThreshHandler, SynapseGroupHandler wumSimHandler, SynapseGroupHandler wumEventHandler,
                                   SynapseGroupHandler postLearnHandler, SynapseGroupHandler synapseDynamicsHandler) const override;

     virtual void genInit(CodeStream &os, const ModelSpecInternal &model,
                          NeuronGroupHandler localNGHandler, NeuronGroupHandler remoteNGHandler,
                          SynapseGroupHandler sgDenseInitHandler, SynapseGroupHandler sgSparseConnectHandler,
                          SynapseGroupHandler sgSparseInitHandler) const override;

     virtual void genDefinitionsPreamble(CodeStream &os) const override;
     virtual void genDefinitionsInternalPreamble(CodeStream &os) const override;
     virtual void genRunnerPreamble(CodeStream &os) const override;
     virtual void genAllocateMemPreamble(CodeStream &os, const ModelSpecInternal &model) const override;
     virtual void genStepTimeFinalisePreamble(CodeStream &os, const ModelSpecInternal &model) const override;

     virtual void genVariableDefinition(CodeStream &definitions, CodeStream &definitionsInternal, const std::string &type, const std::string &name, VarLocation loc) const override;
     virtual void genVariableImplementation(CodeStream &os, const std::string &type, const std::string &name, VarLocation loc) const override;
     virtual void genVariableAllocation(CodeStream &os, const std::string &type, const std::string &name, VarLocation loc, size_t count) const override;
     virtual void genVariableFree(CodeStream &os, const std::string &name, VarLocation loc) const override;

     virtual void genExtraGlobalParamDefinition(CodeStream &definitions, const std::string &type, const std::string &name, VarLocation loc) const override;
     virtual void genExtraGlobalParamImplementation(CodeStream &os, const std::string &type, const std::string &name, VarLocation loc) const override;
     virtual void genExtraGlobalParamAllocation(CodeStream &os, const std::string &type, const std::string &name, VarLocation loc) const override;
     virtual void genExtraGlobalParamPush(CodeStream &os, const std::string &type, const std::string &name) const override;
     virtual void genExtraGlobalParamPull(CodeStream &os, const std::string &type, const std::string &name) const override;

     virtual void genPopVariableInit(CodeStream &os, VarLocation loc, const Substitutions &kernelSubs, Handler handler) const override;
     virtual void genVariableInit(CodeStream &os, VarLocation loc, size_t count, const std::string &indexVarName,
                                  const Substitutions &kernelSubs, Handler handler) const override;
     virtual void genSynapseVariableRowInit(CodeStream &os, VarLocation loc, const SynapseGroupInternal &sg,
                                            const Substitutions &kernelSubs, Handler handler) const override;

     virtual void genVariablePush(CodeStream &os, const std::string &type, const std::string &name, bool autoInitialized, size_t count) const override;
     virtual void genVariablePull(CodeStream &os, const std::string &type, const std::string &name, size_t count) const override;
     virtual void genCurrentTrueSpikePush(CodeStream &os, const NeuronGroupInternal &ng) const override
     {
         genCurrentSpikePush(os, ng, false);
     }
     virtual void genCurrentTrueSpikePull(CodeStream &os, const NeuronGroupInternal &ng) const override
     {
         genCurrentSpikePull(os, ng, false);
     }
     virtual void genCurrentSpikeLikeEventPush(CodeStream &os, const NeuronGroupInternal &ng) const override
     {
         genCurrentSpikePush(os, ng, true);
     }
     virtual void genCurrentSpikeLikeEventPull(CodeStream &os, const NeuronGroupInternal &ng) const override
     {
         genCurrentSpikePull(os, ng, true);
     }

     virtual void genGlobalRNG(CodeStream &definitions, CodeStream &definitionsInternal, CodeStream &runner, CodeStream &allocations, CodeStream &free, const ModelSpecInternal &model) const override;
     virtual void genPopulationRNG(CodeStream &definitions, CodeStream &definitionsInternal, CodeStream &runner, CodeStream &allocations, CodeStream &free,
                                   const std::string &name, size_t count) const override;
     virtual void genTimer(CodeStream &definitions, CodeStream &definitionsInternal, CodeStream &runner, CodeStream &allocations, CodeStream &free,
                           CodeStream &stepTimeFinalise, const std::string &name, bool updateInStepTime) const override;

     virtual void genMakefilePreamble(std::ostream &os) const override;
     virtual void genMakefileLinkRule(std::ostream &os) const override;
     virtual void genMakefileCompileRule(std::ostream &os) const override;

     virtual void genMSBuildConfigProperties(std::ostream &os) const override;
     virtual void genMSBuildImportProps(std::ostream &os) const override;
     virtual void genMSBuildItemDefinitions(std::ostream &os) const override;
     virtual void genMSBuildCompileModule(const std::string &moduleName, std::ostream &os) const override;
     virtual void genMSBuildImportTarget(std::ostream &os) const override;

     virtual std::string getVarPrefix() const override{ return "dd_"; }

     virtual bool isGlobalRNGRequired(const ModelSpecInternal &model) const override;
     virtual bool isSynRemapRequired() const override{ return true; }
     virtual bool isPostsynapticRemapRequired() const override{ return true; }

     //--------------------------------------------------------------------------
     // Public API
     //--------------------------------------------------------------------------
     const cudaDeviceProp &getChosenCUDADevice() const{ return m_ChosenDevice; }
     int getChosenDeviceID() const{ return m_ChosenDeviceID; }
     std::string getNVCCFlags() const;

     //--------------------------------------------------------------------------
     // Static API
     //--------------------------------------------------------------------------
     static size_t getNumPresynapticUpdateThreads(const SynapseGroupInternal &sg);
     static size_t getNumPostsynapticUpdateThreads(const SynapseGroupInternal &sg);
     static size_t getNumSynapseDynamicsThreads(const SynapseGroupInternal &sg);

     //--------------------------------------------------------------------------
     // Constants
     //--------------------------------------------------------------------------
     static const char *KernelNames[KernelMax];

 private:
     //--------------------------------------------------------------------------
     // Type definitions
     //--------------------------------------------------------------------------
     template<typename T>
     using GetPaddedGroupSizeFunc = std::function<size_t(const T&)>;

     template<typename T>
     using FilterGroupFunc = std::function<bool(const T&)>;

     //--------------------------------------------------------------------------
     // Private methods
     //--------------------------------------------------------------------------
     template<typename T>
     void genParallelGroup(CodeStream &os, const Substitutions &kernelSubs, const std::map<std::string, T> &groups, size_t &idStart,
                           GetPaddedGroupSizeFunc<T> getPaddedSizeFunc,
                           FilterGroupFunc<T> filter,
                           GroupHandler<T> handler) const
     {
         // Populate neuron update groups
         for (const auto &g : groups) {
             // If this synapse group should be processed
             Substitutions popSubs(&kernelSubs);
             if(filter(g.second)) {
                 const size_t paddedSize = getPaddedSizeFunc(g.second);

                 os << "// " << g.first << std::endl;

                 // If this is the first  group
                 if (idStart == 0) {
                     os << "if(id < " << paddedSize << ")" << CodeStream::OB(1);
                     popSubs.addVarSubstitution("id", "id");
                 }
                 else {
                     os << "if(id >= " << idStart << " && id < " << idStart + paddedSize << ")" << CodeStream::OB(1);
                     os << "const unsigned int lid = id - " << idStart << ";" << std::endl;
                     popSubs.addVarSubstitution("id", "lid");
                 }

                 handler(os, g.second, popSubs);

                 idStart += paddedSize;
                 os << CodeStream::CB(1) << std::endl;
             }
         }
     }

     template<typename T>
     void genParallelGroup(CodeStream &os, const Substitutions &kernelSubs, const std::map<std::string, T> &groups, size_t &idStart,
                           GetPaddedGroupSizeFunc<T> getPaddedSizeFunc,
                           GroupHandler<T> handler) const
     {
         genParallelGroup<T>(os, kernelSubs, groups, idStart, getPaddedSizeFunc,
                             [](const T&){ return true; }, handler);
     }

     void genEmitSpike(CodeStream &os, const Substitutions &subs, const std::string &suffix) const;

     void genCurrentSpikePush(CodeStream &os, const NeuronGroupInternal &ng, bool spikeEvent) const;
     void genCurrentSpikePull(CodeStream &os, const NeuronGroupInternal &ng, bool spikeEvent) const;

     void genPresynapticUpdatePreSpan(CodeStream &os, const ModelSpecInternal &model, const SynapseGroupInternal &sg, const Substitutions &popSubs, bool trueSpike,
                                      SynapseGroupHandler wumThreshHandler, SynapseGroupHandler wumSimHandler) const;
     void genPresynapticUpdatePostSpan(CodeStream &os, const ModelSpecInternal &model, const SynapseGroupInternal &sg, const Substitutions &popSubs, bool trueSpike,
                                       SynapseGroupHandler wumThreshHandler, SynapseGroupHandler wumSimHandler) const;

     void genKernelDimensions(CodeStream &os, Kernel kernel, size_t numThreads) const;

     bool shouldAccumulateInLinSyn(const SynapseGroupInternal &sg) const;

     bool shouldAccumulateInSharedMemory(const SynapseGroupInternal &sg) const;

     std::string getFloatAtomicAdd(const std::string &ftype) const;

     //--------------------------------------------------------------------------
     // Members
     //--------------------------------------------------------------------------
     const KernelBlockSize m_KernelBlockSizes;
     const Preferences m_Preferences;

     const int m_ChosenDeviceID;
     cudaDeviceProp m_ChosenDevice;

     int m_RuntimeVersion;
 };
 }   // CUDA
 }   // CodeGenerator
CodeGenerator::CUDA::Backend::genCurrentSpikeLikeEventPush
virtual void genCurrentSpikeLikeEventPush(CodeStream &os, const NeuronGroupInternal &ng) const override
Definition: genn_cuda_backend/backend.h:161

NeuronGroupInternal
Definition: neuronGroupInternal.h:9

CodeGenerator::CodeStream::CB
A close bracket marker.
Definition: codeStream.h:82

CodeGenerator::CUDA::Backend::genCurrentTrueSpikePush
virtual void genCurrentTrueSpikePush(CodeStream &os, const NeuronGroupInternal &ng) const override
Definition: genn_cuda_backend/backend.h:153

VarLocation
VarLocation
< Flags defining which memory space variables should be allocated in
Definition: variableMode.h:10

backendBase.h

CodeGenerator::CUDA::KernelInitialize
Definition: genn_cuda_backend/backend.h:63

CodeGenerator::CUDA::Backend::getChosenDeviceID
int getChosenDeviceID() const
Definition: genn_cuda_backend/backend.h:196

CodeGenerator::CUDA::Backend::getVarPrefix
virtual std::string getVarPrefix() const override
Definition: genn_cuda_backend/backend.h:186

CodeGenerator::CUDA::DeviceSelect::MOST_MEMORY
Pick device with most global memory.

CodeGenerator::CUDA::DeviceSelect::OPTIMAL
Pick optimal device based on how well kernels can be simultaneously simulated and occupancy...

CodeGenerator::CUDA::BlockSizeSelect
BlockSizeSelect
Methods for selecting CUDA kernel block size.
Definition: genn_cuda_backend/backend.h:47

CodeGenerator::CodeStream::OB
An open bracket marker.
Definition: codeStream.h:69

CodeGenerator::PreferencesBase
Base class for backend preferences - can be accessed via a global in &#39;classic&#39; C++ code generator...
Definition: backendBase.h:33

CodeGenerator::CUDA::KernelPreNeuronReset
Definition: genn_cuda_backend/backend.h:65

CodeGenerator::BackendBase::NeuronGroupSimHandler
std::function< void(CodeStream &, const NeuronGroupInternal &, Substitutions &, NeuronGroupHandler, NeuronGroupHandler)> NeuronGroupSimHandler
Callback function type for generation neuron group simulation code.
Definition: backendBase.h:74

CodeGenerator::BackendBase::SynapseGroupHandler
GroupHandler< SynapseGroupInternal > SynapseGroupHandler
Standard callback type which provides a CodeStream to write platform-independent code for the specifi...
Definition: backendBase.h:69

CodeGenerator::CUDA::KernelBlockSize
std::array< size_t, KernelMax > KernelBlockSize
Array of block sizes for each kernel.
Definition: genn_cuda_backend/backend.h:74

CodeGenerator
Helper class for generating code - automatically inserts brackets, indents etc.
Definition: backendBase.h:22

CodeGenerator::BackendBase::NeuronGroupHandler
GroupHandler< NeuronGroupInternal > NeuronGroupHandler
Standard callback type which provides a CodeStream to write platform-independent code for the specifi...
Definition: backendBase.h:66

substitutions.h

CodeGenerator::CUDA::DeviceSelect::MANUAL
Use device specified by user.

SynapseGroupInternal
Definition: synapseGroupInternal.h:9

CodeGenerator::CUDA::Backend::genCurrentSpikeLikeEventPull
virtual void genCurrentSpikeLikeEventPull(CodeStream &os, const NeuronGroupInternal &ng) const override
Definition: genn_cuda_backend/backend.h:165

CodeGenerator::CodeStream
Definition: codeStream.h:19

BACKEND_EXPORT
#define BACKEND_EXPORT
Definition: backendExport.h:13

CodeGenerator::Substitutions
Definition: substitutions.h:19

CodeGenerator::Substitutions::addVarSubstitution
void addVarSubstitution(const std::string &source, const std::string &destionation, bool allowOverride=false)
Definition: substitutions.h:39

CodeGenerator::CUDA::KernelNeuronUpdate
Definition: genn_cuda_backend/backend.h:59

CodeGenerator::CUDA::KernelPresynapticUpdate
Definition: genn_cuda_backend/backend.h:60

CodeGenerator::BackendBase
Definition: backendBase.h:54

CodeGenerator::CUDA::KernelPreSynapseReset
Definition: genn_cuda_backend/backend.h:66

CodeGenerator::CUDA::Backend
Definition: genn_cuda_backend/backend.h:109

CodeGenerator::CUDA::KernelPostsynapticUpdate
Definition: genn_cuda_backend/backend.h:61

CodeGenerator::CUDA::KernelMax
Definition: genn_cuda_backend/backend.h:67

CodeGenerator::CUDA::Backend::isSynRemapRequired
virtual bool isSynRemapRequired() const override
Definition: genn_cuda_backend/backend.h:189

backendExport.h

CodeGenerator::CUDA::Preferences
Preferences for CUDA backend.
Definition: genn_cuda_backend/backend.h:80

CodeGenerator::CUDA::KernelSynapseDynamicsUpdate
Definition: genn_cuda_backend/backend.h:62

ModelSpecInternal
Definition: modelSpecInternal.h:10

CodeGenerator::CUDA::Preferences::Preferences
Preferences()
Definition: genn_cuda_backend/backend.h:82

codeStream.h

CodeGenerator::CUDA::KernelInitializeSparse
Definition: genn_cuda_backend/backend.h:64

filesystem
Definition: generateAll.h:18

CodeGenerator::BackendBase::GroupHandler
std::function< void(CodeStream &, const T &, Substitutions &)> GroupHandler
Definition: backendBase.h:63

CodeGenerator::CUDA::DeviceSelect
DeviceSelect
Methods for selecting CUDA device.
Definition: genn_cuda_backend/backend.h:36

CodeGenerator::CUDA::Kernel
Kernel
Kernels generated by CUDA backend.
Definition: genn_cuda_backend/backend.h:57

CodeGenerator::CUDA::BlockSizeSelect::OCCUPANCY
Pick optimal blocksize for each kernel based on occupancy.

CodeGenerator::CUDA::Backend::isPostsynapticRemapRequired
virtual bool isPostsynapticRemapRequired() const override
Definition: genn_cuda_backend/backend.h:190

CodeGenerator::CUDA::Preferences::manualBlockSizes
KernelBlockSize manualBlockSizes
If block size select method is set to BlockSizeSelect::MANUAL, block size to use for each kernel...
Definition: genn_cuda_backend/backend.h:100

CodeGenerator::CUDA::Backend::genCurrentTrueSpikePull
virtual void genCurrentTrueSpikePull(CodeStream &os, const NeuronGroupInternal &ng) const override
Definition: genn_cuda_backend/backend.h:157

CodeGenerator::CUDA::Backend::getChosenCUDADevice
const cudaDeviceProp & getChosenCUDADevice() const
Definition: genn_cuda_backend/backend.h:195

CodeGenerator::BackendBase::Handler
std::function< void(CodeStream &, Substitutions &)> Handler
Definition: backendBase.h:60