JASPL/linearconvolution_8tpp_source.html

template <typename T>
LinearConvolution<T>::LinearConvolution( T& convolution_kernel ) {

    static_assert( is_stdlib_container< T >::value, "LinearConvolution can only accept pointers or container-like objects." );
    static_assert( std::is_arithmetic<typename T::value_type>::value, "LinearConvolution must be made with arithmetic type" );

    //    std::string source_directory = SOURCE_DIR;
    //    std::string kernel_name = "/linearconvolve.cl";

    //    kernel_path = source_directory + kernel_name;

    //    LoadCLKernel<typename T::value_type>( "LinearConvolve" );
    std::string kernel_str = R"END(
         __kernel void LinearConvolve( __global TYPE* input, __constant TYPE* filter_kernel, __global TYPE* output, const uint signal_size, const uint kernel_size )
         {

             int half_k_size = (signal_size%2 == 0)?( kernel_size/2 ):( (kernel_size - 1)/2 );
             int signal_max_index = signal_size - 1;

             int i = get_global_id(0);

             TYPE conv_elem = 0.0;

             int k_max = ( ( i + half_k_size ) > signal_max_index )?( signal_max_index + half_k_size - i ):(kernel_size);
             int k_min = ( ( i - half_k_size ) < 0 )?( half_k_size - i ):(0);

             for ( int j = k_min ; j < k_max ; j++ ) {

                 conv_elem += input[ i + j - half_k_size ]*filter_kernel[ j ];

             }

             //Left side mirroring
             for ( int j = 0 ; j < k_min ; j++ ) {

                 conv_elem += input[ -i - j + half_k_size ]*filter_kernel[ j ];
             }

             //Right side mirroring
             for ( int j = k_max ; j < kernel_size ; j++ ) {

                 conv_elem += input[ 2*signal_max_index - i - j + half_k_size ]*filter_kernel[ j ];

             }

             output[i] = conv_elem;

         }

    )END";

    std::string kernel_name = "LinearConvolve";

    LoadCLKernel<typename T::value_type>( kernel_str, kernel_name );

    uint kernel_size = convolution_kernel.size();
    size_t kernel_bytes = kernel_size*sizeof( typename T::value_type );
    auto kernel_ptr = convolution_kernel.data();

    kernel_buff = cl::Buffer ( context, CL_MEM_READ_ONLY, kernel_bytes );
    command_queue.enqueueWriteBuffer( kernel_buff, CL_TRUE, 0, kernel_bytes, kernel_ptr );

    cl_int err;
    err = kernel.setArg(1, kernel_buff);
    OCL_DEBUG( err );
    err = kernel.setArg(4, kernel_size);
    OCL_DEBUG( err );
}

template <typename T>
LinearConvolution<T>::LinearConvolution( T* convolution_kernel ) {

    static_assert( std::is_arithmetic<T>::value, "LinearConvolution must be made with arithmetic pointer type" );
    std::string source_directory = SOURCE_DIR;
    std::string kernel_name = "/linearconvolve.cl";

    kernel_path = source_directory + kernel_name;

    LoadCLKernel<T>( "LinearConvolve" );

    uint kernel_size = convolution_kernel.size();
    size_t kernel_bytes = kernel_size*sizeof( T );
    auto kernel_ptr = convolution_kernel.data();

    kernel_buff = cl::Buffer ( context, CL_MEM_READ_ONLY, kernel_bytes );
    command_queue.enqueueWriteBuffer( kernel_buff, CL_TRUE, 0, kernel_bytes, kernel_ptr );

    cl_int err;
    err = kernel.setArg(1, kernel_buff);
    OCL_DEBUG( err );
    err = kernel.setArg(3, kernel_size);
    OCL_DEBUG( err );
}

template <typename T>
LinearConvolution<T>::~LinearConvolution() {}

template <typename T>
void LinearConvolution<T>::Trigger() {

    cl_int err;
    err = command_queue.enqueueNDRangeKernel( kernel,cl::NullRange, cl::NDRange( signal_size ) );
    OCL_DEBUG( err );
}

template <typename T>
void LinearConvolution<T>::SetSignal( cl::Buffer& signal_buff, uint sig_size ) {

    signal_size = sig_size;

    cl_int* err_ptr = NULL;
    scratch_buff = cl::Buffer ( context, CL_MEM_READ_WRITE, sig_size*sizeof(typename T::value_type), err_ptr );
    OCL_DEBUG( err_ptr );

    cl_int err = kernel.setArg(2, scratch_buff);
    OCL_DEBUG( err );

    err = kernel.setArg(0, signal_buff);
    err = kernel.setArg(3, sig_size);
    OCL_DEBUG( err );
}

template <typename T>
cl::Buffer& LinearConvolution<T>::ProcessedSignal() {
    return scratch_buff;
}

template <typename T>
size_t LinearConvolution<T>::ProcessedSignalBytes() {
    return signal_size*sizeof( typename T::value_type );
}

template <typename T>
size_t LinearConvolution<T>::ProcessedSignalSize() {
    return signal_size;
}

template <typename T>
bool LinearConvolution<T>::NeedsToReknew() {
    return true;
}