Add OpenCL video kernels for median and sobel img processing functions. They are...
[processor-sdk/gst-plugin-dsp66.git] / src / kernels / oclconv / oclconv.cpp
1 /******************************************************************************
2  * Copyright (c) 2013-2014, Texas Instruments Incorporated - http://www.ti.com/
3  *   All rights reserved.
4  *
5  *   Redistribution and use in source and binary forms, with or without
6  *   modification, are permitted provided that the following conditions are met:
7  *       * Redistributions of source code must retain the above copyright
8  *         notice, this list of conditions and the following disclaimer.
9  *       * Redistributions in binary form must reproduce the above copyright
10  *         notice, this list of conditions and the following disclaimer in the
11  *         documentation and/or other materials provided with the distribution.
12  *       * Neither the name of Texas Instruments Incorporated nor the
13  *         names of its contributors may be used to endorse or promote products
14  *         derived from this software without specific prior written permission.
15  *
16  *   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
17  *   AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
18  *   IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
19  *   ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER OR CONTRIBUTORS BE
20  *   LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
21  *   CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
22  *   SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
23  *   INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
24  *   CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
25  *   ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF
26  *   THE POSSIBILITY OF SUCH DAMAGE.
27  *****************************************************************************/
28 #define __CL_ENABLE_EXCEPTIONS
29 #include <CL/cl.hpp>
30 #include <iostream>
31 #include <fstream>
32 #include <cstdlib>
33 #include "ocl_util.h"
34 #include "conv.dsp_h"
36 //#define VERBOSE
37 using namespace cl;
38 using namespace std;
40 static const int NumElements = 1920 * 1200; /* Maximum resolution */
42 static cl_uchar src  [NumElements];
43 static cl_uchar dst  [NumElements];
45 static int oclconv_imgproc(char *kernelName, unsigned char *data_in, unsigned char *data_out, int width, int height, int sstride, int dstride)
46 {
47    cl_int err     = CL_SUCCESS;
48    int  bufsize = sizeof(src);
49 #ifdef VERBOSE
50    ofstream logfile;
51    logfile.open ("/home/root/oclconv_log.txt", ios::out | ios::app); 
52    logfile << "Entered oclconv_test, width=" << width << " height=" << height << " dstride=" << dstride << " sstride=" << sstride << '\n';
53    logfile.close();
54 #endif
55    unsigned char *ptr_src     = src;
56    unsigned char *ptr_data_in = data_in;
57    for (int y=0; y < height; y++)
58    {
59      memcpy (ptr_src, ptr_data_in, width);
60      ptr_src     += sstride;
61      ptr_data_in += sstride;
62    }
63 #ifdef VERBOSE
64    logfile.open ("/home/root/oclconv_log.txt", ios::out | ios::app); 
65    logfile << "Transfer done, starting openCL specific commands" << '\n';
66    logfile.close();
67 #endif
68    try 
69    {
70      Context context(CL_DEVICE_TYPE_ACCELERATOR);
71      std::vector<Device> devices = context.getInfo<CL_CONTEXT_DEVICES>();
72      devices.resize(1); // resize to 1 since we are only running on 1 DSP
74      Buffer bufA   (context, CL_MEM_READ_ONLY,  bufsize);
75      Buffer bufDst (context, CL_MEM_WRITE_ONLY, bufsize);
77      Program::Binaries binary(1, make_pair(conv_dsp_bin,sizeof(conv_dsp_bin)));
78      Program           program = Program(context, devices, binary);
79      program.build(devices);
80      Kernel kernel(program, kernelName);
81      kernel.setArg(0, bufA);
82      kernel.setArg(1, bufDst);
83      kernel.setArg(2, width);
84      kernel.setArg(3, height);
85      kernel.setArg(4, dstride);
86      kernel.setArg(5, sstride);
88      Event ev1,ev2,ev3,ev4;
90      CommandQueue Q(context, devices[0], CL_QUEUE_PROFILING_ENABLE);
92      Q.enqueueWriteBuffer(bufA, CL_FALSE, 0, bufsize, src, NULL, &ev1);
93      //Q.enqueueNDRangeKernel(kernel, NullRange, NDRange(NumVecElements), 
94      //                       NDRange(WorkGroupSize), NULL, &ev3);
95      Q.enqueueTask (kernel, NULL, &ev3);
96      Q.enqueueReadBuffer (bufDst, CL_TRUE, 0, bufsize, dst, NULL, &ev4);
97    }
98    catch (Error err) 
99    { cerr << "ERROR: " << err.what() << "(" << err.err() << ")" << endl; }
100 #ifdef VERBOSE
101    logfile.open ("/home/root/oclconv_log.txt", ios::out | ios::app); 
102    logfile << "OpenCL done, start transfer to output array!" << '\n';
103    logfile.close();
104 #endif
106    unsigned char *ptr_dst      = dst;
107    unsigned char *ptr_data_out = data_out;
108    for (int y=0; y < height; y++)
109    {
110      memcpy (ptr_data_out, ptr_dst, width);
111      ptr_dst      += dstride;
112      ptr_data_out += dstride;
113    }
115 #ifdef VERBOSE
116    logfile.open ("/home/root/oclconv_log.txt", ios::out | ios::app); 
117    logfile << "Success!" << endl; 
118    logfile.close();
119 #endif
120    return 0;
123 #ifdef __cplusplus
124 extern "C" {
125 #endif
126 int oclconv_kernel(int kernel_type, int filter_size, 
127                    unsigned char *data_in, unsigned char *data_out, 
128                    int width, int height, int dstride, int sstride)
130   int retval = -1;
131   switch(kernel_type)
132   {
133     case 0: /* Median */
134       if(filter_size == 5) { 
135         retval = oclconv_imgproc("Median2x2", data_in, data_out, width, height, sstride, dstride);
136       } else if(filter_size == 9) { 
137         retval = oclconv_imgproc("Median3x3", data_in, data_out, width, height, sstride, dstride);
138       }
139       break;
140     case 1: /* Sobel */
141       if(filter_size == 9) { 
142         retval = oclconv_imgproc("Sobel3x3", data_in, data_out, width, height, sstride, dstride);
143       }
144       break;
145     default:
146       break;
147   }
148   return retval;
150 #ifdef __cplusplus
152 #endif