a734ebabec5b2d87c6142ccf2e368f68c3098b94
[ep-processor-libraries/dsplib.git] / ti / dsplib / src / DSPF_sp_fircirc / c66 / DSPF_sp_fircirc.c
1 /* ======================================================================= */
2 /* DSPF_sp_fircirc.c -- Circular FIR Filter                                */
3 /*              Optimized C Implementation (w/ Intrinsics)                 */
4 /*                                                                         */
5 /* Rev 0.0.1                                                               */
6 /*                                                                         */
7 /* Copyright (C) 2011 Texas Instruments Incorporated - http://www.ti.com/  */ 
8 /*                                                                         */
9 /*                                                                         */
10 /*  Redistribution and use in source and binary forms, with or without     */
11 /*  modification, are permitted provided that the following conditions     */
12 /*  are met:                                                               */
13 /*                                                                         */
14 /*    Redistributions of source code must retain the above copyright       */
15 /*    notice, this list of conditions and the following disclaimer.        */
16 /*                                                                         */
17 /*    Redistributions in binary form must reproduce the above copyright    */
18 /*    notice, this list of conditions and the following disclaimer in the  */
19 /*    documentation and/or other materials provided with the               */
20 /*    distribution.                                                        */
21 /*                                                                         */
22 /*    Neither the name of Texas Instruments Incorporated nor the names of  */
23 /*    its contributors may be used to endorse or promote products derived  */
24 /*    from this software without specific prior written permission.        */
25 /*                                                                         */
26 /*  THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS    */
27 /*  "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT      */
28 /*  LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR  */
29 /*  A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT   */
30 /*  OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,  */
31 /*  SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT       */
32 /*  LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,  */
33 /*  DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY  */
34 /*  THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT    */
35 /*  (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE  */
36 /*  OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.   */
37 /*                                                                         */
38 /* ======================================================================= */
40 #pragma CODE_SECTION(DSPF_sp_fircirc, ".text:optimized");
42 #include "DSPF_sp_fircirc.h"
43 #ifdef __TI_COMPILER_VERSION__
44 #include "c6x.h"
45 #endif
47 #ifdef _LITTLE_ENDIAN
48 void DSPF_sp_fircirc(const float *x, float *h, float *restrict y, 
49                      int index, int csize, int nh, int ny)
50 {
51     int    i, j;
52     /* Circular Buffer block size = ((2^(csize + 1)) / 4) floating point numbers */
53     int    mod = (1 << (csize - 1)) - 1; 
54     float  *x_ptr = (float*)&x[index];
55     __float2_t x_10, x_21, x_32, x_43, x_54, h_10;
56     __float2_t sum1, sum2, sum3, sum4;
58     _nassert(nh >= 2);
59     _nassert(nh % 2 == 0);
60     _nassert(ny >= 4);
61     _nassert(ny % 4 == 0);
62     _nassert((int) x % 8 == 0);
63     _nassert((int) y % 8 == 0);
64     _nassert((int) h % 8 == 0);
66     #pragma MUST_ITERATE(1,,)
67     for(j = 0; j < ny; j+=4)
68     {
69         sum1 = 0;
70         sum2 = 0;
71         sum3 = 0;
72         sum4 = 0;
74         x_10 = _amem8_f2_const(&x_ptr[(i) & (mod)]);
75         x_32 = _amem8_f2_const(&x_ptr[(i+2) & (mod)]);
76         x_21 = _ftof2(_lof2(x_32), _hif2(x_10));
78         /* note: h coeffs given in reverse order: { h[nh-1], h[nh-2], ..., h[0] } */
79         #pragma MUST_ITERATE(1,,)
80         for(i = 0; i < nh; i+=2) {
81             h_10 = _amem8_f2_const(&h[i]);
82             x_54 = _amem8_f2_const(&x_ptr[(i+4) & (mod)]);
83             x_43 = _ftof2(_lof2(x_54), _hif2(x_32));
85             sum1 = _daddsp(sum1, _dmpysp(x_10, h_10));
86             sum2 = _daddsp(sum2, _dmpysp(x_21, h_10));
87             sum3 = _daddsp(sum3, _dmpysp(x_32, h_10));
88             sum4 = _daddsp(sum4, _dmpysp(x_43, h_10));
90             x_10 = x_32;
91             x_21 = x_43;
92             x_32 = x_54;
93         }
94         _amem8_f2(&y[j])   = _ftof2(_hif2(sum2)+_lof2(sum2), _hif2(sum1)+_lof2(sum1));
95         _amem8_f2(&y[j+2]) = _ftof2(_hif2(sum4)+_lof2(sum4), _hif2(sum3)+_lof2(sum3));
96     }
97 }
98 #else
99 void DSPF_sp_fircirc(const float *x, float *h, float *restrict y, 
100                      int index, int csize, int nh, int ny)
102     int    i, j;
103     /* Circular Buffer block size = ((2^(csize + 1)) / 4) floating point numbers */
104     int    mod = (1 << (csize - 1)) - 1; 
105     float  *x_ptr = (float*)&x[index];
106     __float2_t x_01, x_12, x_23, x_34, x_45, h_01;
107     __float2_t sum1, sum2, sum3, sum4;
109     _nassert(nh >= 2);
110     _nassert(nh % 2 == 0);
111     _nassert(ny >= 4);
112     _nassert(ny % 4 == 0);
113     _nassert((int) x % 8 == 0);
114     _nassert((int) y % 8 == 0);
115     _nassert((int) h % 8 == 0);
117     #pragma MUST_ITERATE(1,,)
118     for(j = 0; j < ny; j+=4)
119     {
120         sum1 = 0;
121         sum2 = 0;
122         sum3 = 0;
123         sum4 = 0;
125         x_01 = _amem8_f2_const(&x_ptr[(i) & (mod)]);
126         x_23 = _amem8_f2_const(&x_ptr[(i+2) & (mod)]);
127         x_12 = _ftof2(_lof2(x_01), _hif2(x_23));
129         /* note: h coeffs given in reverse order: { h[nh-1], h[nh-2], ..., h[0] } */
130         #pragma MUST_ITERATE(1,,)
131         for(i = 0; i < nh; i+=2) {
132             h_01 = _amem8_f2_const(&h[i]);
133             x_45 = _amem8_f2_const(&x_ptr[(i+4) & (mod)]);
134             x_34 = _ftof2(_lof2(x_23), _hif2(x_45));
136             sum1 = _daddsp(sum1, _dmpysp(x_01, h_01));
137             sum2 = _daddsp(sum2, _dmpysp(x_12, h_01));
138             sum3 = _daddsp(sum3, _dmpysp(x_23, h_01));
139             sum4 = _daddsp(sum4, _dmpysp(x_34, h_01));
141             x_01 = x_23;
142             x_12 = x_34;
143             x_23 = x_45;
144         }
145         _amem8_f2(&y[j])   = _ftof2(_hif2(sum1)+_lof2(sum1), _hif2(sum2)+_lof2(sum2));
146         _amem8_f2(&y[j+2]) = _ftof2(_hif2(sum3)+_lof2(sum3), _hif2(sum4)+_lof2(sum4));
147     }
149 #endif
150 /* ======================================================================= */
151 /*  End of file:  DSPF_sp_fircirc.c                                        */
152 /* ----------------------------------------------------------------------- */
153 /*            Copyright (c) 2011 Texas Instruments, Incorporated.          */
154 /*                           All Rights Reserved.                          */
155 /* ======================================================================= */