update

author Yangqing Jia <jiayq84@gmail.com>

Wed, 18 Sep 2013 21:55:52 +0000 (14:55 -0700)

committer Yangqing Jia <jiayq84@gmail.com>

Wed, 18 Sep 2013 21:55:52 +0000 (14:55 -0700)
author Yangqing Jia <jiayq84@gmail.com>
Wed, 18 Sep 2013 21:55:52 +0000 (14:55 -0700)
committer Yangqing Jia <jiayq84@gmail.com>
Wed, 18 Sep 2013 21:55:52 +0000 (14:55 -0700)
diff --git a/src/caffeine/layers/inner_product_layer.cu b/src/caffeine/layers/inner_product_layer.cu

index 5afe1469cbdb6dfca260275b65039c5ebefb9814..26a7c4bc93c2cb35f715fe0d2722ef62fe8f9f5c 100644 (file)
--- a/src/caffeine/layers/inner_product_layer.cu
+++ b/src/caffeine/layers/inner_product_layer.cu
@@ -6,6 +6,7 @@
  #include "caffeine/filler.hpp"
  #include "caffeine/layer.hpp"
  #include "caffeine/vision_layers.hpp"
+#include "caffeine/util/blas.hpp"
  
  namespace caffeine {
  
@@ -52,36 +53,12 @@ void InnerProductLayer<Dtype>::Forward_cpu(const vector<Blob<Dtype>*>& bottom,
    const Dtype* bottom_data = bottom[0]->cpu_data();
    Dtype* top_data = (*top)[0]->mutable_cpu_data();
    const Dtype* weight = this->blobs_[0].cpu_data();
-  const Dtype* bias = NULL;
+  caffeine_cpu_gemm<Dtype>(CblasNoTrans, CblasNoTrans, M_, N_, K_, (Dtype)1.,
+      bottom_data, weight, (Dtype)0., top_data);
    if (biasterm_) {
-    bias = this->blobs_[1].cpu_data();
-  }
-  switch(sizeof(Dtype)) {
-  case sizeof(float):
-    // matrix multiply
-    cblas_sgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans, M_, N_, K_,
-        1., (const float*)bottom_data, K_, (const float*)weight, N_, 0.,
-        (float*)top_data, N_);
-    if (bias) {
-      // add bias
-      cblas_sgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans, M_, N_, 1,
-          1., (const float*)bias_multiplier_->cpu_data(), 1,
-          (const float*)bias, N_, 1., (float*)top_data, N_);
-    }
-    break;
-  case sizeof(double):
-    // matrix multiply
-    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans, M_, N_, K_,
-        1., (const double*)bottom_data, K_, (const double*)weight, N_, 0.,
-        (double*)top_data, N_);
-    if (bias) {
-      cblas_sgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans, M_, N_, 1,
-          1., (const float*)bias_multiplier_->cpu_data(), 1,
-          (const float*)bias, N_, 1., (float*)top_data, N_);
-    }
-    break;
-  default:
-    CHECK(false) << "Unknown data type.";
+    caffeine_cpu_gemm<Dtype>(CblasNoTrans, CblasNoTrans, M_, N_, 1, (Dtype)1.,
+        (Dtype*)bias_multiplier_->cpu_data(), this->blobs_[1].cpu_data(),
+        (Dtype)1., top_data);
    }
  }
  
diff --git a/src/caffeine/test/test_util_blas.cpp b/src/caffeine/test/test_util_blas.cpp

index 000311d9af63491d5900e54126b88e523962e538..219967fe06d9a46f7c898215503e7eb05345cfee 100644 (file)
--- a/src/caffeine/test/test_util_blas.cpp
+++ b/src/caffeine/test/test_util_blas.cpp
@@ -31,12 +31,12 @@ TYPED_TEST(GemmTest, TestGemm) {
  
    if (sizeof(TypeParam) == 4 || CAFFEINE_TEST_CUDA_PROP.major >= 2) {
      //[1,2,3; 4 5 6] * [1,2,3,4; 5,6,7,8; 9,10,11,12];
-    decaf_cpu_gemm<TypeParam>(CblasNoTrans, CblasNoTrans, 2, 4, 3, 1.,
+    caffeine_cpu_gemm<TypeParam>(CblasNoTrans, CblasNoTrans, 2, 4, 3, 1.,
          A.cpu_data(), B.cpu_data(), 0., C.mutable_cpu_data());
      for (int i = 0; i < 8; ++i) {
        EXPECT_EQ(C.cpu_data()[i], result[i]);
      }
-    decaf_gpu_gemm<TypeParam>(CblasNoTrans, CblasNoTrans, 2, 4, 3, 1.,
+    caffeine_gpu_gemm<TypeParam>(CblasNoTrans, CblasNoTrans, 2, 4, 3, 1.,
          A.gpu_data(), B.gpu_data(), 0., C.mutable_gpu_data());
      for (int i = 0; i < 8; ++i) {
        EXPECT_EQ(C.cpu_data()[i], result[i]);
@@ -45,12 +45,12 @@ TYPED_TEST(GemmTest, TestGemm) {
      // Test when we have a transposed A
      A.Reshape(1,1,3,2);
      memcpy(A.mutable_cpu_data(), A_reshape_data, 6 * sizeof(TypeParam));
-    decaf_cpu_gemm<TypeParam>(CblasTrans, CblasNoTrans, 2, 4, 3, 1.,
+    caffeine_cpu_gemm<TypeParam>(CblasTrans, CblasNoTrans, 2, 4, 3, 1.,
          A.cpu_data(), B.cpu_data(), 0., C.mutable_cpu_data());
      for (int i = 0; i < 8; ++i) {
        EXPECT_EQ(C.cpu_data()[i], result[i]);
      }
-    decaf_gpu_gemm<TypeParam>(CblasTrans, CblasNoTrans, 2, 4, 3, 1.,
+    caffeine_gpu_gemm<TypeParam>(CblasTrans, CblasNoTrans, 2, 4, 3, 1.,
          A.gpu_data(), B.gpu_data(), 0., C.mutable_gpu_data());
      for (int i = 0; i < 8; ++i) {
        EXPECT_EQ(C.cpu_data()[i], result[i]);
@@ -59,12 +59,12 @@ TYPED_TEST(GemmTest, TestGemm) {
      // Test when we have a transposed A and a transposed B too
      B.Reshape(1,1,4,3);
      memcpy(B.mutable_cpu_data(), B_reshape_data, 12 * sizeof(TypeParam));
-    decaf_cpu_gemm<TypeParam>(CblasTrans, CblasTrans, 2, 4, 3, 1.,
+    caffeine_cpu_gemm<TypeParam>(CblasTrans, CblasTrans, 2, 4, 3, 1.,
          A.cpu_data(), B.cpu_data(), 0., C.mutable_cpu_data());
      for (int i = 0; i < 8; ++i) {
        EXPECT_EQ(C.cpu_data()[i], result[i]);
      }
-    decaf_gpu_gemm<TypeParam>(CblasTrans, CblasTrans, 2, 4, 3, 1.,
+    caffeine_gpu_gemm<TypeParam>(CblasTrans, CblasTrans, 2, 4, 3, 1.,
          A.gpu_data(), B.gpu_data(), 0., C.mutable_gpu_data());
      for (int i = 0; i < 8; ++i) {
        EXPECT_EQ(C.cpu_data()[i], result[i]);
@@ -73,12 +73,12 @@ TYPED_TEST(GemmTest, TestGemm) {
      // Test when we have a transposed B
      A.Reshape(1,1,2,3);
      memcpy(A.mutable_cpu_data(), data, 6 * sizeof(TypeParam));
-    decaf_cpu_gemm<TypeParam>(CblasNoTrans, CblasTrans, 2, 4, 3, 1.,
+    caffeine_cpu_gemm<TypeParam>(CblasNoTrans, CblasTrans, 2, 4, 3, 1.,
          A.cpu_data(), B.cpu_data(), 0., C.mutable_cpu_data());
      for (int i = 0; i < 8; ++i) {
        EXPECT_EQ(C.cpu_data()[i], result[i]);
      }
-    decaf_gpu_gemm<TypeParam>(CblasNoTrans, CblasTrans, 2, 4, 3, 1.,
+    caffeine_gpu_gemm<TypeParam>(CblasNoTrans, CblasTrans, 2, 4, 3, 1.,
          A.gpu_data(), B.gpu_data(), 0., C.mutable_gpu_data());
      for (int i = 0; i < 8; ++i) {
        EXPECT_EQ(C.cpu_data()[i], result[i]);
@@ -100,12 +100,12 @@ TYPED_TEST(GemmTest, TestGemv) {
    memcpy(x.mutable_cpu_data(), data, 3 * sizeof(TypeParam));
  
    if (sizeof(TypeParam) == 4 || CAFFEINE_TEST_CUDA_PROP.major >= 2) {
-    decaf_cpu_gemv<TypeParam>(CblasNoTrans, 2, 3, 1., A.cpu_data(),
+    caffeine_cpu_gemv<TypeParam>(CblasNoTrans, 2, 3, 1., A.cpu_data(),
          x.cpu_data(), 0., y.mutable_cpu_data());
      for (int i = 0; i < 2; ++i) {
        EXPECT_EQ(y.cpu_data()[i], result_2[i]);
      }
-    decaf_gpu_gemv<TypeParam>(CblasNoTrans, 2, 3, 1., A.gpu_data(),
+    caffeine_gpu_gemv<TypeParam>(CblasNoTrans, 2, 3, 1., A.gpu_data(),
          x.gpu_data(), 0., y.mutable_gpu_data());
      for (int i = 0; i < 2; ++i) {
        EXPECT_EQ(y.cpu_data()[i], result_2[i]);
@@ -113,12 +113,12 @@ TYPED_TEST(GemmTest, TestGemv) {
  
      // Test transpose case
      memcpy(y.mutable_cpu_data(), data, 2 * sizeof(TypeParam));
-    decaf_cpu_gemv<TypeParam>(CblasTrans, 2, 3, 1., A.cpu_data(),
+    caffeine_cpu_gemv<TypeParam>(CblasTrans, 2, 3, 1., A.cpu_data(),
          y.cpu_data(), 0., x.mutable_cpu_data());
      for (int i = 0; i < 3; ++i) {
        EXPECT_EQ(x.cpu_data()[i], result_3[i]);
      }
-    decaf_gpu_gemv<TypeParam>(CblasTrans, 2, 3, 1., A.gpu_data(),
+    caffeine_gpu_gemv<TypeParam>(CblasTrans, 2, 3, 1., A.gpu_data(),
          y.gpu_data(), 0., x.mutable_gpu_data());
      for (int i = 0; i < 3; ++i) {
        EXPECT_EQ(x.cpu_data()[i], result_3[i]);
diff --git a/src/caffeine/util/blas.cpp b/src/caffeine/util/blas.cpp

index a1236322144460154c470eb7595c853a5e197637..e03bac25c4be5fcf699cbe05c5f00976219413cf 100644 (file)
--- a/src/caffeine/util/blas.cpp
+++ b/src/caffeine/util/blas.cpp
@@ -6,7 +6,7 @@
  namespace caffeine {
  
  template<>
-void decaf_cpu_gemm<float>(const CBLAS_TRANSPOSE TransA,
+void caffeine_cpu_gemm<float>(const CBLAS_TRANSPOSE TransA,
      const CBLAS_TRANSPOSE TransB, const int M, const int N, const int K,
      const float alpha, const float* A, const float* B, const float beta,
      float* C) {
@@ -17,7 +17,7 @@ void decaf_cpu_gemm<float>(const CBLAS_TRANSPOSE TransA,
  }
  
  template<>
-void decaf_cpu_gemm<double>(const CBLAS_TRANSPOSE TransA,
+void caffeine_cpu_gemm<double>(const CBLAS_TRANSPOSE TransA,
      const CBLAS_TRANSPOSE TransB, const int M, const int N, const int K,
      const double alpha, const double* A, const double* B, const double beta,
      double* C) {
@@ -28,7 +28,7 @@ void decaf_cpu_gemm<double>(const CBLAS_TRANSPOSE TransA,
  }
  
  template <>
-void decaf_gpu_gemm<float>(const CBLAS_TRANSPOSE TransA,
+void caffeine_gpu_gemm<float>(const CBLAS_TRANSPOSE TransA,
      const CBLAS_TRANSPOSE TransB, const int M, const int N, const int K,
      const float alpha, const float* A, const float* B, const float beta,
      float* C) {
@@ -44,7 +44,7 @@ void decaf_gpu_gemm<float>(const CBLAS_TRANSPOSE TransA,
  }
  
  template <>
-void decaf_gpu_gemm<double>(const CBLAS_TRANSPOSE TransA,
+void caffeine_gpu_gemm<double>(const CBLAS_TRANSPOSE TransA,
      const CBLAS_TRANSPOSE TransB, const int M, const int N, const int K,
      const double alpha, const double* A, const double* B, const double beta,
      double* C) {
@@ -60,21 +60,21 @@ void decaf_gpu_gemm<double>(const CBLAS_TRANSPOSE TransA,
  }
  
  template <>
-void decaf_cpu_gemv<float>(const CBLAS_TRANSPOSE TransA, const int M,
+void caffeine_cpu_gemv<float>(const CBLAS_TRANSPOSE TransA, const int M,
      const int N, const float alpha, const float* A, const float* x,
      const float beta, float* y) {
    cblas_sgemv(CblasRowMajor, TransA, M, N, alpha, A, N, x, 1, beta, y, 1);
  }
  
  template <>
-void decaf_cpu_gemv<double>(const CBLAS_TRANSPOSE TransA, const int M,
+void caffeine_cpu_gemv<double>(const CBLAS_TRANSPOSE TransA, const int M,
      const int N, const double alpha, const double* A, const double* x,
      const double beta, double* y) {
    cblas_dgemv(CblasRowMajor, TransA, M, N, alpha, A, N, x, 1, beta, y, 1);
  }
  
  template <>
-void decaf_gpu_gemv<float>(const CBLAS_TRANSPOSE TransA, const int M,
+void caffeine_gpu_gemv<float>(const CBLAS_TRANSPOSE TransA, const int M,
      const int N, const float alpha, const float* A, const float* x,
      const float beta, float* y) {
    cublasOperation_t cuTransA =
@@ -84,7 +84,7 @@ void decaf_gpu_gemv<float>(const CBLAS_TRANSPOSE TransA, const int M,
  }
  
  template <>
-void decaf_gpu_gemv<double>(const CBLAS_TRANSPOSE TransA, const int M,
+void caffeine_gpu_gemv<double>(const CBLAS_TRANSPOSE TransA, const int M,
      const int N, const double alpha, const double* A, const double* x,
      const double beta, double* y) {
    cublasOperation_t cuTransA =
diff --git a/src/caffeine/util/blas.hpp b/src/caffeine/util/blas.hpp

index b1f4e3d60195ef287598e070c42ac9128bfd0a59..00eeea4686b0ba0a0f4955c24730450c5ea18b08 100644 (file)
--- a/src/caffeine/util/blas.hpp
+++ b/src/caffeine/util/blas.hpp
@@ -9,7 +9,7 @@ namespace caffeine {
  // Decaf gemm provides a simpler interface to the gemm functions, with the
  // limitation that the data has to be contiguous in memory.
  template <typename Dtype>
-inline void decaf_cpu_gemm(const CBLAS_TRANSPOSE TransA,
+void caffeine_cpu_gemm(const CBLAS_TRANSPOSE TransA,
      const CBLAS_TRANSPOSE TransB, const int M, const int N, const int K,
      const Dtype alpha, const Dtype* A, const Dtype* B, const Dtype beta,
      Dtype* C);
@@ -18,18 +18,18 @@ inline void decaf_cpu_gemm(const CBLAS_TRANSPOSE TransA,
  // gemm function - following the c convention and calling the fortran-order
  // gpu code under the hood.
  template <typename Dtype>
-void decaf_gpu_gemm(const CBLAS_TRANSPOSE TransA,
+void caffeine_gpu_gemm(const CBLAS_TRANSPOSE TransA,
      const CBLAS_TRANSPOSE TransB, const int M, const int N, const int K,
      const Dtype alpha, const Dtype* A, const Dtype* B, const Dtype beta,
      Dtype* C);
  
  template <typename Dtype>
-void decaf_cpu_gemv(const CBLAS_TRANSPOSE TransA, const int M, const int N,
+void caffeine_cpu_gemv(const CBLAS_TRANSPOSE TransA, const int M, const int N,
      const Dtype alpha, const Dtype* A, const Dtype* x, const Dtype beta,
      Dtype* y);
  
  template <typename Dtype>
-void decaf_gpu_gemv(const CBLAS_TRANSPOSE TransA, const int M, const int N,
+void caffeine_gpu_gemv(const CBLAS_TRANSPOSE TransA, const int M, const int N,
      const Dtype alpha, const Dtype* A, const Dtype* x, const Dtype beta,
      Dtype* y);
author	Yangqing Jia <jiayq84@gmail.com>
	Wed, 18 Sep 2013 21:55:52 +0000 (14:55 -0700)
committer	Yangqing Jia <jiayq84@gmail.com>
	Wed, 18 Sep 2013 21:55:52 +0000 (14:55 -0700)
src/caffeine/layers/inner_product_layer.cu		patch \| blob \| history
src/caffeine/test/test_util_blas.cpp		patch \| blob \| history
src/caffeine/util/blas.cpp		patch \| blob \| history
src/caffeine/util/blas.hpp		patch \| blob \| history