]> Gitweb @ Texas Instruments - Open Source Git Repositories - git.TI.com/gitweb - glsdk/gst-plugin-ducati.git/blobdiff - src/gstducatividdec.c
ducatividdec: do not reorder frames when reordering info is absent
[glsdk/gst-plugin-ducati.git] / src / gstducatividdec.c
index 909abe78739764f357dc95d3ba4ac2672d446723..5203b9a00b08d14ea60ead101343efdb532af184 100644 (file)
@@ -1,3 +1,4 @@
+#define USE_DTS_PTS_CODE
 /*
  * GStreamer
  * Copyright (c) 2010, Texas Instruments Incorporated
@@ -22,6 +23,7 @@
 #endif
 
 #include "gstducatividdec.h"
+#include "gstducatibufferpriv.h"
 
 GST_BOILERPLATE (GstDucatiVidDec, gst_ducati_viddec, GstElement,
     GST_TYPE_ELEMENT);
@@ -36,6 +38,7 @@ enum
 {
   PROP_0,
   PROP_VERSION,
+  PROP_MAX_REORDER_FRAMES,
 };
 
 /* helper functions */
@@ -82,20 +85,34 @@ engine_close (GstDucatiVidDec * self)
     dce_free (self->outArgs);
     self->outArgs = NULL;
   }
+
+  if (self->device) {
+    dce_deinit (self->device);
+    self->device = NULL;
+  }
 }
 
 static gboolean
 engine_open (GstDucatiVidDec * self)
 {
   gboolean ret;
+  int ec;
 
   if (G_UNLIKELY (self->engine)) {
     return TRUE;
   }
 
+  if (self->device == NULL) {
+    self->device = dce_init ();
+    if (self->device == NULL) {
+      GST_ERROR_OBJECT (self, "dce_init() failed");
+      return FALSE;
+    }
+  }
+
   GST_DEBUG_OBJECT (self, "opening engine");
 
-  self->engine = Engine_open ((String) "ivahd_vidsvr", NULL, NULL);
+  self->engine = Engine_open ((String) "ivahd_vidsvr", NULL, &ec);
   if (G_UNLIKELY (!self->engine)) {
     GST_ERROR_OBJECT (self, "could not create engine");
     return FALSE;
@@ -113,7 +130,7 @@ static void
 codec_delete (GstDucatiVidDec * self)
 {
   if (self->pool) {
-    gst_ducati_bufferpool_destroy (self->pool);
+    gst_drm_buffer_pool_destroy (self->pool);
     self->pool = NULL;
   }
 
@@ -122,9 +139,9 @@ codec_delete (GstDucatiVidDec * self)
     self->codec = NULL;
   }
 
-  if (self->input) {
-    MemMgr_Free (self->input);
-    self->input = NULL;
+  if (self->input_bo) {
+    omap_bo_del (self->input_bo);
+    self->input_bo = NULL;
   }
 }
 
@@ -168,109 +185,100 @@ codec_create (GstDucatiVidDec * self)
   self->first_out_buffer = TRUE;
 
   /* allocate input buffer and initialize inBufs: */
+  /* FIXME:  needed size here has nothing to do with width * height */
+  self->input_bo = omap_bo_new (self->device,
+      self->width * self->height, OMAP_BO_WC);
+  self->input = omap_bo_map (self->input_bo);
   self->inBufs->numBufs = 1;
-  self->input = gst_ducati_alloc_1d (self->width * self->height);
-  self->inBufs->descs[0].buf = (XDAS_Int8 *) TilerMem_VirtToPhys (self->input);
-  self->inBufs->descs[0].memType = XDM_MEMTYPE_RAW;
+  self->inBufs->descs[0].buf = (XDAS_Int8 *) omap_bo_handle (self->input_bo);
 
   return TRUE;
 }
 
 static inline GstBuffer *
-codec_bufferpool_get (GstDucatiVidDec * self, GstBuffer * buf)
+codec_buffer_pool_get (GstDucatiVidDec * self, GstBuffer * buf)
 {
   if (G_UNLIKELY (!self->pool)) {
-    guint size;
-
-    size = gst_video_format_get_size (GST_VIDEO_FORMAT_NV12,
+    guint size = gst_video_format_get_size (GST_VIDEO_FORMAT_NV12,
         self->padded_width, self->padded_height);
+
     GST_DEBUG_OBJECT (self, "creating bufferpool");
-    self->pool = gst_ducati_bufferpool_new (GST_ELEMENT (self),
-        GST_PAD_CAPS (self->srcpad), size);
+    self->pool = gst_drm_buffer_pool_new (GST_ELEMENT (self),
+        dce_get_fd (), GST_PAD_CAPS (self->srcpad), size);
+  }
+  return GST_BUFFER (gst_drm_buffer_pool_get (self->pool, FALSE));
+}
+
+static GstDucatiBufferPriv *
+get_buffer_priv (GstDucatiVidDec * self, GstBuffer * buf)
+{
+  GstDucatiBufferPriv *priv = gst_ducati_buffer_priv_get (buf);
+  if (!priv) {
+    GstVideoFormat format = GST_VIDEO_FORMAT_NV12;
+    GstDmaBuf *dmabuf = gst_buffer_get_dma_buf (buf);
+
+    /* if it isn't a dmabuf buffer that we can import, then there
+     * is nothing we can do with it:
+     */
+    if (!dmabuf) {
+      GST_DEBUG_OBJECT (self, "not importing non dmabuf buffer");
+      return NULL;
+    }
+
+    priv = gst_ducati_buffer_priv_new ();
+
+    priv->bo = omap_bo_from_dmabuf (self->device, gst_dma_buf_get_fd (dmabuf));
+
+    priv->uv_offset = gst_video_format_get_component_offset (format,
+        1, self->stride, self->padded_height);
+    priv->size = gst_video_format_get_size (format,
+        self->stride, self->padded_height);
+
+    gst_ducati_buffer_priv_set (buf, priv);
+    gst_mini_object_unref (GST_MINI_OBJECT (priv));
   }
-  return GST_BUFFER (gst_ducati_bufferpool_get (self->pool, buf));
+  return priv;
 }
 
 static XDAS_Int32
 codec_prepare_outbuf (GstDucatiVidDec * self, GstBuffer ** buf,
     gboolean force_internal)
 {
-  XDAS_Int16 y_type, uv_type;
-  guint8 *y_vaddr, *uv_vaddr;
-  SSPtr y_paddr, uv_paddr;
+  GstDucatiBufferPriv *priv = NULL;
 
-  if (force_internal) {
+  if (!force_internal)
+    priv = get_buffer_priv (self, *buf);
+
+  if (!priv) {
     GstBuffer *orig = *buf;
 
     GST_DEBUG_OBJECT (self, "internal bufferpool forced");
-    *buf = codec_bufferpool_get (self, NULL);
+    *buf = codec_buffer_pool_get (self, NULL);
     GST_BUFFER_TIMESTAMP (*buf) = GST_BUFFER_TIMESTAMP (orig);
     GST_BUFFER_DURATION (*buf) = GST_BUFFER_DURATION (orig);
     gst_buffer_unref (orig);
     return codec_prepare_outbuf (self, buf, FALSE);
   }
 
-  y_vaddr = GST_BUFFER_DATA (*buf);
-  uv_vaddr = y_vaddr + self->stride * self->padded_height;
-
-  y_paddr = TilerMem_VirtToPhys (y_vaddr);
-  uv_paddr = TilerMem_VirtToPhys (uv_vaddr);
-
-  y_type = gst_ducati_get_mem_type (y_paddr);
-  uv_type = gst_ducati_get_mem_type (uv_paddr);
-  /* FIXME: workaround for the vc1 codec expecting _RAW when it's actually
-   * _TILEDPAGE... should be removed once the codec is fixed  */
-  if (y_type == XDM_MEMTYPE_TILEDPAGE && self->pageMemType != y_type)
-    y_type = self->pageMemType;
-  if (uv_type == XDM_MEMTYPE_TILEDPAGE && self->pageMemType != uv_type)
-    uv_type = self->pageMemType;
-
-  if (y_type < 0 || uv_type < 0) {
-    GST_DEBUG_OBJECT (self, "non TILER buffer, fallback to bufferpool");
-    *buf = codec_bufferpool_get (self, *buf);
-    return codec_prepare_outbuf (self, buf, FALSE);
-  }
-
-  if (!self->outBufs->numBufs) {
-    /* initialize output buffer type */
-    self->outBufs->numBufs = 2;
-    self->outBufs->descs[0].memType = y_type;
-    self->outBufs->descs[1].memType = uv_type;
-    if (y_type == XDM_MEMTYPE_RAW || y_type == XDM_MEMTYPE_TILEDPAGE) {
-      self->outBufs->descs[0].bufSize.bytes =
-          self->stride * self->padded_height;
-      self->outBufs->descs[1].bufSize.bytes =
-          self->stride * self->padded_height / 2;
-    } else {
-      self->outBufs->descs[0].bufSize.tileMem.width = self->padded_width;
-      self->outBufs->descs[0].bufSize.tileMem.height = self->padded_height;
-      /* note that UV interleaved width is same a Y: */
-      self->outBufs->descs[1].bufSize.tileMem.width = self->padded_width;
-      self->outBufs->descs[1].bufSize.tileMem.height = self->padded_height / 2;
-    }
-  } else {
-    /* verify output buffer type matches what we've already given
-     * to the codec
-     */
-    if ((self->outBufs->descs[0].memType != y_type) ||
-        (self->outBufs->descs[1].memType != uv_type)) {
-      GST_DEBUG_OBJECT (self, "buffer mismatch, fallback to bufferpool");
-      *buf = codec_bufferpool_get (self, *buf);
-      return codec_prepare_outbuf (self, buf, FALSE);
-    }
-  }
-
-  self->outBufs->descs[0].buf = (XDAS_Int8 *) y_paddr;
-  self->outBufs->descs[1].buf = (XDAS_Int8 *) uv_paddr;
+  self->outBufs->numBufs = 2;
+  self->outBufs->descs[0].memType = XDM_MEMTYPE_BO;
+  self->outBufs->descs[0].buf = (XDAS_Int8 *) omap_bo_handle (priv->bo);
+  self->outBufs->descs[0].bufSize.bytes = priv->uv_offset;
+  self->outBufs->descs[1].memType = XDM_MEMTYPE_BO_OFFSET;
+  self->outBufs->descs[1].buf = (XDAS_Int8 *) priv->uv_offset;
+  self->outBufs->descs[1].bufSize.bytes = priv->size - priv->uv_offset;
 
-  return (XDAS_Int32) * buf;    // XXX use lookup table
+  return (XDAS_Int32) * buf;
 }
 
 static GstBuffer *
 codec_get_outbuf (GstDucatiVidDec * self, XDAS_Int32 id)
 {
-  GstBuffer *buf = (GstBuffer *) id;    // XXX use lookup table
+  GstBuffer *buf = (GstBuffer *) id;
+
   if (buf) {
+    g_hash_table_insert (self->passed_in_bufs, buf, buf);
+
     gst_buffer_ref (buf);
   }
   return buf;
@@ -279,10 +287,48 @@ codec_get_outbuf (GstDucatiVidDec * self, XDAS_Int32 id)
 static void
 codec_unlock_outbuf (GstDucatiVidDec * self, XDAS_Int32 id)
 {
-  GstBuffer *buf = (GstBuffer *) id;    // XXX use lookup table
+  GstBuffer *buf = (GstBuffer *) id;
+
   if (buf) {
     GST_DEBUG_OBJECT (self, "free buffer: %d %p", id, buf);
-    gst_buffer_unref (buf);
+    g_hash_table_remove (self->passed_in_bufs, buf);
+  }
+}
+
+static GstFlowReturn
+gst_ducati_viddec_push_earliest (GstDucatiVidDec * self)
+{
+  guint64 earliest_order = G_MAXUINT64;
+  guint earliest_index = 0, i;
+  GstBuffer *buf;
+
+  if (self->backlog_nframes == 0)
+    return GST_FLOW_OK;
+
+  /* work out which frame has the earliest poc */
+  for (i = 0; i < self->backlog_nframes; i++) {
+    guint64 order = GST_BUFFER_OFFSET_END (self->backlog_frames[i]);
+    if (earliest_order == G_MAXUINT64 || order < earliest_order) {
+      earliest_order = order;
+      earliest_index = i;
+    }
+  }
+
+  /* send it, giving away the ref */
+  buf = self->backlog_frames[earliest_index];
+  self->backlog_frames[earliest_index] =
+      self->backlog_frames[--self->backlog_nframes];
+  GST_DEBUG_OBJECT (self, "Actually pushing backlog buffer %" GST_PTR_FORMAT,
+      buf);
+  return gst_pad_push (self->srcpad, buf);
+}
+
+static void
+gst_ducati_viddec_on_flush (GstDucatiVidDec * self, gboolean eos)
+{
+  /* push everything on the backlog, ignoring errors */
+  while (self->backlog_nframes > 0) {
+    gst_ducati_viddec_push_earliest (self);
   }
 }
 
@@ -296,6 +342,9 @@ codec_process (GstDucatiVidDec * self, gboolean send, gboolean flush,
   gint i;
   GstDucatiVidDecClass *klass = GST_DUCATIVIDDEC_GET_CLASS (self);
   GstFlowReturn ret = GST_FLOW_OK;
+  if (flow_ret)
+    /* never leave flow_ret uninitialized */
+    *flow_ret = GST_FLOW_OK;
 
   memset (&self->outArgs->outputID, 0, sizeof (self->outArgs->outputID));
   memset (&self->outArgs->freeBufID, 0, sizeof (self->outArgs->freeBufID));
@@ -308,12 +357,14 @@ codec_process (GstDucatiVidDec * self, gboolean send, gboolean flush,
   if (err) {
     GST_WARNING_OBJECT (self, "err=%d, extendedError=%08x",
         err, self->outArgs->extendedError);
+    gst_ducati_log_extended_error_info (self->outArgs->extendedError);
 
     err = VIDDEC3_control (self->codec, XDM_GETSTATUS,
         self->dynParams, self->status);
-    if (!err) {
+    if (err) {
       GST_WARNING_OBJECT (self, "XDM_GETSTATUS: err=%d, extendedError=%08x",
           err, self->status->extendedError);
+      gst_ducati_log_extended_error_info (self->status->extendedError);
     }
 
     if (flush)
@@ -323,11 +374,17 @@ codec_process (GstDucatiVidDec * self, gboolean send, gboolean flush,
           self->outArgs->extendedError, self->status->extendedError);
   }
 
-  for (i = 0; self->outArgs->outputID[i]; i++) {
+  /* we now let the codec decide */
+  self->dynParams->newFrameFlag = XDAS_FALSE;
+
+  if (err == XDM_EFAIL)
+    goto skip_outbuf_processing;
+
+  for (i = 0; i < IVIDEO2_MAX_IO_BUFFERS && self->outArgs->outputID[i]; i++) {
     gboolean interlaced;
 
+    /* Getting an extra reference for the decoder */
     outbuf = codec_get_outbuf (self, self->outArgs->outputID[i]);
-
     interlaced =
         self->outArgs->decodedBufs.contentType ==
         IVIDEO_PROGRESSIVE ? FALSE : TRUE;
@@ -349,7 +406,7 @@ codec_process (GstDucatiVidDec * self, gboolean send, gboolean flush,
       GST_INFO_OBJECT (self, "changing interlace field in caps");
       gst_caps_set_simple (caps, "interlaced", G_TYPE_BOOLEAN, interlaced,
           NULL);
-      gst_ducati_bufferpool_set_caps (self->pool, caps);
+      gst_drm_buffer_pool_set_caps (self->pool, caps);
       if (!gst_pad_set_caps (self->srcpad, caps)) {
         GST_ERROR_OBJECT (self,
             "downstream didn't want to change interlace mode");
@@ -363,7 +420,6 @@ codec_process (GstDucatiVidDec * self, gboolean send, gboolean flush,
 
     if (G_UNLIKELY (self->send_crop_event) && send) {
       gint crop_width, crop_height;
-      GstDucatiVidDecClass *klass = GST_DUCATIVIDDEC_GET_CLASS (self);
 
       /* send region of interest to sink on first buffer: */
       XDM_Rect *r = &(self->outArgs->displayBufs.bufDesc[0].activeFrameRegion);
@@ -376,9 +432,6 @@ codec_process (GstDucatiVidDec * self, gboolean send, gboolean flush,
       if (crop_height > self->input_height)
         crop_height = self->input_height;
 
-      if (self->interlaced && !strcmp (klass->codec_name, "ivahd_mpeg2vdec"))
-        crop_height = crop_height / 2;
-
       GST_INFO_OBJECT (self, "active frame region %d, %d, %d, %d, crop %dx%d",
           r->topLeft.x, r->topLeft.y, r->bottomRight.x, r->bottomRight.y,
           crop_width, crop_height);
@@ -387,11 +440,17 @@ codec_process (GstDucatiVidDec * self, gboolean send, gboolean flush,
           gst_event_new_crop (r->topLeft.y, r->topLeft.x,
               crop_width, crop_height));
 
+      if (self->crop)
+        gst_video_crop_unref (self->crop);
+
+      self->crop = gst_video_crop_new (r->topLeft.y, r->topLeft.x,
+          crop_width, crop_height);
+
       self->send_crop_event = FALSE;
     }
 
     if (G_UNLIKELY (self->first_out_buffer) && send) {
-      GstDucatiBufferPool *pool;
+      GstDRMBufferPool *pool;
       self->first_out_buffer = FALSE;
 
       /* Destroy the pool so the buffers we used so far are eventually released.
@@ -399,21 +458,18 @@ codec_process (GstDucatiVidDec * self, gboolean send, gboolean flush,
        */
       pool = self->pool;
       self->pool = NULL;
-      gst_ducati_bufferpool_destroy (pool);
+      gst_drm_buffer_pool_destroy (pool);
     }
 
     if (send) {
       GstClockTime ts;
 
-      if (GST_IS_DUCATIBUFFER (outbuf)) {
-        outbuf = gst_ducati_buffer_get (GST_DUCATIBUFFER (outbuf));
-      }
-
       ts = GST_BUFFER_TIMESTAMP (outbuf);
 
       GST_DEBUG_OBJECT (self, "got buffer: %d %p (%" GST_TIME_FORMAT ")",
           i, outbuf, GST_TIME_ARGS (ts));
 
+#ifdef USE_DTS_PTS_CODE
       if (self->ts_may_be_pts) {
         if ((self->last_pts != GST_CLOCK_TIME_NONE) && (self->last_pts > ts)) {
           GST_DEBUG_OBJECT (self, "detected PTS going backwards, "
@@ -421,6 +477,7 @@ codec_process (GstDucatiVidDec * self, gboolean send, gboolean flush,
           self->ts_is_pts = TRUE;
         }
       }
+#endif
 
       self->last_pts = ts;
 
@@ -447,7 +504,10 @@ codec_process (GstDucatiVidDec * self, gboolean send, gboolean flush,
         gst_buffer_set_caps (outbuf, GST_PAD_CAPS (self->srcpad));
       }
 
-      ret = gst_pad_push (self->srcpad, outbuf);
+      if (self->crop)
+        gst_buffer_set_video_crop (outbuf, self->crop);
+
+      ret = klass->push_output (self, outbuf);
       if (flow_ret)
         *flow_ret = ret;
       if (ret != GST_FLOW_OK) {
@@ -456,12 +516,15 @@ codec_process (GstDucatiVidDec * self, gboolean send, gboolean flush,
         send = FALSE;
       }
     } else {
-      GST_DEBUG_OBJECT (self, "free buffer: %d %p", i, outbuf);
+      GST_DEBUG_OBJECT (self, "Buffer not pushed, dropping 'chain' ref: %d %p",
+          i, outbuf);
+
       gst_buffer_unref (outbuf);
     }
   }
 
-  for (i = 0; self->outArgs->freeBufID[i]; i++) {
+skip_outbuf_processing:
+  for (i = 0; i < IVIDEO2_MAX_IO_BUFFERS && self->outArgs->freeBufID[i]; i++) {
     codec_unlock_outbuf (self, self->outArgs->freeBufID[i]);
   }
 
@@ -472,28 +535,35 @@ codec_process (GstDucatiVidDec * self, gboolean send, gboolean flush,
 gboolean
 gst_ducati_viddec_codec_flush (GstDucatiVidDec * self, gboolean eos)
 {
-  gint err;
+  gint err = FALSE;
 
   GST_DEBUG_OBJECT (self, "flush: eos=%d", eos);
 
+  GST_DUCATIVIDDEC_GET_CLASS (self)->on_flush (self, eos);
+
   /* note: flush is synchronized against _chain() to avoid calling
    * the codec from multiple threads
    */
   GST_PAD_STREAM_LOCK (self->sinkpad);
 
+#ifdef USE_DTS_PTS_CODE
   self->dts_ridx = self->dts_widx = 0;
   self->last_dts = self->last_pts = GST_CLOCK_TIME_NONE;
   self->ts_may_be_pts = TRUE;
   self->ts_is_pts = FALSE;
+#endif
   self->wait_keyframe = TRUE;
+  self->in_size = 0;
+  self->needs_flushing = FALSE;
+  self->need_out_buf = TRUE;
 
   if (G_UNLIKELY (self->first_in_buffer)) {
-    return TRUE;
+    goto out;
   }
 
   if (G_UNLIKELY (!self->codec)) {
     GST_WARNING_OBJECT (self, "no codec");
-    return TRUE;
+    goto out;
   }
 
   err = VIDDEC3_control (self->codec, XDM_FLUSH, self->dynParams, self->status);
@@ -503,18 +573,30 @@ gst_ducati_viddec_codec_flush (GstDucatiVidDec * self, gboolean eos)
   }
 
   self->inBufs->descs[0].bufSize.bytes = 0;
+  self->inBufs->numBufs = 0;
   self->inArgs->numBytes = 0;
   self->inArgs->inputID = 0;
+  self->outBufs->numBufs = 0;
 
   do {
     err = codec_process (self, eos, TRUE, NULL);
   } while (err != XDM_EFAIL);
 
+  /* We flushed the decoder, we can now remove the buffer that have never been
+   * unrefed in it */
+  g_hash_table_remove_all (self->passed_in_bufs);
+
   /* reset outArgs in case we're flushing in codec_process trying to do error
    * recovery */
   memset (&self->outArgs->outputID, 0, sizeof (self->outArgs->outputID));
   memset (&self->outArgs->freeBufID, 0, sizeof (self->outArgs->freeBufID));
 
+  self->dynParams->newFrameFlag = XDAS_TRUE;
+
+  /* Reset the push buffer and YUV buffers */
+  self->inBufs->numBufs = 1;
+  self->outBufs->numBufs = 2;
+
   /* on a flush, it is normal (and not an error) for the last _process() call
    * to return an error..
    */
@@ -612,6 +694,7 @@ gst_ducati_viddec_allocate_params (GstDucatiVidDec * self, gint params_sz,
   if (G_UNLIKELY (!self->status)) {
     return FALSE;
   }
+  memset (self->status, 0, status_sz);
   self->status->size = status_sz;
 
   /* allocate inBufs/outBufs: */
@@ -636,6 +719,20 @@ gst_ducati_viddec_allocate_params (GstDucatiVidDec * self, gint params_sz,
 static GstBuffer *
 gst_ducati_viddec_push_input (GstDucatiVidDec * self, GstBuffer * buf)
 {
+  /* If we're about to push a keyframe, then we can flush all the frames
+     we currently have queued. For formats such as H264, this is actually
+     necessary as picture order count is local to each IDR + set of non
+     IDR frames, so will restart at 0 when next IDR frames comes in. For
+     other formats, it is not necessary, but avoids buffering frames that
+     do not need to be. */
+  if (!GST_BUFFER_FLAG_IS_SET (buf, GST_BUFFER_FLAG_DELTA_UNIT)) {
+    GST_DEBUG_OBJECT (self, "Got keyframe, pushing %u frames",
+        self->backlog_nframes);
+    while (self->backlog_nframes > 0) {
+      gst_ducati_viddec_push_earliest (self);
+    }
+  }
+
   if (G_UNLIKELY (self->first_in_buffer) && self->codec_data) {
     push_input (self, GST_BUFFER_DATA (self->codec_data),
         GST_BUFFER_SIZE (self->codec_data));
@@ -648,6 +745,31 @@ gst_ducati_viddec_push_input (GstDucatiVidDec * self, GstBuffer * buf)
   return NULL;
 }
 
+static GstFlowReturn
+gst_ducati_viddec_push_output (GstDucatiVidDec * self, GstBuffer * buf)
+{
+  GstFlowReturn ret = GST_FLOW_OK;
+
+  /* if no reordering info was set, just send the buffer */
+  if (GST_BUFFER_OFFSET_END (buf) == GST_BUFFER_OFFSET_NONE) {
+    GST_DEBUG_OBJECT (self, "No reordering info on that buffer, sending now");
+    return gst_pad_push (self->srcpad, buf);
+  }
+
+  /* add the frame to the list, the array will own the ref */
+  GST_DEBUG_OBJECT (self, "Adding buffer %" GST_PTR_FORMAT " to backlog", buf);
+  self->backlog_frames[self->backlog_nframes++] = buf;
+
+  /* push till we have no more than the max needed, or error */
+  while (self->backlog_nframes > self->backlog_maxframes) {
+    ret = gst_ducati_viddec_push_earliest (self);
+    if (ret != GST_FLOW_OK)
+      break;
+  }
+
+  return ret;
+}
+
 static gint
 gst_ducati_viddec_handle_error (GstDucatiVidDec * self, gint ret,
     gint extended_error, gint status_extended_error)
@@ -663,10 +785,9 @@ gst_ducati_viddec_handle_error (GstDucatiVidDec * self, gint ret,
 /* GstElement vmethod implementations */
 
 static gboolean
-gst_ducati_viddec_sink_setcaps (GstPad * pad, GstCaps * caps)
+gst_ducati_viddec_set_sink_caps (GstDucatiVidDec * self, GstCaps * caps)
 {
   gboolean ret = TRUE;
-  GstDucatiVidDec *self = GST_DUCATIVIDDEC (gst_pad_get_parent (pad));
   GstDucatiVidDecClass *klass = GST_DUCATIVIDDEC_GET_CLASS (self);
   GstStructure *s;
   GstCaps *outcaps = NULL;
@@ -674,8 +795,6 @@ gst_ducati_viddec_sink_setcaps (GstPad * pad, GstCaps * caps)
   gint par_width, par_height;
   gboolean par_present;
 
-  GST_INFO_OBJECT (self, "setcaps (sink): %" GST_PTR_FORMAT, caps);
-
   s = gst_caps_get_structure (caps, 0);
   if (!klass->parse_caps (self, s)) {
     GST_WARNING_OBJECT (self, "missing required fields");
@@ -756,9 +875,27 @@ gst_ducati_viddec_sink_setcaps (GstPad * pad, GstCaps * caps)
 
   GST_INFO_OBJECT (self, "set caps done %d, %" GST_PTR_FORMAT, ret, outcaps);
 
+  /* default to no reordering */
+  self->backlog_maxframes = 0;
+
 out:
   if (outcaps)
     gst_caps_unref (outcaps);
+
+  return ret;
+}
+
+static gboolean
+gst_ducati_viddec_sink_setcaps (GstPad * pad, GstCaps * caps)
+{
+  gboolean ret = TRUE;
+  GstDucatiVidDec *self = GST_DUCATIVIDDEC (gst_pad_get_parent (pad));
+  GstDucatiVidDecClass *klass = GST_DUCATIVIDDEC_GET_CLASS (self);
+
+  GST_INFO_OBJECT (self, "setcaps (sink): %" GST_PTR_FORMAT, caps);
+
+  ret = klass->set_sink_caps (self, caps);
+
   gst_object_unref (self);
 
   return ret;
@@ -884,7 +1021,7 @@ gst_ducati_viddec_do_qos (GstDucatiVidDec * self, GstBuffer * buf)
       GST_TIME_ARGS (qostime), GST_TIME_ARGS (self->qos_earliest_time), diff,
       self->qos_proportion);
 
-  if (klass->drop_frame (self, buf, diff)) {
+  if (klass->can_drop_frame (self, buf, diff)) {
     GST_INFO_OBJECT (self, "dropping frame");
     return FALSE;
   }
@@ -894,7 +1031,7 @@ no_qos:
 }
 
 static gboolean
-gst_ducati_viddec_drop_frame (GstDucatiVidDec * self, GstBuffer * buf,
+gst_ducati_viddec_can_drop_frame (GstDucatiVidDec * self, GstBuffer * buf,
     gint64 diff)
 {
   gboolean is_keyframe = !GST_BUFFER_FLAG_IS_SET (buf,
@@ -911,7 +1048,7 @@ gst_ducati_viddec_chain (GstPad * pad, GstBuffer * buf)
 {
   GstDucatiVidDec *self = GST_DUCATIVIDDEC (GST_OBJECT_PARENT (pad));
   GstClockTime ts = GST_BUFFER_TIMESTAMP (buf);
-  GstFlowReturn ret;
+  GstFlowReturn ret = GST_FLOW_OK;
   Int32 err;
   GstBuffer *outbuf = NULL;
   GstCaps *outcaps = NULL;
@@ -919,6 +1056,7 @@ gst_ducati_viddec_chain (GstPad * pad, GstBuffer * buf)
 
   if (G_UNLIKELY (!self->engine)) {
     GST_ERROR_OBJECT (self, "no engine");
+    gst_buffer_unref (buf);
     return GST_FLOW_ERROR;
   }
 
@@ -943,6 +1081,7 @@ allocate_buffer:
   if (ret != GST_FLOW_OK) {
     GST_WARNING_OBJECT (self, "alloc_buffer failed %s",
         gst_flow_get_name (ret));
+    gst_buffer_unref (buf);
     return ret;
   }
 
@@ -974,6 +1113,8 @@ allocate_buffer:
   if (G_UNLIKELY (!self->codec)) {
     if (!codec_create (self)) {
       GST_ERROR_OBJECT (self, "could not create codec");
+      gst_buffer_unref (buf);
+      gst_buffer_unref (outbuf);
       return GST_FLOW_ERROR;
     }
   }
@@ -988,13 +1129,15 @@ allocate_buffer:
       codec_prepare_outbuf (self, &outbuf, self->first_out_buffer);
   if (!self->inArgs->inputID) {
     GST_ERROR_OBJECT (self, "could not prepare output buffer");
+    gst_buffer_unref (buf);
     return GST_FLOW_ERROR;
   }
+  GST_BUFFER_OFFSET_END (outbuf) = GST_BUFFER_OFFSET_END (buf);
 
 have_out_buf:
-  self->in_size = 0;
   buf = GST_DUCATIVIDDEC_GET_CLASS (self)->push_input (self, buf);
 
+#ifdef USE_DTS_PTS_CODE
   if (ts != GST_CLOCK_TIME_NONE) {
     self->dts_queue[self->dts_widx++ % NDTS] = ts;
     /* if next buffer has earlier ts than previous, then the ts
@@ -1006,30 +1149,60 @@ have_out_buf:
     }
     self->last_dts = ts;
   }
+#endif
 
   if (self->in_size == 0 && outbuf) {
     GST_DEBUG_OBJECT (self, "no input, skipping process");
+
     gst_buffer_unref (outbuf);
     return GST_FLOW_OK;
   }
 
   self->inArgs->numBytes = self->in_size;
   self->inBufs->descs[0].bufSize.bytes = self->in_size;
+  self->inBufs->descs[0].memType = XDM_MEMTYPE_BO;
 
   err = codec_process (self, TRUE, FALSE, &ret);
   if (err) {
     GST_ELEMENT_ERROR (self, STREAM, DECODE, (NULL),
         ("process returned error: %d %08x", err, self->outArgs->extendedError));
+    gst_ducati_log_extended_error_info (self->outArgs->extendedError);
+
     return GST_FLOW_ERROR;
   }
+
   if (ret != GST_FLOW_OK) {
     GST_WARNING_OBJECT (self, "push from codec_process failed %s",
         gst_flow_get_name (ret));
+
     return ret;
   }
 
   self->first_in_buffer = FALSE;
 
+  if (self->params->inputDataMode != IVIDEO_ENTIREFRAME) {
+    /* The copy could be avoided by playing with the buffer pointer,
+       but it seems to be rare and for not many bytes */
+    GST_DEBUG_OBJECT (self, "Consumed %d/%d (%d) bytes, %d left",
+        self->outArgs->bytesConsumed, self->in_size,
+        self->inArgs->numBytes, self->in_size - self->outArgs->bytesConsumed);
+    if (self->outArgs->bytesConsumed > 0) {
+      if (self->outArgs->bytesConsumed > self->in_size) {
+        GST_WARNING_OBJECT (self,
+            "Codec claims to have used more bytes than supplied");
+        self->in_size = 0;
+      } else {
+        if (self->outArgs->bytesConsumed < self->in_size) {
+          memmove (self->input, self->input + self->outArgs->bytesConsumed,
+              self->in_size - self->outArgs->bytesConsumed);
+        }
+        self->in_size -= self->outArgs->bytesConsumed;
+      }
+    }
+  } else {
+    self->in_size = 0;
+  }
+
   if (self->outArgs->outBufsInUseFlag) {
     GST_DEBUG_OBJECT (self, "outBufsInUseFlag set");
     self->need_out_buf = FALSE;
@@ -1044,6 +1217,9 @@ have_out_buf:
     goto allocate_buffer;
   }
 
+  if (self->needs_flushing)
+    gst_ducati_viddec_codec_flush (self, FALSE);
+
   return GST_FLOW_OK;
 }
 
@@ -1078,6 +1254,7 @@ gst_ducati_viddec_event (GstPad * pad, GstEvent * event)
     case GST_EVENT_FLUSH_STOP:
       if (!gst_ducati_viddec_codec_flush (self, FALSE)) {
         GST_ERROR_OBJECT (self, "could not flush");
+        gst_event_unref (event);
         ret = FALSE;
       }
       gst_segment_init (&self->segment, GST_FORMAT_UNDEFINED);
@@ -1140,6 +1317,7 @@ gst_ducati_viddec_change_state (GstElement * element, GstStateChange transition)
 {
   GstStateChangeReturn ret = GST_STATE_CHANGE_SUCCESS;
   GstDucatiVidDec *self = GST_DUCATIVIDDEC (element);
+  gboolean supported;
 
   GST_DEBUG_OBJECT (self, "begin: changing state %s -> %s",
       gst_element_state_get_name (GST_STATE_TRANSITION_CURRENT (transition)),
@@ -1151,6 +1329,16 @@ gst_ducati_viddec_change_state (GstElement * element, GstStateChange transition)
         GST_ERROR_OBJECT (self, "could not open");
         return GST_STATE_CHANGE_FAILURE;
       }
+      /* try to create/destroy the codec here, it may not be supported */
+      supported = codec_create (self);
+      codec_delete (self);
+      self->codec = NULL;
+      if (!supported) {
+        GST_ERROR_OBJECT (element, "Failed to create codec %s, not supported",
+            GST_DUCATIVIDDEC_GET_CLASS (self)->codec_name);
+        engine_close (self);
+        return GST_STATE_CHANGE_FAILURE;
+      }
       break;
     default:
       break;
@@ -1191,13 +1379,11 @@ gst_ducati_viddec_get_property (GObject * obj,
 {
   GstDucatiVidDec *self = GST_DUCATIVIDDEC (obj);
 
+
   switch (prop_id) {
     case PROP_VERSION:{
       int err;
-      char *version = gst_ducati_alloc_1d (VERSION_LENGTH);
-
-      /* in case something fails: */
-      snprintf (version, VERSION_LENGTH, "unsupported");
+      char *version = NULL;
 
       if (!self->engine)
         engine_open (self);
@@ -1206,7 +1392,8 @@ gst_ducati_viddec_get_property (GObject * obj,
         codec_create (self);
 
       if (self->codec) {
-        self->status->data.buf = (XDAS_Int8 *) TilerMem_VirtToPhys (version);
+        version = dce_alloc (VERSION_LENGTH);
+        self->status->data.buf = (XDAS_Int8 *) version;
         self->status->data.bufSize = VERSION_LENGTH;
 
         err = VIDDEC3_control (self->codec, XDM_GETVERSION,
@@ -1220,11 +1407,31 @@ gst_ducati_viddec_get_property (GObject * obj,
       }
 
       g_value_set_string (value, version);
-
-      MemMgr_Free (version);
+      if (version)
+        dce_free (version);
 
       break;
     }
+    case PROP_MAX_REORDER_FRAMES:
+      g_value_set_int (value, self->backlog_default_maxframes);
+      break;
+    default:{
+      G_OBJECT_WARN_INVALID_PROPERTY_ID (obj, prop_id, pspec);
+      break;
+    }
+  }
+}
+
+static void
+gst_ducati_viddec_set_property (GObject * obj,
+    guint prop_id, const GValue * value, GParamSpec * pspec)
+{
+  GstDucatiVidDec *self = GST_DUCATIVIDDEC (obj);
+
+  switch (prop_id) {
+    case PROP_MAX_REORDER_FRAMES:
+      self->backlog_default_maxframes = g_value_get_int (value);
+      break;
     default:{
       G_OBJECT_WARN_INVALID_PROPERTY_ID (obj, prop_id, pspec);
       break;
@@ -1240,6 +1447,8 @@ gst_ducati_viddec_finalize (GObject * obj)
   codec_delete (self);
   engine_close (self);
 
+  /* Will unref the remaining buffers if needed */
+  g_hash_table_unref (self->passed_in_bufs);
   if (self->codec_data) {
     gst_buffer_unref (self->codec_data);
     self->codec_data = NULL;
@@ -1265,6 +1474,8 @@ gst_ducati_viddec_class_init (GstDucatiVidDecClass * klass)
 
   gobject_class->get_property =
       GST_DEBUG_FUNCPTR (gst_ducati_viddec_get_property);
+  gobject_class->set_property =
+      GST_DEBUG_FUNCPTR (gst_ducati_viddec_set_property);
   gobject_class->finalize = GST_DEBUG_FUNCPTR (gst_ducati_viddec_finalize);
   gstelement_class->change_state =
       GST_DEBUG_FUNCPTR (gst_ducati_viddec_change_state);
@@ -1274,13 +1485,27 @@ gst_ducati_viddec_class_init (GstDucatiVidDecClass * klass)
       GST_DEBUG_FUNCPTR (gst_ducati_viddec_allocate_params);
   klass->push_input = GST_DEBUG_FUNCPTR (gst_ducati_viddec_push_input);
   klass->handle_error = GST_DEBUG_FUNCPTR (gst_ducati_viddec_handle_error);
-  klass->drop_frame = GST_DEBUG_FUNCPTR (gst_ducati_viddec_drop_frame);
+  klass->can_drop_frame = GST_DEBUG_FUNCPTR (gst_ducati_viddec_can_drop_frame);
   klass->query = GST_DEBUG_FUNCPTR (gst_ducati_viddec_query);
+  klass->push_output = GST_DEBUG_FUNCPTR (gst_ducati_viddec_push_output);
+  klass->on_flush = GST_DEBUG_FUNCPTR (gst_ducati_viddec_on_flush);
+  klass->set_sink_caps = GST_DEBUG_FUNCPTR (gst_ducati_viddec_set_sink_caps);
 
   g_object_class_install_property (gobject_class, PROP_VERSION,
       g_param_spec_string ("version", "Version",
           "The codec version string", "",
           G_PARAM_READABLE | G_PARAM_STATIC_STRINGS));
+
+  g_object_class_install_property (gobject_class, PROP_MAX_REORDER_FRAMES,
+      g_param_spec_int ("max-reorder-frames",
+          "Maximum number of frames needed for reordering",
+          "The maximum number of frames needed for reordering output frames. "
+          "Only meaningful for codecs with B frames. 0 means no reordering. "
+          "This value will be used if the correct value cannot be inferred "
+          "from the stream. Too low a value may cause misordering, too high "
+          "will cause extra latency.",
+          0, MAX_BACKLOG_FRAMES, MAX_BACKLOG_FRAMES,
+          G_PARAM_READWRITE | G_PARAM_STATIC_STRINGS));
 }
 
 static void
@@ -1324,10 +1549,12 @@ gst_ducati_viddec_init (GstDucatiVidDec * self, GstDucatiVidDecClass * klass)
   self->interlaced = FALSE;
   self->send_crop_event = TRUE;
 
+#ifdef USE_DTS_PTS_CODE
   self->dts_ridx = self->dts_widx = 0;
   self->last_dts = self->last_pts = GST_CLOCK_TIME_NONE;
   self->ts_may_be_pts = TRUE;
   self->ts_is_pts = FALSE;
+#endif
 
   self->pageMemType = XDM_MEMTYPE_TILEDPAGE;
 
@@ -1338,4 +1565,13 @@ gst_ducati_viddec_init (GstDucatiVidDec * self, GstDucatiVidDecClass * klass)
   self->wait_keyframe = TRUE;
 
   self->need_out_buf = TRUE;
+  self->device = NULL;
+  self->input_bo = NULL;
+
+  self->backlog_maxframes = 0;
+  self->backlog_nframes = 0;
+  self->backlog_default_maxframes = MAX_BACKLOG_FRAMES;
+
+  self->passed_in_bufs = g_hash_table_new_full (g_direct_hash, g_direct_equal,
+      NULL, (GDestroyNotify) gst_buffer_unref);
 }