Merge branch 'overlayfs-next' of git://git.kernel.org/pub/scm/linux/kernel/git/mszere...

[linux.git] / drivers / gpu / drm / amd / amdgpu / amdgpu_cs.c
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_cs.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_cs.c

index ffbe9aa9f2325fbebd8286339acac8e45420f22b..f09b2cba40ca505649decf23a27b60850b62407a 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_cs.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_cs.c
@@ -138,7 +138,11 @@ int amdgpu_cs_parser_init(struct amdgpu_cs_parser *p, void *data)
         if (!cs->in.num_chunks)
                 goto out;
  
-       p->ctx_id = cs->in.ctx_id;
+       p->ctx = amdgpu_ctx_get(fpriv, cs->in.ctx_id);
+       if (!p->ctx) {
+               r = -EINVAL;
+               goto out;
+       }
         p->bo_list = amdgpu_bo_list_get(fpriv, cs->in.bo_list_handle);
  
         /* get chunks */
@@ -226,11 +230,6 @@ int amdgpu_cs_parser_init(struct amdgpu_cs_parser *p, void *data)
                 goto out;
         }
  
-       p->ib_bos = kcalloc(p->num_ibs, sizeof(struct amdgpu_bo_list_entry),
-                           GFP_KERNEL);
-       if (!p->ib_bos)
-               r = -ENOMEM;
-
  out:
         kfree(chunk_array);
         return r;
@@ -369,13 +368,6 @@ static int amdgpu_cs_parser_relocs(struct amdgpu_cs_parser *p)
         p->vm_bos = amdgpu_vm_get_bos(p->adev, &fpriv->vm,
                                       &p->validated);
  
-       for (i = 0; i < p->num_ibs; i++) {
-               if (!p->ib_bos[i].robj)
-                       continue;
-
-               list_add(&p->ib_bos[i].tv.head, &p->validated);
-       }
-
         if (need_mmap_lock)
                 down_read(&current->mm->mmap_sem);
  
@@ -445,21 +437,17 @@ static void amdgpu_cs_parser_fini(struct amdgpu_cs_parser *parser, int error, bo
                                            &parser->validated);
         }
  
+       if (parser->ctx)
+               amdgpu_ctx_put(parser->ctx);
         if (parser->bo_list)
                 amdgpu_bo_list_put(parser->bo_list);
         drm_free_large(parser->vm_bos);
         for (i = 0; i < parser->nchunks; i++)
                 drm_free_large(parser->chunks[i].kdata);
         kfree(parser->chunks);
-       for (i = 0; i < parser->num_ibs; i++) {
-               struct amdgpu_bo *bo = parser->ib_bos[i].robj;
+       for (i = 0; i < parser->num_ibs; i++)
                 amdgpu_ib_free(parser->adev, &parser->ibs[i]);
-
-               if (bo)
-                       drm_gem_object_unreference_unlocked(&bo->gem_base);
-       }
         kfree(parser->ibs);
-       kfree(parser->ib_bos);
         if (parser->uf.bo)
                 drm_gem_object_unreference_unlocked(&parser->uf.bo->gem_base);
  }
@@ -499,22 +487,7 @@ static int amdgpu_bo_vm_update_pte(struct amdgpu_cs_parser *p,
                 }
         }
  
-       for (i = 0; i < p->num_ibs; i++) {
-               bo = p->ib_bos[i].robj;
-               if (!bo)
-                       continue;
-
-               bo_va = p->ib_bos[i].bo_va;
-               if (!bo_va)
-                       continue;
-
-               r = amdgpu_vm_bo_update(adev, bo_va, &bo->tbo.mem);
-               if (r)
-                       return r;
-
-               amdgpu_sync_fence(&p->ibs[0].sync, bo_va->last_pt_update);
-       }
-       return amdgpu_vm_clear_invalids(adev, vm);
+       return amdgpu_vm_clear_invalids(adev, vm, &p->ibs[0].sync);
  }
  
  static int amdgpu_cs_ib_vm_chunk(struct amdgpu_device *adev,
@@ -575,11 +548,7 @@ static int amdgpu_cs_ib_fill(struct amdgpu_device *adev,
                 struct amdgpu_cs_chunk *chunk;
                 struct amdgpu_ib *ib;
                 struct drm_amdgpu_cs_chunk_ib *chunk_ib;
-               struct amdgpu_bo_list_entry *ib_bo;
                 struct amdgpu_ring *ring;
-               struct drm_gem_object *gobj;
-               struct amdgpu_bo *aobj;
-               void *kptr;
  
                 chunk = &parser->chunks[i];
                 ib = &parser->ibs[j];
@@ -588,72 +557,61 @@ static int amdgpu_cs_ib_fill(struct amdgpu_device *adev,
                 if (chunk->chunk_id != AMDGPU_CHUNK_ID_IB)
                         continue;
  
-               gobj = drm_gem_object_lookup(adev->ddev, parser->filp, chunk_ib->handle);
-               if (gobj == NULL)
-                       return -ENOENT;
-               aobj = gem_to_amdgpu_bo(gobj);
-
                 r = amdgpu_cs_get_ring(adev, chunk_ib->ip_type,
                                        chunk_ib->ip_instance, chunk_ib->ring,
                                        &ring);
-               if (r) {
-                       drm_gem_object_unreference_unlocked(gobj);
+               if (r)
                         return r;
-               }
  
                 if (ring->funcs->parse_cs) {
-                       r = amdgpu_bo_reserve(aobj, false);
-                       if (r) {
-                               drm_gem_object_unreference_unlocked(gobj);
-                               return r;
+                       struct amdgpu_bo_va_mapping *m;
+                       struct amdgpu_bo *aobj = NULL;
+                       uint64_t offset;
+                       uint8_t *kptr;
+
+                       m = amdgpu_cs_find_mapping(parser, chunk_ib->va_start,
+                                                  &aobj);
+                       if (!aobj) {
+                               DRM_ERROR("IB va_start is invalid\n");
+                               return -EINVAL;
+                       }
+
+                       if ((chunk_ib->va_start + chunk_ib->ib_bytes) >
+                           (m->it.last + 1) * AMDGPU_GPU_PAGE_SIZE) {
+                               DRM_ERROR("IB va_start+ib_bytes is invalid\n");
+                               return -EINVAL;
                         }
  
-                       r = amdgpu_bo_kmap(aobj, &kptr);
+                       /* the IB should be reserved at this point */
+                       r = amdgpu_bo_kmap(aobj, (void **)&kptr);
                         if (r) {
-                               amdgpu_bo_unreserve(aobj);
-                               drm_gem_object_unreference_unlocked(gobj);
                                 return r;
                         }
  
+                       offset = ((uint64_t)m->it.start) * AMDGPU_GPU_PAGE_SIZE;
+                       kptr += chunk_ib->va_start - offset;
+
                         r =  amdgpu_ib_get(ring, NULL, chunk_ib->ib_bytes, ib);
                         if (r) {
                                 DRM_ERROR("Failed to get ib !\n");
-                               amdgpu_bo_unreserve(aobj);
-                               drm_gem_object_unreference_unlocked(gobj);
                                 return r;
                         }
  
                         memcpy(ib->ptr, kptr, chunk_ib->ib_bytes);
                         amdgpu_bo_kunmap(aobj);
-                       amdgpu_bo_unreserve(aobj);
                 } else {
                         r =  amdgpu_ib_get(ring, vm, 0, ib);
                         if (r) {
                                 DRM_ERROR("Failed to get ib !\n");
-                               drm_gem_object_unreference_unlocked(gobj);
                                 return r;
                         }
  
                         ib->gpu_addr = chunk_ib->va_start;
                 }
-               ib->length_dw = chunk_ib->ib_bytes / 4;
-
-               if (chunk_ib->flags & AMDGPU_IB_FLAG_CE)
-                       ib->is_const_ib = true;
-               if (chunk_ib->flags & AMDGPU_IB_FLAG_GDS)
-                       ib->gds_needed = true;
-               if (ib->ring->current_filp != parser->filp) {
-                       ib->ring->need_ctx_switch = true;
-                       ib->ring->current_filp = parser->filp;
-               }
  
-               ib_bo = &parser->ib_bos[j];
-               ib_bo->robj = aobj;
-               ib_bo->prefered_domains = aobj->initial_domain;
-               ib_bo->allowed_domains = aobj->initial_domain;
-               ib_bo->priority = 0;
-               ib_bo->tv.bo = &aobj->tbo;
-               ib_bo->tv.shared = true;
+               ib->length_dw = chunk_ib->ib_bytes / 4;
+               ib->flags = chunk_ib->flags;
+               ib->ctx = parser->ctx;
                 j++;
         }
  
@@ -702,6 +660,7 @@ int amdgpu_cs_ioctl(struct drm_device *dev, void *data, struct drm_file *filp)
         union drm_amdgpu_cs *cs = data;
         struct amdgpu_cs_parser parser;
         int r, i;
+       bool reserved_buffers = false;
  
         down_read(&adev->exclusive_lock);
         if (!adev->accel_working) {
@@ -721,15 +680,21 @@ int amdgpu_cs_ioctl(struct drm_device *dev, void *data, struct drm_file *filp)
                 return r;
         }
  
-       r = amdgpu_cs_ib_fill(adev, &parser);
-       if (!r) {
-               r = amdgpu_cs_parser_relocs(&parser);
-               if (r && r != -ERESTARTSYS)
-                       DRM_ERROR("Failed to parse relocation %d!\n", r);
+       r = amdgpu_cs_parser_relocs(&parser);
+       if (r) {
+               if (r != -ERESTARTSYS) {
+                       if (r == -ENOMEM)
+                               DRM_ERROR("Not enough memory for command submission!\n");
+                       else
+                               DRM_ERROR("Failed to process the buffer list %d!\n", r);
+               }
+       } else {
+               reserved_buffers = true;
+               r = amdgpu_cs_ib_fill(adev, &parser);
         }
  
         if (r) {
-               amdgpu_cs_parser_fini(&parser, r, false);
+               amdgpu_cs_parser_fini(&parser, r, reserved_buffers);
                 up_read(&adev->exclusive_lock);
                 r = amdgpu_cs_handle_lockup(adev, r);
                 return r;
@@ -768,8 +733,13 @@ int amdgpu_cs_wait_ioctl(struct drm_device *dev, void *data,
         uint64_t seq[AMDGPU_MAX_RINGS] = {0};
         struct amdgpu_ring *ring = NULL;
         unsigned long timeout = amdgpu_gem_timeout(wait->in.timeout);
+       struct amdgpu_ctx *ctx;
         long r;
  
+       ctx = amdgpu_ctx_get(filp->driver_priv, wait->in.ctx_id);
+       if (ctx == NULL)
+               return -EINVAL;
+
         r = amdgpu_cs_get_ring(adev, wait->in.ip_type, wait->in.ip_instance,
                                wait->in.ring, &ring);
         if (r)
@@ -778,6 +748,7 @@ int amdgpu_cs_wait_ioctl(struct drm_device *dev, void *data,
         seq[ring->idx] = wait->in.handle;
  
         r = amdgpu_fence_wait_seq_timeout(adev, seq, true, timeout);
+       amdgpu_ctx_put(ctx);
         if (r < 0)
                 return r;