[TRITON-MLIR][BACKEND]fix atomic_rmw for vector (#966)

Co-authored-by: dongdongl <dongdongl@nvidia.com>
2022-12-08 20:03:40 +08:00
parent f0885e9caf
commit c7cf9c6a32
1 changed files with 4 additions and 2 deletions
--- a/lib/Conversion/TritonGPUToLLVM/TritonGPUToLLVM.cpp
+++ b/lib/Conversion/TritonGPUToLLVM/TritonGPUToLLVM.cpp
@@ -4420,6 +4420,7 @@ struct AtomicRMWOpConversion
            rewriter, loc, getTypeConverter()->getIndexType(), ii);
        rmwVal = insert_element(vecTy, rmwVal, valElements[i + ii], iiVal);
      }
+
      Value rmwPtr = ptrElements[i];
      Value rmwMask = maskElements[i];
      rmwMask = and_(rmwMask, mask);
@@ -4477,9 +4478,10 @@ struct AtomicRMWOpConversion
      atom.o(rmwOp).o(sTy);
      if (valueTy) {
        atom(dstOpr, ptrOpr, valOpr).predicate(rmwMask);
-        auto ret = ptxBuilderAtomicRMW.launch(rewriter, loc, valueElemTy);
+        auto retType = vec == 1 ? valueElemTy : vecTy;
+        auto ret = ptxBuilderAtomicRMW.launch(rewriter, loc, retType);
        for (int ii = 0; ii < vec; ++ii) {
-          resultVals[i * vec + ii] =
+          resultVals[i + ii] =
              vec == 1 ? ret : extract_element(valueElemTy, ret, idx_val(ii));
        }
      } else {