[Triton-MLIR] Generate LLVM/PTX code for async ops (#735)

2022-10-04 09:37:00 -07:00
parent f9d7f2f126
commit 289ff293cc
9 changed files with 412 additions and 57 deletions
--- a/lib/Dialect/TritonGPU/IR/Dialect.cpp
+++ b/lib/Dialect/TritonGPU/IR/Dialect.cpp
@@ -72,6 +72,21 @@ SmallVector<unsigned> getSizePerThread(Attribute layout) {
  }
 }

+SmallVector<unsigned> getThreadsPerCTA(const Attribute &layout) {
+  SmallVector<unsigned> threads;
+  if (auto blockedLayout = layout.dyn_cast<BlockedEncodingAttr>()) {
+    for (int d = 0, n = blockedLayout.getOrder().size(); d < n; ++d)
+      threads.push_back(blockedLayout.getThreadsPerWarp()[d] *
+                        blockedLayout.getWarpsPerCTA()[d]);
+  } else if (auto mmaLayout = layout.dyn_cast<MmaEncodingAttr>()) {
+    assert(0 && "Unimplemented usage of MmaEncodingAttr");
+  } else {
+    assert(0 && "Unimplemented usage of getShapePerCTA");
+  }
+
+  return threads;
+}
+
 SmallVector<unsigned> getShapePerCTA(const Attribute &layout) {
  SmallVector<unsigned> shape;
  if (auto blockedLayout = layout.dyn_cast<BlockedEncodingAttr>()) {