update mma encoding & triton-opt

2022-06-06 21:03:58 +08:00
parent 7807f64ef3
commit 366dddc3bc
13 changed files with 88 additions and 28 deletions
--- a/bin/CMakeLists.txt
+++ b/bin/CMakeLists.txt
@@ -4,17 +4,15 @@ get_property(conversion_libs GLOBAL PROPERTY MLIR_CONVERSION_LIBS)
 add_llvm_executable(triton-opt triton-opt.cpp)
 # TODO: what's this?
-llvm_update_compile_flags(triton-opt)
+# llvm_update_compile_flags(triton-opt)
 target_link_libraries(triton-opt PRIVATE
  TritonTransforms
  TritonGPUTransforms
  ${dialect_libs}
  ${conversion_libs}
  MLIROptLib
-
+  MLIRPass
-  TritonIR
+  MLIRTransforms
  TritonTransforms
  TritonGPUIR
  TritonGPUTransforms
 )
 mlir_check_all_link_libraries(triton-opt)
--- a/bin/triton-opt.cpp
+++ b/bin/triton-opt.cpp
@@ -1,6 +1,9 @@
 #include "triton/Dialect/Triton/IR/Dialect.h"
 #include "triton/Dialect/TritonGPU/IR/Dialect.h"
 #include "triton/Dialect/Triton/Transforms/Passes.h"
 #include "triton/Dialect/TritonGPU/Transforms/Passes.h"
 #include "mlir/IR/Dialect.h"
 #include "mlir/InitAllPasses.h"
 #include "mlir/Support/MlirOptMain.h"
@@ -8,7 +11,10 @@
 int main(int argc, char **argv) {
  mlir::registerAllPasses();
  mlir::registerTritonPasses();
  mlir::registerTritonGPUPasses();
  // TODO: register Triton & TritonGPU passes
  mlir::DialectRegistry registry;
  registry.insert<mlir::triton::TritonDialect,
                  mlir::triton::gpu::TritonGPUDialect,
--- a/include/triton/Dialect/Triton/IR/TritonOps.td
+++ b/include/triton/Dialect/Triton/IR/TritonOps.td
@@ -126,7 +126,7 @@ def TT_GEPOp : TT_Op<"getelementptr",
    let results = (outs TT_PtrTensor:$result);
-    let assemblyFormat = "$ptr `,` $offset `,` attr-dict `:` type($result)";
+    let assemblyFormat = "$ptr `,` $offset attr-dict `:` type($result)";
 }
--- a/include/triton/Dialect/Triton/Transforms/Passes.h
+++ b/include/triton/Dialect/Triton/Transforms/Passes.h
@@ -9,6 +9,10 @@ namespace triton {
 std::unique_ptr<Pass> createCombineOpsPass();
 }
 #define GEN_PASS_REGISTRATION
 #include "triton/Dialect/Triton/Transforms/Passes.h.inc"
 }
 #endif
--- a/include/triton/Dialect/Triton/Transforms/Passes.td
+++ b/include/triton/Dialect/Triton/Transforms/Passes.td
@@ -14,7 +14,7 @@ def TritonCombineOps : Pass</*cli-arg*/"triton-combine", /*Op*/"mlir::ModuleOp">
        load(ptrs, broadcast(cond), other)
  }];
-  let constructor = "mlir::triton::createCombineOpsPass";
+  let constructor = "mlir::triton::createCombineOpsPass()";
  let dependentDialects = ["mlir::arith::ArithmeticDialect",
                           /*SelectOp*/"mlir::StandardOpsDialect"];
--- a/include/triton/Dialect/TritonGPU/IR/TritonGPUAttrDefs.td
+++ b/include/triton/Dialect/TritonGPU/IR/TritonGPUAttrDefs.td
@@ -130,7 +130,7 @@ def TritonGPUMmaEncodingAttr : TritonGPU_Attr<"TritonGPUMmaEncoding"> {
    // TODO: should we rename this as blockTileSize? (consistent naming with Distributed layout)
    ArrayRefParameter<"unsigned">:$shapePerTile,
    // TODO: should Distributed layout also 
-    ArrayRefParameter<"unsigned">:$reptitions,
+    ArrayRefParameter<"unsigned">:$repetitions,
    ArrayRefParameter<"unsigned">:$contigPerThread
    // "AffineMap":$warpOrdering,
    // "AffineMap":$blockOrdering
--- a/include/triton/Dialect/TritonGPU/IR/TritonGPUOps.td
+++ b/include/triton/Dialect/TritonGPU/IR/TritonGPUOps.td
@@ -26,6 +26,8 @@ def TTG_ConvertLayoutOp : TTG_Op<"convert_layout",
  let arguments = (ins TT_Tensor:$src);
  let results = (outs TT_Tensor:$result);
  let assemblyFormat = "$src attr-dict `:` functional-type(operands, results)";
 }
 def TTG_AsyncWaitOp : TTG_Op<"async_wait"> {
--- a/include/triton/Dialect/TritonGPU/Transforms/Passes.h
+++ b/include/triton/Dialect/TritonGPU/Transforms/Passes.h
@@ -4,19 +4,15 @@
 #include "mlir/Pass/Pass.h"
 namespace mlir {
-std::unique_ptr<Pass> createTritonGPUPipelinePass(int numStages);
+std::unique_ptr<Pass> createTritonGPUPipelinePass(int numStages = 2);
-namespace triton {
+std::unique_ptr<Pass> createTritonGPUCombineOpsPass();
 namespace gpu {
 std::unique_ptr<Pass> createCombineOpsPass();
 std::unique_ptr<Pass> createTritonGPUVerifier();
 }
 }
-// /// Generate the code for registering passes.
+/// Generate the code for registering passes.
-// #define GEN_PASS_REGISTRATION
+#define GEN_PASS_REGISTRATION
-// #include "triton/Dialect/TritonGPU/Transforms/Passes.h.inc"
+#include "triton/Dialect/TritonGPU/Transforms/Passes.h.inc"
 } // namespace mlir
 #endif
--- a/include/triton/Dialect/TritonGPU/Transforms/Passes.td
+++ b/include/triton/Dialect/TritonGPU/Transforms/Passes.td
@@ -19,7 +19,7 @@ def TritonGPUPipeline : Pass<"tritongpu-pipeline", "mlir::ModuleOp"> {
    ...
  }];
-  let constructor = "mlir::triton::gpu::createPipelinePass";
+  let constructor = "mlir::createTritonGPUPipelinePass()";
  let dependentDialects = ["mlir::triton::gpu::TritonGPUDialect",
                           "mlir::scf::SCFDialect",
@@ -45,7 +45,7 @@ def TritonGPUCombineOps : Pass<"tritongpu-combine", "mlir::ModuleOp"> {
    convert_layout(%src, #LAYOUT) => %src if %src.layout() == #LAYOUT
  }];
-  let constructor = "mlir::triton::gpu::createCombineOpsPass";
+  let constructor = "mlir::createTritonGPUCombineOpsPass()";
  let dependentDialects = ["mlir::triton::gpu::TritonGPUDialect",
                           "mlir::triton::TritonDialect"];
@@ -56,7 +56,7 @@ def TritonGPUVerifier : Pass<"tritongpu-verifier", "mlir::ModuleOp"> {
  let description = [{}];
-  let constructor = "mlir::triton::gpu::createTritonGPUVerifier";
+  let constructor = "mlir::createTritonGPUVerifier()";
  let dependentDialects = ["mlir::triton::gpu::TritonGPUDialect"];
 }
--- a/lib/Dialect/TritonGPU/IR/Dialect.cpp
+++ b/lib/Dialect/TritonGPU/IR/Dialect.cpp
@@ -112,11 +112,65 @@ void TritonGPUBlockedEncodingAttr::print(mlir::AsmPrinter &printer) const {
 Attribute 
 TritonGPUMmaEncodingAttr::parse(AsmParser &parser, Type type) {
-  llvm_unreachable("Not implemented");
+  if (parser.parseLess().failed())
    return {};
  DictionaryAttr dict;
  if (parser.parseAttribute(dict).failed())
    return {};
  if (parser.parseGreater().failed())
    return {};
  SmallVector<unsigned, 2> fragmentPerWarp;
  SmallVector<unsigned, 2> shapePerWarp;
  SmallVector<unsigned, 2> warpPerTile;
  SmallVector<unsigned, 2> shapePerTile;
  SmallVector<unsigned, 2> repetitions;
  SmallVector<unsigned, 2> contigPerThread;
  for (const NamedAttribute &attr : dict) {
    if (attr.getName() == "fragmentPerWarp") {
      if (parseIntArrayAttr(parser, attr, fragmentPerWarp, "fragmentPerWarp").failed())
        return {};
    } else if (attr.getName() == "shapePerWarp") {
      if (parseIntArrayAttr(parser, attr, shapePerWarp, "shapePerWarp").failed())
        return {};
    } else if (attr.getName() == "warpPerTile") {
      if (parseIntArrayAttr(parser, attr, warpPerTile, "warpPerTile").failed())
        return {};
    } else if (attr.getName() == "shapePerTile") {
      if (parseIntArrayAttr(parser, attr, shapePerTile, "shapePerTile").failed())
        return {};
    } else if (attr.getName() == "repetitions") {
      if (parseIntArrayAttr(parser, attr, repetitions, "repetitions").failed())
        return {};
    } else if (attr.getName() == "contigPerThread") {
      if (parseIntArrayAttr(parser, attr, contigPerThread, "contigPerThread").failed())
        return {};
    } else {
      parser.emitError(parser.getNameLoc(), "unexpected key: ")
             << attr.getName().strref();
      return {};
    }
  }
  return parser.getChecked<TritonGPUMmaEncodingAttr>(parser.getContext(),
                                                     fragmentPerWarp,
                                                     shapePerWarp,
                                                     warpPerTile,
                                                     shapePerTile,
                                                     repetitions,
                                                     contigPerThread);
 }
 void TritonGPUMmaEncodingAttr::print(AsmPrinter &printer) const {
-  llvm_unreachable("Not implemented");
+  printer << "<{"
          << "fragmentPerWarp = [" << getFragmentPerWarp() << "]"
          << ", shapePerWarp = [" << getShapePerWarp() << "]"
          << ", warpPerTile = [" << getWarpPerTile() << "]"
          << ", shapePerTile = [" << getShapePerTile() << "]"
          << ", repetitions = [" << getRepetitions() << "]"
          << ", contigPerThread = [" << getContigPerThread() << "]"
          << "}>";
 }
 Attribute
--- a/lib/Dialect/TritonGPU/Transforms/Combine.cpp
+++ b/lib/Dialect/TritonGPU/Transforms/Combine.cpp
@@ -45,6 +45,6 @@ public:
  }
 };
-std::unique_ptr<Pass> triton::gpu::createCombineOpsPass() {
+std::unique_ptr<Pass> mlir::createTritonGPUCombineOpsPass() {
  return std::make_unique<TritonGPUCombineOpsPass>();
 }
--- a/lib/Dialect/TritonGPU/Transforms/Verifier.cpp
+++ b/lib/Dialect/TritonGPU/Transforms/Verifier.cpp
@@ -100,6 +100,6 @@ private:
  }
 };
-std::unique_ptr<Pass> triton::gpu::createTritonGPUVerifier() {
+std::unique_ptr<Pass> mlir::createTritonGPUVerifier() {
  return std::make_unique<TritonGPUVerifier>();
 }
--- a/python/src/triton.cc
+++ b/python/src/triton.cc
@@ -1353,10 +1353,10 @@ void init_triton_ir(py::module &&m) {
        self.addPass(mlir::createTritonGPUPipelinePass(numStages));
      })
      .def("add_triton_gpu_combine_pass", [](mlir::PassManager &self) {
-        self.addPass(mlir::triton::gpu::createCombineOpsPass());
+        self.addPass(mlir::createTritonGPUCombineOpsPass());
      })
      .def("add_triton_gpu_verifier_pass", [](mlir::PassManager &self) {
-        self.addPass(mlir::triton::gpu::createTritonGPUVerifier());
+        self.addPass(mlir::createTritonGPUVerifier());
      })
      ;
 }