R600/SI: Allow comuting fp immediates

author Matt Arsenault <Matthew.Arsenault@amd.com>

Fri, 17 Oct 2014 18:00:39 +0000 (18:00 +0000)

committer Matt Arsenault <Matthew.Arsenault@amd.com>

Fri, 17 Oct 2014 18:00:39 +0000 (18:00 +0000)
author Matt Arsenault <Matthew.Arsenault@amd.com>
Fri, 17 Oct 2014 18:00:39 +0000 (18:00 +0000)
committer Matt Arsenault <Matthew.Arsenault@amd.com>
Fri, 17 Oct 2014 18:00:39 +0000 (18:00 +0000)
diff --git a/lib/Target/R600/SIInstrInfo.cpp b/lib/Target/R600/SIInstrInfo.cpp

index e1201ce399de1298a196330b4967f3b8dac9ac46..eb8d38cd1840f4816f9903bd4756f4c4b78b7303 100644 (file)
--- a/lib/Target/R600/SIInstrInfo.cpp
+++ b/lib/Target/R600/SIInstrInfo.cpp
@@ -712,8 +712,8 @@ MachineInstr *SIInstrInfo::commuteInstruction(MachineInstr *MI,
      return nullptr;
  
    if (!Src1.isReg()) {
-    // XXX: Commute instructions with FPImm operands
-    if (NewMI || !Src1.isImm() ||
+    // Allow commuting instructions with Imm or FPImm operands.
+    if (NewMI || (!Src1.isImm() && !Src1.isFPImm()) ||
         (!isVOP2(MI->getOpcode()) && !isVOP3(MI->getOpcode()))) {
        return nullptr;
      }
@@ -733,7 +733,13 @@ MachineInstr *SIInstrInfo::commuteInstruction(MachineInstr *MI,
  
      unsigned Reg = Src0.getReg();
      unsigned SubReg = Src0.getSubReg();
-    Src0.ChangeToImmediate(Src1.getImm());
+    if (Src1.isImm())
+      Src0.ChangeToImmediate(Src1.getImm());
+    else if (Src1.isFPImm())
+      Src0.ChangeToFPImmediate(Src1.getFPImm());
+    else
+      llvm_unreachable("Should only have immediates");
+
      Src1.ChangeToRegister(Reg, false);
      Src1.setSubReg(SubReg);
    } else {
diff --git a/test/CodeGen/R600/imm.ll b/test/CodeGen/R600/imm.ll

index 6c135730ab21906bf30374b5fde38775f91be01b..44b5daca8d350fc6dae84bc177248948c1fd785f 100644 (file)
--- a/test/CodeGen/R600/imm.ll
+++ b/test/CodeGen/R600/imm.ll
@@ -104,7 +104,7 @@ define void @store_literal_imm_f32(float addrspace(1)* %out) {
  
  ; CHECK-LABEL: {{^}}add_inline_imm_0.0_f32
  ; CHECK: S_LOAD_DWORD [[VAL:s[0-9]+]]
-; CHECK: V_ADD_F32_e64 [[REG:v[0-9]+]], [[VAL]], 0.0{{$}}
+; CHECK: V_ADD_F32_e64 [[REG:v[0-9]+]], 0.0, [[VAL]]{{$}}
  ; CHECK-NEXT: BUFFER_STORE_DWORD [[REG]]
  define void @add_inline_imm_0.0_f32(float addrspace(1)* %out, float %x) {
    %y = fadd float %x, 0.0
@@ -114,7 +114,7 @@ define void @add_inline_imm_0.0_f32(float addrspace(1)* %out, float %x) {
  
  ; CHECK-LABEL: {{^}}add_inline_imm_0.5_f32
  ; CHECK: S_LOAD_DWORD [[VAL:s[0-9]+]]
-; CHECK: V_ADD_F32_e64 [[REG:v[0-9]+]], [[VAL]], 0.5{{$}}
+; CHECK: V_ADD_F32_e64 [[REG:v[0-9]+]], 0.5, [[VAL]]{{$}}
  ; CHECK-NEXT: BUFFER_STORE_DWORD [[REG]]
  define void @add_inline_imm_0.5_f32(float addrspace(1)* %out, float %x) {
    %y = fadd float %x, 0.5
@@ -124,7 +124,7 @@ define void @add_inline_imm_0.5_f32(float addrspace(1)* %out, float %x) {
  
  ; CHECK-LABEL: {{^}}add_inline_imm_neg_0.5_f32
  ; CHECK: S_LOAD_DWORD [[VAL:s[0-9]+]]
-; CHECK: V_ADD_F32_e64 [[REG:v[0-9]+]], [[VAL]], -0.5{{$}}
+; CHECK: V_ADD_F32_e64 [[REG:v[0-9]+]], -0.5, [[VAL]]{{$}}
  ; CHECK-NEXT: BUFFER_STORE_DWORD [[REG]]
  define void @add_inline_imm_neg_0.5_f32(float addrspace(1)* %out, float %x) {
    %y = fadd float %x, -0.5
@@ -134,7 +134,7 @@ define void @add_inline_imm_neg_0.5_f32(float addrspace(1)* %out, float %x) {
  
  ; CHECK-LABEL: {{^}}add_inline_imm_1.0_f32
  ; CHECK: S_LOAD_DWORD [[VAL:s[0-9]+]]
-; CHECK: V_ADD_F32_e64 [[REG:v[0-9]+]], [[VAL]], 1.0{{$}}
+; CHECK: V_ADD_F32_e64 [[REG:v[0-9]+]], 1.0, [[VAL]]{{$}}
  ; CHECK-NEXT: BUFFER_STORE_DWORD [[REG]]
  define void @add_inline_imm_1.0_f32(float addrspace(1)* %out, float %x) {
    %y = fadd float %x, 1.0
@@ -144,7 +144,7 @@ define void @add_inline_imm_1.0_f32(float addrspace(1)* %out, float %x) {
  
  ; CHECK-LABEL: {{^}}add_inline_imm_neg_1.0_f32
  ; CHECK: S_LOAD_DWORD [[VAL:s[0-9]+]]
-; CHECK: V_ADD_F32_e64 [[REG:v[0-9]+]], [[VAL]], -1.0{{$}}
+; CHECK: V_ADD_F32_e64 [[REG:v[0-9]+]], -1.0, [[VAL]]{{$}}
  ; CHECK-NEXT: BUFFER_STORE_DWORD [[REG]]
  define void @add_inline_imm_neg_1.0_f32(float addrspace(1)* %out, float %x) {
    %y = fadd float %x, -1.0
@@ -154,7 +154,7 @@ define void @add_inline_imm_neg_1.0_f32(float addrspace(1)* %out, float %x) {
  
  ; CHECK-LABEL: {{^}}add_inline_imm_2.0_f32
  ; CHECK: S_LOAD_DWORD [[VAL:s[0-9]+]]
-; CHECK: V_ADD_F32_e64 [[REG:v[0-9]+]], [[VAL]], 2.0{{$}}
+; CHECK: V_ADD_F32_e64 [[REG:v[0-9]+]], 2.0, [[VAL]]{{$}}
  ; CHECK-NEXT: BUFFER_STORE_DWORD [[REG]]
  define void @add_inline_imm_2.0_f32(float addrspace(1)* %out, float %x) {
    %y = fadd float %x, 2.0
@@ -164,7 +164,7 @@ define void @add_inline_imm_2.0_f32(float addrspace(1)* %out, float %x) {
  
  ; CHECK-LABEL: {{^}}add_inline_imm_neg_2.0_f32
  ; CHECK: S_LOAD_DWORD [[VAL:s[0-9]+]]
-; CHECK: V_ADD_F32_e64 [[REG:v[0-9]+]], [[VAL]], -2.0{{$}}
+; CHECK: V_ADD_F32_e64 [[REG:v[0-9]+]], -2.0, [[VAL]]{{$}}
  ; CHECK-NEXT: BUFFER_STORE_DWORD [[REG]]
  define void @add_inline_imm_neg_2.0_f32(float addrspace(1)* %out, float %x) {
    %y = fadd float %x, -2.0
@@ -174,7 +174,7 @@ define void @add_inline_imm_neg_2.0_f32(float addrspace(1)* %out, float %x) {
  
  ; CHECK-LABEL: {{^}}add_inline_imm_4.0_f32
  ; CHECK: S_LOAD_DWORD [[VAL:s[0-9]+]]
-; CHECK: V_ADD_F32_e64 [[REG:v[0-9]+]], [[VAL]], 4.0{{$}}
+; CHECK: V_ADD_F32_e64 [[REG:v[0-9]+]], 4.0, [[VAL]]{{$}}
  ; CHECK-NEXT: BUFFER_STORE_DWORD [[REG]]
  define void @add_inline_imm_4.0_f32(float addrspace(1)* %out, float %x) {
    %y = fadd float %x, 4.0
@@ -184,10 +184,32 @@ define void @add_inline_imm_4.0_f32(float addrspace(1)* %out, float %x) {
  
  ; CHECK-LABEL: {{^}}add_inline_imm_neg_4.0_f32
  ; CHECK: S_LOAD_DWORD [[VAL:s[0-9]+]]
-; CHECK: V_ADD_F32_e64 [[REG:v[0-9]+]], [[VAL]], -4.0{{$}}
+; CHECK: V_ADD_F32_e64 [[REG:v[0-9]+]], -4.0, [[VAL]]{{$}}
  ; CHECK-NEXT: BUFFER_STORE_DWORD [[REG]]
  define void @add_inline_imm_neg_4.0_f32(float addrspace(1)* %out, float %x) {
    %y = fadd float %x, -4.0
    store float %y, float addrspace(1)* %out
    ret void
  }
+
+; CHECK-LABEL: @commute_add_inline_imm_0.5_f32
+; CHECK: BUFFER_LOAD_DWORD [[VAL:v[0-9]+]]
+; CHECK: V_ADD_F32_e32 [[REG:v[0-9]+]], 0.5, [[VAL]]
+; CHECK-NEXT: BUFFER_STORE_DWORD [[REG]]
+define void @commute_add_inline_imm_0.5_f32(float addrspace(1)* %out, float addrspace(1)* %in) {
+  %x = load float addrspace(1)* %in
+  %y = fadd float %x, 0.5
+  store float %y, float addrspace(1)* %out
+  ret void
+}
+
+; CHECK-LABEL: @commute_add_literal_f32
+; CHECK: BUFFER_LOAD_DWORD [[VAL:v[0-9]+]]
+; CHECK: V_ADD_F32_e32 [[REG:v[0-9]+]], 0x44800000, [[VAL]]
+; CHECK-NEXT: BUFFER_STORE_DWORD [[REG]]
+define void @commute_add_literal_f32(float addrspace(1)* %out, float addrspace(1)* %in) {
+  %x = load float addrspace(1)* %in
+  %y = fadd float %x, 1024.0
+  store float %y, float addrspace(1)* %out
+  ret void
+}
author	Matt Arsenault <Matthew.Arsenault@amd.com>
	Fri, 17 Oct 2014 18:00:39 +0000 (18:00 +0000)
committer	Matt Arsenault <Matthew.Arsenault@amd.com>
	Fri, 17 Oct 2014 18:00:39 +0000 (18:00 +0000)
lib/Target/R600/SIInstrInfo.cpp		patch \| blob \| history
test/CodeGen/R600/imm.ll		patch \| blob \| history