add a note
authorChris Lattner <sabre@nondot.org>
Tue, 13 May 2008 19:56:20 +0000 (19:56 +0000)
committerChris Lattner <sabre@nondot.org>
Tue, 13 May 2008 19:56:20 +0000 (19:56 +0000)
git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@51062 91177308-0d34-0410-b5e6-96231b3b80d8

lib/Target/X86/README-SSE.txt

index 5f114a855f097bada2a82ba6f8f823128244306f..61649726e3816365b6dd2e9dbc820ef771e1c35c 100644 (file)
@@ -787,5 +787,23 @@ _foo2:
 
 In sse4 mode, we could use insertps to make both better.
 
+Here's another testcase that could use insertps [mem]:
+
+#include <xmmintrin.h>
+extern float x2, x3;
+__m128 foo1 (float x1, float x4) {
+ return _mm_set_ps (x2, x1, x3, x4);
+}
+
+gcc mainline compiles it to:
+
+foo1:
+       insertps        $0x10, x2(%rip), %xmm0
+       insertps        $0x10, x3(%rip), %xmm1
+       movaps  %xmm1, %xmm2
+       movlhps %xmm0, %xmm2
+       movaps  %xmm2, %xmm0
+       ret
+
 //===---------------------------------------------------------------------===//