vst instructions are modeled as this:
authorEvan Cheng <evan.cheng@apple.com>
Wed, 12 May 2010 01:42:50 +0000 (01:42 +0000)
committerEvan Cheng <evan.cheng@apple.com>
Wed, 12 May 2010 01:42:50 +0000 (01:42 +0000)
commit5bdc2aa264b38a4632cf1e4fef1f328b464147a5
treeaa03391aabf4e8bb4a9d504f73f8b0424f42e23b
parent736f89b1c15410f1b77db820ad8353fb4b0dda19
vst instructions are modeled as this:
v1024 = REG_SEQUENCE ...
v1025 = EXTRACT_SUBREG v1024, 5
v1026 = EXTRACR_SUBREG v1024, 6
      = VSTxx <addr>, v1025, v1026

The REG_SEQUENCE ensures the sources that feed into the VST instruction
are getting the right register allocation so they form a large super-
register. The extract_subreg will be coalesced away all would just work:
v1024 = REG_SEQUENCE ...
      = VSTxx <addr>, v1024:5, v1024:6

The problem is if the coalescer isn't run, the extract_subreg instructions
would stick around and there is no assurance v1025 and v1026 will get the
right registers.

As a short term workaround, teach the NEON pre-allocation pass to transfer
the sub-register indices over. An alternative would be do it 2addr pass
when reg_sequence's are eliminated. But that *seems* wrong and require
updating liveness information.

Another alternative is to do this in the scheduler when the instructions are
created. But that would mean somehow the scheduler this has to be done for
correctness reason. That's yucky as well. So for now, we are leaving this
in the target specific pass.

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@103540 91177308-0d34-0410-b5e6-96231b3b80d8
lib/Target/ARM/NEONPreAllocPass.cpp