Port Folly to PPC64
[folly.git] / folly / detail / MemoryIdler.cpp
1 /*
2  * Copyright 2015 Facebook, Inc.
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  *
8  *   http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 #include <folly/detail/MemoryIdler.h>
18 #include <folly/Logging.h>
19 #include <folly/Malloc.h>
20 #include <folly/ScopeGuard.h>
21 #include <folly/detail/CacheLocality.h>
22 #include <limits.h>
23 #include <pthread.h>
24 #include <stdio.h>
25 #include <string.h>
26 #include <unistd.h>
27 #include <sys/mman.h>
28 #include <utility>
29
30
31 namespace folly { namespace detail {
32
33 AtomicStruct<std::chrono::steady_clock::duration>
34 MemoryIdler::defaultIdleTimeout(std::chrono::seconds(5));
35
36
37 // Calls mallctl, optionally reading a value of type <T> if out is
38 // non-null.  Logs on error.
39 template <typename T>
40 static int mallctlRead(const char* cmd, T* out) {
41   size_t outLen = sizeof(T);
42   int err = mallctl(cmd,
43                     out, out ? &outLen : nullptr,
44                     nullptr, 0);
45   if (err != 0) {
46     FB_LOG_EVERY_MS(WARNING, 10000)
47       << "mallctl " << cmd << ": " << strerror(err) << " (" << err << ")";
48   }
49   return err;
50 }
51
52 static int mallctlCall(const char* cmd) {
53   // Use <unsigned> rather than <void> to avoid sizeof(void).
54   return mallctlRead<unsigned>(cmd, nullptr);
55 }
56
57 void MemoryIdler::flushLocalMallocCaches() {
58   if (usingJEMalloc()) {
59     if (!mallctl || !mallctlnametomib || !mallctlbymib) {
60       FB_LOG_EVERY_MS(ERROR, 10000) << "mallctl* weak link failed";
61       return;
62     }
63
64     // "tcache.flush" was renamed to "thread.tcache.flush" in jemalloc 3
65     mallctlCall("thread.tcache.flush");
66
67     // By default jemalloc has 4 arenas per cpu, and then assigns each
68     // thread to one of those arenas.  This means that in any service
69     // that doesn't perform a lot of context switching, the chances that
70     // another thread will be using the current thread's arena (and hence
71     // doing the appropriate dirty-page purging) are low.  Some good
72     // tuned configurations (such as that used by hhvm) use fewer arenas
73     // and then pin threads to avoid contended access.  In that case,
74     // purging the arenas is counter-productive.  We use the heuristic
75     // that if narenas <= 2 * num_cpus then we shouldn't do anything here,
76     // which detects when the narenas has been reduced from the default
77     size_t narenas;
78     unsigned arenaForCurrent;
79     size_t mib[3];
80     size_t miblen = 3;
81     if (mallctlRead<size_t>("opt.narenas", &narenas) == 0 &&
82         narenas > 2 * CacheLocality::system().numCpus &&
83         mallctlRead<unsigned>("thread.arena", &arenaForCurrent) == 0 &&
84         mallctlnametomib("arena.0.purge", mib, &miblen) == 0) {
85       mib[1] = size_t(arenaForCurrent);
86       mallctlbymib(mib, miblen, nullptr, nullptr, nullptr, 0);
87     }
88   }
89 }
90
91
92 // Stack madvise isn't Linux or glibc specific, but the system calls
93 // and arithmetic (and bug compatibility) are not portable.  The set of
94 // platforms could be increased if it was useful.
95 #if (FOLLY_X64 || FOLLY_PPC64 ) && defined(_GNU_SOURCE) && defined(__linux__)
96
97 static const size_t s_pageSize = sysconf(_SC_PAGESIZE);
98 static FOLLY_TLS uintptr_t tls_stackLimit;
99 static FOLLY_TLS size_t tls_stackSize;
100
101 static void fetchStackLimits() {
102   pthread_attr_t attr;
103   pthread_getattr_np(pthread_self(), &attr);
104   SCOPE_EXIT { pthread_attr_destroy(&attr); };
105
106   void* addr;
107   size_t rawSize;
108   int err;
109   if ((err = pthread_attr_getstack(&attr, &addr, &rawSize))) {
110     // unexpected, but it is better to continue in prod than do nothing
111     FB_LOG_EVERY_MS(ERROR, 10000) << "pthread_attr_getstack error " << err;
112     assert(false);
113     tls_stackSize = 1;
114     return;
115   }
116   assert(addr != nullptr);
117   assert(rawSize >= PTHREAD_STACK_MIN);
118
119   // glibc subtracts guard page from stack size, even though pthread docs
120   // seem to imply the opposite
121   size_t guardSize;
122   if (pthread_attr_getguardsize(&attr, &guardSize) != 0) {
123     guardSize = 0;
124   }
125   assert(rawSize > guardSize);
126
127   // stack goes down, so guard page adds to the base addr
128   tls_stackLimit = uintptr_t(addr) + guardSize;
129   tls_stackSize = rawSize - guardSize;
130
131   assert((tls_stackLimit & (s_pageSize - 1)) == 0);
132 }
133
134 FOLLY_NOINLINE static uintptr_t getStackPtr() {
135   char marker;
136   auto rv = uintptr_t(&marker);
137   return rv;
138 }
139
140 void MemoryIdler::unmapUnusedStack(size_t retain) {
141   if (tls_stackSize == 0) {
142     fetchStackLimits();
143   }
144   if (tls_stackSize <= std::max(size_t(1), retain)) {
145     // covers both missing stack info, and impossibly large retain
146     return;
147   }
148
149   auto sp = getStackPtr();
150   assert(sp >= tls_stackLimit);
151   assert(sp - tls_stackLimit < tls_stackSize);
152
153   auto end = (sp - retain) & ~(s_pageSize - 1);
154   if (end <= tls_stackLimit) {
155     // no pages are eligible for unmapping
156     return;
157   }
158
159   size_t len = end - tls_stackLimit;
160   assert((len & (s_pageSize - 1)) == 0);
161   if (madvise((void*)tls_stackLimit, len, MADV_DONTNEED) != 0) {
162     // It is likely that the stack vma hasn't been fully grown.  In this
163     // case madvise will apply dontneed to the present vmas, then return
164     // errno of ENOMEM.  We can also get an EAGAIN, theoretically.
165     // EINVAL means either an invalid alignment or length, or that some
166     // of the pages are locked or shared.  Neither should occur.
167     assert(errno == EAGAIN || errno == ENOMEM);
168   }
169 }
170
171 #else
172
173 void MemoryIdler::unmapUnusedStack(size_t retain) {
174 }
175
176 #endif
177
178 }}