Bernhard Fischer
[rrdtool.git] / src / rrd_open.c
index c29741c..7812da1 100644 (file)
 #include "unused.h"
 #define MEMBLK 8192
 
-/* open a database file, return its header and a open filehandle */
-/* positioned to the first cdp in the first rra */
+/* DEBUG 2 prints information obtained via mincore(2) */
+// #define DEBUG 2
+/* do not calculate exact madvise hints but assume 1 page for headers and
+ * set DONTNEED for the rest, which is assumed to be data */
+//#define ONE_PAGE 1
+/* Avoid calling madvise on areas that were already hinted. May be benefical if
+ * your syscalls are very slow */
+#define CHECK_MADVISE_OVERLAPS 1
 
-rrd_file_t*
-rrd_open(const char * const file_name, rrd_t *rrd, unsigned rdwr)
+#ifdef HAVE_MMAP
+/* the cast to void* is there to avoid this warning seen on ia64 with certain
+   versions of gcc: 'cast increases required alignment of target type'
+*/
+#define __rrd_read(dst, dst_t, cnt) \
+       (dst) = (dst_t*)(void*) (data + offset); \
+       offset += sizeof(dst_t) * (cnt)
+#else
+#define __rrd_read(dst, dst_t, cnt) \
+       if ((dst = malloc(sizeof(dst_t)*(cnt))) == NULL) { \
+               rrd_set_error(#dst " malloc"); \
+               goto out_nullify_head; \
+       } \
+       offset += read (rrd_file->fd, dst, sizeof(dst_t)*(cnt))
+#endif
+
+/* next page-aligned (i.e. page-align up) */
+#ifndef PAGE_ALIGN
+#define PAGE_ALIGN(addr) (((addr)+_page_size-1)&(~(_page_size-1)))
+#endif
+/* previous page-aligned (i.e. page-align down) */
+#ifndef PAGE_ALIGN_DOWN
+#define PAGE_ALIGN_DOWN(addr) (((addr)+_page_size-1)&(~(_page_size-1)))
+#endif
+
+#ifdef HAVE_MMAP
+/* vector of last madvise hint */
+typedef struct _madvise_vec_t {
+    void     *start;
+    ssize_t   length;
+} _madvise_vec_t;
+_madvise_vec_t _madv_vec = { NULL, 0 };
+#endif
+
+#if defined CHECK_MADVISE_OVERLAPS
+#define _madvise(_start, _off, _hint) \
+    if ((_start) != _madv_vec.start && (ssize_t)(_off) != _madv_vec.length) { \
+        _madv_vec.start = (_start) ; _madv_vec.length = (_off); \
+        madvise((_start), (_off), (_hint)); \
+    }
+#else
+#define _madvise(_start, _off, _hint) \
+    madvise((_start), (_off), (_hint))
+#endif
+
+/* Open a database file, return its header and an open filehandle,
+ * positioned to the first cdp in the first rra.
+ * In the error path of rrd_open, only rrd_free(&rrd) has to be called
+ * before returning an error. Do not call rrd_close upon failure of rrd_open.
+ */
+
+rrd_file_t *rrd_open(
+    const char *const file_name,
+    rrd_t *rrd,
+    unsigned rdwr)
 {
-       int flags = 0;
-       mode_t mode = S_IRUSR;
-       int version, prot = PROT_READ;
-       off_t offset = 0;
-       char *data;
-       struct stat statb;
-       rrd_file_t *rrd_file = malloc(sizeof(rrd_file_t));
-       if (rrd_file == NULL) {
-               rrd_set_error("allocating rrd_file descriptor for '%s'",
-                       file_name);
-               return NULL;
-       }
-       memset(rrd_file, 0, sizeof(rrd_file_t));
-       rrd_init(rrd);
-       if (rdwr == RRD_READWRITE) {
-               mode |= S_IWUSR;
-               prot |= PROT_WRITE;
-       } else if (rdwr == RRD_CREAT) {
-               mode |= S_IWUSR;
-               prot |= PROT_WRITE;
-               flags |= (O_CREAT|O_TRUNC);
-       }
-#ifdef O_NONBLOCK
-       flags |= O_NONBLOCK;
+    int       flags = 0;
+    mode_t    mode = S_IRUSR;
+    int       version;
+
+#ifdef HAVE_MMAP
+    ssize_t   _page_size = sysconf(_SC_PAGESIZE);
+    int       mm_prot = PROT_READ, mm_flags = 0;
+    char     *data;
 #endif
+    off_t     offset = 0;
+    struct stat statb;
+    rrd_file_t *rrd_file = NULL;
+    off_t     newfile_size = 0;
 
-       if ((rrd_file->fd = open(file_name, flags, mode)) < 0 ){
-               rrd_set_error("opening '%s': %s",file_name, rrd_strerror(errno));
-               return NULL;
-       }
+    if (rdwr & RRD_CREAT)
+        newfile_size = (off_t) rrd->stat_head;
+    rrd_init(rrd);
+    rrd_file = malloc(sizeof(rrd_file_t));
+    if (rrd_file == NULL) {
+        rrd_set_error("allocating rrd_file descriptor for '%s'", file_name);
+        return NULL;
+    }
+    memset(rrd_file, 0, sizeof(rrd_file_t));
+
+#ifdef DEBUG
+    if ((rdwr & (RRD_READONLY | RRD_READWRITE)) ==
+        (RRD_READONLY | RRD_READWRITE)) {
+        /* Both READONLY and READWRITE were given, which is invalid.  */
+        rrd_set_error("in read/write request mask");
+        exit(-1);
+    }
+#endif
+    if (rdwr & RRD_READONLY) {
+        flags |= O_RDONLY;
+#ifdef HAVE_MMAP
+        mm_flags = MAP_PRIVATE;
+# ifdef MAP_NORESERVE
+        mm_flags |= MAP_NORESERVE;  /* readonly, so no swap backing needed */
+# endif
+#endif
+    } else {
+        if (rdwr & RRD_READWRITE) {
+            mode |= S_IWUSR;
+            flags |= O_RDWR;
+#ifdef HAVE_MMAP
+            mm_flags = MAP_SHARED;
+            mm_prot |= PROT_WRITE;
+#endif
+        }
+        if (rdwr & RRD_CREAT) {
+            flags |= (O_CREAT | O_TRUNC);
+        }
+    }
+    if (rdwr & RRD_READAHEAD) {
+#ifdef MAP_POPULATE
+        mm_flags |= MAP_POPULATE;   /* populate ptes and data */
+#endif
+#if defined MAP_NONBLOCK
+//  if (!(rdwr & RRD_COPY))
+        mm_flags |= MAP_NONBLOCK;   /* just populate ptes */
+#endif
+#ifdef USE_DIRECT_IO
+    } else {
+        flags |= O_DIRECT;
+#endif
+    }
+#ifdef O_NONBLOCK
+    flags |= O_NONBLOCK;
+#endif
 
-       /* ???: length = lseek(rrd_file->fd, 0, SEEK_END); */
-       /* ??? locking the whole area of the file may overdo it a bit, does it? */
-       if ((fstat(rrd_file->fd, &statb)) < 0) {
-               rrd_set_error("fstat '%s': %s",file_name, rrd_strerror(errno));
-               goto out_close;
-       }
-       rrd_file->file_len = statb.st_size;
+    if ((rrd_file->fd = open(file_name, flags, mode)) < 0) {
+        rrd_set_error("opening '%s': %s", file_name, rrd_strerror(errno));
+        goto out_free;
+    }
 
+    /* Better try to avoid seeks as much as possible. stat may be heavy but
+     * many concurrent seeks are even worse.  */
+    if (newfile_size == 0 && ((fstat(rrd_file->fd, &statb)) < 0)) {
+        rrd_set_error("fstat '%s': %s", file_name, rrd_strerror(errno));
+        goto out_close;
+    }
+    if (newfile_size == 0) {
+        rrd_file->file_len = statb.st_size;
+    } else {
+        rrd_file->file_len = newfile_size;
+        lseek(rrd_file->fd, newfile_size - 1, SEEK_SET);
+        write(rrd_file->fd, "\0", 1);  /* poke */
+        lseek(rrd_file->fd, 0, SEEK_SET);
+    }
 #ifdef HAVE_POSIX_FADVISE
     /* In general we need no read-ahead when dealing with rrd_files.
        When we stop reading, it is highly unlikely that we start up again.
        In this manner we actually save time and diskaccess (and buffer cache).
        Thanks to Dave Plonka for the Idea of using POSIX_FADV_RANDOM here. */
     if (0 != posix_fadvise(rrd_file->fd, 0, 0, POSIX_FADV_RANDOM)) {
-        rrd_set_error("setting POSIX_FADV_RANDOM on '%s': %s",file_name, rrd_strerror(errno));
+        rrd_set_error("setting POSIX_FADV_RANDOM on '%s': %s", file_name,
+                      rrd_strerror(errno));
         goto out_close;
-     }
+    }
 #endif
 
 /*
-        if (rdwr == RRD_READWRITE)
+        if (rdwr & RRD_READWRITE)
         {
            if (setvbuf((rrd_file->fd),NULL,_IONBF,2)) {
                   rrd_set_error("failed to disable the stream buffer\n");
@@ -131,187 +241,312 @@ rrd_open(const char * const file_name, rrd_t *rrd, unsigned rdwr)
            }
         }
 */
-       data = mmap(0, rrd_file->file_len, prot, MAP_SHARED,
-               rrd_file->fd, offset);
-
-       /* lets see if the first read worked */
-       if (data == MAP_FAILED) {
-               rrd_set_error("error mmaping file '%s'",file_name);
-               goto out_close;
-       }
-       rrd_file->file_start = data;
-#ifdef USE_MADVISE
-       if (rrd == NULL) { /*XXX: currently not used! */
-               /* We will read everything in a moment (copying) */
-               madvise(data, rrd_file->file_len, MADV_WILLNEED|MADV_SEQUENTIAL);
-               goto out_done;
-       }
-       /* We do not need to read anything in for the moment */
-       madvise(data, rrd_file->file_len, MADV_DONTNEED);
-#endif
+#ifdef HAVE_MMAP
+    data = mmap(0, rrd_file->file_len, mm_prot, mm_flags,
+                rrd_file->fd, offset);
 
-#ifdef USE_MADVISE
-       /* the stat_head will be needed soonish, so hint accordingly */
-       madvise(data+offset, sizeof(stat_head_t), MADV_WILLNEED);
+    /* lets see if the first read worked */
+    if (data == MAP_FAILED) {
+        rrd_set_error("mmaping file '%s': %s", file_name,
+                      rrd_strerror(errno));
+        goto out_close;
+    }
+    rrd_file->file_start = data;
+    if (rdwr & RRD_CREAT) {
+        goto out_done;
+    }
 #endif
+#ifdef USE_MADVISE
+    if (rdwr & RRD_COPY) {
+        /* We will read everything in a moment (copying) */
+        _madvise(data, rrd_file->file_len, MADV_WILLNEED | MADV_SEQUENTIAL);
+    } else {
+# ifndef ONE_PAGE
+        /* We do not need to read anything in for the moment */
+        _madvise(data, rrd_file->file_len, MADV_DONTNEED);
+        /* the stat_head will be needed soonish, so hint accordingly */
+        _madvise(data + PAGE_ALIGN_DOWN(offset),
+                 PAGE_ALIGN(sizeof(stat_head_t)),
+                 MADV_WILLNEED | MADV_RANDOM);
 
-       rrd->stat_head = (stat_head_t*)(data + offset);
-       offset += sizeof(stat_head_t);
+# else
+/* alternatively: keep 1 page worth of data, likely headers,
+ * don't need the rest.  */
+        _madvise(data, _page_size, MADV_WILLNEED | MADV_SEQUENTIAL);
+        _madvise(data + _page_size, (rrd_file->file_len >= _page_size)
+                 ? rrd_file->file_len - _page_size : 0, MADV_DONTNEED);
+# endif
+    }
+#endif
 
-        /* lets do some test if we are on track ... */
-       if (memcmp(rrd->stat_head->cookie,RRD_COOKIE,sizeof(RRD_COOKIE)) != 0) {
-               rrd_set_error("'%s' is not an RRD file",file_name);
-               goto out_nullify_head;
-       }
+    __rrd_read(rrd->stat_head, stat_head_t,
+               1);
 
-       if (rrd->stat_head->float_cookie != FLOAT_COOKIE){
-               rrd_set_error("This RRD was created on other architecture");
-               goto out_nullify_head;
-       }
+    /* lets do some test if we are on track ... */
+    if (memcmp(rrd->stat_head->cookie, RRD_COOKIE, sizeof(RRD_COOKIE)) != 0) {
+        rrd_set_error("'%s' is not an RRD file", file_name);
+        goto out_nullify_head;
+    }
 
-       version = atoi(rrd->stat_head->version);
+    if (rrd->stat_head->float_cookie != FLOAT_COOKIE) {
+        rrd_set_error("This RRD was created on another architecture");
+        goto out_nullify_head;
+    }
 
-       if (version > atoi(RRD_VERSION)) {
-            rrd_set_error("can't handle RRD file version %s",
-                        rrd->stat_head->version);
-            goto out_nullify_head;
-       }
+    version = atoi(rrd->stat_head->version);
 
-#ifdef USE_MADVISE
-       /* the ds_def will be needed soonish, so hint accordingly */
-       madvise(data+offset, sizeof(ds_def_t)*rrd->stat_head->ds_cnt, MADV_WILLNEED);
+    if (version > atoi(RRD_VERSION)) {
+        rrd_set_error("can't handle RRD file version %s",
+                      rrd->stat_head->version);
+        goto out_nullify_head;
+    }
+#if defined USE_MADVISE && !defined ONE_PAGE
+    /* the ds_def will be needed soonish, so hint accordingly */
+    _madvise(data + PAGE_ALIGN_DOWN(offset),
+             PAGE_ALIGN(sizeof(ds_def_t) * rrd->stat_head->ds_cnt),
+             MADV_WILLNEED);
 #endif
-       rrd->ds_def = (ds_def_t*)(data + offset);
-       offset += sizeof(ds_def_t) * rrd->stat_head->ds_cnt;
+    __rrd_read(rrd->ds_def, ds_def_t,
+               rrd->stat_head->ds_cnt);
 
-#ifdef USE_MADVISE
-       /* the rra_def will be needed soonish, so hint accordingly */
-       madvise(data+offset, sizeof(rra_def_t)*rrd->stat_head->rra_cnt, MADV_WILLNEED);
+#if defined USE_MADVISE && !defined ONE_PAGE
+    /* the rra_def will be needed soonish, so hint accordingly */
+    _madvise(data + PAGE_ALIGN_DOWN(offset),
+             PAGE_ALIGN(sizeof(rra_def_t) * rrd->stat_head->rra_cnt),
+             MADV_WILLNEED);
 #endif
-       rrd->rra_def = (rra_def_t*)(data + offset);
-       offset += sizeof(rra_def_t) * rrd->stat_head->rra_cnt;
+    __rrd_read(rrd->rra_def, rra_def_t,
+               rrd->stat_head->rra_cnt);
 
     /* handle different format for the live_head */
-       if (version < 3) {
-            rrd->live_head = (live_head_t *)malloc(sizeof(live_head_t));
-            if (rrd->live_head == NULL) {
-                rrd_set_error("live_head_t malloc");
-                goto out_close;
-            }
-               memmove(&rrd->live_head->last_up, data+offset, sizeof(long));
-               rrd->live_head->last_up_usec = 0;
-       } else {
-#ifdef USE_MADVISE
-               /* the live_head will be needed soonish, so hint accordingly */
-               madvise(data+offset, sizeof(live_head_t), MADV_WILLNEED);
+    if (version < 3) {
+        rrd->live_head = (live_head_t *) malloc(sizeof(live_head_t));
+        if (rrd->live_head == NULL) {
+            rrd_set_error("live_head_t malloc");
+            goto out_close;
+        }
+#ifdef HAVE_MMAP
+        memmove(&rrd->live_head->last_up, data + offset, sizeof(long));
+        offset += sizeof(long);
+#else
+        offset += read(rrd_file->fd, &rrd->live_head->last_up, sizeof(long));
+#endif
+        rrd->live_head->last_up_usec = 0;
+    } else {
+#if defined USE_MADVISE && !defined ONE_PAGE
+        /* the live_head will be needed soonish, so hint accordingly */
+        _madvise(data + PAGE_ALIGN_DOWN(offset),
+                 PAGE_ALIGN(sizeof(live_head_t)), MADV_WILLNEED);
 #endif
-               rrd->live_head = (live_head_t*)(data + offset);
-               offset += sizeof(live_head_t);
-       }
-// This doesn't look like it needs madvise
-       rrd->pdp_prep = (pdp_prep_t*)(data + offset);
-       offset += sizeof(pdp_prep_t) * rrd->stat_head->ds_cnt;
-
-// This could benefit from madvise()ing
-       rrd->cdp_prep = (cdp_prep_t*)(data + offset);
-       offset += sizeof(cdp_prep_t) *
-                               (rrd->stat_head->rra_cnt * rrd->stat_head->ds_cnt);
-
-// This could benefit from madvise()ing
-       rrd->rra_ptr = (rra_ptr_t*)(data + offset);
-       offset += sizeof(rra_ptr_t) * rrd->stat_head->rra_cnt;
+        __rrd_read(rrd->live_head, live_head_t,
+                   1);
+    }
+//XXX: This doesn't look like it needs madvise
+    __rrd_read(rrd->pdp_prep, pdp_prep_t,
+               rrd->stat_head->ds_cnt);
+
+//XXX: This could benefit from madvise()ing
+    __rrd_read(rrd->cdp_prep, cdp_prep_t,
+               rrd->stat_head->rra_cnt * rrd->stat_head->ds_cnt);
+
+//XXX: This could benefit from madvise()ing
+    __rrd_read(rrd->rra_ptr, rra_ptr_t,
+               rrd->stat_head->rra_cnt);
+
+    rrd_file->header_len = offset;
+    rrd_file->pos = offset;
 #ifdef USE_MADVISE
-out_done:
+  out_done:
 #endif
-       rrd_file->header_len = offset;
-       rrd_file->pos = offset;
-/* we could close(rrd_file->fd); here, the mapping is still valid anyway */
-       return (rrd_file);
-out_nullify_head:
-       rrd->stat_head = NULL;
-out_close:
-       close(rrd_file->fd);
-       return NULL;
+    return (rrd_file);
+  out_nullify_head:
+    rrd->stat_head = NULL;
+  out_close:
+    close(rrd_file->fd);
+  out_free:
+    free(rrd_file);
+    return NULL;
 }
 
+
 /* Close a reference to an rrd_file.  */
-int rrd_close(rrd_file_t* rrd_file) {
-       int ret = 0;
+
+int rrd_close(
+    rrd_file_t *rrd_file)
+{
+    int       ret;
+
+#if defined HAVE_MMAP || defined DEBUG
+    ssize_t   _page_size = sysconf(_SC_PAGESIZE);
+#endif
+#if defined DEBUG && DEBUG > 1
+    /* pretty print blocks in core */
+    off_t     off;
+    unsigned char *vec;
+
+    off = rrd_file->file_len +
+        ((rrd_file->file_len + _page_size - 1) / _page_size);
+    vec = malloc(off);
+    if (vec != NULL) {
+        memset(vec, 0, off);
+        if (mincore(rrd_file->file_start, rrd_file->file_len, vec) == 0) {
+            int       prev;
+            unsigned  is_in = 0, was_in = 0;
+
+            for (off = 0, prev = 0; off < rrd_file->file_len; ++off) {
+                is_in = vec[off] & 1;   /* if lsb set then is core resident */
+                if (off == 0)
+                    was_in = is_in;
+                if (was_in != is_in) {
+                    fprintf(stderr, "%sin core: %p len %ld\n",
+                            was_in ? "" : "not ", vec + prev, off - prev);
+                    was_in = is_in;
+                    prev = off;
+                }
+            }
+            fprintf(stderr,
+                    "%sin core: %p len %ld\n",
+                    was_in ? "" : "not ", vec + prev, off - prev);
+        } else
+            fprintf(stderr, "mincore: %s", rrd_strerror(errno));
+    }
+#endif                          /* DEBUG */
+
+#ifdef USE_MADVISE
+# ifdef ONE_PAGE
+    /* Keep headers around, round up to next page boundary.  */
+    ret =
+        PAGE_ALIGN(rrd_file->header_len % _page_size + rrd_file->header_len);
+    if (rrd_file->file_len > ret)
+        _madvise(rrd_file->file_start + ret,
+                 rrd_file->file_len - ret, MADV_DONTNEED);
+# else
+    /* ignoring errors from RRDs that are smaller then the file_len+rounding */
+    _madvise(rrd_file->file_start + PAGE_ALIGN_DOWN(rrd_file->header_len),
+             rrd_file->file_len - PAGE_ALIGN(rrd_file->header_len),
+             MADV_DONTNEED);
+# endif
+#endif
 #ifdef HAVE_MMAP
-       ret = munmap(rrd_file->file_start, rrd_file->file_len);
-//     if (ret != 0)
-//             rrd_set_error("munmap rrd_file");
+    ret = munmap(rrd_file->file_start, rrd_file->file_len);
+    if (ret != 0)
+        rrd_set_error("munmap rrd_file: %s", rrd_strerror(errno));
 #endif
-       free(rrd_file);
-       rrd_file = NULL;
-       return ret;
+    ret = close(rrd_file->fd);
+    if (ret != 0)
+        rrd_set_error("closing file: %s", rrd_strerror(errno));
+    free(rrd_file);
+    rrd_file = NULL;
+    return ret;
 }
 
+
 /* Set position of rrd_file.  */
-off_t rrd_seek(rrd_file_t* rrd_file, off_t off, int whence) {
-       off_t ret = 0;
+
+off_t rrd_seek(
+    rrd_file_t *rrd_file,
+    off_t off,
+    int whence)
+{
+    off_t     ret = 0;
+
 #ifdef HAVE_MMAP
-       if (whence == SEEK_SET)
-               rrd_file->pos = off;
-       else if (whence == SEEK_CUR)
-               rrd_file->pos += off;
-       else if (whence == SEEK_END)
-               rrd_file->pos = rrd_file->file_len + off;
+    if (whence == SEEK_SET)
+        rrd_file->pos = off;
+    else if (whence == SEEK_CUR)
+        rrd_file->pos += off;
+    else if (whence == SEEK_END)
+        rrd_file->pos = rrd_file->file_len + off;
 #else
-       ret = lseek(rrd_file->fd, off, whence);
-       if (ret < 0)
-               rrd_set_error("lseek: %s", rrd_strerror(errno));
-       rrd_file->pos = ret;
+    ret = lseek(rrd_file->fd, off, whence);
+    if (ret < 0)
+        rrd_set_error("lseek: %s", rrd_strerror(errno));
+    rrd_file->pos = ret;
 #endif
 //XXX: mimic fseek, which returns 0 upon success
-       return ret == -1; //XXX: or just ret to mimic lseek
+    return ret == -1;   //XXX: or just ret to mimic lseek
 }
 
+
 /* Get current position in rrd_file.  */
-off_t rrd_tell(rrd_file_t* rrd_file) {
-       return rrd_file->pos;
+
+inline off_t rrd_tell(
+    rrd_file_t *rrd_file)
+{
+    return rrd_file->pos;
 }
 
+
 /* read count bytes into buffer buf, starting at rrd_file->pos.
- * Returns the number of bytes read.  */
-ssize_t rrd_read(rrd_file_t* rrd_file, void*buf, size_t count) {
+ * Returns the number of bytes read or <0 on error.  */
+
+inline ssize_t rrd_read(
+    rrd_file_t *rrd_file,
+    void *buf,
+    size_t count)
+{
 #ifdef HAVE_MMAP
-       char* pos = rrd_file->file_start + rrd_file->pos;
-       buf = memmove(buf, pos, count);
-       return count;
+    size_t _cnt = count;
+    ssize_t _surplus = rrd_file->pos + _cnt - rrd_file->file_len;
+    if (_surplus > 0) { /* short read */
+        _cnt -= _surplus;
+    }
+    if (_cnt == 0)
+        return 0; /* EOF */
+    buf = memcpy(buf, rrd_file->file_start + rrd_file->pos, _cnt);
+
+    rrd_file->pos += _cnt; /* mimmic read() semantics */
+    return _cnt;
 #else
-       ssize_t ret;
-       ret = read(rrd_file->fd, buf, count);
-       //XXX: eventually add generic rrd_set_error(""); here
-       return ret;
+    ssize_t   ret;
+
+    ret = read(rrd_file->fd, buf, count);
+    if (ret > 0)
+        rrd_file->pos += ret; /* mimmic read() semantics */
+    return ret;
 #endif
 }
 
+
 /* write count bytes from buffer buf to the current position
- * rrd_file->pos of rrd_file->fd.  */
-ssize_t rrd_write(rrd_file_t * rrd_file, const void*buf, size_t count) {
-       ssize_t ret = count;
+ * rrd_file->pos of rrd_file->fd.
+ * Returns the number of bytes written.  */
+
+inline ssize_t rrd_write(
+    rrd_file_t *rrd_file,
+    const void *buf,
+    size_t count)
+{
 #ifdef HAVE_MMAP
-       char *off, *new_pos;
-       off = rrd_file->file_start + rrd_file->pos;
-       new_pos = memmove(rrd_file->file_start + rrd_file->pos, buf, count);
-       ret = new_pos - off;
+    memcpy(rrd_file->file_start + rrd_file->pos, buf, count);
+    rrd_file->pos += count;
+    return count;       /* mimmic write() semantics */
 #else
-       ret = write(rrd_file->fd, buf, count)
+    ssize_t   _sz = write(rrd_file->fd, buf, count);
+
+    if (_sz > 0)
+        rrd_file->pos += _sz;
+    return _sz;
 #endif
-       return ret;
 }
 
+
 /* flush all data pending to be written to FD.  */
-void rrd_flush(rrd_file_t* rrd_file)
+
+inline void rrd_flush(
+    rrd_file_t *rrd_file)
 {
-       if (fdatasync(rrd_file->fd) != 0) {
-               rrd_set_error("flushing fd %d: %s", rrd_file->fd,
-                       rrd_strerror(errno));
-       }
+    if (fdatasync(rrd_file->fd) != 0) {
+        rrd_set_error("flushing fd %d: %s", rrd_file->fd,
+                      rrd_strerror(errno));
+    }
 }
 
-void rrd_init(rrd_t *rrd)
+
+/* Initialize RRD header.  */
+
+void rrd_init(
+    rrd_t *rrd)
 {
     rrd->stat_head = NULL;
     rrd->ds_def = NULL;
@@ -323,11 +558,20 @@ void rrd_init(rrd_t *rrd)
     rrd->rrd_value = NULL;
 }
 
-void rrd_free(rrd_t UNUSED(*rrd))
+
+/* free RRD header data.  */
+
+#ifdef HAVE_MMAP
+inline void rrd_free(
+    rrd_t UNUSED(*rrd))
+{
+}
+#else
+void rrd_free(
+    rrd_t *rrd)
 {
-#ifndef HAVE_MMAP
     if (atoi(rrd->stat_head->version) < 3)
-           free(rrd->live_head);
+        free(rrd->live_head);
     free(rrd->stat_head);
     free(rrd->ds_def);
     free(rrd->rra_def);
@@ -335,55 +579,76 @@ void rrd_free(rrd_t UNUSED(*rrd))
     free(rrd->pdp_prep);
     free(rrd->cdp_prep);
     free(rrd->rrd_value);
-#endif
 }
+#endif
+
 
 /* routine used by external libraries to free memory allocated by
  * rrd library */
-void rrd_freemem(void *mem)
+
+void rrd_freemem(
+    void *mem)
 {
-       free(mem);
+    free(mem);
 }
 
-int readfile(const char *file_name, char **buffer, int skipfirst){
-    long writecnt=0,totalcnt = MEMBLK;
-     long offset = 0;
-    FILE *input=NULL;
-    char c ;
-    if ((strcmp("-",file_name) == 0)) { input = stdin; }
-    else {
-      if ((input = fopen(file_name,"rb")) == NULL ){
-        rrd_set_error("opening '%s': %s",file_name,rrd_strerror(errno));
-        return (-1);
-      }
+
+/* XXX: FIXME: missing documentation.  */
+/*XXX: FIXME should be renamed to rrd_readfile or _rrd_readfile */
+
+int /*_rrd_*/ readfile(
+    const char *file_name,
+    char **buffer,
+    int skipfirst)
+{
+    long      writecnt = 0, totalcnt = MEMBLK;
+    long      offset = 0;
+    FILE     *input = NULL;
+    char      c;
+
+    if ((strcmp("-", file_name) == 0)) {
+        input = stdin;
+    } else {
+        if ((input = fopen(file_name, "rb")) == NULL) {
+            rrd_set_error("opening '%s': %s", file_name, rrd_strerror(errno));
+            return (-1);
+        }
     }
-    if (skipfirst){
-      do { c = getc(input); offset++; } while (c != '\n' && ! feof(input));
+    if (skipfirst) {
+        do {
+            c = getc(input);
+            offset++;
+        } while (c != '\n' && !feof(input));
     }
-    if (strcmp("-",file_name)) {
-      fseek(input, 0, SEEK_END);
-      /* have extra space for detecting EOF without realloc */
-      totalcnt = (ftell(input) + 1) / sizeof(char) - offset;
-      if (totalcnt < MEMBLK)
-        totalcnt = MEMBLK; /* sanitize */
-      fseek(input, offset * sizeof(char), SEEK_SET);
+    if (strcmp("-", file_name)) {
+        fseek(input, 0, SEEK_END);
+        /* have extra space for detecting EOF without realloc */
+        totalcnt = (ftell(input) + 1) / sizeof(char) - offset;
+        if (totalcnt < MEMBLK)
+            totalcnt = MEMBLK;  /* sanitize */
+        fseek(input, offset * sizeof(char), SEEK_SET);
     }
-    if (((*buffer) = (char *) malloc((totalcnt+4) * sizeof(char))) == NULL) {
+    if (((*buffer) = (char *) malloc((totalcnt + 4) * sizeof(char))) == NULL) {
         perror("Allocate Buffer:");
         exit(1);
     };
-    do{
-      writecnt += fread((*buffer)+writecnt, 1, (totalcnt - writecnt) * sizeof(char),input);
-      if (writecnt >= totalcnt){
-        totalcnt += MEMBLK;
-        if (((*buffer)=rrd_realloc((*buffer), (totalcnt+4) * sizeof(char)))==NULL){
-            perror("Realloc Buffer:");
-            exit(1);
-        };
-      }
-    } while (! feof(input));
+    do {
+        writecnt +=
+            fread((*buffer) + writecnt, 1,
+                  (totalcnt - writecnt) * sizeof(char), input);
+        if (writecnt >= totalcnt) {
+            totalcnt += MEMBLK;
+            if (((*buffer) =
+                 rrd_realloc((*buffer),
+                             (totalcnt + 4) * sizeof(char))) == NULL) {
+                perror("Realloc Buffer:");
+                exit(1);
+            };
+        }
+    } while (!feof(input));
     (*buffer)[writecnt] = '\0';
-    if (strcmp("-",file_name) != 0) {fclose(input);};
+    if (strcmp("-", file_name) != 0) {
+        fclose(input);
+    };
     return writecnt;
 }
-