* progress in moving all the fileaccess over to a wrapper system that can do fd based...
[rrdtool.git] / src / rrd_fetch.c
1 /*****************************************************************************
2  * RRDtool 1.2.23  Copyright by Tobi Oetiker, 1997-2007
3  *****************************************************************************
4  * rrd_fetch.c  read date from an rrd to use for further processing
5  *****************************************************************************
6  * $Id$
7  * $Log$
8  * Revision 1.8  2004/05/18 18:53:03  oetiker
9  * big spell checking patch -- slif@bellsouth.net
10  *
11  * Revision 1.7  2003/11/11 19:46:21  oetiker
12  * replaced time_value with rrd_time_value as MacOS X introduced a struct of that name in their standard headers
13  *
14  * Revision 1.6  2003/01/16 23:27:54  oetiker
15  * fix border condition in rra selection of rrd_fetch
16  * -- Stanislav Sinyagin <ssinyagin@yahoo.com>
17  *
18  * Revision 1.5  2002/06/23 22:29:40  alex
19  * Added "step=1800" and such to "DEF"
20  * Cleaned some of the signed vs. unsigned problems
21  *
22  * Revision 1.4  2002/02/01 20:34:49  oetiker
23  * fixed version number and date/time
24  *
25  * Revision 1.3  2001/12/24 06:51:49  alex
26  * A patch of size 44Kbytes... in short:
27  *
28  * Found and repaired the off-by-one error in rrd_fetch_fn().
29  * As a result I had to remove the hacks in rrd_fetch_fn(),
30  * rrd_tool.c, vdef_calc(), data_calc(), data_proc() and
31  * reduce_data().  There may be other places which I didn't
32  * find so be careful.
33  *
34  * Enhanced debugging in rrd_fetch_fn(), it shows the RRA selection
35  * process.
36  *
37  * Added the ability to print VDEF timestamps.  At the moment it
38  * is a hack, I needed it now to fix the off-by-one error.
39  * If the format string is "%c" (and nothing else!), the time
40  * will be printed by both ctime() and as a long int.
41  *
42  * Moved some code around (slightly altering it) from rrd_graph()
43  *   initializing     now in rrd_graph_init()
44  *   options parsing  now in rrd_graph_options()
45  *   script parsing   now in rrd_graph_script()
46  *
47  * Revision 1.2  2001/12/17 12:48:43  oetiker
48  * fix overflow error ...
49  *
50  * Revision 1.1.1.1  2001/02/25 22:25:05  oetiker
51  * checkin
52  *
53  *****************************************************************************/
54
55 #include "rrd_tool.h"
56
57 #include "rrd_is_thread_safe.h"
58 /*#define DEBUG*/
59
60 int
61 rrd_fetch(int argc, 
62           char **argv,
63           time_t         *start,
64           time_t         *end,       /* which time frame do you want ?
65                                       * will be changed to represent reality */
66           unsigned long  *step,      /* which stepsize do you want? 
67                                       * will be changed to represent reality */
68           unsigned long  *ds_cnt,    /* number of data sources in file */
69           char           ***ds_namv,   /* names of data sources */
70           rrd_value_t    **data)     /* two dimensional array containing the data */
71 {
72
73
74     long     step_tmp =1;
75     time_t   start_tmp=0, end_tmp=0;
76     const char *cf;
77
78     struct rrd_time_value start_tv, end_tv;
79     char     *parsetime_error = NULL;
80     optind = 0; opterr = 0;  /* initialize getopt */
81
82     /* init start and end time */
83     parsetime("end-24h", &start_tv);
84     parsetime("now", &end_tv);
85
86     while (1){
87         static struct option long_options[] =
88         {
89             {"resolution",      required_argument, 0, 'r'},
90             {"start",      required_argument, 0, 's'},
91             {"end",      required_argument, 0, 'e'},
92             {0,0,0,0}
93         };
94         int option_index = 0;
95         int opt;
96         opt = getopt_long(argc, argv, "r:s:e:", 
97                           long_options, &option_index);
98
99         if (opt == EOF)
100             break;
101
102         switch(opt) {
103         case 's':
104             if ((parsetime_error = parsetime(optarg, &start_tv))) {
105                 rrd_set_error( "start time: %s", parsetime_error );
106                 return -1;
107             }
108             break;
109         case 'e':
110             if ((parsetime_error = parsetime(optarg, &end_tv))) {
111                 rrd_set_error( "end time: %s", parsetime_error );
112                 return -1;
113             }
114             break;
115         case 'r':
116             step_tmp = atol(optarg);
117             break;
118         case '?':
119             rrd_set_error("unknown option '-%c'",optopt);
120             return(-1);
121         }
122     }
123
124     
125     if (proc_start_end(&start_tv,&end_tv,&start_tmp,&end_tmp) == -1){
126         return -1;
127     }  
128
129     
130     if (start_tmp < 3600*24*365*10){
131         rrd_set_error("the first entry to fetch should be after 1980");
132         return(-1);
133     }
134     
135     if (end_tmp < start_tmp) {
136         rrd_set_error("start (%ld) should be less than end (%ld)", start_tmp, end_tmp);
137         return(-1);
138     }
139     
140     *start = start_tmp;
141     *end = end_tmp;
142
143     if (step_tmp < 1) {
144         rrd_set_error("step must be >= 1 second");
145         return -1;
146     }
147     *step = step_tmp;
148     
149     if (optind + 1 >= argc){
150         rrd_set_error("not enough arguments");
151         return -1;
152     }
153
154     cf = argv[optind+1];
155
156     if (rrd_fetch_r(argv[optind],cf,start,end,step,ds_cnt,ds_namv,data) == -1)
157         return(-1);
158     return (0);
159 }
160
161 int
162 rrd_fetch_r(
163     const char           *filename,  /* name of the rrd */
164     const char           *cf,        /* which consolidation function ?*/
165     time_t         *start,
166     time_t         *end,       /* which time frame do you want ?
167                                 * will be changed to represent reality */
168     unsigned long  *step,      /* which stepsize do you want? 
169                                 * will be changed to represent reality */
170     unsigned long  *ds_cnt,    /* number of data sources in file */
171     char           ***ds_namv, /* names of data_sources */
172     rrd_value_t    **data)     /* two dimensional array containing the data */
173 {
174     enum     cf_en cf_idx;
175
176     if ((int)(cf_idx=cf_conv(cf)) == -1 ){
177         return -1;
178     }
179
180     return (rrd_fetch_fn(filename,cf_idx,start,end,step,ds_cnt,ds_namv,data));
181 }
182
183 int
184 rrd_fetch_fn(
185     const char     *filename,  /* name of the rrd */
186     enum cf_en     cf_idx,         /* which consolidation function ?*/
187     time_t         *start,
188     time_t         *end,       /* which time frame do you want ?
189                                 * will be changed to represent reality */
190     unsigned long  *step,      /* which stepsize do you want? 
191                                 * will be changed to represent reality */
192     unsigned long  *ds_cnt,    /* number of data sources in file */
193     char           ***ds_namv,   /* names of data_sources */
194     rrd_value_t    **data)     /* two dimensional array containing the data */
195 {
196     long           i,ii;
197     time_t         cal_start,cal_end, rra_start_time,rra_end_time;
198     long  best_full_rra=0, best_part_rra=0, chosen_rra=0, rra_pointer=0;
199     long  best_full_step_diff=0, best_part_step_diff=0, tmp_step_diff=0, tmp_match=0, best_match=0;
200     long  full_match, rra_base;
201     long           start_offset, end_offset;
202     int            first_full = 1;
203     int            first_part = 1;
204     rrd_t     rrd;
205     rrd_file_t     *rrd_file;
206     rrd_value_t    *data_ptr;
207     unsigned long  rows;
208 #ifdef HAVE_POSIX_FADVISE
209     long  rrd_head_size;
210 #endif
211
212 #ifdef DEBUG
213 fprintf(stderr,"Entered rrd_fetch_fn() searching for the best match\n");
214 fprintf(stderr,"Looking for: start %10lu end %10lu step %5lu\n",
215                                                 *start,*end,*step);
216 #endif
217
218     rrd_file = rrd_open(filename,&rrd, RRD_READONLY);
219     if (rrd_file == NULL)
220         return(-1);
221
222 #ifdef HAVE_POSIX_FADVISE
223     rrd_head_size = rrd_file->header_len;
224 #endif
225     /* when was the really last update of this file ? */
226
227     if (((*ds_namv) = (char **) malloc(rrd.stat_head->ds_cnt * sizeof(char*)))==NULL){
228         rrd_set_error("malloc fetch ds_namv array");
229         rrd_free(&rrd);
230         close(rrd_file->fd);
231         return(-1);
232     }
233     
234     for(i=0;(unsigned long)i<rrd.stat_head->ds_cnt;i++){
235         if ((((*ds_namv)[i]) = malloc(sizeof(char) * DS_NAM_SIZE))==NULL){
236             rrd_set_error("malloc fetch ds_namv entry");
237             rrd_free(&rrd);
238             free(*ds_namv);
239             close(rrd_file->fd);
240             return(-1);
241         }
242         strncpy((*ds_namv)[i],rrd.ds_def[i].ds_nam,DS_NAM_SIZE-1);
243         (*ds_namv)[i][DS_NAM_SIZE-1]='\0';
244
245     }
246     
247     /* find the rra which best matches the requirements */
248     for(i=0;(unsigned)i<rrd.stat_head->rra_cnt;i++){
249         if(cf_conv(rrd.rra_def[i].cf_nam) == cf_idx){
250             
251             cal_end = (rrd.live_head->last_up - (rrd.live_head->last_up 
252                           % (rrd.rra_def[i].pdp_cnt 
253                              * rrd.stat_head->pdp_step)));
254             cal_start = (cal_end 
255                          - (rrd.rra_def[i].pdp_cnt 
256                             * rrd.rra_def[i].row_cnt
257                             * rrd.stat_head->pdp_step));
258
259             full_match = *end -*start;
260 #ifdef DEBUG
261 fprintf(stderr,"Considering: start %10lu end %10lu step %5lu ",
262                                                         cal_start,cal_end,
263                         rrd.stat_head->pdp_step * rrd.rra_def[i].pdp_cnt);
264 #endif
265             /* we need step difference in either full or partial case */
266             tmp_step_diff = labs(*step - (rrd.stat_head->pdp_step
267                                            * rrd.rra_def[i].pdp_cnt));
268             /* best full match */
269             if(cal_end >= *end 
270                && cal_start <= *start){
271                 if (first_full || (tmp_step_diff < best_full_step_diff)){
272                     first_full=0;
273                     best_full_step_diff = tmp_step_diff;
274                     best_full_rra=i;
275 #ifdef DEBUG
276 fprintf(stderr,"best full match so far\n");
277 #endif
278                 } else {
279 #ifdef DEBUG
280 fprintf(stderr,"full match, not best\n");
281 #endif
282                 }
283                 
284             } else {
285                 /* best partial match */
286                 tmp_match = full_match;
287                 if (cal_start>*start)
288                     tmp_match -= (cal_start-*start);
289                 if (cal_end<*end)
290                     tmp_match -= (*end-cal_end);                
291                 if (first_part ||
292                     (best_match < tmp_match) ||
293                     (best_match == tmp_match && 
294                      tmp_step_diff < best_part_step_diff)){ 
295 #ifdef DEBUG
296 fprintf(stderr,"best partial so far\n");
297 #endif
298                     first_part=0;
299                     best_match = tmp_match;
300                     best_part_step_diff = tmp_step_diff;
301                     best_part_rra =i;
302                 } else {
303 #ifdef DEBUG
304 fprintf(stderr,"partial match, not best\n");
305 #endif
306                 }
307             }
308         }
309     }
310
311     /* lets see how the matching went. */
312     if (first_full==0)
313         chosen_rra = best_full_rra;
314     else if (first_part==0)
315         chosen_rra = best_part_rra;
316     else {
317         rrd_set_error("the RRD does not contain an RRA matching the chosen CF");
318         rrd_free(&rrd);
319         close(rrd_file->fd);
320         return(-1);
321     }
322         
323     /* set the wish parameters to their real values */
324     *step = rrd.stat_head->pdp_step * rrd.rra_def[chosen_rra].pdp_cnt;
325     *start -= (*start % *step);
326     *end += (*step - *end % *step);
327     rows = (*end - *start) / *step + 1;
328
329 #ifdef DEBUG
330     fprintf(stderr,"We found:    start %10lu end %10lu step %5lu rows  %lu\n",
331                                                 *start,*end,*step,rows);
332 #endif
333
334 /* Start and end are now multiples of the step size.  The amount of
335 ** steps we want is (end-start)/step and *not* an extra one.
336 ** Reasoning:  if step is s and we want to graph from t to t+s,
337 ** we need exactly ((t+s)-t)/s rows.  The row to collect from the
338 ** database is the one with time stamp (t+s) which means t to t+s.
339 */
340     *ds_cnt =   rrd.stat_head->ds_cnt; 
341     if (((*data) = malloc(*ds_cnt * rows * sizeof(rrd_value_t)))==NULL){
342         rrd_set_error("malloc fetch data area");
343         for (i=0;(unsigned long)i<*ds_cnt;i++)
344               free((*ds_namv)[i]);
345         free(*ds_namv);
346         rrd_free(&rrd);
347         close(rrd_file->fd);
348         return(-1);
349     }
350     
351     data_ptr=(*data);
352     
353     /* find base address of rra */
354     rra_base = rrd_file->header_len;
355     for(i=0;i<chosen_rra;i++)
356         rra_base += ( *ds_cnt
357                       * rrd.rra_def[i].row_cnt
358                       * sizeof(rrd_value_t));
359
360     /* find start and end offset */
361     rra_end_time = (rrd.live_head->last_up 
362                     - (rrd.live_head->last_up % *step));
363     rra_start_time = (rra_end_time
364                  - ( *step * (rrd.rra_def[chosen_rra].row_cnt-1)));
365     /* here's an error by one if we don't be careful */
366     start_offset =(long)(*start + *step - rra_start_time) / (long)*step;
367     end_offset = (long)(rra_end_time - *end ) / (long)*step; 
368 #ifdef DEBUG
369     fprintf(stderr,"rra_start %lu, rra_end %lu, start_off %li, end_off %li\n",
370             rra_start_time,rra_end_time,start_offset,end_offset);
371 #endif
372
373     /* fill the gap at the start if needs be */
374
375     if (start_offset <= 0)
376         rra_pointer = rrd.rra_ptr[chosen_rra].cur_row+1;
377     else 
378         rra_pointer = rrd.rra_ptr[chosen_rra].cur_row+1+start_offset;
379     
380     if(rrd_seek(rrd_file,(rra_base 
381                    + (rra_pointer
382                       * *ds_cnt
383                       * sizeof(rrd_value_t))),SEEK_SET) != 0){
384         rrd_set_error("seek error in RRA");
385         for (i=0;(unsigned)i<*ds_cnt;i++)
386               free((*ds_namv)[i]);
387         free(*ds_namv);
388         rrd_free(&rrd);
389         free(*data);
390         *data = NULL;
391         close(rrd_file->fd);
392         return(-1);
393
394     }
395 #ifdef DEBUG
396     fprintf(stderr,"First Seek: rra_base %lu rra_pointer %lu\n",
397             rra_base, rra_pointer);
398 #endif
399     /* step trough the array */
400
401     for (i=start_offset;
402          i< (signed)rrd.rra_def[chosen_rra].row_cnt - end_offset;
403          i++){
404         /* no valid data yet */
405         if (i<0) {
406 #ifdef DEBUG
407             fprintf(stderr,"pre fetch %li -- ",i);
408 #endif
409             for(ii=0;(unsigned)ii<*ds_cnt;ii++){
410                 *(data_ptr++) = DNAN;
411 #ifdef DEBUG
412                 fprintf(stderr,"%10.2f ",*(data_ptr-1));
413 #endif
414             }
415         } 
416         /* past the valid data area */
417         else if (i >= (signed)rrd.rra_def[chosen_rra].row_cnt) {
418 #ifdef DEBUG
419             fprintf(stderr,"post fetch %li -- ",i);
420 #endif
421             for(ii=0;(unsigned)ii<*ds_cnt;ii++){
422                 *(data_ptr++) = DNAN;
423 #ifdef DEBUG
424                 fprintf(stderr,"%10.2f ",*(data_ptr-1));
425 #endif
426             }
427         } else {
428             /* OK we are inside the valid area but the pointer has to 
429              * be wrapped*/
430             if (rra_pointer >= (signed)rrd.rra_def[chosen_rra].row_cnt) {
431                 rra_pointer -= rrd.rra_def[chosen_rra].row_cnt;
432                 if(rrd_seek(rrd_file,(rra_base+rra_pointer
433                                * *ds_cnt
434                                * sizeof(rrd_value_t)),SEEK_SET) != 0){
435                     rrd_set_error("wrap seek in RRA did fail");
436                     for (ii=0;(unsigned)ii<*ds_cnt;ii++)
437                         free((*ds_namv)[ii]);
438                     free(*ds_namv);
439                     rrd_free(&rrd);
440                     free(*data);
441                     *data = NULL;
442                     close(rrd_file->fd);
443                     return(-1);
444                 }
445 #ifdef DEBUG
446                 fprintf(stderr,"wrap seek ...\n");
447 #endif
448             }
449
450             if(rrd_read(rrd_file,data_ptr,
451                      sizeof(rrd_value_t)* (*ds_cnt))
452                     != (ssize_t)(sizeof(rrd_value_t)*(*ds_cnt)*rrd.stat_head->ds_cnt)){
453                 rrd_set_error("fetching cdp from rra");
454                 for (ii=0;(unsigned)ii<*ds_cnt;ii++)
455                     free((*ds_namv)[ii]);
456                 free(*ds_namv);
457                 rrd_free(&rrd);
458                 free(*data);
459                 *data = NULL;
460                 close(rrd_file->fd);
461                 return(-1);
462             }
463 #ifdef HAVE_POSIX_FADVISE
464        /* don't pollute the buffer cache with data read from the file. We do this while reading to 
465           keep damage minimal */
466        if (0 != posix_fadvise(rrd_file->fd, rrd_head_size, 0, POSIX_FADV_DONTNEED)) {
467            rrd_set_error("setting POSIX_FADV_DONTNEED on '%s': %s",filename, rrd_strerror(errno));
468            close(rrd_file->fd);
469            return(-1);
470        } 
471 #endif
472
473 #ifdef DEBUG
474             fprintf(stderr,"post fetch %li -- ",i);
475             for(ii=0;ii<*ds_cnt;ii++)
476                 fprintf(stderr,"%10.2f ",*(data_ptr+ii));
477 #endif
478             data_ptr += *ds_cnt;
479             rra_pointer ++;
480         }
481 #ifdef DEBUG
482             fprintf(stderr,"\n");
483 #endif      
484         
485     }
486     rrd_free(&rrd);
487 #ifdef HAVE_POSIX_FADVISE
488     /* and just to be sure we drop everything except the header at the end */
489     if (0 != posix_fadvise(rrd_file->fd, rrd_head_size, 0, POSIX_FADV_DONTNEED)) {
490            rrd_set_error("setting POSIX_FADV_DONTNEED on '%s': %s",filename, rrd_strerror(errno));
491            close(rrd_file->fd);
492            return(-1);
493     } 
494 #endif      
495     close(rrd_file->fd);
496     return(0);
497 }