mcelog: set n.meta to NULL after meta data is cleared.
[collectd.git] / src / mcelog.c
1 /*-
2  * collectd - src/mcelog.c
3  * MIT License
4  *
5  * Copyright(c) 2016-2017 Intel Corporation. All rights reserved.
6  *
7  * Permission is hereby granted, free of charge, to any person obtaining a
8  * copy of this software and associated documentation files (the "Software"),
9  * to deal in the Software without restriction, including without limitation
10  * the rights to use, copy, modify, merge, publish, distribute, sublicense,
11  * and/or sell copies of the Software, and to permit persons to whom the
12  * Software is furnished to do so, subject to the following conditions:
13  *
14  * The above copyright notice and this permission notice shall be included in
15  * all copies or substantial portions of the Software.
16  *
17  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
18  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
19  * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
20  * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
21  * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING
22  * FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER
23  * DEALINGS IN THE SOFTWARE.
24
25  * Authors:
26  *   Maryam Tahhan <maryam.tahhan@intel.com>
27  *   Volodymyr Mytnyk <volodymyrx.mytnyk@intel.com>
28  *   Taras Chornyi <tarasx.chornyi@intel.com>
29  *   Krzysztof Matczak <krzysztofx.matczak@intel.com>
30  */
31
32 #include "collectd.h"
33
34 #include "common.h"
35 #include "utils_llist.h"
36
37 #include <poll.h>
38 #include <sys/socket.h>
39 #include <sys/un.h>
40 #include <unistd.h>
41
42 #define MCELOG_PLUGIN "mcelog"
43 #define MCELOG_BUFF_SIZE 1024
44 #define MCELOG_POLL_TIMEOUT 1000 /* ms */
45 #define MCELOG_SOCKET_STR "SOCKET"
46 #define MCELOG_DIMM_NAME "DMI_NAME"
47 #define MCELOG_CORRECTED_ERR "corrected memory errors"
48 #define MCELOG_UNCORRECTED_ERR "uncorrected memory errors"
49 #define MCELOG_CORRECTED_ERR_TYPE_INS "corrected_memory_errors"
50 #define MCELOG_UNCORRECTED_ERR_TYPE_INS "uncorrected_memory_errors"
51
52 typedef struct mcelog_config_s {
53   char logfile[PATH_MAX]; /* mcelog logfile */
54   pthread_t tid;          /* poll thread id */
55   llist_t *dimms_list;    /* DIMMs list */
56   /* lock for dimms cache */
57   _Bool persist;
58   pthread_mutex_t dimms_lock;
59 } mcelog_config_t;
60
61 typedef struct socket_adapter_s socket_adapter_t;
62
63 struct socket_adapter_s {
64   int sock_fd;                  /* mcelog server socket fd */
65   struct sockaddr_un unix_sock; /* mcelog client socket */
66   pthread_rwlock_t lock;
67   /* function pointers for socket operations */
68   int (*write)(socket_adapter_t *self, const char *msg, const size_t len);
69   int (*reinit)(socket_adapter_t *self);
70   int (*receive)(socket_adapter_t *self, FILE **p_file);
71   int (*close)(socket_adapter_t *self);
72 };
73
74 typedef struct mcelog_memory_rec_s {
75   int corrected_err_total; /* x total*/
76   int corrected_err_timed; /* x in 24h*/
77   char corrected_err_timed_period[DATA_MAX_NAME_LEN];
78   int uncorrected_err_total; /* x total*/
79   int uncorrected_err_timed; /* x in 24h*/
80   char uncorrected_err_timed_period[DATA_MAX_NAME_LEN];
81   char location[DATA_MAX_NAME_LEN];  /* SOCKET x CHANNEL x DIMM x*/
82   char dimm_name[DATA_MAX_NAME_LEN]; /* DMI_NAME "DIMM_F1" */
83 } mcelog_memory_rec_t;
84
85 static int socket_close(socket_adapter_t *self);
86 static int socket_write(socket_adapter_t *self, const char *msg,
87                         const size_t len);
88 static int socket_reinit(socket_adapter_t *self);
89 static int socket_receive(socket_adapter_t *self, FILE **p_file);
90
91 static mcelog_config_t g_mcelog_config = {
92     .logfile = "/var/log/mcelog", .persist = 0,
93 };
94
95 static socket_adapter_t socket_adapter = {
96     .sock_fd = -1,
97     .unix_sock =
98         {
99             .sun_family = AF_UNIX, .sun_path = "/var/run/mcelog-client",
100         },
101     .lock = PTHREAD_RWLOCK_INITIALIZER,
102     .close = socket_close,
103     .write = socket_write,
104     .reinit = socket_reinit,
105     .receive = socket_receive,
106 };
107
108 static _Bool mcelog_thread_running;
109
110 static void mcelog_free_dimms_list_records(llist_t *dimms_list) {
111
112   for (llentry_t *e = llist_head(dimms_list); e != NULL; e = e->next) {
113     sfree(e->key);
114     sfree(e->value);
115   }
116 }
117
118 /* Create or get dimm by dimm name/location */
119 static llentry_t *mcelog_dimm(const mcelog_memory_rec_t *rec,
120                               llist_t *dimms_list) {
121
122   char dimm_name[DATA_MAX_NAME_LEN];
123
124   if (strlen(rec->dimm_name) > 0) {
125     ssnprintf(dimm_name, sizeof(dimm_name), "%s_%s", rec->location,
126               rec->dimm_name);
127   } else
128     sstrncpy(dimm_name, rec->location, sizeof(dimm_name));
129
130   llentry_t *dimm_le = llist_search(g_mcelog_config.dimms_list, dimm_name);
131
132   if (dimm_le == NULL) {
133     mcelog_memory_rec_t *dimm_mr = calloc(1, sizeof(*dimm_mr));
134     if (dimm_mr == NULL) {
135       ERROR(MCELOG_PLUGIN ": Error allocating dimm memory item");
136       return NULL;
137     }
138     char *p_name = strdup(dimm_name);
139     if (p_name == NULL) {
140       ERROR(MCELOG_PLUGIN ": strdup: error");
141       return NULL;
142     }
143
144     /* add new dimm */
145     dimm_le = llentry_create(p_name, dimm_mr);
146     if (dimm_le == NULL) {
147       ERROR(MCELOG_PLUGIN ": llentry_create(): error");
148       free(dimm_mr);
149       return NULL;
150     }
151     pthread_mutex_lock(&g_mcelog_config.dimms_lock);
152     llist_append(g_mcelog_config.dimms_list, dimm_le);
153     pthread_mutex_unlock(&g_mcelog_config.dimms_lock);
154   }
155
156   return dimm_le;
157 }
158
159 static void mcelog_update_dimm_stats(llentry_t *dimm,
160                                      const mcelog_memory_rec_t *rec) {
161   pthread_mutex_lock(&g_mcelog_config.dimms_lock);
162   memcpy(dimm->value, rec, sizeof(mcelog_memory_rec_t));
163   pthread_mutex_unlock(&g_mcelog_config.dimms_lock);
164 }
165
166 static int mcelog_config(oconfig_item_t *ci) {
167   int use_logfile = 0, use_memory = 0;
168   for (int i = 0; i < ci->children_num; i++) {
169     oconfig_item_t *child = ci->children + i;
170     if (strcasecmp("McelogLogfile", child->key) == 0) {
171       use_logfile = 1;
172       if (use_memory) {
173         ERROR(MCELOG_PLUGIN ": Invalid configuration option: \"%s\", Memory "
174                             "option is already configured.",
175               child->key);
176         return (-1);
177       }
178       if (cf_util_get_string_buffer(child, g_mcelog_config.logfile,
179                                     sizeof(g_mcelog_config.logfile)) < 0) {
180         ERROR(MCELOG_PLUGIN ": Invalid configuration option: \"%s\".",
181               child->key);
182         return (-1);
183       }
184       memset(socket_adapter.unix_sock.sun_path, 0,
185              sizeof(socket_adapter.unix_sock.sun_path));
186     } else if (strcasecmp("Memory", child->key) == 0) {
187       if (use_logfile) {
188         ERROR(MCELOG_PLUGIN ": Invalid configuration option: \"%s\", Logfile "
189                             "option is already configured.",
190               child->key);
191         return (-1);
192       }
193       use_memory = 1;
194       oconfig_item_t *mem_child = child->children;
195       for (int j = 0; j < child->children_num; j++) {
196         mem_child += j;
197         if (strcasecmp("McelogClientSocket", mem_child->key) == 0) {
198           if (cf_util_get_string_buffer(
199                   mem_child, socket_adapter.unix_sock.sun_path,
200                   sizeof(socket_adapter.unix_sock.sun_path)) < 0) {
201             ERROR(MCELOG_PLUGIN ": Invalid configuration option: \"%s\".",
202                   mem_child->key);
203             return (-1);
204           }
205         } else if (strcasecmp("PersistentNotification", mem_child->key) == 0) {
206           if (cf_util_get_boolean(mem_child, &g_mcelog_config.persist) < 0) {
207             ERROR(MCELOG_PLUGIN ": Invalid configuration option: \"%s\".",
208                   mem_child->key);
209             return (-1);
210           }
211         } else {
212           ERROR(MCELOG_PLUGIN ": Invalid Memory configuration option: \"%s\".",
213                 mem_child->key);
214           return (-1);
215         }
216       }
217       memset(g_mcelog_config.logfile, 0, sizeof(g_mcelog_config.logfile));
218     } else {
219       ERROR(MCELOG_PLUGIN ": Invalid configuration option: \"%s\".",
220             child->key);
221       return (-1);
222     }
223   }
224   return (0);
225 }
226
227 static int socket_close(socket_adapter_t *self) {
228   int ret = 0;
229   pthread_rwlock_rdlock(&self->lock);
230   if (fcntl(self->sock_fd, F_GETFL) != -1) {
231     char errbuf[MCELOG_BUFF_SIZE];
232     if (shutdown(self->sock_fd, SHUT_RDWR) != 0) {
233       ERROR(MCELOG_PLUGIN ": Socket shutdown failed: %s",
234             sstrerror(errno, errbuf, sizeof(errbuf)));
235       ret = -1;
236     }
237     if (close(self->sock_fd) != 0) {
238       ERROR(MCELOG_PLUGIN ": Socket close failed: %s",
239             sstrerror(errno, errbuf, sizeof(errbuf)));
240       ret = -1;
241     }
242   }
243   pthread_rwlock_unlock(&self->lock);
244   return (ret);
245 }
246
247 static int socket_write(socket_adapter_t *self, const char *msg,
248                         const size_t len) {
249   int ret = 0;
250   pthread_rwlock_rdlock(&self->lock);
251   if (swrite(self->sock_fd, msg, len) < 0)
252     ret = -1;
253   pthread_rwlock_unlock(&self->lock);
254   return (ret);
255 }
256
257 static void mcelog_dispatch_notification(notification_t *n) {
258   if (!n) {
259     ERROR(MCELOG_PLUGIN ": %s: NULL pointer", __FUNCTION__);
260     return;
261   }
262
263   sstrncpy(n->host, hostname_g, sizeof(n->host));
264   sstrncpy(n->type, "gauge", sizeof(n->type));
265   plugin_dispatch_notification(n);
266   if (n->meta)
267     plugin_notification_meta_free(n->meta);
268 }
269
270 static int socket_reinit(socket_adapter_t *self) {
271   char errbuff[MCELOG_BUFF_SIZE];
272   int ret = -1;
273   cdtime_t interval = plugin_get_interval();
274   struct timeval socket_timeout = CDTIME_T_TO_TIMEVAL(interval);
275
276   /* synchronization via write lock since sock_fd may be changed here */
277   pthread_rwlock_wrlock(&self->lock);
278   self->sock_fd =
279       socket(PF_UNIX, SOCK_STREAM | SOCK_CLOEXEC | SOCK_NONBLOCK, 0);
280   if (self->sock_fd < 0) {
281     ERROR(MCELOG_PLUGIN ": Could not create a socket. %s",
282           sstrerror(errno, errbuff, sizeof(errbuff)));
283     pthread_rwlock_unlock(&self->lock);
284     return (ret);
285   }
286
287   /* Set socket timeout option */
288   if (setsockopt(self->sock_fd, SOL_SOCKET, SO_SNDTIMEO, &socket_timeout,
289                  sizeof(socket_timeout)) < 0)
290     ERROR(MCELOG_PLUGIN ": Failed to set the socket timeout option.");
291
292   /* downgrading to read lock due to possible recursive read locks
293    * in self->close(self) call */
294   pthread_rwlock_unlock(&self->lock);
295   pthread_rwlock_rdlock(&self->lock);
296   if (connect(self->sock_fd, (struct sockaddr *)&(self->unix_sock),
297               sizeof(self->unix_sock)) < 0) {
298     ERROR(MCELOG_PLUGIN ": Failed to connect to mcelog server. %s",
299           sstrerror(errno, errbuff, sizeof(errbuff)));
300     self->close(self);
301     ret = -1;
302   } else {
303     ret = 0;
304     mcelog_dispatch_notification(
305         &(notification_t){.severity = NOTIF_OKAY,
306                           .time = cdtime(),
307                           .message = "Connected to mcelog server",
308                           .plugin = MCELOG_PLUGIN,
309                           .type_instance = "mcelog_status"});
310   }
311   pthread_rwlock_unlock(&self->lock);
312   return (ret);
313 }
314
315 static int mcelog_dispatch_mem_notifications(const mcelog_memory_rec_t *mr) {
316   notification_t n = {.severity = NOTIF_WARNING,
317                       .time = cdtime(),
318                       .plugin = MCELOG_PLUGIN,
319                       .type = "errors"};
320
321   int dispatch_corrected_notifs = 0, dispatch_uncorrected_notifs = 0;
322
323   if (mr == NULL)
324     return (-1);
325
326   llentry_t *dimm = mcelog_dimm(mr, g_mcelog_config.dimms_list);
327   if (dimm == NULL) {
328     ERROR(MCELOG_PLUGIN
329           ": Error adding/getting dimm memory item to/from cache");
330     return (-1);
331   }
332   mcelog_memory_rec_t *mr_old = dimm->value;
333   if (!g_mcelog_config.persist) {
334
335     if (mr_old->corrected_err_total != mr->corrected_err_total ||
336         mr_old->corrected_err_timed != mr->corrected_err_timed)
337       dispatch_corrected_notifs = 1;
338
339     if (mr_old->uncorrected_err_total != mr->uncorrected_err_total ||
340         mr_old->uncorrected_err_timed != mr->uncorrected_err_timed)
341       dispatch_uncorrected_notifs = 1;
342
343     if (!dispatch_corrected_notifs && !dispatch_uncorrected_notifs) {
344       DEBUG("%s: No new notifications to dispatch", MCELOG_PLUGIN);
345       return (0);
346     }
347   } else {
348     dispatch_corrected_notifs = 1;
349     dispatch_uncorrected_notifs = 1;
350   }
351
352   sstrncpy(n.host, hostname_g, sizeof(n.host));
353
354   if (mr->dimm_name[0] != '\0')
355     ssnprintf(n.plugin_instance, sizeof(n.plugin_instance), "%s_%s",
356               mr->location, mr->dimm_name);
357   else
358     sstrncpy(n.plugin_instance, mr->location, sizeof(n.plugin_instance));
359
360   if (dispatch_corrected_notifs) {
361     /* Corrected Error Notifications */
362     if (mr->corrected_err_total > 0 || mr->corrected_err_timed > 0) {
363       if (plugin_notification_meta_add_signed_int(
364               &n, MCELOG_CORRECTED_ERR, mr->corrected_err_total) < 0) {
365         ERROR(MCELOG_PLUGIN ": add corrected errors meta data failed");
366         plugin_notification_meta_free(n.meta);
367         return (-1);
368       }
369       if (plugin_notification_meta_add_signed_int(
370               &n, "corrected memory timed errors", mr->corrected_err_timed) <
371           0) {
372         ERROR(MCELOG_PLUGIN ": add corrected timed errors meta data failed");
373         plugin_notification_meta_free(n.meta);
374         return (-1);
375       }
376       ssnprintf(n.message, sizeof(n.message), "Corrected Memory Errors");
377       sstrncpy(n.type_instance, MCELOG_CORRECTED_ERR_TYPE_INS,
378                sizeof(n.type_instance));
379       plugin_dispatch_notification(&n);
380
381       if (n.meta)
382         plugin_notification_meta_free(n.meta);
383         n.meta = NULL;
384     }
385   }
386
387   if (dispatch_uncorrected_notifs) {
388     /* Uncorrected Error Notifications */
389     if (mr->uncorrected_err_total > 0 || mr->uncorrected_err_timed > 0) {
390       if (plugin_notification_meta_add_signed_int(
391               &n, MCELOG_UNCORRECTED_ERR, mr->uncorrected_err_total) < 0) {
392         ERROR(MCELOG_PLUGIN ": add uncorrected errors meta data failed");
393         plugin_notification_meta_free(n.meta);
394         return (-1);
395       }
396       if (plugin_notification_meta_add_signed_int(
397               &n, "uncorrected memory timed errors",
398               mr->uncorrected_err_timed) < 0) {
399         ERROR(MCELOG_PLUGIN ": add uncorrected timed errors meta data failed");
400         plugin_notification_meta_free(n.meta);
401         return (-1);
402       }
403       ssnprintf(n.message, sizeof(n.message), "Uncorrected Memory Errors");
404       sstrncpy(n.type_instance, MCELOG_UNCORRECTED_ERR_TYPE_INS,
405                sizeof(n.type_instance));
406       n.severity = NOTIF_FAILURE;
407       plugin_dispatch_notification(&n);
408       if (n.meta)
409         plugin_notification_meta_free(n.meta);
410         n.meta = NULL;
411     }
412   }
413
414   return (0);
415 }
416
417 static int mcelog_submit(const mcelog_memory_rec_t *mr) {
418
419   if (!mr) {
420     ERROR(MCELOG_PLUGIN ": %s: NULL pointer", __FUNCTION__);
421     return (-1);
422   }
423
424   llentry_t *dimm = mcelog_dimm(mr, g_mcelog_config.dimms_list);
425   if (dimm == NULL) {
426     ERROR(MCELOG_PLUGIN
427           ": Error adding/getting dimm memory item to/from cache");
428     return (-1);
429   }
430
431   value_list_t vl = {
432       .values_len = 1,
433       .values = &(value_t){.derive = (derive_t)mr->corrected_err_total},
434       .time = cdtime(),
435       .plugin = MCELOG_PLUGIN,
436       .type = "errors",
437       .type_instance = MCELOG_CORRECTED_ERR_TYPE_INS};
438
439   mcelog_update_dimm_stats(dimm, mr);
440
441   if (mr->dimm_name[0] != '\0')
442     ssnprintf(vl.plugin_instance, sizeof(vl.plugin_instance), "%s_%s",
443               mr->location, mr->dimm_name);
444   else
445     sstrncpy(vl.plugin_instance, mr->location, sizeof(vl.plugin_instance));
446
447   plugin_dispatch_values(&vl);
448
449   ssnprintf(vl.type_instance, sizeof(vl.type_instance),
450             "corrected_memory_errors_in_%s", mr->corrected_err_timed_period);
451   vl.values = &(value_t){.derive = (derive_t)mr->corrected_err_timed};
452   plugin_dispatch_values(&vl);
453
454   sstrncpy(vl.type_instance, MCELOG_UNCORRECTED_ERR_TYPE_INS,
455            sizeof(vl.type_instance));
456   vl.values = &(value_t){.derive = (derive_t)mr->uncorrected_err_total};
457   plugin_dispatch_values(&vl);
458
459   ssnprintf(vl.type_instance, sizeof(vl.type_instance),
460             "uncorrected_memory_errors_in_%s",
461             mr->uncorrected_err_timed_period);
462   vl.values = &(value_t){.derive = (derive_t)mr->uncorrected_err_timed};
463   plugin_dispatch_values(&vl);
464
465   return (0);
466 }
467
468 static int parse_memory_info(FILE *p_file, mcelog_memory_rec_t *memory_record) {
469   char buf[DATA_MAX_NAME_LEN] = {0};
470   while (fgets(buf, sizeof(buf), p_file)) {
471     /* Got empty line or "done" */
472     if ((!strncmp("\n", buf, strlen(buf))) ||
473         (!strncmp(buf, "done\n", strlen(buf))))
474       return (1);
475     if (strlen(buf) < 5)
476       continue;
477     if (!strncmp(buf, MCELOG_SOCKET_STR, strlen(MCELOG_SOCKET_STR))) {
478       sstrncpy(memory_record->location, buf, strlen(buf));
479       /* replace spaces with '_' */
480       for (size_t i = 0; i < strlen(memory_record->location); i++)
481         if (memory_record->location[i] == ' ')
482           memory_record->location[i] = '_';
483       DEBUG(MCELOG_PLUGIN ": Got SOCKET INFO %s", memory_record->location);
484     }
485     if (!strncmp(buf, MCELOG_DIMM_NAME, strlen(MCELOG_DIMM_NAME))) {
486       char *name = NULL;
487       char *saveptr = NULL;
488       name = strtok_r(buf, "\"", &saveptr);
489       if (name != NULL && saveptr != NULL) {
490         name = strtok_r(NULL, "\"", &saveptr);
491         if (name != NULL) {
492           sstrncpy(memory_record->dimm_name, name,
493                    sizeof(memory_record->dimm_name));
494           DEBUG(MCELOG_PLUGIN ": Got DIMM NAME %s", memory_record->dimm_name);
495         }
496       }
497     }
498     if (!strncmp(buf, MCELOG_CORRECTED_ERR, strlen(MCELOG_CORRECTED_ERR))) {
499       /* Get next line*/
500       if (fgets(buf, sizeof(buf), p_file) != NULL) {
501         sscanf(buf, "\t%d total", &(memory_record->corrected_err_total));
502         DEBUG(MCELOG_PLUGIN ": Got corrected error total %d",
503               memory_record->corrected_err_total);
504       }
505       if (fgets(buf, sizeof(buf), p_file) != NULL) {
506         sscanf(buf, "\t%d in %s", &(memory_record->corrected_err_timed),
507                memory_record->corrected_err_timed_period);
508         DEBUG(MCELOG_PLUGIN ": Got timed corrected errors %d in %s",
509               memory_record->corrected_err_total,
510               memory_record->corrected_err_timed_period);
511       }
512     }
513     if (!strncmp(buf, MCELOG_UNCORRECTED_ERR, strlen(MCELOG_UNCORRECTED_ERR))) {
514       if (fgets(buf, sizeof(buf), p_file) != NULL) {
515         sscanf(buf, "\t%d total", &(memory_record->uncorrected_err_total));
516         DEBUG(MCELOG_PLUGIN ": Got uncorrected error total %d",
517               memory_record->uncorrected_err_total);
518       }
519       if (fgets(buf, sizeof(buf), p_file) != NULL) {
520         sscanf(buf, "\t%d in %s", &(memory_record->uncorrected_err_timed),
521                memory_record->uncorrected_err_timed_period);
522         DEBUG(MCELOG_PLUGIN ": Got timed uncorrected errors %d in %s",
523               memory_record->uncorrected_err_total,
524               memory_record->uncorrected_err_timed_period);
525       }
526     }
527     memset(buf, 0, sizeof(buf));
528   }
529   /* parsing definitely finished */
530   return (0);
531 }
532
533 static void poll_worker_cleanup(void *arg) {
534   mcelog_thread_running = 0;
535   FILE *p_file = *((FILE **)arg);
536   if (p_file != NULL)
537     fclose(p_file);
538   free(arg);
539 }
540
541 static int socket_receive(socket_adapter_t *self, FILE **pp_file) {
542   int res = -1;
543   pthread_rwlock_rdlock(&self->lock);
544   struct pollfd poll_fd = {
545       .fd = self->sock_fd, .events = POLLIN | POLLPRI,
546   };
547
548   if ((res = poll(&poll_fd, 1, MCELOG_POLL_TIMEOUT)) <= 0) {
549     if (res != 0 && errno != EINTR) {
550       char errbuf[MCELOG_BUFF_SIZE];
551       ERROR("mcelog: poll failed: %s",
552             sstrerror(errno, errbuf, sizeof(errbuf)));
553     }
554     pthread_rwlock_unlock(&self->lock);
555     return (res);
556   }
557
558   if (poll_fd.revents & (POLLERR | POLLHUP | POLLNVAL)) {
559     /* connection is broken */
560     ERROR(MCELOG_PLUGIN ": Connection to socket is broken");
561     if (poll_fd.revents & (POLLERR | POLLHUP)) {
562       mcelog_dispatch_notification(
563           &(notification_t){.severity = NOTIF_FAILURE,
564                             .time = cdtime(),
565                             .message = "Connection to mcelog socket is broken.",
566                             .plugin = MCELOG_PLUGIN,
567                             .type_instance = "mcelog_status"});
568     }
569     pthread_rwlock_unlock(&self->lock);
570     return (-1);
571   }
572
573   if (!(poll_fd.revents & (POLLIN | POLLPRI))) {
574     INFO(MCELOG_PLUGIN ": No data to read");
575     pthread_rwlock_unlock(&self->lock);
576     return (0);
577   }
578
579   if ((*pp_file = fdopen(dup(self->sock_fd), "r")) == NULL)
580     res = -1;
581
582   pthread_rwlock_unlock(&self->lock);
583   return (res);
584 }
585
586 static void *poll_worker(__attribute__((unused)) void *arg) {
587   char errbuf[MCELOG_BUFF_SIZE];
588   mcelog_thread_running = 1;
589   FILE **pp_file = calloc(1, sizeof(*pp_file));
590   if (pp_file == NULL) {
591     ERROR("mcelog: memory allocation failed: %s",
592           sstrerror(errno, errbuf, sizeof(errbuf)));
593     pthread_exit((void *)1);
594   }
595
596   pthread_cleanup_push(poll_worker_cleanup, pp_file);
597
598   while (1) {
599     /* blocking call */
600     int res = socket_adapter.receive(&socket_adapter, pp_file);
601     if (res < 0) {
602       socket_adapter.close(&socket_adapter);
603       while (socket_adapter.reinit(&socket_adapter) != 0) {
604         nanosleep(&CDTIME_T_TO_TIMESPEC(MS_TO_CDTIME_T(MCELOG_POLL_TIMEOUT)),
605                   NULL);
606       }
607       continue;
608     }
609     /* timeout or no data to read */
610     else if (res == 0)
611       continue;
612
613     if (*pp_file == NULL)
614       continue;
615
616     mcelog_memory_rec_t memory_record = {0};
617     while (parse_memory_info(*pp_file, &memory_record)) {
618       /* Check if location was successfully parsed */
619       if (memory_record.location[0] == '\0') {
620         memset(&memory_record, 0, sizeof(memory_record));
621         continue;
622       }
623
624       if (mcelog_dispatch_mem_notifications(&memory_record) != 0)
625         ERROR(MCELOG_PLUGIN ": Failed to submit memory errors notification");
626       if (mcelog_submit(&memory_record) != 0)
627         ERROR(MCELOG_PLUGIN ": Failed to submit memory errors");
628       memset(&memory_record, 0, sizeof(memory_record));
629     }
630
631     fclose(*pp_file);
632     *pp_file = NULL;
633   }
634
635   mcelog_thread_running = 0;
636   pthread_cleanup_pop(1);
637   return (NULL);
638 }
639
640 static int mcelog_init(void) {
641   if (g_mcelog_config.logfile != NULL &&
642       socket_adapter.unix_sock.sun_path != NULL) {
643     INFO(MCELOG_PLUGIN
644          ": No configuration selected defaulting to memory errors.");
645     memset(g_mcelog_config.logfile, 0, sizeof(g_mcelog_config.logfile));
646   }
647   g_mcelog_config.dimms_list = llist_create();
648   int err = pthread_mutex_init(&g_mcelog_config.dimms_lock, NULL);
649   if (err < 0) {
650     ERROR(MCELOG_PLUGIN ": plugin: failed to initialize cache lock");
651     return (-1);
652   }
653
654   if (socket_adapter.reinit(&socket_adapter) != 0) {
655     ERROR(MCELOG_PLUGIN ": Cannot connect to client socket");
656     return (-1);
657   }
658
659   if (socket_adapter.unix_sock.sun_path != NULL) {
660     if (plugin_thread_create(&g_mcelog_config.tid, NULL, poll_worker, NULL,
661                              NULL) != 0) {
662       ERROR(MCELOG_PLUGIN ": Error creating poll thread.");
663       return (-1);
664     }
665   }
666   return (0);
667 }
668
669 static int get_memory_machine_checks(void) {
670   static const char dump[] = "dump all bios\n";
671   int ret = socket_adapter.write(&socket_adapter, dump, sizeof(dump));
672   if (ret != 0)
673     ERROR(MCELOG_PLUGIN ": SENT DUMP REQUEST FAILED");
674   else
675     DEBUG(MCELOG_PLUGIN ": SENT DUMP REQUEST OK");
676   return (ret);
677 }
678
679 static int mcelog_read(__attribute__((unused)) user_data_t *ud) {
680   DEBUG(MCELOG_PLUGIN ": %s", __FUNCTION__);
681
682   if (get_memory_machine_checks() != 0)
683     ERROR(MCELOG_PLUGIN ": MACHINE CHECK INFO NOT AVAILABLE");
684
685   return (0);
686 }
687
688 static int mcelog_shutdown(void) {
689   int ret = 0;
690   if (mcelog_thread_running) {
691     pthread_cancel(g_mcelog_config.tid);
692     if (pthread_join(g_mcelog_config.tid, NULL) != 0) {
693       ERROR(MCELOG_PLUGIN ": Stopping thread failed.");
694       ret = -1;
695     }
696   }
697   pthread_mutex_lock(&g_mcelog_config.dimms_lock);
698   mcelog_free_dimms_list_records(g_mcelog_config.dimms_list);
699   llist_destroy(g_mcelog_config.dimms_list);
700   pthread_mutex_unlock(&g_mcelog_config.dimms_lock);
701   pthread_mutex_destroy(&g_mcelog_config.dimms_lock);
702   g_mcelog_config.dimms_list = NULL;
703   ret = socket_adapter.close(&socket_adapter) || ret;
704   pthread_rwlock_destroy(&(socket_adapter.lock));
705   return (-ret);
706 }
707
708 void module_register(void) {
709   plugin_register_complex_config(MCELOG_PLUGIN, mcelog_config);
710   plugin_register_init(MCELOG_PLUGIN, mcelog_init);
711   plugin_register_complex_read(NULL, MCELOG_PLUGIN, mcelog_read, 0, NULL);
712   plugin_register_shutdown(MCELOG_PLUGIN, mcelog_shutdown);
713 }