Merge branch 'collectd-5.7' into collectd-5.8
[collectd.git] / src / collectd-python.pod
1 # Permission is hereby granted, free of charge, to any person obtaining a
2 # copy of this software and associated documentation files (the "Software"),
3 # to deal in the Software without restriction, including without limitation
4 # the rights to use, copy, modify, merge, publish, distribute, sublicense,
5 # and/or sell copies of the Software, and to permit persons to whom the
6 # Software is furnished to do so, subject to the following conditions:
7 #
8 # The above copyright notice and this permission notice shall be included in
9 # all copies or substantial portions of the Software.
10
11 =encoding UTF-8
12
13 =head1 NAME
14
15 collectd-python - Documentation of collectd's C<python plugin>
16
17 =head1 SYNOPSIS
18
19   LoadPlugin python
20   # ...
21   <Plugin python>
22     ModulePath "/path/to/your/python/modules"
23     LogTraces true
24     Interactive false
25     Import "spam"
26
27     <Module spam>
28       spam "wonderful" "lovely"
29     </Module>
30   </Plugin>
31
32 =head1 DESCRIPTION
33
34 The C<python plugin> embeds a Python-interpreter into collectd and provides an
35 interface to collectd's plugin system. This makes it possible to write plugins
36 for collectd in Python. This is a lot more efficient than executing a
37 Python-script every time you want to read a value with the C<exec plugin> (see
38 L<collectd-exec(5)>) and provides a lot more functionality, too.
39
40 The minimum required Python version is I<2.6>.
41
42 =head1 CONFIGURATION
43
44 =over 4
45
46 =item B<LoadPlugin> I<Plugin>
47
48 Loads the Python plugin I<Plugin>.
49
50 =item B<Encoding> I<Name>
51
52 The default encoding for Unicode objects you pass to collectd. If you omit this
53 option it will default to B<ascii> on I<Python 2>. On I<Python 3> it will
54 always be B<utf-8>, as this function was removed, so this will be silently
55 ignored.
56 These defaults are hardcoded in Python and will ignore everything else,
57 including your locale.
58
59 =item B<ModulePath> I<Name>
60
61 Prepends I<Name> to B<sys.path>. You won't be able to import any scripts you
62 wrote unless they are located in one of the directories in this list. Please
63 note that it only has effect on plugins loaded after this option. You can
64 use multiple B<ModulePath> lines to add more than one directory.
65
66 =item B<LogTraces> I<bool>
67
68 If a Python script throws an exception it will be logged by collectd with the
69 name of the exception and the message. If you set this option to true it will
70 also log the full stacktrace just like the default output of an interactive
71 Python interpreter. This does not apply to the CollectError exception, which
72 will never log a stacktrace.
73 This should probably be set to false most of the time but is very useful for
74 development and debugging of new modules.
75
76 =item B<Interactive> I<bool>
77
78 This option will cause the module to launch an interactive Python interpreter
79 that reads from and writes to the terminal. Note that collectd will terminate
80 right after starting up if you try to run it as a daemon while this option is
81 enabled so make sure to start collectd with the B<-f> option.
82
83 The B<collectd> module is I<not> imported into the interpreter's globals. You
84 have to do it manually. Be sure to read the help text of the module, it can be
85 used as a reference guide during coding.
86
87 This interactive session will behave slightly differently from a daemonized
88 collectd script as well as from a normal Python interpreter:
89
90 =over 4
91
92 =item *
93
94 B<1.> collectd will try to import the B<readline> module to give you a decent
95 way of entering your commands. The daemonized collectd won't do that.
96
97 =item *
98
99 B<2.> Python will be handling I<SIGINT>. Pressing I<Ctrl+C> will usually cause
100 collectd to shut down. This would be problematic in an interactive session,
101 therefore Python will be handling it in interactive sessions. This allows you
102 to use I<Ctrl+C> to interrupt Python code without killing collectd. This also
103 means you can catch I<KeyboardInterrupt> exceptions which does not work during
104 normal operation.
105
106 To quit collectd send I<EOF> (press I<Ctrl+D> at the beginning of a new line).
107
108 =item *
109
110 B<3.> collectd handles I<SIGCHLD>. This means that Python won't be able to
111 determine the return code of spawned processes with system(), popen() and
112 subprocess. This will result in Python not using external programs like less
113 to display help texts. You can override this behavior with the B<PAGER>
114 environment variable, e.g. I<export PAGER=less> before starting collectd.
115 Depending on your version of Python this might or might not result in an
116 B<OSError> exception which can be ignored.
117
118 If you really need to spawn new processes from Python you can register an init
119 callback and reset the action for SIGCHLD to the default behavior. Please note
120 that this I<will> break the exec plugin. Do not even load the exec plugin if
121 you intend to do this!
122
123 There is an example script located in B<contrib/python/getsigchld.py>  to do
124 this. If you import this from I<collectd.conf> SIGCHLD will be handled
125 normally and spawning processes from Python will work as intended.
126
127 =back
128
129 =item E<lt>B<Module> I<Name>E<gt> block
130
131 This block may be used to pass on configuration settings to a Python module.
132 The configuration is converted into an instance of the B<Config> class which is
133 passed to the registered configuration callback. See below for details about
134 the B<Config> class and how to register callbacks.
135
136 The I<name> identifies the callback.
137
138 =back
139
140 =head1 STRINGS
141
142 There are a lot of places where strings are sent from collectd to Python and
143 from Python to collectd. How exactly this works depends on whether byte or
144 unicode strings or Python2 or Python3 are used.
145
146 Python2 has I<str>, which is just bytes, and I<unicode>. Python3 has I<str>,
147 which is a unicode object, and I<bytes>.
148
149 When passing strings from Python to collectd all of these object are supported
150 in all places, however I<str> should be used if possible. These strings must
151 not contain a NUL byte. Ignoring this will result in a I<TypeError> exception.
152 If a byte string was used it will be used as is by collectd. If a unicode
153 object was used it will be encoded using the default encoding (see above). If
154 this is not possible Python will raise a I<UnicodeEncodeError> exception.
155
156 When passing strings from collectd to Python the behavior depends on the
157 Python version used. Python2 will always receive a I<str> object. Python3 will
158 usually receive a I<str> object as well, however the original string will be
159 decoded to unicode using the default encoding. If this fails because the
160 string is not a valid sequence for this encoding a I<bytes> object will be
161 returned instead.
162
163 =head1 WRITING YOUR OWN PLUGINS
164
165 Writing your own plugins is quite simple. collectd manages plugins by means of
166 B<dispatch functions> which call the appropriate B<callback functions>
167 registered by the plugins. Any plugin basically consists of the implementation
168 of these callback functions and initializing code which registers the
169 functions with collectd. See the section "EXAMPLES" below for a really basic
170 example. The following types of B<callback functions> are known to collectd
171 (all of them are optional):
172
173 =over 4
174
175 =item configuration functions
176
177 These are called during configuration if an appropriate
178 B<Module> block has been encountered. It is called once for each B<Module>
179 block which matches the name of the callback as provided with the
180 B<register_config> method - see below.
181
182 Python thread support has not been initialized at this point so do not use any
183 threading functions here!
184
185 =item init functions
186
187 These are called once after loading the module and before any
188 calls to the read and write functions. It should be used to initialize the
189 internal state of the plugin (e.E<nbsp>g. open sockets, ...). This is the
190 earliest point where you may use threads.
191
192 =item read functions
193
194 These are used to collect the actual data. It is called once
195 per interval (see the B<Interval> configuration option of collectd). Usually
196 it will call B<plugin_dispatch_values> to dispatch the values to collectd
197 which will pass them on to all registered B<write functions>. If this function
198 throws any kind of exception the plugin will be skipped for an increasing
199 amount of time until it returns normally again.
200
201 =item write functions
202
203 These are used to write the dispatched values. It is called
204 once for every value that was dispatched by any plugin.
205
206 =item flush functions
207
208 These are used to flush internal caches of plugins. It is
209 usually triggered by the user only. Any plugin which caches data before
210 writing it to disk should provide this kind of callback function.
211
212 =item log functions
213
214 These are used to pass messages of plugins or the daemon itself
215 to the user.
216
217 =item notification function
218
219 These are used to act upon notifications. In general, a
220 notification is a status message that may be associated with a data instance.
221 Usually, a notification is generated by the daemon if a configured threshold
222 has been exceeded (see the section "THRESHOLD CONFIGURATION" in
223 L<collectd.conf(5)> for more details), but any plugin may dispatch
224 notifications as well.
225
226 =item shutdown functions
227
228 These are called once before the daemon shuts down. It should
229 be used to clean up the plugin (e.g. close sockets, ...).
230
231 =back
232
233 Any function (except log functions) may throw an exception in case of
234 errors. The exception will be passed on to the user using collectd's logging
235 mechanism. If a log callback throws an exception it will be printed to standard
236 error instead.
237
238 See the documentation of the various B<register_> methods in the section
239 "FUNCTIONS" below for the number and types of arguments passed to each
240 B<callback function>. This section also explains how to register B<callback
241 functions> with collectd.
242
243 To enable a module, copy it to a place where Python can find it (i.E<nbsp>e. a
244 directory listed in B<sys.path>) just as any other Python plugin and add
245 an appropriate B<Import> option to the configuration file. After restarting
246 collectd you're done.
247
248 =head1 CLASSES
249
250 The following complex types are used to pass values between the Python plugin
251 and collectd:
252
253 =head2 CollectdError
254
255 This is an exception. If any Python script raises this exception it will
256 still be treated like an error by collectd but it will be logged as a
257 warning instead of an error and it will never generate a stacktrace.
258
259  class CollectdError(Exception)
260
261 Basic exception for collectd Python scripts.
262 Throwing this exception will not cause a stacktrace to be logged, even if
263 LogTraces is enabled in the config.
264
265 =head2 Signed
266
267 The Signed class is just a long. It has all its methods and behaves exactly
268 like any other long object. It is used to indicate if an integer was or should
269 be stored as a signed or unsigned integer object.
270
271  class Signed(long)
272
273 This is a long by another name. Use it in meta data dicts
274 to choose the way it is stored in the meta data.
275
276 =head2 Unsigned
277
278 The Unsigned class is just a long. It has all its methods and behaves exactly
279 like any other long object. It is used to indicate if an integer was or should
280 be stored as a signed or unsigned integer object.
281
282  class Unsigned(long)
283
284 This is a long by another name. Use it in meta data dicts
285 to choose the way it is stored in the meta data.
286
287 =head2 Config
288
289 The Config class is an object which keeps the information provided in the
290 configuration file. The sequence of children keeps one entry for each
291 configuration option. Each such entry is another Config instance, which
292 may nest further if nested blocks are used.
293
294  class Config(object)
295
296 This represents a piece of collectd's config file. It is passed to scripts with
297 config callbacks (see B<register_config>) and is of little use if created
298 somewhere else.
299
300 It has no methods beyond the bare minimum and only exists for its data members.
301
302 Data descriptors defined here:
303
304 =over 4
305
306 =item parent
307
308 This represents the parent of this node. On the root node
309 of the config tree it will be None.
310
311 =item key
312
313 This is the keyword of this item, i.e. the first word of any given line in the
314 config file. It will always be a string.
315
316 =item values
317
318 This is a tuple (which might be empty) of all value, i.e. words following the
319 keyword in any given line in the config file.
320
321 Every item in this tuple will be either a string, a float or a boolean,
322 depending on the contents of the configuration file.
323
324 =item children
325
326 This is a tuple of child nodes. For most nodes this will be empty. If this node
327 represents a block instead of a single line of the config file it will contain
328 all nodes in this block.
329
330 =back
331
332 =head2 PluginData
333
334 This should not be used directly but it is the base class for both Values and
335 Notification. It is used to identify the source of a value or notification.
336
337  class PluginData(object)
338
339 This is an internal class that is the base for Values and Notification. It is
340 pretty useless by itself and was therefore not exported to the collectd module.
341
342 Data descriptors defined here:
343
344 =over 4
345
346 =item host
347
348 The hostname of the host this value was read from. For dispatching this can be
349 set to an empty string which means the local hostname as defined in
350 collectd.conf.
351
352 =item plugin
353
354 The name of the plugin that read the data. Setting this member to an empty
355 string will insert "python" upon dispatching.
356
357 =item plugin_instance
358
359 Plugin instance string. May be empty.
360
361 =item time
362
363 This is the Unix timestamp of the time this value was read. For dispatching
364 values this can be set to zero which means "now". This means the time the value
365 is actually dispatched, not the time it was set to 0.
366
367 =item type
368
369 The type of this value. This type has to be defined in your I<types.db>.
370 Attempting to set it to any other value will raise a I<TypeError> exception.
371 Assigning a type is mandatory, calling dispatch without doing so will raise a
372 I<RuntimeError> exception.
373
374 =item type_instance
375
376 Type instance string. May be empty.
377
378 =back
379
380 =head2 Values
381
382 A Value is an object which features a sequence of values. It is based on the
383 I<PluginData> type and uses its members to identify the values.
384
385  class Values(PluginData)
386
387 A Values object used for dispatching values to collectd and receiving values
388 from write callbacks.
389
390 Method resolution order:
391
392 =over 4
393
394 =item Values
395
396 =item PluginData
397
398 =item object
399
400 =back
401
402 Methods defined here:
403
404 =over 4
405
406 =item B<dispatch>([type][, values][, plugin_instance][, type_instance][, plugin][, host][, time][, interval]) -> None.
407
408 Dispatch this instance to the collectd process. The object has members for each
409 of the possible arguments for this method. For a detailed explanation of these
410 parameters see the member of the same same.
411
412 If you do not submit a parameter the value saved in its member will be
413 submitted. If you do provide a parameter it will be used instead, without
414 altering the member.
415
416 =item B<write>([destination][, type][, values][, plugin_instance][, type_instance][, plugin][, host][, time][, interval]) -> None.
417
418 Write this instance to a single plugin or all plugins if "destination" is
419 omitted. This will bypass the main collectd process and all filtering and
420 caching. Other than that it works similar to "dispatch". In most cases
421 "dispatch" should be used instead of "write".
422
423 =back
424
425 Data descriptors defined here:
426
427 =over 4
428
429 =item interval
430
431 The interval is the timespan in seconds between two submits for the same data
432 source. This value has to be a positive integer, so you can't submit more than
433 one value per second. If this member is set to a non-positive value, the
434 default value as specified in the config file will be used (default: 10).
435
436 If you submit values more often than the specified interval, the average will
437 be used. If you submit less values, your graphs will have gaps.
438
439 =item values
440
441 These are the actual values that get dispatched to collectd. It has to be a
442 sequence (a tuple or list) of numbers. The size of the sequence and the type of
443 its content depend on the type member your I<types.db> file. For more
444 information on this read the L<types.db(5)> manual page.
445
446 If the sequence does not have the correct size upon dispatch a I<RuntimeError>
447 exception will be raised. If the content of the sequence is not a number, a
448 I<TypeError> exception will be raised.
449
450 =item meta
451
452 These are the meta data for this Value object.
453 It has to be a dictionary of numbers, strings or bools. All keys must be
454 strings. I<int> and <long> objects will be dispatched as signed integers unless
455 they are between 2**63 and 2**64-1, which will result in a unsigned integer.
456 You can force one of these storage classes by using the classes
457 B<collectd.Signed> and B<collectd.Unsigned>. A meta object received by a write
458 callback will always contain B<Signed> or B<Unsigned> objects.
459
460 =back
461
462 =head2 Notification
463
464 A notification is an object defining the severity and message of the status
465 message as well as an identification of a data instance by means of the members
466 of I<PluginData> on which it is based.
467
468 class Notification(PluginData)
469 The Notification class is a wrapper around the collectd notification.
470 It can be used to notify other plugins about bad stuff happening. It works
471 similar to Values but has a severity and a message instead of interval
472 and time.
473 Notifications can be dispatched at any time and can be received with
474 register_notification.
475
476 Method resolution order:
477
478 =over 4
479
480 =item Notification
481
482 =item PluginData
483
484 =item object
485
486 =back
487
488 Methods defined here:
489
490 =over 4
491
492 =item B<dispatch>([type][, message][, plugin_instance][, type_instance][, plugin][, host][, time][, severity][, meta]) -> None.  Dispatch a notification.
493
494 Dispatch this instance to the collectd process. The object has members for each
495 of the possible arguments for this method. For a detailed explanation of these
496 parameters see the member of the same same.
497
498 If you do not submit a parameter the value saved in its member will be
499 submitted. If you do provide a parameter it will be used instead, without
500 altering the member.
501
502 =back
503
504 Data descriptors defined here:
505
506 =over 4
507
508 =item message
509
510 Some kind of description of what's going on and why this Notification was
511 generated.
512
513 =item severity
514
515 The severity of this notification. Assign or compare to I<NOTIF_FAILURE>,
516 I<NOTIF_WARNING> or I<NOTIF_OKAY>.
517
518 =item meta
519
520 These are the meta data for the Notification object.
521 It has to be a dictionary of numbers, strings or bools. All keys must be
522 strings. I<int> and I<long> objects will be dispatched as signed integers unless
523 they are between 2**63 and 2**64-1, which will result in a unsigned integer.
524 One of these storage classes can be forced by using the classes
525 B<collectd.Signed> and B<collectd.Unsigned>. A meta object received by a
526 notification callback will always contain B<Signed> or B<Unsigned> objects.
527
528 =back
529
530 =head1 FUNCTIONS
531
532 The following functions provide the C-interface to Python-modules.
533
534 =over 4
535
536 =item B<register_*>(I<callback>[, I<data>][, I<name>]) -> identifier
537
538 There are eight different register functions to get callback for eight
539 different events. With one exception all of them are called as shown above.
540
541 =over 4
542
543 =item *
544
545 I<callback> is a callable object that will be called every time the event is
546 triggered.
547
548 =item *
549
550 I<data> is an optional object that will be passed back to the callback function
551 every time it is called. If you omit this parameter no object is passed back to
552 your callback, not even None.
553
554 =item *
555
556 I<name> is an optional identifier for this callback. The default name is
557 B<python>.I<module>. I<module> is taken from the B<__module__> attribute of
558 your callback function. Every callback needs a unique identifier, so if you
559 want to register the same callback multiple times in the same module you need to
560 specify a name here. Otherwise it's safe to ignore this parameter.
561
562 =item *
563
564 I<identifier> is the full identifier assigned to this callback.
565
566 =back
567
568 These functions are called in the various stages of the daemon (see the section
569 L<"WRITING YOUR OWN PLUGINS"> above) and are passed the following arguments:
570
571 =over 4
572
573 =item register_config
574
575 The only argument passed is a I<Config> object. See above for the layout of this
576 data type.
577 Note that you cannot receive the whole config files this way, only B<Module>
578 blocks inside the Python configuration block. Additionally you will only
579 receive blocks where your callback identifier matches B<python.>I<blockname>.
580
581 =item register_init
582
583 The callback will be called without arguments.
584
585 =item register_read(callback[, interval][, data][, name]) -> I<identifier>
586
587 This function takes an additional parameter: I<interval>. It specifies the
588 time between calls to the callback function.
589
590 The callback will be called without arguments.
591
592 =item register_shutdown
593
594 The callback will be called without arguments.
595
596 =item register_write
597
598 The callback function will be called with one argument passed, which will be a
599 I<Values> object. For the layout of I<Values> see above.
600 If this callback function throws an exception the next call will be delayed by
601 an increasing interval.
602
603 =item register_flush
604
605 Like B<register_config> is important for this callback because it determines
606 what flush requests the plugin will receive.
607
608 The arguments passed are I<timeout> and I<identifier>. I<timeout> indicates
609 that only data older than I<timeout> seconds is to be flushed. I<identifier>
610 specifies which values are to be flushed.
611
612 =item register_log
613
614 The arguments are I<severity> and I<message>. The severity is an integer and
615 small for important messages and high for less important messages. The least
616 important level is B<LOG_DEBUG>, the most important level is B<LOG_ERR>. In
617 between there are (from least to most important): B<LOG_INFO>, B<LOG_NOTICE>,
618 and B<LOG_WARNING>. I<message> is simply a string B<without> a newline at the
619 end.
620
621 If this callback throws an exception it will B<not> be logged. It will just be
622 printed to B<sys.stderr> which usually means silently ignored.
623
624 =item register_notification
625
626 The only argument passed is a I<Notification> object. See above for the layout of this
627 data type.
628
629 =back
630
631 =item B<unregister_*>(I<identifier>) -> None
632
633 Removes a callback or data-set from collectd's internal list of callback
634 functions. Every I<register_*> function has an I<unregister_*> function.
635 I<identifier> is either the string that was returned by the register function
636 or a callback function. The identifier will be constructed in the same way as
637 for the register functions.
638
639 =item B<get_dataset>(I<name>) -> I<definition>
640
641 Returns the definition of a dataset specified by I<name>. I<definition> is a list
642 of tuples, each representing one data source. Each tuple has 4 values:
643
644 =over 4
645
646 =item name
647
648 A string, the name of the data source.
649
650 =item type
651
652 A string that is equal to either of the variables B<DS_TYPE_COUNTER>,
653 B<DS_TYPE_GAUGE>, B<DS_TYPE_DERIVE> or B<DS_TYPE_ABSOLUTE>.
654
655 =item min
656
657 A float or None, the minimum value.
658
659 =item max
660
661 A float or None, the maximum value.
662
663 =back
664
665 =item B<flush>(I<plugin[, timeout][, identifier]) -> None
666
667 Flush one or all plugins. I<timeout> and the specified I<identifiers> are
668 passed on to the registered flush-callbacks. If omitted, the timeout defaults
669 to C<-1>. The identifier defaults to None. If the B<plugin> argument has been
670 specified, only named plugin will be flushed.
671
672 =item B<error>, B<warning>, B<notice>, B<info>, B<debug>(I<message>)
673
674 Log a message with the specified severity.
675
676 =back
677
678 =head1 EXAMPLES
679
680 Any Python module will start similar to:
681
682   import collectd
683
684 A very simple read function might look like:
685
686   import random
687
688   def read(data=None):
689     vl = collectd.Values(type='gauge')
690     vl.plugin='python.spam'
691     vl.dispatch(values=[random.random() * 100])
692
693 A very simple write function might look like:
694
695   def write(vl, data=None):
696     for i in vl.values:
697       print "%s (%s): %f" % (vl.plugin, vl.type, i)
698
699 To register those functions with collectd:
700
701   collectd.register_read(read)
702   collectd.register_write(write)
703
704 See the section L<"CLASSES"> above for a complete documentation of the data
705 types used by the read, write and match functions.
706
707 =head1 CAVEATS
708
709 =over 4
710
711 =item *
712
713 collectd is heavily multi-threaded. Each collectd thread accessing the Python
714 plugin will be mapped to a Python interpreter thread. Any such thread will be
715 created and destroyed transparently and on-the-fly.
716
717 Hence, any plugin has to be thread-safe if it provides several entry points
718 from collectd (i.E<nbsp>e. if it registers more than one callback or if a
719 registered callback may be called more than once in parallel).
720
721 =item *
722
723 The Python thread module is initialized just before calling the init callbacks.
724 This means you must not use Python's threading module prior to this point. This
725 includes all config and possibly other callback as well.
726
727 =item *
728
729 The python plugin exports the internal API of collectd which is considered
730 unstable and subject to change at any time. We try hard to not break backwards
731 compatibility in the Python API during the life cycle of one major release.
732 However, this cannot be guaranteed at all times. Watch out for warnings
733 dispatched by the python plugin after upgrades.
734
735 =back
736
737 =head1 KNOWN BUGS
738
739 =over 4
740
741 =item *
742
743 Not all aspects of the collectd API are accessible from Python. This includes
744 but is not limited to filters.
745
746 =back
747
748 =head1 SEE ALSO
749
750 L<collectd(1)>,
751 L<collectd.conf(5)>,
752 L<collectd-perl(5)>,
753 L<collectd-exec(5)>,
754 L<types.db(5)>,
755 L<python(1)>,
756
757 =head1 AUTHOR
758
759 The C<python plugin> has been written by
760 Sven Trenkel E<lt>collectdE<nbsp>atE<nbsp>semidefinite.deE<gt>.
761
762 This manpage has been written by Sven Trenkel
763 E<lt>collectdE<nbsp>atE<nbsp>semidefinite.deE<gt>.
764 It is based on the L<collectd-perl(5)> manual page by
765 Florian Forster E<lt>octoE<nbsp>atE<nbsp>collectd.orgE<gt> and
766 Sebastian Harl E<lt>shE<nbsp>atE<nbsp>tokkee.orgE<gt>.
767
768 =cut