Allows min size specification without unit (i.e. in bytes)
[dus.git] / dus.c
1
2 /*
3  *  dus is a simple utility to display the files and directories
4  *  according to their total disk occupancy.
5  *
6  *  Copyright (c) 2010 Francois Fleuret
7  *  Written by Francois Fleuret <francois@fleuret.org>
8  *
9  *  This file is part of dus.
10  *
11  *  dus is free software: you can redistribute it and/or modify it
12  *  under the terms of the GNU General Public License version 3 as
13  *  published by the Free Software Foundation.
14  *
15  *  dus is distributed in the hope that it will be useful, but WITHOUT
16  *  ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
17  *  or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public
18  *  License for more details.
19  *
20  *  You should have received a copy of the GNU General Public License
21  *  along with dus.  If not, see <http://www.gnu.org/licenses/>.
22  *
23  */
24
25 #define VERSION_NUMBER "1.2"
26
27 #define _BSD_SOURCE
28
29 #include <sys/types.h>
30 #include <sys/stat.h>
31 #include <sys/param.h>
32 #include <dirent.h>
33 #include <stdlib.h>
34 #include <stdio.h>
35 #include <unistd.h>
36 #include <errno.h>
37 #include <string.h>
38 #include <sys/ioctl.h>
39 #include <locale.h>
40 #include <getopt.h>
41
42 #define BUFFER_SIZE 4096
43
44 typedef int64_t size_sum_t;
45
46 /* Yeah, global variables! */
47
48 int ignore_dotfiles = 0; /* 1 means ignore files and directories
49                             starting with a dot */
50
51 int forced_width = 0; /* -1 means no width limit, strictly positive
52                          means limit, 0 means not active */
53
54 int forced_height = 0; /* -1 means no height limit, strictly positive
55                            means limit, 0 means not active */
56
57 int fancy_size_display = 0; /* 1 means to use floating values with K, M and G
58                                as units */
59
60 int reverse_sorting = 0; /* 1 means to show the large ones first */
61
62 int show_top = 0; /* 1 means to show the top of the sorted list
63                      instead of the bottom */
64
65 size_sum_t size_min = -1; /* -1 means no minimum size, otherwise lower
66                               bound on the size to display a
67                               file/dir */
68
69 /********************************************************************/
70
71 /* malloc with error checking.  */
72
73 void *safe_malloc(size_t n) {
74   void *p = malloc(n);
75   if (!p && n != 0) {
76     fprintf(stderr, "Can not allocate memory: %s\n", strerror(errno));
77     exit(EXIT_FAILURE);
78   }
79   return p;
80 }
81
82 /********************************************************************/
83
84 int ignore_entry(const char *name) {
85   return
86     strcmp(name, ".") == 0 ||
87     strcmp(name, "..") == 0 ||
88     (ignore_dotfiles && name[0] == '.' && name[1] != '/');
89 }
90
91 size_sum_t entry_size(const char *name) {
92   DIR *dir;
93   struct dirent *dir_e;
94   struct stat dummy;
95   size_sum_t result;
96   char subname[PATH_MAX];
97
98   result = 0;
99
100   if(lstat(name, &dummy) != 0) {
101     fprintf(stderr, "Can not stat %s: %s\n", name, strerror(errno));
102     exit(EXIT_FAILURE);
103   }
104
105   if(S_ISLNK(dummy.st_mode)) {
106     return 0;
107   }
108
109   if(S_ISDIR(dummy.st_mode)) {
110     dir = opendir(name);
111     if(dir) {
112       while((dir_e = readdir(dir))) {
113         if(!ignore_entry(dir_e->d_name)) {
114           snprintf(subname, PATH_MAX, "%s/%s", name, dir_e->d_name);
115           result += entry_size(subname);
116         }
117       }
118       closedir(dir);
119     } else {
120       fprintf(stderr, "Can not open directory %s: %s\n", name, strerror(errno));
121       exit(EXIT_FAILURE);
122     }
123   } else if(S_ISREG(dummy.st_mode)) {
124     result += dummy.st_size;
125   }
126
127   return result;
128 }
129
130 size_sum_t atoss(const char *string) {
131   size_sum_t total, partial_total;
132   const char *c;
133   total = 0;
134   partial_total = 0;
135
136   for(c = string; *c; c++) {
137     if(*c >= '0' && *c <= '9') {
138       partial_total = 10 * partial_total + ((int) (*c - '0'));
139     } else if(*c == 'K' || *c == 'k') {
140       total += partial_total * 1024;
141       partial_total = 0;
142     } else if(*c == 'M' || *c == 'm') {
143       total += partial_total * 1024 * 1024;
144       partial_total = 0;
145     } else if(*c == 'G' || *c == 'g') {
146       total += partial_total * 1024 * 1024 * 1024;
147       partial_total = 0;
148     } else {
149       fprintf(stderr, "Syntax error in %s\n", string);
150     }
151   }
152
153   total += partial_total;
154
155   return total;
156 }
157
158 /**********************************************************************/
159
160 struct entry_node {
161   struct entry_node *next;
162   char *name;
163   size_sum_t size;
164 };
165
166 struct entry_node *push_entry(char *name, struct entry_node *head) {
167   struct entry_node *result;
168   result = safe_malloc(sizeof(struct entry_node));
169   result->name = strdup(name);
170   result->size = entry_size(name);
171   result->next = head;
172   return result;
173 }
174
175 struct entry_node *push_dir_content(char *name, struct entry_node *head) {
176   char subname[PATH_MAX];
177   DIR *dir;
178   struct dirent *dir_e;
179   dir = opendir(name);
180   if(dir) {
181     while((dir_e = readdir(dir))) {
182       if(!ignore_entry(dir_e->d_name)) {
183         snprintf(subname, PATH_MAX, "%s/%s", name, dir_e->d_name);
184         head = push_entry(subname, head);
185       }
186     }
187     closedir(dir);
188   } else {
189     fprintf(stderr, "Can not open directory %s: %s\n", name, strerror(errno));
190     exit (EXIT_FAILURE);
191   }
192   return head;
193 }
194
195 void destroy_entry_list(struct entry_node *node) {
196   struct entry_node *next;
197   while(node) {
198     next = node->next;
199     free(node->name);
200     free(node);
201     node = next;
202   }
203 }
204
205 /**********************************************************************/
206
207 int compare_files(const void *x1, const void *x2) {
208   const struct entry_node **f1, **f2;
209
210   f1 = (const struct entry_node **) x1;
211   f2 = (const struct entry_node **) x2;
212
213   if(reverse_sorting) {
214     if((*f1)->size < (*f2)->size) {
215       return 1;
216     } else if((*f1)->size > (*f2)->size) {
217       return -1;
218     } else {
219       return 0;
220     }
221   } else {
222     if((*f1)->size < (*f2)->size) {
223       return -1;
224     } else if((*f1)->size > (*f2)->size) {
225       return 1;
226     } else {
227       return 0;
228     }
229   }
230 }
231
232 void raw_print(char *buffer, size_t buffer_size,
233                char *filename,  size_sum_t size) {
234   char *a, *b, *c, u;
235
236   b = buffer;
237   do {
238     if(b >= buffer + buffer_size) {
239       fprintf(stderr, "Buffer overflow in raw_print (hu?!).\n");
240       exit(EXIT_FAILURE);
241     }
242     *(b++) = size%10 + '0';
243     size /= 10;
244   } while(size);
245
246   a = buffer;
247   c = b;
248   while(a < c) {
249     u = *a;
250     *(a++) = *(--c);
251     *c = u;
252   }
253
254   *(b++) = ' ';
255
256   snprintf(b, buffer_size - (b - buffer), "%s\n", filename);
257 }
258
259 void fancy_print(char *buffer, size_t buffer_size,
260                  char *filename, size_sum_t size) {
261   if(size < 1024) {
262     snprintf(buffer,
263              buffer_size,
264              "% 8d -- %s\n",
265              ((int) size),
266              filename);
267   } else if(size < 1024 * 1024) {
268     snprintf(buffer,
269              buffer_size,
270              "% 7.1fK -- %s\n",
271              ((double) (size))/(1024.0),
272              filename);
273   } else if(size < 1024 * 1024 * 1024) {
274     snprintf(buffer,
275              buffer_size,
276              "% 7.1fM -- %s\n",
277              ((double) (size))/(1024.0 * 1024),
278              filename);
279   } else {
280     snprintf(buffer,
281              buffer_size,
282              "% 7.1fG -- %s\n",
283              ((double) (size))/(1024.0 * 1024.0 * 1024.0),
284              filename);
285   }
286 }
287
288 void print_sorted(struct entry_node *root, int width, int height) {
289   char line[BUFFER_SIZE];
290   struct entry_node *node;
291   struct entry_node **nodes;
292   int nb_nodes, n, first, last;
293
294   nb_nodes = 0;
295   for(node = root; node; node = node->next) {
296     if(size_min < 0 || node->size >= size_min) {
297       nb_nodes++;
298     }
299   }
300
301   nodes = safe_malloc(nb_nodes * sizeof(struct entry_node *));
302
303   n = 0;
304   for(node = root; node; node = node->next) {
305     if(size_min < 0 || node->size >= size_min) {
306       nodes[n++] = node;
307     }
308   }
309
310   qsort(nodes, nb_nodes, sizeof(struct entry_node *), compare_files);
311
312   first = 0;
313   last = nb_nodes;
314
315   if(forced_height) {
316     height = forced_height;
317   }
318
319   if(forced_width) {
320     width = forced_width;
321   }
322
323   if(height >= 0 && nb_nodes > height && !show_top && !forced_height) {
324     printf("...\n");
325   }
326
327   if(height > 0 && height < nb_nodes) {
328     first = nb_nodes - height;
329   }
330
331   if(show_top) {
332     n = last;
333     last = nb_nodes - first;
334     first = nb_nodes - n;
335   }
336
337   /* I do not like valgrind to complain about uninitialized data */
338   if(width < BUFFER_SIZE) {
339     line[width] = '\0';
340   }
341
342   for(n = first; n < last; n++) {
343     if(fancy_size_display) {
344       fancy_print(line, BUFFER_SIZE, nodes[n]->name, nodes[n]->size);
345     } else {
346       raw_print(line, BUFFER_SIZE, nodes[n]->name, nodes[n]->size);
347     }
348     if(width >= 1 && width + 1 < BUFFER_SIZE && line[width]) {
349       line[width] = '\n';
350       line[width + 1] = '\0';
351     }
352     printf(line);
353   }
354
355   if(height >= 0 && nb_nodes > height && show_top && !forced_height) {
356     printf("...\n");
357   }
358
359   free(nodes);
360 }
361
362 /**********************************************************************/
363
364 void usage(FILE *out) {
365   fprintf(out, "Usage: dus [OPTION]... [FILE]...\n");
366   fprintf(out, "Version %s (%s)\n", VERSION_NUMBER, UNAME);
367   fprintf(out, "Lists files and directories according to their size. The sizes are computed by summing recursively exact file sizes through directories. If a given directory has its name appended with '/', it is not listed, but the elements it contains are. If no files or directories are provided as arguments, the current directory is used as default.\n");
368   fprintf(out, "\n");
369   /*            01234567890123456789012345678901234567890123456789012345678901234567890123456789*/
370   fprintf(out, "   -d, --ignore-dots          ignore files and directories starting with a '.'\n");
371   fprintf(out, "   -f, --fancy                display size with float values and K, M and G\n");
372   fprintf(out, "                              units.\n");
373   fprintf(out, "   -r, --reverse-order        reverse the sorting order.\n");
374   fprintf(out, "   -t, --show-top             show the top of the list.\n");
375   fprintf(out, "   -c <cols>, --nb-columns <cols>\n");
376   fprintf(out, "                              specificy the number of columns to display. The\n");
377   fprintf(out, "                              value -1 corresponds to no constraint. By default\n");
378   fprintf(out, "                              the command uses the tty width, or no constraint\n");
379   fprintf(out, "                              if the stdout is not a tty.\n");
380   fprintf(out, "   -l <lines>, --nb-lines <lines>\n");
381   fprintf(out, "                              same as -c for number of lines.\n");
382   fprintf(out, "   -h, --help                 show this help.\n");
383   fprintf(out, "   -m <size>, --size-min <size>\n");
384   fprintf(out, "                              set the listed entries minimum size.\n");
385   fprintf(out, "\n");
386   fprintf(out, "Report bugs and comments to <francois@fleuret.org>.\n");
387 }
388
389 /**********************************************************************/
390
391 static struct option long_options[] = {
392   { "ignore-dots", no_argument, 0, 'd' },
393   { "reverse-order", no_argument, 0, 'r' },
394   { "show-top", no_argument, 0, 't' },
395   { "help", no_argument, 0, 'h' },
396   { "fancy", no_argument, 0, 'f' },
397   { "nb-columns", 1, 0, 'c' },
398   { "nb-lines", 1, 0, 'l' },
399   { "size-min", 1, 0, 'm' },
400   { 0, 0, 0, 0 }
401 };
402
403 int main(int argc, char **argv) {
404   int c, l;
405   struct entry_node *root;
406   struct winsize win;
407
408   root = 0;
409
410   setlocale (LC_ALL, "");
411
412   while ((c = getopt_long(argc, argv, "dfrtl:c:m:hd",
413                           long_options, NULL)) != -1) {
414     switch (c) {
415
416     case 'd':
417       ignore_dotfiles = 1;
418       break;
419
420     case 'f':
421       fancy_size_display = 1;
422       break;
423
424     case 'r':
425       reverse_sorting = 1;
426       break;
427
428     case 't':
429       show_top = 1;
430       break;
431
432     case 'l':
433       forced_height = atoi(optarg);
434       break;
435
436     case 'c':
437       forced_width = atoi(optarg);
438       break;
439
440     case 'm':
441       size_min = atoss(optarg);
442       break;
443
444     case 'h':
445       usage(stdout);
446       exit(EXIT_SUCCESS);
447
448       break;
449
450     default:
451       usage(stderr);
452       exit(EXIT_FAILURE);
453     }
454   }
455
456   if (optind < argc) {
457     while (optind < argc) {
458       l = strlen(argv[optind]);
459       if(l > 0 && argv[optind][l - 1] == '/') {
460         argv[optind][l - 1] = '\0';
461         root = push_dir_content(argv[optind++], root);
462       } else {
463         root = push_entry(argv[optind++], root);
464       }
465     }
466   } else {
467     root = push_dir_content(".", root);
468   }
469
470   if(isatty(STDOUT_FILENO) &&
471      !ioctl (STDOUT_FILENO, TIOCGWINSZ, (char *) &win)) {
472     print_sorted(root, win.ws_col, win.ws_row - 2);
473   } else {
474     print_sorted(root, -1, -1);
475   }
476
477   destroy_entry_list(root);
478
479   exit(EXIT_SUCCESS);
480 }