Cosmetics. The debug check for interval order is still there.
[selector.git] / selector.c
1
2 /*
3  *  selector is a simple command line utility for selection of strings
4  *  with a dynamic pattern-matching.
5  *
6  *  Copyright (c) 2009, 2010, 2011 Francois Fleuret
7  *  Written by Francois Fleuret <francois@fleuret.org>
8  *
9  *  This file is part of selector.
10  *
11  *  selector is free software: you can redistribute it and/or modify
12  *  it under the terms of the GNU General Public License version 3 as
13  *  published by the Free Software Foundation.
14  *
15  *  selector is distributed in the hope that it will be useful, but
16  *  WITHOUT ANY WARRANTY; without even the implied warranty of
17  *  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
18  *  General Public License for more details.
19  *
20  *  You should have received a copy of the GNU General Public License
21  *  along with selector.  If not, see <http://www.gnu.org/licenses/>.
22  *
23  */
24
25 /*
26
27   To use it as a super-history-search for bash:
28   selector --bash <(history)
29
30 */
31
32 #define _GNU_SOURCE
33
34 #include <stdio.h>
35 #include <stdlib.h>
36 #include <unistd.h>
37 #include <string.h>
38 #include <errno.h>
39 #include <ncurses.h>
40 #include <fcntl.h>
41 #include <sys/ioctl.h>
42 #include <termios.h>
43 #include <regex.h>
44 #include <locale.h>
45 #include <getopt.h>
46 #include <limits.h>
47
48 #define VERSION "1.1.5"
49
50 #define BUFFER_SIZE 4096
51
52 /* Yeah, global variables! */
53
54 int nb_lines_max = 1000;
55 char pattern_separator = ';';
56 char label_separator = '\0';
57 int output_to_vt_buffer = 0;
58 int add_control_qs = 0;
59 int with_colors = 1;
60 int zsh_history = 0;
61 int bash_history = 0;
62 int inverse_order = 0;
63 int remove_duplicates = 0;
64 int use_regexp = 0;
65 int case_sensitive = 0;
66 char *title = 0;
67 int error_flash = 0;
68 int upper_caps_makes_case_sensitive = 0;
69 int show_long_lines = 0;
70 int show_hits = 0;
71
72 int attr_modeline, attr_focus_line, attr_error, attr_hits;
73
74 /********************************************************************/
75
76 /* malloc with error checking.  */
77
78 void *safe_malloc(size_t n) {
79   void *p = malloc(n);
80   if(!p && n != 0) {
81     fprintf(stderr,
82             "selector: can not allocate memory: %s\n", strerror(errno));
83     exit(EXIT_FAILURE);
84   }
85   return p;
86 }
87
88 /*********************************************************************/
89
90 void inject_into_tty_buffer(char *string, int add_control_qs) {
91   struct termios oldtio, newtio;
92   const char *k;
93   const char control_q = '\021';
94   tcgetattr(STDIN_FILENO, &oldtio);
95   memset(&newtio, 0, sizeof(newtio));
96   /* Set input mode (non-canonical, *no echo*,...) */
97   tcsetattr(STDIN_FILENO, TCSANOW, &newtio);
98   /* Put the selected string in the tty input buffer */
99   for(k = string; *k; k++) {
100     if(add_control_qs && !(*k >= ' ' && *k <= '~')) {
101       /* Add ^Q to quote control characters */
102       ioctl(STDIN_FILENO, TIOCSTI, &control_q);
103     }
104     ioctl(STDIN_FILENO, TIOCSTI, k);
105   }
106   /* Restore the old settings */
107   tcsetattr(STDIN_FILENO, TCSANOW, &oldtio);
108 }
109
110 /*********************************************************************/
111
112 void str_to_positive_integers(char *string, int *values, int nb) {
113   int current_value, gotone;
114   char *s;
115   int n;
116
117   n = 0;
118   current_value = 0;
119   gotone = 0;
120   s = string;
121
122   while(1) {
123     if(*s >= '0' && *s <= '9') {
124       current_value = current_value * 10 + (int) (*s - '0');
125       gotone = 1;
126     } else if(*s == ',' || *s == '\0') {
127       if(gotone) {
128         if(n < nb) {
129           values[n++] = current_value;
130           if(*s == '\0') {
131             if(n == nb) {
132               return;
133             } else {
134               fprintf(stderr,
135                       "selector: Missing value in `%s'.\n", string);
136               exit(EXIT_FAILURE);
137             }
138           }
139           current_value = 0;
140           gotone = 0;
141         } else {
142           fprintf(stderr,
143                   "selector: Too many values in `%s'.\n", string);
144           exit(EXIT_FAILURE);
145         }
146       } else {
147         fprintf(stderr,
148                 "selector: Empty value in `%s'.\n", string);
149         exit(EXIT_FAILURE);
150       }
151     } else {
152       fprintf(stderr,
153               "selector: Syntax error in `%s'.\n", string);
154       exit(EXIT_FAILURE);
155     }
156     s++;
157   }
158 }
159
160 void error_feedback() {
161   if(error_flash) {
162     flash();
163   } else {
164     beep();
165   }
166 }
167
168 void usage(FILE *out) {
169
170   fprintf(out, "Selector version %s (%s)\n", VERSION, UNAME);
171   fprintf(out, "Written by Francois Fleuret <francois@fleuret.org>.\n");
172   fprintf(out, "\n");
173   fprintf(out, "Usage: selector [options] [<filename1> [<filename2> ...]]\n");
174   fprintf(out, "\n");
175   fprintf(out, " -h, --help\n");
176   fprintf(out, "         show this help\n");
177   fprintf(out, " -v, --inject-in-tty\n");
178   fprintf(out, "         inject the selected line in the tty\n");
179   fprintf(out, " -w, --add-control-qs\n");
180   fprintf(out, "         quote control characters with ^Qs when using -v\n");
181   fprintf(out, " -d, --remove-duplicates\n");
182   fprintf(out, "         remove duplicated lines\n");
183   fprintf(out, " -b, --remove-bash-prefix\n");
184   fprintf(out, "         remove the bash history line prefix\n");
185   fprintf(out, " -z, --remove-zsh-prefix\n");
186   fprintf(out, "         remove the zsh history line prefix\n");
187   fprintf(out, " -i, --revert-order\n");
188   fprintf(out, "         invert the order of lines\n");
189   fprintf(out, " -e, --regexp\n");
190   fprintf(out, "         start in regexp mode\n");
191   fprintf(out, " -a, --case-sensitive\n");
192   fprintf(out, "         start in case sensitive mode\n");
193   fprintf(out, " -j, --show-long-lines\n");
194   fprintf(out, "         print three dots at the end of truncated lines\n");
195   fprintf(out, " -y, --show-hits\n");
196   fprintf(out, "         highlight the matching substrings\n");
197   fprintf(out, " -u, --upper-case-makes-case-sensitive\n");
198   fprintf(out, "         using an upper case character in the matching string makes\n");
199   fprintf(out, "         the matching case-sensitive\n");
200   fprintf(out, " -m, --monochrome\n");
201   fprintf(out, "         monochrome mode\n");
202   fprintf(out, " -q, --no-beep\n");
203   fprintf(out, "         make a flash instead of a beep on an edition error\n");
204   fprintf(out, " --bash\n");
205   fprintf(out, "         setting for bash history search, same as -b -i -d -v -w -l ${HISTSIZE}\n");
206   fprintf(out, " --      all following arguments are filenames\n");
207   fprintf(out, " -t <title>, --title <title>\n");
208   fprintf(out, "         add a title in the modeline\n");
209   fprintf(out, " -c <colors>, --colors <colors>\n");
210   fprintf(out, "         set the display colors with an argument of the form\n");
211   fprintf(out, "         <fg_modeline>,<bg_modeline>,<fg_highlight>,<bg_highlight>\n");
212   fprintf(out, " -o <output filename>, --output-file <output filename>\n");
213   fprintf(out, "         set a file to write the selected line to\n");
214   fprintf(out, " -s <pattern separator>, --pattern-separator <pattern separator>\n");
215   fprintf(out, "         set the symbol to separate substrings in the pattern\n");
216   fprintf(out, " -x <label separator>, --label-separator <label separator>\n");
217   fprintf(out, "         set the symbol to terminate the label\n");
218   fprintf(out, " -l <max number of lines>, --number-of-lines <max number of lines>\n");
219   fprintf(out, "         set the maximum number of lines to take into account\n");
220   fprintf(out, "\n");
221 }
222
223 /*********************************************************************/
224
225 /* A quick and dirty hash table */
226
227 #define MAGIC_HASH_MULTIPLIER 387433
228
229 /* The table itself stores indexes of the strings taken in a char**
230    table. When a string is added, if it was already in the table, the
231    new index replaces the previous one.  */
232
233 struct hash_table_t {
234   int size;
235   int *entries;
236 };
237
238 struct hash_table_t *new_hash_table(int size) {
239   int k;
240   struct hash_table_t *hash_table;
241
242   hash_table = safe_malloc(sizeof(struct hash_table_t));
243
244   hash_table->size = size;
245   hash_table->entries = safe_malloc(hash_table->size * sizeof(int));
246
247   for(k = 0; k < hash_table->size; k++) {
248     hash_table->entries[k] = -1;
249   }
250
251   return hash_table;
252 }
253
254 void free_hash_table(struct hash_table_t *hash_table) {
255   free(hash_table->entries);
256   free(hash_table);
257 }
258
259 /* Adds new_string in the table, associated to new_index. If this
260    string was not already in the table, returns -1. Otherwise, returns
261    the previous index it had. */
262
263 int add_and_get_previous_index(struct hash_table_t *hash_table,
264                                const char *new_string, int new_index,
265                                char **strings) {
266
267   unsigned int code = 0, start;
268   int k;
269
270   /* This is my recipe. I checked, it seems to work (as long as
271      hash_table->size is not a multiple of MAGIC_HASH_MULTIPLIER that
272      should be okay) */
273
274   for(k = 0; new_string[k]; k++) {
275     code = code * MAGIC_HASH_MULTIPLIER + (unsigned int) (new_string[k]);
276   }
277
278   code = code % hash_table->size;
279   start = code;
280
281   while(hash_table->entries[code] >= 0) {
282     /* There is a string with that code */
283     if(strcmp(new_string, strings[hash_table->entries[code]]) == 0) {
284       /* It is the same string, we keep a copy of the stored index */
285       int result = hash_table->entries[code];
286       /* Put the new one */
287       hash_table->entries[code] = new_index;
288       /* And return the previous one */
289       return result;
290     }
291     /* This collision was not the same string, let's move to the next
292        in the table */
293     code = (code + 1) % hash_table->size;
294     /* We came back to our original code, which means that the table
295        is full */
296     if(code == start) {
297       fprintf(stderr,
298               "Full hash table (that should not happen)\n");
299       exit(EXIT_FAILURE);
300    }
301   }
302
303   /* This string was not already in there, store the index in the
304      table and return -1 */
305
306   hash_table->entries[code] = new_index;
307   return -1;
308 }
309
310 /*********************************************************************
311  A matcher matches either with a collection of substrings, or with a
312  regexp */
313
314 struct matcher {
315   regex_t preg;
316   int regexp_error;
317   int nb_patterns;
318   int case_sensitive;
319   char *splitted_patterns, **patterns;
320 };
321
322 /* Routine to add an interval to a sorted list of intervals
323    extermities. Returns the number of extremities. This is an effing
324    nightmare */
325
326 int add_interval(int n, int *switches, int start, int end) {
327   int f, g, k;
328
329   if(start == end) { return n; }
330
331   f = 0;
332   while(f < n && switches[f] <= start) { f++; }
333   g = f;
334   while(g < n && switches[g] <= end) { g++; }
335
336   if(f == n) {
337     /* switches[n]   start  end  */
338     /* XXXXXXXXXX|               */
339     switches[f] = start;
340     switches[f+1] = end;
341     return n + 2;
342   }
343
344   if(f % 2) {
345
346     if(g % 2) {
347       /* switches[f-1]   start   switches[f]         switches[g-1]   end    switches[g] */
348       /* |XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|   ...   |XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX| */
349       for(k = f; k < n; k++) { switches[k] = switches[k + (g - f)]; }
350       return n - (g - f);
351     } else {
352       /* switches[f-1]   start   switches[f]         switches[g-1]   end    switches[g] */
353       /* |XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|   ...   XXXXXXXXXXXX|          |XXXXXXXXXX */
354       switches[g - 1] = end;
355       for(k = f; k < n; k++) { switches[k] = switches[k + ((g - 1) - f)]; }
356       return n - ((g - 1) - f);
357     }
358
359   } else {
360
361     if(f == g) {
362       /* switches[f-1]   start  end   switches[f]  */
363       /* XXXXXXXXXXXX|                |XXXXXXXXXX  */
364       for(k = n - 1; k >= f; k--) {
365         switches[k + 2] = switches[k];
366       }
367       switches[f] = start;
368       switches[f + 1] = end;
369       return n + 2;
370     }
371
372     if(g % 2) {
373       /* switches[f-1]   start   switches[f]         switches[g-1]   end    switches[g] */
374       /* XXXXXXXXXXXX|           |XXXXXXXXXX   ...   |XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX| */
375       switches[f] = start;
376       for(k = f + 1; k < n; k++) { switches[k] = switches[k + (g - (f + 1))]; }
377       return n - (g - (f + 1));
378     } else {
379       /* switches[f-1]   start   switches[f]         switches[g-1]   end    switches[g] */
380       /* XXXXXXXXXXXX|           |XXXXXXXXXX   ...   XXXXXXXXXXXX|          |XXXXXXXXXX */
381       switches[f] = start;
382       switches[g - 1] = end;
383       for(k = f + 1; k < n; k++) { switches[k] = switches[k + ((g - 1) - (f + 1))]; }
384       return n - ((g - 1) - (f + 1));
385     }
386   }
387 }
388
389 int match(struct matcher *matcher, char *string, int *nb_switches, int *switches) {
390   int n;
391   char *where;
392   regmatch_t matches;
393
394   if(nb_switches) { *nb_switches = 0; }
395
396   if(matcher->nb_patterns >= 0) {
397     if(matcher->case_sensitive) {
398       for(n = 0; n < matcher->nb_patterns; n++) {
399         if((where = strstr(string, matcher->patterns[n])) == 0) return 0;
400         if(switches) {
401           *nb_switches = add_interval(*nb_switches, switches,
402                                       (int) (where - string),
403                                       (int) (where - string) + strlen(matcher->patterns[n]));
404         }
405       }
406     } else {
407       for(n = 0; n < matcher->nb_patterns; n++) {
408         if((where = strcasestr(string, matcher->patterns[n])) == 0) return 0;
409         if(switches) {
410           *nb_switches = add_interval(*nb_switches, switches,
411                                       (int) (where - string),
412                                       (int) (where - string) + strlen(matcher->patterns[n]));
413 #warning CHECK THE INTERVALS
414           {
415             /* int i; */
416             /* FILE *out = fopen("/tmp/intervals", "w"); */
417             /* for(k = 0; k < (*nb_switches)/2; k++) { */
418             /* i = 0; */
419             /* for(; i < switches[2 * k]; i++) fprintf(out, "-"); */
420             /* for(; i < switches[2 * k + 1]; i++) fprintf(out, "%c", string[i]); */
421             /* for(; i < strlen(string); i++) fprintf(out, "-"); */
422             /* fprintf(out, "\n"); */
423             /* } */
424             /* fclose(out); */
425             int k;
426             for(k = 0; k < *nb_switches - 1; k++) {
427               if(switches[k] > switches[k+1]) {
428                 abort();
429               }
430             }
431           }
432         }
433       }
434     }
435     return 1;
436   } else {
437     if(switches) {
438       if(regexec(&matcher->preg, string, 1, &matches, 0) == 0) {
439         *nb_switches = 2;
440         switches[0] = matches.rm_so;
441         switches[1] = matches.rm_eo;
442         return 1;
443       } else {
444         return 0;
445       }
446     } else {
447       return regexec(&matcher->preg, string, 0, 0, 0) == 0;
448     }
449   }
450 }
451
452 void free_matcher(struct matcher *matcher) {
453   if(matcher->nb_patterns < 0) {
454     if(!matcher->regexp_error) regfree(&matcher->preg);
455   } else {
456     free(matcher->splitted_patterns);
457     free(matcher->patterns);
458   }
459 }
460
461 void initialize_matcher(struct matcher *matcher,
462                         int use_regexp, int case_sensitive,
463                         const char *pattern) {
464   const char *s;
465   char *t, *last_pattern_start;
466   int n;
467
468   if(use_regexp) {
469     matcher->case_sensitive = case_sensitive;
470     matcher->nb_patterns = -1;
471     matcher->regexp_error = regcomp(&matcher->preg, pattern,
472                                     case_sensitive ? 0 : REG_ICASE);
473   } else {
474     matcher->regexp_error = 0;
475     matcher->nb_patterns = 1;
476
477     if(upper_caps_makes_case_sensitive) {
478       for(s = pattern; *s && !case_sensitive; s++) {
479         case_sensitive = (*s >= 'A' && *s <= 'Z');
480       }
481     }
482
483     matcher->case_sensitive = case_sensitive;
484
485     for(s = pattern; *s; s++) {
486       if(*s == pattern_separator) {
487         matcher->nb_patterns++;
488       }
489     }
490
491     matcher->splitted_patterns =
492       safe_malloc((strlen(pattern) + 1) * sizeof(char));
493
494     matcher->patterns =
495       safe_malloc(matcher->nb_patterns * sizeof(char *));
496
497     strcpy(matcher->splitted_patterns, pattern);
498
499     n = 0;
500     last_pattern_start = matcher->splitted_patterns;
501     for(t = matcher->splitted_patterns; n < matcher->nb_patterns; t++) {
502       if(*t == pattern_separator || *t == '\0') {
503         *t = '\0';
504         matcher->patterns[n++] = last_pattern_start;
505         last_pattern_start = t + 1;
506       }
507     }
508   }
509 }
510
511 /*********************************************************************
512  Buffer edition */
513
514 void delete_char(char *buffer, int *position) {
515   if(buffer[*position]) {
516     int c = *position;
517     while(c < BUFFER_SIZE && buffer[c]) {
518       buffer[c] = buffer[c+1];
519       c++;
520     }
521   } else error_feedback();
522 }
523
524 void backspace_char(char *buffer, int *position) {
525   if(*position > 0) {
526     if(buffer[*position]) {
527       int c = *position - 1;
528       while(buffer[c]) {
529         buffer[c] = buffer[c+1];
530         c++;
531       }
532     } else {
533       buffer[*position - 1] = '\0';
534     }
535
536     (*position)--;
537   } else error_feedback();
538 }
539
540 void insert_char(char *buffer, int *position, char character) {
541   if(strlen(buffer) < BUFFER_SIZE - 1) {
542     int c = *position;
543     char t = buffer[c], u;
544     while(t) {
545       c++;
546       u = buffer[c];
547       buffer[c] = t;
548       t = u;
549     }
550     c++;
551     buffer[c] = '\0';
552     buffer[(*position)++] = character;
553   } else error_feedback();
554 }
555
556 void kill_before_cursor(char *buffer, int *position) {
557   int s = 0;
558   while(buffer[*position + s]) {
559     buffer[s] = buffer[*position + s];
560     s++;
561   }
562   buffer[s] = '\0';
563   *position = 0;
564 }
565
566 void kill_after_cursor(char *buffer, int *position) {
567   buffer[*position] = '\0';
568 }
569
570 /*********************************************************************/
571
572 int previous_visible(int current_line, char **lines, struct matcher *matcher) {
573   int line = current_line - 1;
574   while(line >= 0 && !match(matcher, lines[line], 0, 0)) line--;
575   return line;
576 }
577
578 int next_visible(int current_line, int nb_lines, char **lines,
579                  struct matcher *matcher) {
580   int line = current_line + 1;
581   while(line < nb_lines && !match(matcher, lines[line], 0, 0)) line++;
582
583   if(line < nb_lines)
584     return line;
585   else
586     return -1;
587 }
588
589 /*********************************************************************/
590
591 void print_string_with_switches(char *buffer, int line_width,
592                                 int console_width,
593                                 int nb_patterns, int *switches) {
594   int w, current = 0, next;
595   if(switches) {
596     for(w = 0; w < nb_patterns && switches[2 * w] < line_width; w++) {
597       if(switches[2 * w] < switches[2 * w + 1]) {
598         next = switches[2 * w];
599         if(next > line_width) { next = line_width; }
600         if(next > current) { addnstr(buffer + current,  next - current); }
601         attron(attr_hits);
602         current = next;
603         next = switches[2 * w + 1];
604         if(next > line_width) { next = line_width; }
605         if(next > current) { addnstr(buffer + current,  next - current); }
606         attroff(attr_hits);
607         current = next;
608       }
609     }
610     if(current < line_width) {
611       addnstr(buffer + current, console_width - current);
612     }
613   } else {
614     addnstr(buffer, console_width);
615   }
616 }
617
618 /* The line highlighted is the first one matching the matcher in that
619    order: (1) current_focus_line after motion, if it does not match,
620    then (2) the first with a greater index, if none matches, then (3)
621    the first with a lesser index.
622
623    The index of the line actually shown highlighted is written in
624    displayed_focus_line (it can be -1 if no line at all matches the
625    matcher)
626
627    If there is a motion and a line is actually shown highlighted, its
628    value is written in current_focus_line. */
629
630 void update_screen(int *current_focus_line, int *displayed_focus_line,
631                    int motion,
632                    int nb_lines, char **lines,
633                    int cursor_position,
634                    char *pattern) {
635   int *switches;
636   char buffer[BUFFER_SIZE];
637   struct matcher matcher;
638   int k, l, m;
639   int console_width, console_height;
640   int nb_printed_lines = 0;
641   int cursor_x;
642   int nb_switches;
643
644   initialize_matcher(&matcher, use_regexp, case_sensitive, pattern);
645
646   if(show_hits && matcher.nb_patterns >= 0) {
647     switches = safe_malloc(sizeof(int) * matcher.nb_patterns * 2);
648   } else {
649     switches = safe_malloc(sizeof(int) * 2);
650   }
651
652   console_width = getmaxx(stdscr);
653   console_height = getmaxy(stdscr);
654
655   use_default_colors();
656
657   /* Add an empty line where we will print the modeline at the end */
658
659   addstr("\n");
660
661   /* If the regexp is erroneous, print a message saying so */
662
663   if(matcher.regexp_error) {
664     attron(attr_error);
665     addnstr("Regexp syntax error", console_width);
666     attroff(attr_error);
667   }
668
669   /* Else, and we do have lines to select from, find a visible line. */
670
671   else if(nb_lines > 0) {
672     int new_focus_line;
673     if(match(&matcher, lines[*current_focus_line], 0, 0)) {
674       new_focus_line = *current_focus_line;
675     } else {
676       new_focus_line = next_visible(*current_focus_line, nb_lines, lines,
677                                     &matcher);
678       if(new_focus_line < 0) {
679         new_focus_line = previous_visible(*current_focus_line, lines, &matcher);
680       }
681     }
682
683     /* If we found a visible line and we should move, let's move */
684
685     if(new_focus_line >= 0 && motion != 0) {
686       int l = new_focus_line;
687       if(motion > 0) {
688         /* We want to go down, let's find the first visible line below */
689         for(m = 0; l >= 0 && m < motion; m++) {
690           l = next_visible(l, nb_lines, lines, &matcher);
691           if(l >= 0) {
692             new_focus_line = l;
693           }
694         }
695       } else {
696         /* We want to go up, let's find the first visible line above */
697         for(m = 0; l >= 0 && m < -motion; m++) {
698           l = previous_visible(l, lines, &matcher);
699           if(l >= 0) {
700             new_focus_line = l;
701           }
702         }
703       }
704     }
705
706     /* Here new_focus_line is either a line number matching the
707        pattern, or -1 */
708
709     if(new_focus_line >= 0) {
710
711       int first_line = new_focus_line, last_line = new_focus_line;
712       int nb_match = 1;
713
714       /* We find the first and last lines to show, so that the total
715          of visible lines between them (them included) is
716          console_height-1 */
717
718       while(nb_match < console_height-1 &&
719             (first_line > 0 || last_line < nb_lines - 1)) {
720
721         if(first_line > 0) {
722           first_line--;
723           while(first_line > 0 && !match(&matcher, lines[first_line], 0, 0)) {
724             first_line--;
725           }
726           if(match(&matcher, lines[first_line], 0, 0)) {
727             nb_match++;
728           }
729         }
730
731         if(nb_match < console_height - 1 && last_line < nb_lines - 1) {
732           last_line++;
733           while(last_line < nb_lines - 1 && !match(&matcher, lines[last_line], 0, 0)) {
734             last_line++;
735           }
736
737           if(match(&matcher, lines[last_line], 0, 0)) {
738             nb_match++;
739           }
740         }
741       }
742
743       /* Now we display them */
744
745       for(l = first_line; l <= last_line; l++) {
746         if(match(&matcher, lines[l], &nb_switches, switches)) {
747           int k = 0;
748
749           while(lines[l][k] && k < BUFFER_SIZE - 2 && k < console_width) {
750             buffer[k] = lines[l][k];
751             k++;
752           }
753
754           /* Highlight the highlighted line ... */
755
756           if(l == new_focus_line) {
757             if(show_long_lines && k >= console_width) {
758               if(console_width >= 4) {
759                 buffer[console_width - 4] = ' ';
760                 buffer[console_width - 3] = '.';
761                 buffer[console_width - 2] = '.';
762                 buffer[console_width - 1] = '.';
763               }
764             } else {
765               while(k < console_width) {
766                 buffer[k++] = ' ';
767               }
768             }
769             attron(attr_focus_line);
770             print_string_with_switches(buffer, k, console_width,
771                                        nb_switches / 2, switches);
772             attroff(attr_focus_line);
773           } else {
774             if(show_long_lines && k >= console_width) {
775               if(console_width >= 4) {
776                 buffer[console_width - 4] = ' ';
777                 buffer[console_width - 3] = '.';
778                 buffer[console_width - 2] = '.';
779                 buffer[console_width - 1] = '.';
780               }
781             } else {
782               buffer[k++] = '\n';
783               buffer[k++] = '\0';
784             }
785
786             print_string_with_switches(buffer, k, console_width,
787                                        nb_switches / 2, switches);
788           }
789
790           nb_printed_lines++;
791         }
792       }
793
794       /* If we are on a focused line and we moved, this become the new
795          focus line */
796
797       if(motion != 0) {
798         *current_focus_line = new_focus_line;
799       }
800     }
801
802     *displayed_focus_line = new_focus_line;
803
804     if(nb_printed_lines == 0) {
805       attron(attr_error);
806       addnstr("No selection", console_width);
807       attroff(attr_error);
808     }
809   }
810
811   /* Else, print a message saying that there are no lines to select from */
812
813   else {
814     attron(attr_error);
815     addnstr("Empty choice", console_width);
816     attroff(attr_error);
817   }
818
819   clrtobot();
820
821   /* Draw the modeline */
822
823   move(0, 0);
824
825   attron(attr_modeline);
826
827   for(k = 0; k < console_width; k++) buffer[k] = ' ';
828   buffer[console_width] = '\0';
829   addnstr(buffer, console_width);
830
831   move(0, 0);
832
833   /* There must be a more elegant way of moving the cursor at a
834      location met during display */
835
836   cursor_x = 0;
837
838   if(title) {
839     addstr(title);
840     addstr(" ");
841     cursor_x += strlen(title) + 1;
842   }
843
844   sprintf(buffer, "%d/%d ", nb_printed_lines, nb_lines);
845   addstr(buffer);
846   cursor_x += strlen(buffer);
847
848   addnstr(pattern, cursor_position);
849   cursor_x += cursor_position;
850
851   if(pattern[cursor_position]) {
852     addstr(pattern + cursor_position);
853   } else {
854     addstr(" ");
855   }
856
857   /* Add a few info about the mode we are in (regexp and/or case
858      sensitive) */
859
860   if(use_regexp || matcher.case_sensitive) {
861     addstr(" [");
862     if(use_regexp) {
863       addstr("regexp");
864     }
865
866     if(matcher.case_sensitive) {
867       if(use_regexp) {
868         addstr(",");
869       }
870       addstr("case");
871     }
872     addstr("]");
873   }
874
875   move(0, cursor_x);
876
877   attroff(attr_modeline);
878
879   /* We are done */
880
881   refresh();
882   if(switches) { free(switches); }
883   free_matcher(&matcher);
884 }
885
886 /*********************************************************************/
887
888 void store_line(struct hash_table_t *hash_table,
889                 const char *new_line,
890                 int *nb_lines, char **lines) {
891   int dup;
892
893   /* Remove the zsh history prefix */
894
895   if(zsh_history && *new_line == ':') {
896     while(*new_line && *new_line != ';') new_line++;
897     if(*new_line == ';') new_line++;
898   }
899
900   /* Remove the bash history prefix */
901
902   if(bash_history) {
903     while(*new_line == ' ') new_line++;
904     while(*new_line >= '0' && *new_line <= '9') new_line++;
905     while(*new_line == ' ') new_line++;
906   }
907
908   /* Check for duplicates with the hash table and insert the line in
909      the list if necessary */
910
911   if(hash_table) {
912     dup = add_and_get_previous_index(hash_table,
913                                      new_line, *nb_lines, lines);
914   } else {
915     dup = -1;
916   }
917
918   if(dup < 0) {
919     lines[*nb_lines] = safe_malloc((strlen(new_line) + 1) * sizeof(char));
920     strcpy(lines[*nb_lines], new_line);
921   } else {
922     /* The string was already in there, so we do not allocate a new
923        string but use the pointer to the first occurence of it */
924     lines[*nb_lines] = lines[dup];
925     lines[dup] = 0;
926   }
927
928   (*nb_lines)++;
929 }
930
931 void read_file(struct hash_table_t *hash_table,
932                const char *input_filename,
933                int nb_lines_max, int *nb_lines, char **lines) {
934
935   char raw_line[BUFFER_SIZE];
936   char *s;
937   FILE *file;
938
939   file = fopen(input_filename, "r");
940
941   if(!file) {
942     fprintf(stderr, "selector: Can not open `%s'.\n", input_filename);
943     exit(EXIT_FAILURE);
944   }
945
946   while(*nb_lines < nb_lines_max && fgets(raw_line, BUFFER_SIZE, file)) {
947     for(s = raw_line + strlen(raw_line) - 1; s > raw_line && *s == '\n'; s--) {
948       *s = '\0';
949     }
950     store_line(hash_table, raw_line, nb_lines, lines);
951   }
952
953   fclose(file);
954 }
955
956 /*********************************************************************/
957
958 /* For long options that have no equivalent short option, use a
959    non-character as a pseudo short option, starting with CHAR_MAX + 1.  */
960 enum
961 {
962   OPT_BASH_MODE = CHAR_MAX + 1
963 };
964
965 static struct option long_options[] = {
966   { "output-file", 1, 0, 'o' },
967   { "pattern-separator", 1, 0, 's' },
968   { "label-separator", 1, 0, 'x' },
969   { "inject-in-tty", no_argument, 0, 'v' },
970   { "add-control-qs", no_argument, 0, 'w' },
971   { "monochrome", no_argument, 0, 'm' },
972   { "no-beep", no_argument, 0, 'q' },
973   { "revert-order", no_argument, 0, 'i' },
974   { "remove-bash-prefix", no_argument, 0, 'b' },
975   { "remove-zsh-prefix", no_argument, 0, 'z' },
976   { "remove-duplicates", no_argument, 0, 'd' },
977   { "regexp", no_argument, 0, 'e' },
978   { "case-sensitive", no_argument, 0, 'a' },
979   { "show-long-lines", no_argument, 0, 'j'},
980   { "show-hits", no_argument, 0, 'j'},
981   { "upper-case-makes-case-sensitive", no_argument, 0, 'u' },
982   { "title", 1, 0, 't' },
983   { "number-of-lines", 1, 0, 'l' },
984   { "colors", 1, 0, 'c' },
985   { "bash", no_argument, 0, OPT_BASH_MODE },
986   { "help", no_argument, 0, 'h' },
987   { 0, 0, 0, 0 }
988 };
989
990 int main(int argc, char **argv) {
991
992   char output_filename[BUFFER_SIZE];
993   char pattern[BUFFER_SIZE];
994   int c, k, l, n;
995   int cursor_position;
996   int error = 0, show_help = 0, done = 0;
997   int key;
998   int current_focus_line, displayed_focus_line;
999
1000   int colors[4];
1001   int color_fg_modeline, color_bg_modeline;
1002   int color_fg_highlight, color_bg_highlight;
1003
1004   char **lines, **labels;
1005   int nb_lines;
1006   struct hash_table_t *hash_table;
1007   char *bash_histsize;
1008
1009   if(!isatty(STDIN_FILENO)) {
1010     fprintf(stderr, "selector: The standard input is not a tty.\n");
1011     exit(EXIT_FAILURE);
1012   }
1013
1014   color_fg_modeline  = COLOR_WHITE;
1015   color_bg_modeline  = COLOR_BLACK;
1016   color_fg_highlight = COLOR_BLACK;
1017   color_bg_highlight = COLOR_YELLOW;
1018
1019   setlocale(LC_ALL, "");
1020
1021   strcpy(output_filename, "");
1022
1023   while ((c = getopt_long(argc, argv, "o:s:x:vwmqf:ibzdeajyunt:l:c:-h",
1024                           long_options, NULL)) != -1) {
1025
1026     switch(c) {
1027
1028     case 'o':
1029       strncpy(output_filename, optarg, BUFFER_SIZE);
1030       break;
1031
1032     case 's':
1033       pattern_separator = optarg[0];
1034       break;
1035
1036     case 'x':
1037       label_separator = optarg[0];
1038       break;
1039
1040     case 'v':
1041       output_to_vt_buffer = 1;
1042       break;
1043
1044     case 'w':
1045       add_control_qs = 1;
1046       break;
1047
1048     case 'm':
1049       with_colors = 0;
1050       break;
1051
1052     case 'q':
1053       error_flash = 1;
1054       break;
1055
1056     case 'i':
1057       inverse_order = 1;
1058       break;
1059
1060     case 'b':
1061       bash_history = 1;
1062       break;
1063
1064     case 'z':
1065       zsh_history = 1;
1066       break;
1067
1068     case 'd':
1069       remove_duplicates = 1;
1070       break;
1071
1072     case 'e':
1073       use_regexp = 1;
1074       break;
1075
1076     case 'a':
1077       case_sensitive = 1;
1078       break;
1079
1080     case 'j':
1081       show_long_lines = 1;
1082       break;
1083
1084     case 'y':
1085       show_hits = 1;
1086       break;
1087
1088     case 'u':
1089       upper_caps_makes_case_sensitive = 1;
1090       break;
1091
1092     case 't':
1093       free(title);
1094       title = safe_malloc((strlen(optarg) + 1) * sizeof(char));
1095       strcpy(title, optarg);
1096       break;
1097
1098     case 'l':
1099       str_to_positive_integers(optarg, &nb_lines_max, 1);
1100       break;
1101
1102     case 'c':
1103       str_to_positive_integers(optarg, colors, 4);
1104       color_fg_modeline = colors[0];
1105       color_bg_modeline = colors[1];
1106       color_fg_highlight = colors[2];
1107       color_bg_highlight = colors[3];
1108       break;
1109
1110     case 'h':
1111       show_help = 1;
1112       break;
1113
1114     case OPT_BASH_MODE:
1115       /* Same as -c 7,4,0,3 -q */
1116       /* color_fg_modeline = 7; */
1117       /* color_bg_modeline = 4; */
1118       /* color_fg_highlight = 0; */
1119       /* color_bg_highlight = 3; */
1120       /* error_flash = 1; */
1121       /* Same as -b -i -d -v -w */
1122       bash_history = 1;
1123       inverse_order = 1;
1124       remove_duplicates = 1;
1125       output_to_vt_buffer = 1;
1126       add_control_qs = 1;
1127       bash_histsize = getenv("HISTSIZE");
1128       if(bash_histsize) {
1129         str_to_positive_integers(bash_histsize, &nb_lines_max, 1);
1130       }
1131       break;
1132
1133     default:
1134       error = 1;
1135       break;
1136     }
1137   }
1138
1139   if(error) {
1140     usage(stderr);
1141     exit(EXIT_FAILURE);
1142   }
1143
1144   if(show_help) {
1145     usage(stdout);
1146     exit(EXIT_SUCCESS);
1147   }
1148
1149   lines = safe_malloc(nb_lines_max * sizeof(char *));
1150
1151   nb_lines = 0;
1152
1153   if(remove_duplicates) {
1154     hash_table = new_hash_table(nb_lines_max * 10);
1155   } else {
1156     hash_table = 0;
1157   }
1158
1159   while(optind < argc) {
1160     read_file(hash_table,
1161               argv[optind],
1162               nb_lines_max, &nb_lines, lines);
1163     optind++;
1164   }
1165
1166   if(hash_table) {
1167     free_hash_table(hash_table);
1168   }
1169
1170   /* Now remove the null strings */
1171
1172   n = 0;
1173   for(k = 0; k < nb_lines; k++) {
1174     if(lines[k]) {
1175       lines[n++] = lines[k];
1176     }
1177   }
1178
1179   nb_lines = n;
1180
1181   if(inverse_order) {
1182     for(l = 0; l < nb_lines / 2; l++) {
1183       char *s = lines[nb_lines - 1 - l];
1184       lines[nb_lines - 1 - l] = lines[l];
1185       lines[l] = s;
1186     }
1187   }
1188
1189   /* Build the labels from the strings, take only the part before the
1190      label_separator and transform control characters to printable
1191      ones */
1192
1193   labels = safe_malloc(nb_lines * sizeof(char *));
1194
1195   for(l = 0; l < nb_lines; l++) {
1196     char *s, *t;
1197     int e = 0;
1198     const char *u;
1199     t = lines[l];
1200
1201     while(*t && *t != label_separator) {
1202       u = unctrl(*t++);
1203       e += strlen(u);
1204     }
1205
1206     labels[l] = safe_malloc((e + 1) * sizeof(char));
1207     t = lines[l];
1208     s = labels[l];
1209     while(*t && *t != label_separator) {
1210       u = unctrl(*t++);
1211       while(*u) { *s++ = *u++; }
1212     }
1213     *s = '\0';
1214   }
1215
1216   pattern[0] = '\0';
1217
1218   cursor_position = 0;
1219
1220   /* Here we start to display with curse */
1221
1222   initscr();
1223   cbreak();
1224   noecho();
1225   intrflush(stdscr, FALSE);
1226
1227   /* So that the arrow keys work */
1228   keypad(stdscr, TRUE);
1229
1230   attr_error = A_STANDOUT;
1231   attr_modeline = A_REVERSE;
1232   attr_focus_line = A_STANDOUT;
1233   attr_hits = A_BOLD;
1234
1235   if(with_colors && has_colors()) {
1236
1237     start_color();
1238
1239     if(color_fg_modeline < 0  || color_fg_modeline >= COLORS ||
1240        color_bg_modeline < 0  || color_bg_modeline >= COLORS ||
1241        color_fg_highlight < 0 || color_bg_highlight >= COLORS ||
1242        color_bg_highlight < 0 || color_bg_highlight >= COLORS) {
1243       echo();
1244       endwin();
1245       fprintf(stderr, "selector: Color numbers have to be between 0 and %d.\n",
1246               COLORS - 1);
1247       exit(EXIT_FAILURE);
1248     }
1249
1250     init_pair(1, color_fg_modeline, color_bg_modeline);
1251     attr_modeline = COLOR_PAIR(1);
1252
1253     init_pair(2, color_fg_highlight, color_bg_highlight);
1254     attr_focus_line = COLOR_PAIR(2);
1255
1256     init_pair(3, COLOR_WHITE, COLOR_RED);
1257     attr_error = COLOR_PAIR(3);
1258
1259   }
1260
1261   current_focus_line = 0;
1262   displayed_focus_line = 0;
1263
1264   update_screen(&current_focus_line, &displayed_focus_line,
1265                 0,
1266                 nb_lines, labels, cursor_position, pattern);
1267
1268   do {
1269     int motion = 0;
1270
1271     key = getch();
1272
1273     if(key >= ' ' && key <= '~') { /* Insert character */
1274       insert_char(pattern, &cursor_position, key);
1275     }
1276
1277     else if(key == KEY_BACKSPACE ||
1278             key == '\010' || /* ^H */
1279             key == '\177') { /* ^? */
1280       backspace_char(pattern, &cursor_position);
1281     }
1282
1283     else if(key == KEY_DC ||
1284             key == '\004') { /* ^D */
1285       delete_char(pattern, &cursor_position);
1286     }
1287
1288     else if(key == KEY_HOME) {
1289       current_focus_line = 0;
1290     }
1291
1292     else if(key == KEY_END) {
1293       current_focus_line = nb_lines - 1;
1294     }
1295
1296     else if(key == KEY_NPAGE) {
1297       motion = 10;
1298     }
1299
1300     else if(key == KEY_PPAGE) {
1301       motion = -10;
1302     }
1303
1304     else if(key == KEY_DOWN ||
1305             key == '\016') { /* ^N */
1306       motion = 1;
1307     }
1308
1309     else if(key == KEY_UP ||
1310             key == '\020') { /* ^P */
1311       motion = -1;
1312     }
1313
1314     else if(key == KEY_LEFT ||
1315             key == '\002') { /* ^B */
1316       if(cursor_position > 0) cursor_position--;
1317       else error_feedback();
1318     }
1319
1320     else if(key == KEY_RIGHT ||
1321             key == '\006') { /* ^F */
1322       if(pattern[cursor_position]) cursor_position++;
1323       else error_feedback();
1324     }
1325
1326     else if(key == '\001') { /* ^A */
1327       cursor_position = 0;
1328     }
1329
1330     else if(key == '\005') { /* ^E */
1331       cursor_position = strlen(pattern);
1332     }
1333
1334     else if(key == '\022') { /* ^R */
1335       use_regexp = !use_regexp;
1336     }
1337
1338     else if(key == '\011') { /* ^I */
1339       case_sensitive = !case_sensitive;
1340     }
1341
1342     else if(key == '\025') { /* ^U */
1343       kill_before_cursor(pattern, &cursor_position);
1344     }
1345
1346     else if(key == '\013') { /* ^K */
1347       kill_after_cursor(pattern, &cursor_position);
1348     }
1349
1350     else if(key == '\014') { /* ^L */
1351       /* I suspect that we may sometime mess up the display, so ^L is
1352          here to force a full refresh */
1353       clear();
1354     }
1355
1356     else if(key == '\007' || /* ^G */
1357             key == '\033' || /* ^[ (escape) */
1358             key == '\n' ||
1359             key == KEY_ENTER) {
1360       done = 1;
1361     }
1362
1363     else if(key == KEY_RESIZE || key == -1) {
1364       /* Do nothing when the tty is resized */
1365     }
1366
1367     else {
1368       /* Unknown key */
1369       error_feedback();
1370     }
1371
1372     update_screen(&current_focus_line, &displayed_focus_line,
1373                   motion,
1374                   nb_lines, labels, cursor_position, pattern);
1375
1376   } while(!done);
1377
1378   echo();
1379   endwin();
1380
1381   /* Here we come back to standard display */
1382
1383   if(key == KEY_ENTER || key == '\n') {
1384
1385     char *t;
1386
1387     if(displayed_focus_line >= 0 && displayed_focus_line < nb_lines) {
1388       t = lines[displayed_focus_line];
1389       if(label_separator) {
1390         while(*t && *t != label_separator) t++;
1391         if(*t) t++;
1392       }
1393     } else {
1394       t = 0;
1395     }
1396
1397     if(output_to_vt_buffer && t) {
1398       inject_into_tty_buffer(t, add_control_qs);
1399     }
1400
1401     if(output_filename[0]) {
1402       FILE *out = fopen(output_filename, "w");
1403       if(out) {
1404         if(t) {
1405           fprintf(out, "%s", t);
1406         }
1407         fprintf(out, "\n");
1408       } else {
1409         fprintf(stderr,
1410                 "selector: Can not open %s for writing.\n",
1411                 output_filename);
1412         exit(EXIT_FAILURE);
1413       }
1414       fclose(out);
1415     }
1416
1417   } else {
1418     printf("Aborted.\n");
1419   }
1420
1421   for(l = 0; l < nb_lines; l++) {
1422     free(lines[l]);
1423     free(labels[l]);
1424   }
1425
1426   free(labels);
1427   free(lines);
1428   free(title);
1429
1430   exit(EXIT_SUCCESS);
1431 }