]> Pileus Git - ~andy/gtk/blob - gtk/gtkimcontextsimple.c
Fixed Bug 554506 – combining diacritics broken, became deadkeys
[~andy/gtk] / gtk / gtkimcontextsimple.c
1 /* GTK - The GIMP Toolkit
2  * Copyright (C) 2000 Red Hat, Inc.
3  *
4  * This library is free software; you can redistribute it and/or
5  * modify it under the terms of the GNU Lesser General Public
6  * License as published by the Free Software Foundation; either
7  * version 2 of the License, or (at your option) any later version.
8  *
9  * This library is distributed in the hope that it will be useful,
10  * but WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
12  * Lesser General Public License for more details.
13  *
14  * You should have received a copy of the GNU Lesser General Public
15  * License along with this library; if not, write to the
16  * Free Software Foundation, Inc., 59 Temple Place - Suite 330,
17  * Boston, MA 02111-1307, USA.
18  */
19
20 #include "config.h"
21 #include <stdlib.h>
22 #include <string.h>
23
24 #include <gdk/gdkkeysyms.h>
25 #include "gtkaccelgroup.h"
26 #include "gtkimcontextsimple.h"
27 #include "gtksettings.h"
28 #include "gtkwidget.h"
29 #include "gtkintl.h"
30 #include "gtkalias.h"
31
32 typedef struct _GtkComposeTable GtkComposeTable;
33 typedef struct _GtkComposeTableCompact GtkComposeTableCompact;
34
35 struct _GtkComposeTable 
36 {
37   const guint16 *data;
38   gint max_seq_len;
39   gint n_seqs;
40 };
41
42 struct _GtkComposeTableCompact
43 {
44   const guint16 *data;
45   gint max_seq_len;
46   gint n_index_size;
47   gint n_index_stride;
48 };
49
50 /* This file contains the table of the compose sequences, 
51  * static const guint16 gtk_compose_seqs_compact[] = {}
52  * IT is generated from the compose-parse.py script.
53  */
54 #include "gtkimcontextsimpleseqs.h"
55
56 /* From the values below, the value 22 means the number of different first keysyms 
57  * that exist in the Compose file (from Xorg). When running compose-parse.py without 
58  * parameters, you get the count that you can put here. Needed when updating the
59  * gtkimcontextsimpleseqs.h header file (contains the compose sequences).
60  */
61 static const GtkComposeTableCompact gtk_compose_table_compact = {
62   gtk_compose_seqs_compact,
63   5,
64   22,
65   6
66 };
67
68 static const guint16 gtk_compose_ignore[] = {
69   GDK_Shift_L,
70   GDK_Shift_R,
71   GDK_Control_L,
72   GDK_Control_R,
73   GDK_Caps_Lock,
74   GDK_Shift_Lock,
75   GDK_Meta_L,
76   GDK_Meta_R,
77   GDK_Alt_L,
78   GDK_Alt_R,
79   GDK_Super_L,
80   GDK_Super_R,
81   GDK_Hyper_L,
82   GDK_Hyper_R,
83   GDK_Mode_switch,
84   GDK_ISO_Level3_Shift
85 };
86
87 static void     gtk_im_context_simple_finalize           (GObject                  *obj);
88 static gboolean gtk_im_context_simple_filter_keypress    (GtkIMContext             *context,
89                                                           GdkEventKey              *key);
90 static void     gtk_im_context_simple_reset              (GtkIMContext             *context);
91 static void     gtk_im_context_simple_get_preedit_string (GtkIMContext             *context,
92                                                           gchar                   **str,
93                                                           PangoAttrList           **attrs,
94                                                           gint                     *cursor_pos);
95
96 G_DEFINE_TYPE (GtkIMContextSimple, gtk_im_context_simple, GTK_TYPE_IM_CONTEXT)
97
98 static void
99 gtk_im_context_simple_class_init (GtkIMContextSimpleClass *class)
100 {
101   GtkIMContextClass *im_context_class = GTK_IM_CONTEXT_CLASS (class);
102   GObjectClass *gobject_class = G_OBJECT_CLASS (class);
103
104   im_context_class->filter_keypress = gtk_im_context_simple_filter_keypress;
105   im_context_class->reset = gtk_im_context_simple_reset;
106   im_context_class->get_preedit_string = gtk_im_context_simple_get_preedit_string;
107   gobject_class->finalize = gtk_im_context_simple_finalize;
108 }
109
110 static void
111 gtk_im_context_simple_init (GtkIMContextSimple *im_context_simple)
112 {  
113 }
114
115 static void
116 gtk_im_context_simple_finalize (GObject *obj)
117 {
118   GtkIMContextSimple *context_simple = GTK_IM_CONTEXT_SIMPLE (obj);
119
120   if (context_simple->tables)
121     {
122       g_slist_foreach (context_simple->tables, (GFunc)g_free, NULL);
123       g_slist_free (context_simple->tables);
124
125       context_simple->tables = NULL;
126     }
127
128   G_OBJECT_CLASS (gtk_im_context_simple_parent_class)->finalize (obj);
129 }
130
131 /** 
132  * gtk_im_context_simple_new:
133  * 
134  * Creates a new #GtkIMContextSimple.
135  *
136  * Returns: a new #GtkIMContextSimple.
137  **/
138 GtkIMContext *
139 gtk_im_context_simple_new (void)
140 {
141   return g_object_new (GTK_TYPE_IM_CONTEXT_SIMPLE, NULL);
142 }
143
144 static void
145 gtk_im_context_simple_commit_char (GtkIMContext *context,
146                                    gunichar ch)
147 {
148   gchar buf[10];
149   gint len;
150
151   GtkIMContextSimple *context_simple = GTK_IM_CONTEXT_SIMPLE (context);
152
153   g_return_if_fail (g_unichar_validate (ch));
154   
155   len = g_unichar_to_utf8 (ch, buf);
156   buf[len] = '\0';
157
158   if (context_simple->tentative_match || context_simple->in_hex_sequence)
159     {
160       context_simple->in_hex_sequence = FALSE;  
161       context_simple->tentative_match = 0;
162       context_simple->tentative_match_len = 0;
163       g_signal_emit_by_name (context_simple, "preedit-changed");
164       g_signal_emit_by_name (context_simple, "preedit-end");
165     }
166
167   g_signal_emit_by_name (context, "commit", &buf);
168 }
169
170 static int
171 compare_seq_index (const void *key, const void *value)
172 {
173   const guint *keysyms = key;
174   const guint16 *seq = value;
175
176   if (keysyms[0] < seq[0])
177     return -1;
178   else if (keysyms[0] > seq[0])
179     return 1;
180
181   return 0;
182 }
183
184 static int
185 compare_seq (const void *key, const void *value)
186 {
187   int i = 0;
188   const guint *keysyms = key;
189   const guint16 *seq = value;
190
191   while (keysyms[i])
192     {
193       if (keysyms[i] < seq[i])
194         return -1;
195       else if (keysyms[i] > seq[i])
196         return 1;
197
198       i++;
199     }
200
201   return 0;
202 }
203
204 static gboolean
205 check_table (GtkIMContextSimple    *context_simple,
206              const GtkComposeTable *table,
207              gint                   n_compose)
208 {
209   gint row_stride = table->max_seq_len + 2; 
210   guint16 *seq; 
211   
212   /* Will never match, if the sequence in the compose buffer is longer
213    * than the sequences in the table.  Further, compare_seq (key, val)
214    * will overrun val if key is longer than val. */
215   if (n_compose > table->max_seq_len)
216     return FALSE;
217   
218   seq = bsearch (context_simple->compose_buffer,
219                  table->data, table->n_seqs,
220                  sizeof (guint16) *  row_stride, 
221                  compare_seq);
222
223   if (seq)
224     {
225       guint16 *prev_seq;
226
227       /* Back up to the first sequence that matches to make sure
228        * we find the exact match if their is one.
229        */
230       while (seq > table->data)
231         {
232           prev_seq = seq - row_stride;
233           if (compare_seq (context_simple->compose_buffer, prev_seq) != 0)
234             break;
235           seq = prev_seq;
236         }
237       
238       if (n_compose == table->max_seq_len ||
239           seq[n_compose] == 0) /* complete sequence */
240         {
241           guint16 *next_seq;
242           gunichar value = 
243             0x10000 * seq[table->max_seq_len] + seq[table->max_seq_len + 1];
244
245           
246           /* We found a tentative match. See if there are any longer
247            * sequences containing this subsequence
248            */
249           next_seq = seq + row_stride;
250           if (next_seq < table->data + row_stride * table->n_seqs)
251             {
252               if (compare_seq (context_simple->compose_buffer, next_seq) == 0)
253                 {
254                   context_simple->tentative_match = value;
255                   context_simple->tentative_match_len = n_compose;
256                 
257                   g_signal_emit_by_name (context_simple, "preedit-changed");
258
259                   return TRUE;
260                 }
261             }
262
263           gtk_im_context_simple_commit_char (GTK_IM_CONTEXT (context_simple), value);
264           context_simple->compose_buffer[0] = 0;
265         }
266       
267       return TRUE;
268     }
269
270   return FALSE;
271 }
272
273 static gboolean
274 check_compact_table (GtkIMContextSimple    *context_simple,
275              const GtkComposeTableCompact *table,
276              gint                   n_compose)
277 {
278   gint row_stride;
279   guint16 *seq_index;
280   guint16 *seq; 
281   gint i;
282
283   /* Will never match, if the sequence in the compose buffer is longer
284    * than the sequences in the table.  Further, compare_seq (key, val)
285    * will overrun val if key is longer than val. */
286   if (n_compose > table->max_seq_len)
287     return FALSE;
288   
289   seq_index = bsearch (context_simple->compose_buffer,
290                  table->data, table->n_index_size,
291                  sizeof (guint16) *  table->n_index_stride, 
292                  compare_seq_index);
293
294   if (!seq_index)
295     return FALSE;
296
297   if (seq_index && n_compose == 1)
298     return TRUE;
299
300   seq = NULL;
301
302   for (i = n_compose-1; i < table->max_seq_len; i++)
303     {
304       row_stride = i + 1;
305
306       if (seq_index[i+1] - seq_index[i] > 0)
307         {
308           seq = bsearch (context_simple->compose_buffer + 1,
309                  table->data + seq_index[i], (seq_index[i+1] - seq_index[i]) / row_stride,
310                  sizeof (guint16) *  row_stride, 
311                  compare_seq);
312
313           if (seq)
314             {
315               if (i == n_compose - 1)
316                 break;
317               else
318                 {
319                   g_signal_emit_by_name (context_simple, "preedit-changed");
320                   return TRUE;
321                 }
322              }
323         }
324     }
325
326   if (!seq)
327     return FALSE;
328   else
329     {
330       gunichar value;
331
332       value = seq[row_stride - 1];
333           
334       gtk_im_context_simple_commit_char (GTK_IM_CONTEXT (context_simple), value);
335       context_simple->compose_buffer[0] = 0;
336
337       return TRUE;
338     }
339
340   return FALSE;
341 }
342
343 /* This function receives a sequence of Unicode characters and tries to
344  * normalize it (NFC). We check for the case the the resulting string
345  * has length 1 (single character).
346  * NFC normalisation normally rearranges diacritic marks, unless these
347  * belong to the same Canonical Combining Class.
348  * If they belong to the same canonical combining class, we produce all
349  * permutations of the diacritic marks, then attempt to normalize.
350  */
351 static gboolean
352 check_normalize_nfc (gunichar* combination_buffer, gint n_compose)
353 {
354   gunichar combination_buffer_temp[GTK_MAX_COMPOSE_LEN];
355   gchar *combination_utf8_temp = NULL;
356   gchar *nfc_temp = NULL;
357   gint n_combinations;
358   gunichar temp_swap;
359   gint i;
360
361   n_combinations = 1;
362
363   for (i = 1; i < n_compose; i++ )
364      n_combinations *= i;
365
366   /* Xorg reuses dead_tilde for the perispomeni diacritic mark.
367    * We check if base character belongs to Greek Unicode block,
368    * and if so, we replace tilde with perispomeni. */
369   if (combination_buffer[0] >= 0x390 && combination_buffer[0] <= 0x3FF)
370     {
371       for (i = 1; i < n_compose; i++ )
372         if (combination_buffer[i] == 0x303)
373           combination_buffer[i] = 0x342;
374     }
375
376   memcpy (combination_buffer_temp, combination_buffer, GTK_MAX_COMPOSE_LEN * sizeof (gunichar) );
377
378   for (i = 0; i < n_combinations; i++ )
379     {
380       g_unicode_canonical_ordering (combination_buffer_temp, n_compose);
381       combination_utf8_temp = g_ucs4_to_utf8 (combination_buffer_temp, -1, NULL, NULL, NULL);
382       nfc_temp = g_utf8_normalize (combination_utf8_temp, -1, G_NORMALIZE_NFC);         
383
384       if (g_utf8_strlen (nfc_temp, -1) == 1)
385         {
386           memcpy (combination_buffer, combination_buffer_temp, GTK_MAX_COMPOSE_LEN * sizeof (gunichar) );
387
388           g_free (combination_utf8_temp);
389           g_free (nfc_temp);
390
391           return TRUE;
392         }
393
394       g_free (combination_utf8_temp);
395       g_free (nfc_temp);
396
397       if (n_compose > 2)
398         {
399           temp_swap = combination_buffer_temp[i % (n_compose - 1) + 1];
400           combination_buffer_temp[i % (n_compose - 1) + 1] = combination_buffer_temp[(i+1) % (n_compose - 1) + 1];
401           combination_buffer_temp[(i+1) % (n_compose - 1) + 1] = temp_swap;
402         }
403       else
404         break;
405     }
406
407   return FALSE;
408 }
409
410 /* Checks if a keysym is a dead key. Dead key keysym values are defined in
411  * ../gdk/gdkkeysyms.h and the first is GDK_dead_grave. As X.Org is updated,
412  * more dead keys are added and we need to update the upper limit.
413  * Also checks if the keysym belongs to the non-spacing mark Unicode category,
414  * by invoking gdk_keyval_to_unicode(). For keysyms like 0x1000000 + 0x0301,
415  * it converts them to 0x301, which makes g_unichar_type() report them as
416  * non-spacing mark. Thus, we check that the value is less then 0x1000000.
417  * check_algorithmically() does not handle keysyms > 0x1000000.
418  */
419 #define IS_DEAD_KEY(k) \
420     (((k) >= GDK_dead_grave && (k) <= (GDK_dead_dasia+1)) || \
421      ((g_unichar_type (gdk_keyval_to_unicode (k)) == G_UNICODE_NON_SPACING_MARK) && \
422       ((k) < 0x1000000)))
423
424 static gboolean
425 check_algorithmically (GtkIMContextSimple    *context_simple,
426                        gint                   n_compose)
427
428 {
429   gint i;
430   gunichar combination_buffer[GTK_MAX_COMPOSE_LEN];
431   gchar *combination_utf8, *nfc;
432
433   if (n_compose >= GTK_MAX_COMPOSE_LEN)
434     return FALSE;
435
436   for (i = 0; i < n_compose && IS_DEAD_KEY (context_simple->compose_buffer[i]); i++)
437     ;
438   if (i == n_compose)
439     return TRUE;
440
441   if (i > 0 && i == n_compose - 1)
442     {
443       combination_buffer[0] = gdk_keyval_to_unicode (context_simple->compose_buffer[i]);
444       combination_buffer[n_compose] = 0;
445       i--;
446       while (i >= 0)
447         {
448           switch (context_simple->compose_buffer[i])
449             {
450 #define CASE(keysym, unicode) \
451             case GDK_dead_##keysym: combination_buffer[i+1] = unicode; break
452
453             CASE (grave, 0x0300);
454             CASE (acute, 0x0301);
455             CASE (circumflex, 0x0302);
456             CASE (tilde, 0x0303);       /* Also used with perispomeni, 0x342. */
457             CASE (macron, 0x0304);
458             CASE (breve, 0x0306);
459             CASE (abovedot, 0x0307);
460             CASE (diaeresis, 0x0308);
461             CASE (hook, 0x0309);
462             CASE (abovering, 0x030A);
463             CASE (doubleacute, 0x030B);
464             CASE (caron, 0x030C);
465             CASE (abovecomma, 0x0313);         /* Equivalent to psili */
466             CASE (abovereversedcomma, 0x0314); /* Equivalent to dasia */
467             CASE (horn, 0x031B);        /* Legacy use for psili, 0x313 (or 0x343). */
468             CASE (belowdot, 0x0323);
469             CASE (cedilla, 0x0327);
470             CASE (ogonek, 0x0328);      /* Legacy use for dasia, 0x314.*/
471             CASE (iota, 0x0345);
472             CASE (voiced_sound, 0x3099);        /* Per Markus Kuhn keysyms.txt file. */
473             CASE (semivoiced_sound, 0x309A);    /* Per Markus Kuhn keysyms.txt file. */
474
475             /* The following cases are to be removed once xkeyboard-config,
476              * xorg are fully updated.
477              */
478             /* Workaround for typo in 1.4.x xserver-xorg */
479             case 0xfe66: combination_buffer[i+1] = 0x314; break;
480             /* CASE (dasia, 0x314); */
481             /* CASE (perispomeni, 0x342); */
482             /* CASE (psili, 0x343); */
483 #undef CASE
484             default:
485               combination_buffer[i+1] = gdk_keyval_to_unicode (context_simple->compose_buffer[i]);
486             }
487           i--;
488         }
489       
490       /* If the buffer normalizes to a single character, 
491        * then modify the order of combination_buffer accordingly, if necessary,
492        * and return TRUE. 
493        */
494       if (check_normalize_nfc (combination_buffer, n_compose))
495         {
496           gunichar value;
497           combination_utf8 = g_ucs4_to_utf8 (combination_buffer, -1, NULL, NULL, NULL);
498           nfc = g_utf8_normalize (combination_utf8, -1, G_NORMALIZE_NFC);
499
500           value = g_utf8_get_char (nfc);
501           gtk_im_context_simple_commit_char (GTK_IM_CONTEXT (context_simple), value);
502           context_simple->compose_buffer[0] = 0;
503
504           g_free (combination_utf8);
505           g_free (nfc);
506
507           return TRUE;
508         }
509     }
510
511   return FALSE;
512 }
513
514 /* In addition to the table-driven sequences, we allow Unicode hex
515  * codes to be entered. The method chosen here is similar to the
516  * one recommended in ISO 14755, but not exactly the same, since we
517  * don't want to steal 16 valuable key combinations. 
518  * 
519  * A hex Unicode sequence must be started with Ctrl-Shift-U, followed
520  * by a sequence of hex digits entered with Ctrl-Shift still held.
521  * Releasing one of the modifiers or pressing space while the modifiers
522  * are still held commits the character. It is possible to erase
523  * digits using backspace.
524  *
525  * As an extension to the above, we also allow to start the sequence
526  * with Ctrl-Shift-U, then release the modifiers before typing any
527  * digits, and enter the digits without modifiers.
528  */
529 #define HEX_MOD_MASK (GDK_CONTROL_MASK | GDK_SHIFT_MASK)
530
531 static gboolean
532 check_hex (GtkIMContextSimple *context_simple,
533            gint                n_compose)
534 {
535   /* See if this is a hex sequence, return TRUE if so */
536   gint i;
537   GString *str;
538   gulong n;
539   gchar *nptr = NULL;
540   gchar buf[7];
541
542   context_simple->tentative_match = 0;
543   context_simple->tentative_match_len = 0;
544
545   str = g_string_new (NULL);
546   
547   i = 0;
548   while (i < n_compose)
549     {
550       gunichar ch;
551       
552       ch = gdk_keyval_to_unicode (context_simple->compose_buffer[i]);
553       
554       if (ch == 0)
555         return FALSE;
556
557       if (!g_unichar_isxdigit (ch))
558         return FALSE;
559
560       buf[g_unichar_to_utf8 (ch, buf)] = '\0';
561
562       g_string_append (str, buf);
563       
564       ++i;
565     }
566
567   n = strtoul (str->str, &nptr, 16);
568
569   /* if strtoul fails it probably means non-latin digits were used;
570    * we should in principle handle that, but we probably don't.
571    */
572   if (nptr - str->str < str->len)
573     {
574       g_string_free (str, TRUE);
575       return FALSE;
576     }
577   else
578     g_string_free (str, TRUE);
579
580   if (g_unichar_validate (n))
581     {
582       context_simple->tentative_match = n;
583       context_simple->tentative_match_len = n_compose;
584     }
585   
586   return TRUE;
587 }
588
589 static void
590 beep_window (GdkWindow *window)
591 {
592   GtkWidget *widget;
593
594   gdk_window_get_user_data (window, (gpointer) &widget);
595
596   if (GTK_IS_WIDGET (widget))
597     {
598       gtk_widget_error_bell (widget);
599     }
600   else
601     {
602       GdkScreen *screen = gdk_drawable_get_screen (GDK_DRAWABLE (window));
603       gboolean   beep;
604
605       g_object_get (gtk_settings_get_for_screen (screen),
606                     "gtk-error-bell", &beep,
607                     NULL);
608
609       if (beep)
610         gdk_window_beep (window);
611     }
612 }
613
614 static gboolean
615 no_sequence_matches (GtkIMContextSimple *context_simple,
616                      gint                n_compose,
617                      GdkEventKey        *event)
618 {
619   GtkIMContext *context;
620   gunichar ch;
621   
622   context = GTK_IM_CONTEXT (context_simple);
623   
624   /* No compose sequences found, check first if we have a partial
625    * match pending.
626    */
627   if (context_simple->tentative_match)
628     {
629       gint len = context_simple->tentative_match_len;
630       int i;
631       
632       gtk_im_context_simple_commit_char (context, context_simple->tentative_match);
633       context_simple->compose_buffer[0] = 0;
634       
635       for (i=0; i < n_compose - len - 1; i++)
636         {
637           GdkEvent *tmp_event = gdk_event_copy ((GdkEvent *)event);
638           tmp_event->key.keyval = context_simple->compose_buffer[len + i];
639           
640           gtk_im_context_filter_keypress (context, (GdkEventKey *)tmp_event);
641           gdk_event_free (tmp_event);
642         }
643
644       return gtk_im_context_filter_keypress (context, event);
645     }
646   else
647     {
648       context_simple->compose_buffer[0] = 0;
649       if (n_compose > 1)                /* Invalid sequence */
650         {
651           beep_window (event->window);
652           return TRUE;
653         }
654   
655       ch = gdk_keyval_to_unicode (event->keyval);
656       if (ch != 0)
657         {
658           gtk_im_context_simple_commit_char (context, ch);
659           return TRUE;
660         }
661       else
662         return FALSE;
663     }
664 }
665
666 static gboolean
667 is_hex_keyval (guint keyval)
668 {
669   gunichar ch = gdk_keyval_to_unicode (keyval);
670
671   return g_unichar_isxdigit (ch);
672 }
673
674 static guint
675 canonical_hex_keyval (GdkEventKey *event)
676 {
677   GdkKeymap *keymap = gdk_keymap_get_for_display (gdk_drawable_get_display (event->window));
678   guint keyval;
679   guint *keyvals = NULL;
680   gint n_vals = 0;
681   gint i;
682   
683   /* See if the keyval is already a hex digit */
684   if (is_hex_keyval (event->keyval))
685     return event->keyval;
686
687   /* See if this key would have generated a hex keyval in
688    * any other state, and return that hex keyval if so
689    */
690   gdk_keymap_get_entries_for_keycode (keymap,
691                                       event->hardware_keycode,
692                                       NULL,
693                                       &keyvals, &n_vals);
694
695   keyval = 0;
696   i = 0;
697   while (i < n_vals)
698     {
699       if (is_hex_keyval (keyvals[i]))
700         {
701           keyval = keyvals[i];
702           break;
703         }
704
705       ++i;
706     }
707
708   g_free (keyvals);
709   
710   if (keyval)
711     return keyval;
712   else
713     /* No way to make it a hex digit
714      */
715     return 0;
716 }
717
718 static gboolean
719 gtk_im_context_simple_filter_keypress (GtkIMContext *context,
720                                        GdkEventKey  *event)
721 {
722   GtkIMContextSimple *context_simple = GTK_IM_CONTEXT_SIMPLE (context);
723   GSList *tmp_list;  
724   int n_compose = 0;
725   gboolean have_hex_mods;
726   gboolean is_hex_start;
727   gboolean is_hex_end;
728   gboolean is_backspace;
729   gboolean is_escape;
730   guint hex_keyval;
731   int i;
732
733   while (context_simple->compose_buffer[n_compose] != 0)
734     n_compose++;
735
736   if (event->type == GDK_KEY_RELEASE)
737     {
738       if (context_simple->in_hex_sequence &&
739           (event->keyval == GDK_Control_L || event->keyval == GDK_Control_R ||
740            event->keyval == GDK_Shift_L || event->keyval == GDK_Shift_R))
741         {
742           if (context_simple->tentative_match &&
743               g_unichar_validate (context_simple->tentative_match))
744             {
745               gtk_im_context_simple_commit_char (context, context_simple->tentative_match);
746               context_simple->compose_buffer[0] = 0;
747
748             }
749           else if (n_compose == 0)
750             {
751               context_simple->modifiers_dropped = TRUE;
752             }
753           else
754             {
755               /* invalid hex sequence */
756               beep_window (event->window);
757               
758               context_simple->tentative_match = 0;
759               context_simple->in_hex_sequence = FALSE;
760               context_simple->compose_buffer[0] = 0;
761               
762               g_signal_emit_by_name (context_simple, "preedit-changed");
763               g_signal_emit_by_name (context_simple, "preedit-end");
764             }
765
766           return TRUE;
767         }
768       else
769         return FALSE;
770     }
771
772   /* Ignore modifier key presses */
773   for (i = 0; i < G_N_ELEMENTS (gtk_compose_ignore); i++)
774     if (event->keyval == gtk_compose_ignore[i])
775       return FALSE;
776
777   if (context_simple->in_hex_sequence && context_simple->modifiers_dropped)
778     have_hex_mods = TRUE;
779   else
780     have_hex_mods = (event->state & (HEX_MOD_MASK)) == HEX_MOD_MASK;
781   is_hex_start = event->keyval == GDK_U;
782   is_hex_end = (event->keyval == GDK_space || 
783                 event->keyval == GDK_KP_Space ||
784                 event->keyval == GDK_Return || 
785                 event->keyval == GDK_ISO_Enter ||
786                 event->keyval == GDK_KP_Enter);
787   is_backspace = event->keyval == GDK_BackSpace;
788   is_escape = event->keyval == GDK_Escape;
789   hex_keyval = canonical_hex_keyval (event);
790
791   /* If we are already in a non-hex sequence, or
792    * this keystroke is not hex modifiers + hex digit, don't filter 
793    * key events with accelerator modifiers held down.
794    */
795   if (!have_hex_mods ||
796       (n_compose > 0 && !context_simple->in_hex_sequence) || 
797       (n_compose == 0 && !context_simple->in_hex_sequence && !is_hex_start) ||
798       (context_simple->in_hex_sequence && !hex_keyval && 
799        !is_hex_start && !is_hex_end && !is_escape && !is_backspace))
800     {
801       if (event->state & (gtk_accelerator_get_default_mod_mask () & ~GDK_SHIFT_MASK) ||
802           (context_simple->in_hex_sequence && context_simple->modifiers_dropped &&
803            (event->keyval == GDK_Return || 
804             event->keyval == GDK_ISO_Enter ||
805             event->keyval == GDK_KP_Enter)))
806         {
807           return FALSE;
808         }
809     }
810   
811   /* Handle backspace */
812   if (context_simple->in_hex_sequence && have_hex_mods && is_backspace)
813     {
814       if (n_compose > 0)
815         {
816           n_compose--;
817           context_simple->compose_buffer[n_compose] = 0;
818           check_hex (context_simple, n_compose);
819         }
820       else
821         {
822           context_simple->in_hex_sequence = FALSE;
823         }
824
825       g_signal_emit_by_name (context_simple, "preedit-changed");
826
827       if (!context_simple->in_hex_sequence)
828         g_signal_emit_by_name (context_simple, "preedit-end");
829       
830       return TRUE;
831     }
832
833   /* Check for hex sequence restart */
834   if (context_simple->in_hex_sequence && have_hex_mods && is_hex_start)
835     {
836       if (context_simple->tentative_match &&
837           g_unichar_validate (context_simple->tentative_match))
838         {
839           gtk_im_context_simple_commit_char (context, context_simple->tentative_match);
840           context_simple->compose_buffer[0] = 0;
841         }
842       else 
843         {
844           /* invalid hex sequence */
845           if (n_compose > 0)
846             beep_window (event->window);
847           
848           context_simple->tentative_match = 0;
849           context_simple->in_hex_sequence = FALSE;
850           context_simple->compose_buffer[0] = 0;
851         }
852     }
853   
854   /* Check for hex sequence start */
855   if (!context_simple->in_hex_sequence && have_hex_mods && is_hex_start)
856     {
857       context_simple->compose_buffer[0] = 0;
858       context_simple->in_hex_sequence = TRUE;
859       context_simple->modifiers_dropped = FALSE;
860       context_simple->tentative_match = 0;
861
862       g_signal_emit_by_name (context_simple, "preedit-start");
863       g_signal_emit_by_name (context_simple, "preedit-changed");
864   
865       return TRUE;
866     }
867   
868   /* Then, check for compose sequences */
869   if (context_simple->in_hex_sequence)
870     {
871       if (hex_keyval)
872         context_simple->compose_buffer[n_compose++] = hex_keyval;
873       else if (is_escape)
874         {
875           gtk_im_context_simple_reset (context);
876           
877           return TRUE;
878         }
879       else if (!is_hex_end)
880         {
881           /* non-hex character in hex sequence */
882           beep_window (event->window);
883           
884           return TRUE;
885         }
886     }
887   else
888     context_simple->compose_buffer[n_compose++] = event->keyval;
889
890   context_simple->compose_buffer[n_compose] = 0;
891
892   if (context_simple->in_hex_sequence)
893     {
894       /* If the modifiers are still held down, consider the sequence again */
895       if (have_hex_mods)
896         {
897           /* space or return ends the sequence, and we eat the key */
898           if (n_compose > 0 && is_hex_end)
899             {
900               if (context_simple->tentative_match &&
901                   g_unichar_validate (context_simple->tentative_match))
902                 {
903                   gtk_im_context_simple_commit_char (context, context_simple->tentative_match);
904                   context_simple->compose_buffer[0] = 0;
905                 }
906               else
907                 {
908                   /* invalid hex sequence */
909                   beep_window (event->window);
910
911                   context_simple->tentative_match = 0;
912                   context_simple->in_hex_sequence = FALSE;
913                   context_simple->compose_buffer[0] = 0;
914                 }
915             }
916           else if (!check_hex (context_simple, n_compose))
917             beep_window (event->window);
918           
919           g_signal_emit_by_name (context_simple, "preedit-changed");
920
921           if (!context_simple->in_hex_sequence)
922             g_signal_emit_by_name (context_simple, "preedit-end");
923
924           return TRUE;
925         }
926     }
927   else
928     {
929       tmp_list = context_simple->tables;
930       while (tmp_list)
931         {
932           if (check_table (context_simple, tmp_list->data, n_compose))
933             return TRUE;
934           tmp_list = tmp_list->next;
935         }
936   
937       if (check_algorithmically (context_simple, n_compose))
938         return TRUE;
939
940       if (check_compact_table (context_simple, &gtk_compose_table_compact, n_compose))
941         return TRUE;
942     }
943   
944   /* The current compose_buffer doesn't match anything */
945   return no_sequence_matches (context_simple, n_compose, event);
946 }
947
948 static void
949 gtk_im_context_simple_reset (GtkIMContext *context)
950 {
951   GtkIMContextSimple *context_simple = GTK_IM_CONTEXT_SIMPLE (context);
952
953   context_simple->compose_buffer[0] = 0;
954
955   if (context_simple->tentative_match || context_simple->in_hex_sequence)
956     {
957       context_simple->in_hex_sequence = FALSE;
958       context_simple->tentative_match = 0;
959       context_simple->tentative_match_len = 0;
960       g_signal_emit_by_name (context_simple, "preedit-changed");
961       g_signal_emit_by_name (context_simple, "preedit-end");
962     }
963 }
964
965 static void     
966 gtk_im_context_simple_get_preedit_string (GtkIMContext   *context,
967                                           gchar         **str,
968                                           PangoAttrList **attrs,
969                                           gint           *cursor_pos)
970 {
971   char outbuf[37]; /* up to 6 hex digits */
972   int len = 0;
973   
974   GtkIMContextSimple *context_simple = GTK_IM_CONTEXT_SIMPLE (context);
975
976   if (context_simple->in_hex_sequence)
977     {
978       int hexchars = 0;
979          
980       outbuf[0] = 'u';
981       len = 1;
982
983       while (context_simple->compose_buffer[hexchars] != 0)
984         {
985           len += g_unichar_to_utf8 (gdk_keyval_to_unicode (context_simple->compose_buffer[hexchars]),
986                                     outbuf + len);
987           ++hexchars;
988         }
989
990       g_assert (len < 25);
991     }
992   else if (context_simple->tentative_match)
993     len = g_unichar_to_utf8 (context_simple->tentative_match, outbuf);
994       
995   outbuf[len] = '\0';      
996
997   if (str)
998     *str = g_strdup (outbuf);
999
1000   if (attrs)
1001     {
1002       *attrs = pango_attr_list_new ();
1003       
1004       if (len)
1005         {
1006           PangoAttribute *attr = pango_attr_underline_new (PANGO_UNDERLINE_SINGLE);
1007           attr->start_index = 0;
1008           attr->end_index = len;
1009           pango_attr_list_insert (*attrs, attr);
1010         }
1011     }
1012
1013   if (cursor_pos)
1014     *cursor_pos = len;
1015 }
1016
1017 /**
1018  * gtk_im_context_simple_add_table:
1019  * @context_simple: A #GtkIMContextSimple
1020  * @data: the table 
1021  * @max_seq_len: Maximum length of a sequence in the table
1022  *               (cannot be greater than #GTK_MAX_COMPOSE_LEN)
1023  * @n_seqs: number of sequences in the table
1024  * 
1025  * Adds an additional table to search to the input context.
1026  * Each row of the table consists of @max_seq_len key symbols
1027  * followed by two #guint16 interpreted as the high and low
1028  * words of a #gunicode value. Tables are searched starting
1029  * from the last added.
1030  *
1031  * The table must be sorted in dictionary order on the
1032  * numeric value of the key symbol fields. (Values beyond
1033  * the length of the sequence should be zero.)
1034  **/
1035 void
1036 gtk_im_context_simple_add_table (GtkIMContextSimple *context_simple,
1037                                  guint16            *data,
1038                                  gint                max_seq_len,
1039                                  gint                n_seqs)
1040 {
1041   GtkComposeTable *table;
1042
1043   g_return_if_fail (GTK_IS_IM_CONTEXT_SIMPLE (context_simple));
1044   g_return_if_fail (data != NULL);
1045   g_return_if_fail (max_seq_len <= GTK_MAX_COMPOSE_LEN);
1046   
1047   table = g_new (GtkComposeTable, 1);
1048   table->data = data;
1049   table->max_seq_len = max_seq_len;
1050   table->n_seqs = n_seqs;
1051
1052   context_simple->tables = g_slist_prepend (context_simple->tables, table);
1053 }
1054
1055 #define __GTK_IM_CONTEXT_SIMPLE_C__
1056 #include "gtkaliasdef.c"