Сам в печали что лексеров под utf нет
есть два варианта написания:
1) в виде плугина без изменения самой сцинтиллы см ExternalLexer.h
2) внедрят внутрь.
Вобщем шарашу парсер для языка типа 1С.
А я радостный залез русификнул яваскриптовый лексер и проверять не стал светит оно или нет. Хорошо ты тему раскрыл