Редактирование идиш текстов под управлением операционной системы Unix

Выбор

Чтобы писать на Идише в Unix, вы можете выполнить следующие действия:

  1. Напишите в YIVO транслитерации и преобразования, если вы хотите, чтобы какой-либо другой форме, используя shraybmashinke.
  2. Писать напрямую в Unicode, сохраняя файл в формате utf-8.

Это концентрирует внимание на способы, чтобы сделать последнее. Вы действительно хотите использовать Юникод в долгосрочной перспективе, поскольку позволяет совмещать несколько языков в одном документе, и он определяет Формат представления, в частности, двустороннюю компоновку.

Вопросы

  • а каком программном уровне является преобразование нажатия клавиш в символьное представление достигается?
    • В Unix «консольный режим», драйвер устройства делает сопоставление.
    • В Unix «х-окна ввода», x-сервер имеет контурную карту, таблицу, чтобы преобразовать событие ключей (ключ-пресс-мероприятия) в идентификаторами. Есть список идентификаторами вinclude/X11/keysymdef.h, который поставляется с X распределений; она определяет, арабский, Тайский, иврит, и другими идентификаторами. В иврите отсутствует в списке специальных символов идиш. Я не рекомендую вам играть с иврита или Идиша идентификаторами; на keysym значения х-окна конкретными и не соответствуют кодировке Unicode. Однако, некоторые приложения (например, xterm) понять keysym формы 0x100XXXX как Юникод ПСК-2 персонажа ХХХХ.
    • Вы можете включить x расширение клавиатуры (xkb), чтобы позволить вам переключаться между раскладками клавиатуры и интерпретировать нажатия на клавиши, как идиш в соответствующий макет.
    • Вы можете использовать пакет ibus, которые использовали, УИМ методы. На Debian (в том числе Ubuntu) установки, используйте команду apt-получить , чтобы получить эти пакеты: пакет, пакет ibus-m17n, libm17n-0, m17n-ВНО, пакет ibus-GTK версий. Запустить пакет ibus-Setup (настройка ) и выберите идиш-йиво (m17n) в качестве метода ввода. Теперь любая программа, использующая пакет ibus может принять ввод; переключаться между обычным входным и пакет с <контроль-космос> (вы можете настроить это).
    • Если вы предпочитаете Yankl Халперн это раскладка клавиатуры, вы можете захватить этот файл и установить его в каталоге напечатано, запустивфайл/usr/Бен/m17n-дБ (вам потребуется сделать это как root). Затем вы должны запустить пакет ibus-Daemon в -д —xim —обновления кэша (как самого себя).
    • Вы можете ввести х метода ввода (XIM). Некоторые х-приложения Windows могут использовать эту технику.
    • Вы можете ввести способ ввода в GTK+ библиотека. Такой метод может быть включен в любой гнома применение, например, в gedit. Входные методы позволяют контекстная нескольких ключевых переводы.
    • Приложений, таких как в yudit и Вим могут применить свои собственные назначения.
  • Может ли пользователь настроить отображение? В Unix «х-окна ввода», в xmodmap программа может модифицировать раскладку таблицы. В xkeycaps программа поможет вам настроить xmodmap конфигурации в интерактивном режиме. Аналогично, некоторые Х-Х ресурсов на основе заявок, в частности с xterm (эмулятор терминала), может быть настроена для перевода конкретной клавиши в любой нужный лад. Во многих случаях, правда, нужны специальные разрешения, чтобы изменять файлы конфигурации.
  • Пользователь может легко переключаться из одного сопоставления в другое? В Unix, xmodmap может изменить контурную карту, Таблица на лету (влияющие на все приложения). Х-приложения-конкретные сопоставления, как правило, загружаются только при запуске приложения. Однако, с xterm позволяет ключу быть сопоставлена такая функция, как «переход к другой загруженной карты». Xkb позволяет установить определенную клавишу или их группы, что позволяет переключать раскладки. Пакет ibus позволяет переключаться между методами ввода. В yudit делает свое собственное отображение, и нажатие всего одной кнопки переключается с одного на другое. ВИМ делает свое собственное отображение, и простой командой (которая может быть сопоставлена комбинация клавиш) переключается с одного на другое.
  • Сопоставления позволяют сделать несколько ключевых переводы? Когда я типа идиш, я бы хотел «W», чтобы быть Син, но я также хочу «ш.» к голени, потому что мой родной язык-Русский. Я хочу, «н», чтобы дать мне окончательный монахиня и запятую. В Unix, несколько ключевых переводы не доступны в ядре или x-Windows на уровне (насколько я знаю), но они возможны в пакет ibus, в GTK+ входные модули, и некоторые приложения, в частности, в yudit и Вим.
  • Это Юникод (utf-8) в формат для хранения данных? Этот вопрос обычно зависит от приложения. В Unix, в yudit только использует Юникод, а Вим может быть настроен на использование Юникода (и перевод к ней от других кодировок). В Linux-разновидность Unix, в «консольный режим», приложения получают символы Юникода (я думаю).
  • Существуют ли шрифты , которые правильно отображать Юникод, особенно идиш-конкретные буквы, такие как pasekh-tsvey-yudn? Начиная с 2000 года, ответ становится все более позитивные на всех платформах. Посмотреть шрифты, ниже.
  • Сделать отображение двигателей и редакторы правильно обработать сочинять персонажей? В Unix система x-Windows сервер, видимо, не имеет такой поддержки, но некоторые приложения (например, в xterm и в yudit) дисплей эквивалентен предварительно составленные характеры где это возможно, и использовать простой суперпозиции иначе. Gvim (графическая версия редактора vim , который обходит с xterm) только использует суперпозиции. ВИМ понимает 0-Ширина характере композиции (она занимается только моноширинный шрифты, и вертикальное выравнивание, поэтому важно).
  • Сделать дисплей ручка двигателей bidirectionality? Существует несколько уровней способностей: (a) нет поддержки, (б) содержимое окна может быть вручную присвоено значение RTL, (в) фрагмент текста в окне может быть вручную присвоено значение RTL, (д) весь текст автоматически отображается в соответствии полноценного двунаправленного алгоритма. Обычно отображают двигатели являются частью верхнего уровня приложения (то есть в Unix, когда я использовать vim в xterm через через x-Windows через ОС, это Вим, которая решает, как раскладывать персонажей. Более низкие уровни дают никакой поддержки). Текущий статус (2003) в Unix заключается в том, что Вим использует метод (б), в yudit и с abiword способ (д).
  • Можно напрямую ввести значение Unicode? некоторые приложения имеют такую способность: Вим (вы типа <хтр-с V>u05d7 получить khes) и символов (вы переключитесь на «юникод» keymap и типа u05d7). Он не поддерживается на более низких уровнях (пока).
  • Есть ли независимые от приложения интерфейсный процессор , который может преобразовывать нажатия клавиш в символы Unicode Для что приложение запущено? В x-окна, такой процессор называется х метода ввода (XIM). Многие приложения, в том числе Gvim, с abiword, и в yudit, может быть вложен в XIM; в yudit можете переключаться между несколькими XIMs во время сеанса. Я построил идиш XIM, но только преуспевает в том, чтобы разговаривать с abiword.
  • Возможна ли интернационализация приложений, то есть, чтобы сообщения об ошибках, справочные экраны, кнопки и ярлыки на вашем любимом языке? В Unix, программы, скомпилированные с libintl может быть интернационализированным. Я написал необходимые переводы для символов (скриншот) и с abiword.
  • Можно проверять правописание, вставлять индивидуальные списки правописания? В Вим и с abiword, ответ да, как в Романизированных и Unicode идиш. Я построил эти списки правописания.

Шрифты

В Unix, вы будете использовать x-Windows система. Я рекомендую вам пройти Маркус Кун шрифты если вы уже не имеете их в вашем х-дистрибутив Windows. Они присутствуют в X11R6.4. В-misc-fixed-medium-r-normal—20-200-75-75-c-100-iso10646-1 шрифт есть мои изменения, чтобы сделать его полным и четким на идиш. Для шрифтов TrueType, рекомендую FreeSans.

xkb

Вместо использования х-контурные карты для Windows, вы можете использовать x клавиатура расширение, известное как xkb. Этот объект позволяет установить несколько раскладок клавиатуры и переключаться между ними. Этот объект не зависит от всех x-приложений Windows. Это не дает вам несколько ключевых переводы. Здесь приведены инструкции для убунту Линукс.

  1. Убедитесь, что у вас нет XKB_DISABLE установить в вашей переменной окружения.
  2. Как корень, добавьте в файл /usr/share/X11/xkb/symbols/us содержимое этого файла.
  3. В каталоге /usr/share/X11/xkb/rules, добавьте следующую строку в конце нас: секция (примерно строка 269) как base.lst и evdev.lst:
  4. yiddish us: Yiddish 
  5. В каталоге /usr/share/X11/xkb/rules, добавьте следующую строку в пределах «нас» <макет>, в variantList после русской фонетических варианта, в обоих base.xml и evdev.хм::
    <variant> <configItem> <name>yiddish</name> <description>Yiddish</description> <languageList><iso639Id>yid</iso639Id></languageList> </configItem> </variant> 
  6. Запускать setxkbmap нас
  7. С помощью гнома-клавиатура-свойства, в разделе «Макеты» на вкладке
    1. Добавить макет: language → Yiddish → USA Yiddish
    2. Набор вариантов компоновки так вы знаете комбинации клавиш для изменения раскладки. Возможно, вы хотите использовать светодиоды на клавиатуре, чтобы показать альтернативный макет.
  8. Запускать setxkbmap -option grp:switch,grp:alts_toggle
  9. Теперь вы можете использовать (1) Все, что вы настроили в предыдущем шаге для переключения раскладок, (2) клавишу Shift для переключения уровней и (3) с правой клавишей Alt для переключения групп (несколько клавиш имеют вторую группу символов). Клавиатура выглядит как этот PDF файл. Если вам нужно Тип номера-предварительно составленные письма, разделяющую Алеф от его pasekh, например, использовать гласные расположены на клавишу Q или группы-двух символов на различные другие ключи.

с xterm

Варианты с xterm с 2000 года понимает кодировку utf-8. Вы можете получить в xterm и скомпилировать его самостоятельно, если вам нужно; вы должны оговорить./настроить опции —Enable-широкий-символов. Ограничения/баги: с xterm не имеет любой bidi поддержки. Он сочиняет персонажей путем простого наложения, если он не может найти предварительно составленные персонажа. Это не влияет на предварительно составленные характеры в разрез буфера, а не пост-состоит, как и должно.Поддержка файлов: Вы можете добавить эту информацию в ваш ~/.Xdefaults в файл для поддержки (1) хороший Unicode шрифт (на «средний» размер шрифта, и (2) клавиатуры для кодировки идиш (включить/отключить с Mode_switch ключ).

В yudit

Гаспар и на всем Синае в yudit редактор позволяет редактировать в utf-8 текст. Вот скриншот. Я построил раскладку клавиатуры для него, что является частью дистрибутива. Это сопоставление имеет несколько ключевых интерфейсных процессоров, так что вы можете типа «ш» если вы хотите голени. Идиш сопоставление также вставляет shtumer Алеф после пробела перед определенными гласными. В yudit также работает с моим XIM. Yudit есть свой собственный TrueType-шрифт отображения двигателя, так что Вы не должны иметь один в вашем X11. Yudit есть интернационализация, так что вы можете иметь все редактора Сообщений, представленных на языке идиш. В yudit не правда БИДИ дисплея. Вы должны будете установить ваш ~/.символов/символов.свойства файла есть строки что-то вроде этого:

 yudit.default.language=yi yudit.editor.font=iso10646 yudit.editor.fonts=arial,cyberbit,iso10646,caslr yudit.editor.fontsize=20 | yudit.editor.fontsizes=10,12,14,16,20,24 yudit.editor.input=Yiddish yudit.editor.inputs=straight,unicode,Yiddish,Russian,German yudit.font.arial=arial__h.ttf,cyberbit.ttf yudit.font.caslr=caslr.ttf yudit.font.cyberbit=cyberbit.ttf,CyberBitMods.ttf yudit.font.iso10646=-misc-fixed-medium-r-normal--20-200-75-75-c-100-iso10646-1 yudit.editor.fonts=arial,cyberbit,iso10646,caslr

Вы, возможно, захотите Cyberbit шрифт. Он отсутствует несколько символов, которые вы можете получить, добавив CyberBitMods на пути к шрифтам. Вы также можете в caslr шрифт, хотя не такая красивая, на идиш. В yudit способен генерировать вывод PostScript. Существует версия, что в yudit работает на Win32 платформах, которые вы можете найтиздесь. С Win32 краткая инструкция по установке: (1) Запустите исполняемый файл вы скачайте установить программу (ее название соответствует этому шаблону: в yudit*.exe-файл (2) Установить растровые шрифты, запустив программу, которая соответствует этому шаблону: bitmap_fonts*.ехе (3) с помощью любого текстового редактора, изменитьпрограммные Program Files\Yudit\Config\yudit.properties .свойства следующим образом:

yudit.datapath=C:\Program Files\Yudit\data
yudit.fontpath=C:\WINNT\FONTS [for Win2000]
yudit.fontpath=C:\WINDOES\FONTS [for Win98]

ВИМ

Брэм Moolenaar в редактор vim это свободно распространяемая версия популярного редактора VI; он нормально работает как для Unix, так и Win32. Начиная с версии 6.0, она имеет довольно хорошую поддержку для Unicode и идиш. Используйте его вместе с xterm (как выше) или в gvim режиме (минуя терминал), чтобы получить максимальную выгоду. Вотскриншот из gvim интерфейс. Вам не нужны специальные сопоставление символов для материалов с xterm; использовать vim вместо контурной карты. Поместите эти команды в ~/.существует:

setfileencodings=cp1255,utf-8 guifont=8x13bold encoding=utf-8 filetype plugin on syntax on 

Вы хотите знать о следующих команд:

:set rl sets mode in current window to RTL :set norl sets mode in current window to LTR :set keymap=yi switches to the Yiddish keymap :set encoding=utf-8 allows Vim to output well to your UTF-8 enabled xterm <control-^> toggles foreign-language input mode.

Если вы планируете смешивать языки, я предлагаю вам использовать несколько окон, одно с RTL включен, другой без. Ограничения/ошибки: Вим не имеет никакого БИДИ поддержки и вряд ли грозят. Поддерживая файла: получить этот файл и распакуйте его в вашу домашнюю директорию. Она включает в себя проверку орфографии на латинице и в Unicode идиш и клавиатурные макросы (полный интерфейсный процессор) для Юникода идиш. Он требует версию 6.0 по крайней мере. Прочитайте файл readme (в нем инструкции для Unix и для Win32).

С abiword

С abiword-полнофункциональный (в конечном итоге) текстовый процессор, а не просто текстовый редактор. Он использует XML в качестве предпочтительного формата файлов, но она может импортировать и экспортировать файлы в формате текстовых файлов и файлов в Юникоде. Самые последние варианты с abiword текстовый процессор ручкой БИДИ. Они также могут сделать еврейском письме-формировать, что означает, что финал письма генерируются автоматически, а результирующий файл содержит медиальный, а не конечных букв; оставить этот параметр выключен. С abiword имеет версии для Unix и MacOS и Win32; все имеют схожий внешний вид. Вот скриншот.

Многое из следующего является устаревшим; abiword это быстро движущуюся мишень. Это является хитрым, чтобы настроить шрифты для с abiword для Unix/x-окон.

  1. В каталог шрифтов (обычно это /usr/share/AbiSuite/fonts, вам нужно построить подкаталог кодировке utf-8.
  2. Положить копию или ссылку на разумные значение True-Type шрифты, такие как ариал.тцф.
  3. Запустить ttmkfdir в этом каталоге (ttmkfdir найти здесь). Эта программа извлекает имена шрифтов из ttf файлов и строит шрифты.масштаб.
  4. В результирующем файле шрифтов.масштаб, сделать одну новую строку для каждого шрифта (там скорее всего уже будет несколько с немного разными именами кодирования). На этой новой строке кодировки, которая является -ИСО суффикс, чтобы сказать iso10646-1. Этот суффикс говорит «Я-Юникод шрифт».
  5. Запустить mkfontdir в этом каталоге. Эта программа создает шрифты.реж, где под x-Windows, требуется, чтобы понять содержание.
  6. С abiword в каталоге bin, обычно это/usr/доли/AbiSuite/Бен, бегиttfadmin.sh каталог /usr/доли/AbiSuite/шрифты/Кодировка utf-8 в ISO-10646-1. Эта программа создает вспомогательные файлы *.u2g и *.t42 для каждого шрифта. С abiword нужны эти вспомогательные файлы понимать шрифты.
  7. Ваш x-сервер для Windows, должен понимать как типы шрифтов обычно используются abiword и также шрифты, шрифт Arial, потому что только истинный Тип шрифта, насколько я знаю, широко доступен и поддерживает идиш. Вам нужно по крайней мере версии 4.1.0 х-окна. В его конфигурационный файл (обычно этофайл/etc/xf86config в), необходимо иметь
      Load  "type1"
      Load  "xtt"

    в раздел «Module». Если вы должны добавить эти строки, вам нужно перезапустить x-Windows, чтобы изменения вступили в силу.

  8. Каждый раз, когда вы запустите с abiword, вы должны сначала установить переменную среды lang, чтобы Йи.Кодировка utf-8. На .в utf-8 часть указывает, какой шрифт использовать. Первая часть говорит, «я предпочитаю идиш запрещено».
  9. Когда вы читаете в кодировке utf-8 текстовый файл, прочитать его как типа закодированный текст, а затем выберите UTF8 в кодировку, в результате появится диалоговое окно.
  10. Я не знаю хороший способ сопоставления клавиатуры. Я использую xmodmap и переключаться между английским и идиш карты. Однако, этот метод требует использования нескольких нажатий клавиш, чтобы получить гласные на Алеф или линии над беев или любого другого несколько-в кодировке UTF8 символов. Я могу дать вам соответствующие файлы xmodmap и небольшое ТЗ программа, которая позволяет Вам переключаться между ними.
  11. При выходе с abiword, вам нужно сбросить переменной lang и также удалить лишние каталоги из fontpath, что с abiword иногда листья валяются:

xset fp- /usr/share/AbiSuite/fonts/ and xset fp- /usr/share/AbiSuite/fonts/utf-8/.

Я работаю по орфографии для с abiword/идиш. Я орфографию проверять файлы; задать мне дополнительные сведения. В настоящее время существуют следующие проблемы:

  1. Получение abiword, чтобы понять прошивках файлы для языков, таких как идиш, не в ее текущий список. Я просто называю их финские файлы и установить язык на финский.
  2. Интерактивное меню, когда парта впереди использует не UTF8 в шрифт, так что все что вы видите-это бред.

мул

Мул 2.3-это расширение для GNU emacs на 19.28 редактор. Он не поддерживает юникод, но он поддерживает различные языковые кодовые страницы. Он использует свой собственный специфический «junet» Формат файла для многоязычных файлов. Я советую вам избегать его.

в emacs

Имеется экспериментальная (10/2003) версии emacs, который обрабатывает UTF8 и по сообщениям ручками БИДИ достаточно хорошо; он в http://www.m17n.org/emacs-bidi/. Emacs-это полнофункциональный редактор, но это занимает много усилий, чтобы выучить его. Обновление (7/2008): при поддержке bidi пока недоступна для emacs (за исключением, что экспериментальная и работает в emacs -СЗ (без графики) в Биди с поддержкой эмулятора терминала), вы можете воспользоваться бедных-Ман-биди.Эль, которая запускает командную строку инструментов fribidi или bidiv как подпроцесс преобразовать логический вход в Visual выход в зеркальный буфер. Существует также метод ввода на идиш по emacs, который обрабатывает ЙИВО-как входных, среди прочего, написанная Нильсом Гизене. По состоянию на август 2010 года в развитие филиала в emacs поддерживает двунаправленный дисплей и старые бедные-Ман-биди.

В KDE

Для KDE 3-это «окружающая среда», включая оконный менеджер и многим приложениям. Его текстовый редактор вызывается приложений koffice. Приложений koffice поддерживает БИДИ и различных кодировок, включая Unicode.

Резюме

 

Продукт БИДИ раскладки клавиатуры редактор уровня
с xterm никто одноключевые нет редактирования
ВИМ инструкция по буфер; влияет только на отображение несколько-ключ; хорошая ЙИВО транскрипции Полное редактирование (использование моего правописания-орфографии плагин для Латинизированной или Unicode идиш); обычный текст; моноширинный дисплея только
В yudit автоматическая; влияет только на отображение несколько-ключ; хорошая ЙИВО транскрипции приемлемо редактирования; обычный текст; позволяет выполнять анализ типа и не-моноширинный шрифты; генерирует PostScript-файла.
Приложений koffice ? ? вся «обработка текстов»; вставляет коды формата; может выводить простой текст или XML или какие-то другие формы.
С abiword автоматическая; влияет только на отображение нет вся «обработка текстов»; вставляет коды формата; может выводить простой текст или XML или какие-то другие формы.

Ссылка на оригинал статьи: http://cs.engr.uky.edu/~raphael/yiddish/unix.html

 

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Можно использовать следующие HTML-теги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>