polskich znak�w w TeXu (w implementacjach opartych na web2c) | |
Istnieje kilka sposob�w kodowania polskich znak�w w dokumencie TeXowym. Najbardziej komfortowa jest notacja ,,naturalna'' o�miobitowa, tzn. zastosowanie jakiej� strony kodowej (np. cp852, cp1250, ISO 8859-2 (Latin 2), itp.). S� dwa zasadnicze sposoby nauczenia TeXa przetwarzania tak zapisanego tekstu. Jeden polega na zastosowaniu znak�w aktywnych. Drugi wymaga wsparcia ze strony samej implementacji TeXa polegaj�cego na przekodowywaniu znak�w z wej�cia na odpowiednie pozycje znak�w w stosowanych fontach. Ka�dy z wymienionych sposob�w ma swoje wady i zalety. Przekodowywanie znak�w narodowych przez samego TeXa jest dost�pne od dawna w emTeXu i sbTeXu (MS DOG), natomiast w popularnych dystrybucjach UNIXowych opartych na web2c pojawi�o si� dos�ownie przed chwil� (je�li pami�ta�, �e chwila w TeXu mo�e trwa� p� roku; w por�wnaniu z wiekiem TeXa jest to czas zaniedbywalny). W zwi�zku z tym przekodowanie sta�o si� dost�pne r�wnie� w fpTeXu --- opartej na web2c dystrybucji TeXa dla Windows 95/98/NT. A poniewa� MikTeX (te� Windows) nie zamierza by� w tej kwestii w tyle, mo�na mie� nadziej�, �e wkr�tce praktycznie ka�dy licz�cy si� TeX b�dzie m�g� przekodowywa�. Implementacja przekodowywania, pod
tajemnicz� nazw� TCX zosta�a wprowadzona do dystrybucji
web2c ju� jaki� czas temu. Wkr�tce jednak przeciwnicy
tego rozwi�zania (zwi�zani z ekip� LaTeXa 2e) wymogli
jego unieczynnienie w �r�d�ach ( Warto tu jeszcze zaznaczy�, �e wprowadzenie przekodowywania nie narusza licencji TeXa. Jak wiadomo, jedyn� osob� w�adn� aby wprowadza� zmiany w TeXu jest Don Knuth. Nie dotyczy to wszak�e drobnych szczeg��w zwi�zanych ze specyfik� danego systemu operacyjnego (�rodowiska obliczeniowego), w kt�rym dana implementacja TeXa ma dzia�a�. W istocie TeX ma mechanizm zamiany dowolnego (jednobajtowego) kodu u�ywanego w dokumentach na reprezentacj� opart� na ASCII i u�ywan� w pliku .dvi (reprezentacja ta odzwierciedla uk�ad znak�w w fontach). Mechanizm przekodowywania zosta� przewidziany z my�l� o komputerach pracuj�cych w EBCDICu (kt�ry jest istotnie odmienny od ASCII). Wierzymy, �e �rodowisko obliczeniowe pos�uguj�ce si� kodem (na przyk�ad) ISO 8859-2 te� jest �rodowiskiem ,,nie-ASCII'' i �e w zwi�zku z tym pracuj�ca w nim implementacja TeXa mo�e mie� w odpowiednie tablice w programie w�o�one odwzorowanie ISO 8859-2 w uk�ad font�w. W zwi�zku z mnogo�ci� stosowanych ,,stron kodowych'' zaszycie odwzorowania w kompilat TeXa jest niepraktyczne. Dlatego web2c oferuje rewelacyjne uproszczenie: tabel� opisuj�c� przekodowanie mo�na zada� przy pomocy opcji polecenia uruchamiaj�cego TeXa. | |
Jak si� tego u�ywa? W nowej wersji web2c (7.3) i w konsekwencji teTeXa
(1.0) TeX reaguje na dodatkow� opcj�
Przyk�ad: pod Linuksem poni�sze wywo�anie przetwarza dokument MeXowy z polskimi znakami w notacji ,,naturalnej'': mex -translate-file=il2-pl mojdokument.tex Istnieje alternatywny spos�b informowania TeXa o sposobie kodowania danego pliku. Web2c ,,od zawsze'' reagowa�o na pierwsz� lini� pliku zaczynaj�c� si� w taki spos�b %&mex za�adowaniem odpowiedniego formatu (tutaj MeXa). W nowej wersji ten mechanizm zosta� rozszerzony. Nast�puj�ca linia %&mex --translate-file=il2-pl opr�cz formatu zadaje r�wnie� kodowanie pliku. Mo�na r�wnie� pomin�� nazw� formatu: %& --translate-file=il2-pl U�ycie opcji TeX poszukuje pliku opisuj�cego przekodowanie w
bie��cym katalogu oraz w miejscu w�a�ciwym dla plik�w
.pool czyli domy�lnie
Opcji -translate-file mo�na u�ywa� r�wnie� w wywo�aniu initexa, ale b�dzie ona w mocy tylko w czasie jego pracy. Po co to komu? Mo�na wyobrazi� sobie format oparty na MeXu definiuj�cy makra o nazwach zawieraj�cych polskie znaki. W pliku takiego formatu nazwy makr by�yby zakodowane w notacji wewn�trznej. A zatem format by�by nadal niezale�ny od notacji wej�ciowej! Przy przetwarzaniu dokumentu mo�naby nadal wskaza� dowoln� stron� kodow� dla wej�cia i dawa�aby ona dost�p do makr o polskich nazwach. Jak si� zdaje web2c jest pierwsz� na �wiecie implementacj� TeXa o takich mo�liwo�ciach. | |
|
These binaries (installable software) and packages are in development.
They may not be fully stable and should be used with caution. We make no claims about them.
Health stats visible at Monitor.