Previous Next Contents

5. Aktivierung des Zeichensatzes "ISO-latin1" ("Umlaute")

Sowohl fuer die Textkonsole als auch fuer X11 existieren fonts, die den Zeichensatz "ISO-latin1" nicht komplett darstellen koennen. In diesem Fall hilft natuerlich die Konfiguration der Programme nicht weiter ...

Neuere Programmversionen fragen die Umgebungsvariable "LC_CTYPE" ab und nehmen die laenderspezifischen Einstellungen automatisch vor. Fuer Deutschland sollte man diese Variable auf "ISO-8859-1" setzen und nur noch solche Programme konfigurieren, die tatsaechlich individuell konfiguriert werden muessen. Unter Umstaenden werden die unten genannten Einstellungen von den neueren Programmversionen schon nicht mehr erkannt.

PROFILE:

    -----8<----- hier schneiden -----8<-----
    export LC_CTYPE=ISO-8859-1
    -----8<----- hier schneiden -----8<-----

In der Regel ist es unter LINUX nicht notwendig, die virtuellen Bildschirme (pty's und tty's) mit dem Befehl "stty pass8" in den 8-bit Modus zu schalten (das sind sie naemlich von Hause aus).

5.1 bash, ab Version 1.14 (Shell, Komandozeile)

Die "bash" wird wie alle "readline"-basierten Programme u.a. durch die Datei "~/.inputrc" konfiguriert:

        -----8<----- hier schneiden -----8<-----
        set meta-flag on
        set convert-meta off
        set output-meta on
        -----8<----- hier schneiden -----8<-----

Obige Eintraege erlauben die Ein- und Ausgabe von Umlauten. Kopiert man die Datei ".inputrc" ausserdem noch nach "/etc/skel", so erhaelt sie jeder neu angelegte Benutzer automatisch.

5.2 tcsh, ab Version ??? (Shell, Komandozeile)

Die "tcsh" wird NICHT ueber die Datei "~/.inputrc" konfiguriert, sondern ueber PROFILE.

        -----8<----- hier schneiden -----8<-----
        setenv LC_CTYPE iso_8859_1
        -----8<----- hier schneiden -----8<-----

5.3 TeX/LaTeX (professionelles Satzsystem)

"iso.sty"
"xlatin1.sty"

Machen den kompletten ISO-latin1 -Zeichensatz unter TeX oder LaTeX verfuegbar (also insbesondere die Umlaute)

"isolatin1.sty"

Nur fuer LaTeX. Erlaubt nicht (wie man vermuten sollte) die Verwendung aller Zeichen aus "ISO-latin1".

"umlaute.sty"

(ISO-) Umlaute werden vom TeX/LateX direkt und ohne Fehlermeldung verarbeitet

Die Aktivierung der style-Dateien erfolgt mit dem Befehl
"\input xlatin1.sty"
(Beispiel unter TeX), bzw.
"\documentstyle[german,a4,xlatin1]{dletter}"
(LaTeX), bzw.
"\usepackage{german,xlatin1}"
(LaTeX, neues Format). Siehe auch Abschnitt xterm und Abschitt Deutsche Trenntabellen und deutsches Layout fuer TeX/LaTeX

5.4 "GNU emacs", ab Version 19 (leistungsfaehiger Editor)

( Hinweis: bei Problemen mit der Aktivierung der Umlaute bei bestimmten Versionen sollte man die Version 19.28 benutzen )

Die Konfigurationsdateien fuer den "emacs" sind im wesentlichen:

"/usr/lib/emacs/site-lisp/site-start.el" (global),
"~/.emacs" (persoenlich), "/usr/lib/emacs/site-lisp/default.el" (gobal),

und werden in dieser Reihenfolge abgearbeitet. Insbesondere ueberschreiben also die Einstellungen in der "default.el" die Einstellungen aus ".emacs" und "site-start.el". Die Eintraege

        -----8<----- hier schneiden -----8<-----
        (standard-display-european t)

        (set-input-mode (car (current-input-mode))
                (nth 1 (current-input-mode))
                0) 
        -----8<----- hier schneiden -----8<-----
in einer dieser Dateien erlauben die Eingabe und Darstellung des ISO-latin1 -Zeichensatzes. Speziellere Informationen findet man in der FAQ zum Thema "emacs und Umlaute" von Karl Brodowsky; Bezugsquellen siehe Kapitel Bezugsquellen.

Das Abarbeiten von default.el laesst sich allerdings mit

        -----8<----- hier schneiden -----8<-----
            (setq inhibit-default-init t)
        -----8<----- hier schneiden -----8<-----

in der Datei ~/.emacs unterbinden

Der emacs kann in seinen Faehigkeiten durch LISP-Module (erkennbar an der Dateiendung ".el" oder ".elc"; letzteres ist die compilierte Form einer ".el"-Datei) erheblich erweitert werden. "Nur Kaffeekochen kann er nicht". Die Lisp-Dateien muessen sich im Suchpfad des "emacs" befinden (z.B. in "/usr/lib/emacs/site-lisp") und koennen mit dem Befehl "M-x iso-tex" (Beispiel) ("M" steht fuer Meta, die Meta-Taste "M" liegt meist auf der "Alt"-Taste) oder durch eine Anweisung in den Konfigurationsdateien (s.o.) geladen werden.

iso-tex ("iso-tex.el")

Zeigt die Umlaute als Umlaute an, speichert sie aber im "Vokal-Format" ab ( "a fuer a mit Punkten darueber).

konvers ("konvers.el")

Wie "iso-tex", kann aber nicht nur in beide Richtungen konvertieren, sondern beherrscht auch noch andere Formate ("MIME")

iso-accent-mode ("iso-acc.el")

Erlaubt die Eingabe von Umlauten und Akzenten durch vorangestellte Zeichen, d.h. ~a wird schon waehrend der Eingabe der Zeichen zu einem a mit der Schlange darueber (und auch als solches abgespeichert).

alt-symbol ("alt-symbol.el")

Aehnlich wie "iso-accent"

AucTeX, ab Version 9

AucTeX ist eine leistungsfaehige "TeXshell". Soll " nun ein " oder ein '' erzeugen? (-> Eingabe von Umlauten)

-----8<----- hier schneiden -----8<-----
(defvar TeX-quote-after-quote t
  "*Behaviour of \\[TeX-insert-quote]. Nil means standard behaviour;
  when non-nil, opening and closing quotes are inserted only after \"{}.")
-----8<----- hier schneiden -----8<-----
(Datei "/usr/lib/emacs/site-lisp/tex-site.el")

5.5 xterm (Fenster mit Kommandozeile)

Das "xterm" ist nur ein huebsches Fensterchen fuer eine shell, also siehe Abschnitt bash und Abschnitt tcsh. Es kann aber sein, dass dieses Fenster nur die ersten 7 Bit eines Zeichens darstellt. In diesem Fall schaffen die Eintraege "XTerm*eightBitInput: true" und "XTerm*eightBitOutput: true" Abhilfe. Beide SIND aber standardmaessig so eingestellt. ( XRESOURCE )

5.6 less (einfacher Dateibetrachter)

Und noch ein Eintrag fuer die Datei "/etc/profile" ...

 
        -----8<----- hier schneiden -----8<-----
        export LESSCHARSET=latin1
        -----8<----- hier schneiden -----8<-----

5.7 a2ps (druckt Textdateien auf Postskript-Druckern)

Eine "8-bit-cleane" Version findet sich im Diskettensatz "g1" von Jochen Hein.

5.8 pine (einfaches Email-Programm, "Pine is no longer elm")

Konfigurationsdateien fuer "pine" sind: "~/.pinerc" (persoenliche Konfiguration) "/usr/local/lib/pine.conf" (globale Konfiguration)

        -----8<----- hier schneiden -----8<-----
        # character-set should reflect the capabilities of the display
        # you have. Normal default is US-ASCII.  Typical alternatives
        # include ISO-8859-x, where x is a number between 1 and 9.
        character-set=ISO-8859-1
        -----8<----- hier schneiden -----8<-----

5.9 joe (WordStar-aehnlicher Editor)

Die Konfigurationsdateien des joe sind: "/usr/lib/joerc", "/usr/lib/jmacsrc" und "/usr/lib/jstarrc". Folgender Eintrag in einer dieser Dateien aktiviert die Darstellung des kompletten Zeichensatzes:

        -----8<----- hier schneiden -----8<-----
        -asis
        -----8<----- hier schneiden -----8<-----
Sie duerfen dabei vor dem Minuszeichen weder Leerzeichen noch Tabulatorzeichen haben!

5.10 elm (Email-Programm)

die Konfigurationsdatei fuer "elm" ist: "~/.elm/elmrc" (persoenliche Konfiguration)

 
        -----8<----- hier schneiden -----8<-----
        charset = iso-8859-1
        displaycharset = iso-8859-1
        textencoding = 8bit
        -----8<----- hier schneiden -----8<-----

Es sind Versionen von "elm" ohne "charset"-Unterstuetzung im Umlauf. In diesem Fall hilft nur eine neue Kompilation des Programms; diese ist jedoch nicht einfach.

5.11 nn (newsreader)

"~/.nn/init" (persoenliche Konfiguration)

        -----8<----- hier schneiden -----8<-----
        set data-bits 8
        -----8<----- hier schneiden -----8<-----

5.12 lynx (textbasierter WWW-Client)

Das 8-Bit Lynx 2.3b Binary, die Sourcen, die Sourcen zu "ncurses 1.8.5", den "ncurses 8-Bit Patch", sowie die Lynx- Help-Files finden sich unter ftp://ftp.educat.hu-berlin.de/pub/network

Uebersetzt man lynx selbst, muss man unbedingt folgende CFLAGS angeben, um eine 8-bit-Version zu bekommen:

CFLAGS=-funsigned-char

5.13 ncurses (Version 1.9.x) (C-Bibliothek zur Bildschirmsteuerung)

Siehe Abschnitt gslp. Die Version 1.9.x ist derzeit aktuell und ist 8bit-clean.

5.14 gslp (einfachster "ascii nach postscript" Konverter)

Mir sind derzeit zwei Patches bekannt, die dem "gslp" den ISO-latin1 Zeichensatz beibringen. Der eine stammt von Arne Marschall <arne@mars.rmt.sub.org> und ist in dem Packet "mgetty" enthalten, der andere stammt von Fritz Elfert <fritz@wuemaus.franken.de> und erschien in der newsgroup "de.comp.linux".

5.15 postscript, allgemein (verbreitetes Textformat)

Das Problem mit Postscript ist, dass die Zeichensaetze von Haus aus nur die 7-Bit-Zeichen enthalten. Will ein Programm deutsche Umlaute oder generell Zeichen, die nicht in 7-Bit-Ascii enthalten sind, im postscript-Format ausgeben, so muss es den sogenannten "encoding vector" der gewuenschten Schriftart entsprechend anpassen. (Der "encoding vector" gibt die Zuordnung Character-Code -> Symbol, z.B. "65" -> "A" an.)

Dieses geschieht normalerweise in einem Vorspann, ueber den der Encoding-Vector aller benutzten Schriften auf ISO8859-1 oder aehnliches geaendert wird (z.B. gut in den ersten 30 Zeilen von "groff -Tps" erkennbar).

Fehlen in einem gedruckten postscript-Dokument die Umlaute ganz oder werden diese verstuemmelt gedruckt, so liegt das nicht am Drucker oder am Ghostscript (konvertiert Postscript in das Pixelformat fuer den Drucker), sondern am erzeugenden Programm.


Previous Next Contents