Türkçe ile *NIX'i Barıştırmak

Diyelim ki, yazıcıdan türkçe bir metin çıkartmanız gerekiyor. Ama yeni kurulmuş bir BSD konsolundasınız; ya da KDE çalışıtırıyorsunuz ama türkçe klavyeniz yok. Ne yapabilirsiniz? Bu yazıda sadece geleneksel *nix araçları kullanarak neler yapabileceğinizi anlatmaya çalışacağım.

Önce vi kullanarak -Emacs de kullanabilirsiniz tabii- benim uydurduğum basit bir markup dili ile türkçe metninizi yazın. Aşağıda bu dil ile yazılmış türk alfabesini görebilirsiniz:

ABCCxDEFGGxHIIxJKLMNOOxPRSSxTUUxVYZ
abccxdefggxhixijklmnooxprssxtuuxvyz

Gördüğünüz gibi dil basit. 'x' harfi alfabemizde yer almadığı için onu noktalı harflerin noktası yerine kullanıyoruz. Bunun tek istisnası 'x'in küçük 'ı'nın noktasını silmek için kullanılması. Daha sonra aşağıdaki sed programcığını kullanarak metin dosyanızı groff kaynağına çevirin.

#!/usr/bin/sed -f
#Turkish Markup Language ile yazilan metinleri groff kaynagina cevirir.
#Once kafayi(header) yazalim.
#Burada s`den ve g`den sonra gelen harflerin kucuk ve buyukleri ile 
#Buyuk i tanimlaniyor. C`den, o`dan ve u`dan sonra gelen harfler zaten
#groff`ta tanimli olarak geliyor. i`nin noktasiz olani da oyle.
i\
.AM\
.acc*over-def breve \\(ab\
.acc*over-def dot \\(a.\
\
.char \\(yg g\\*[breve]\
.char \\(yG G\\*[breve]\
.char \\(s, s\\*,\
.char \\(S, S\\*,\
.char \\(I. I\\*[dot]\
.LP
#Simdi regular expressions ile donusumleri yapalim.
s/cx/\\\(\,c/g
s/Cx/\\\(\,C/g
s/gx/\\\(yg/g
s/Gx/\\\(yG/g
s/ix/\\\(\.i/g
s/Ix/\\\(I\./g
s/ox/\\\(\:o/g
s/Ox/\\\(\:O/g
s/sx/\\\(s\,/g
s/Sx/\\\(S\,/g
s/ux/\\\(\:u/g
s/Ux/\\\(\:U/g
#X yazmak da mumkun olsun.
s/kx/x/g
s/Kx/X/g

Elde ettiğiniz groff kaynağını 'groff -ms' komutu ile postscript dosyasına çevirdikten sonra basılmaya hazır dosyanız elinizde olacaktır. Artık bu son dosyayı 'lpr' komutu ile yazıcıya gönderebilirsiniz. Tabii programları teker teker çalıştırıp fazladan dosyalar oluşturmak yerine *nix borularını(pipe) da kullanabilirsiniz. Şöyle ki:

sed -f tuxrkcxe.sed metin.txt | groff -ms | lpr

Notlar:

Debian GNU/Linux kullanıyorsanız,
```
apt-get install groff
```
yapmanız gerekebilir.
sed programını 'tuxrkcxe.sed' adıyla kaydettiğinizi varsaydım.
Programda küçük bir hata var. Kafa(header) bölümünü gereksiz yere tekrar tekrar yazıyor. Ama program yine de çalışıyor.

Görüşler

tongucyumruk
20 yıl önce

Peki buna gerçekten gerek var mı? Emacs ve benzeri metin editörleri zaten halihazırda birçok giriş yöntemi desteği ile geliyorlar. Bir örnek için şunara bakabilirsiniz:

M-x set-input-method <RET> latin-5-postfix

Bu komut sayesinde türkçe karakterleri şu şekilde yazabilirsiniz:

s, = ş
g~ = ğ

Veya LaTeX tarzı giriş metodunu kullanıp aşağıdaki gibi yazabilirsiniz:

\\pi = Pi karakteri
\\int = integral karakteri.

Bu arada yanlış anlaşılmasın, bence fikriniz oldukça güzel. Özellikle türkçe klavye vs... bulamadığmız durumlarda türkçe yazabilmek için tam bir kurtarıcı. Ancak bence "x" karakterini temel alan bir sistem yerine elimizdeki sed betiğini postfix veya prefix yazım tarzını işleyecek biçimde değiştirmek mantıklı olacaktır.

Not: Tabii bir diğer seçenekte doğrudan LaTeX ile yazmak olabilir. Düz metinden LaTeX belgesi üretmek herhalde o kadar da zor değildir...

misafir
20 yıl önce

Katılıyorum. Tabii ki Perl atasözünün de söylediği gibi, bir işi yapmanın birden fazla yolu var. Burada iki amacım vardı: biri basit bir markup ortaya koymak. Yani yumuşak g'yi her yazmak istediğimizde latex'te "\\u g" yazmak yerine sadece "gx" yazmak. İkincisi de basit araçları kullanarak bile neler yapılabileceğini göstermek.

misafir
20 yıl önce

Pardon, LaTeX demek istemiştim :-)

FZ
20 yıl önce

Her seferinde gx yazmak yerine misal Ctrl ile Alt arasındaki arasındaki o anlamsız Win tuşunu Emacs ortamında (ya da belki VIM, vi?) programlasak da Win+g bastığımızda ğ ya da g~ filan bassa böylece iki tuşa ayrı ayrı basmak yerine tek bir tuş kombinasyonu kullanmış olsak?

FZ
20 yıl önce

gx basmak istersem nasıl yazacağım? (çok dikkatli okumadım yazıyı, kaçırmış olabilirim, mazur görün) bir tür "escape" mekanizması var mı yukarıda?

misafir
20 yıl önce

Onu "gkx" diye yazabilirsiniz. sed scriptinin son üç satırında mekanizmayı görebilirsiniz.

FZ
20 yıl önce

Yani gkx yazarsam gx elde ediyorum. Pekiyi gkx yazmak istersem? gkkx? Ya gkkx yazmak istersem? O zaman da gkkkx? Bunun yerine başına bir sembol koysak ve bu sözcüğü (ya da belki başka bir gruplandırma yöntemi ile cümleyi, vs. ya da ayracımız, gruplandırıcımız her ne ise, çift tırnak arasına alıp vs.) yorumlama desek nasıl olurdu?

misafir
20 yıl önce

Mümkün tabii ama sed scripti ile zor gibi görünüyor. Daha gelişmiş bir versiyonu awk ile yazmayı düşünüyorum. Hatta aynı markup'ı ve html'deki &#XXX kodlarını kullanarak türkçe karakterli html oluşturmayı da bu programa eklemek istiyorum. Önerileriniz için teşekkürler.

FZ
20 yıl önce

Bu benim aklıma nereden geldi, hmm, sanırım Lisp'ten ve C# dillerinden geldi.

Nasıldı C# ortamında, sürekli "escape" yapmak yerine

@"Oh rahat rahat \ gibi özel anlamı olan şeyleri işte böyle \ basayım, başlarına ekstra bir şey yazmakla uğraşmayayım misal hemen \\t yazayım olduğu gibi görünsün \\\\t yazmama gerek kalmasın, vs."

gibi.

Ya da işte Common Lisp'teki reader macro mevzusu gibi, nasıldı misal #| gibi bir şeyi s-exp'nin (symbolic expression) başına koyunca onun tamamının etkilenmesi, vs.

misafir
20 yıl önce

Eğer programcı arkadaşlardan bu markup'ı beğenenler varsa istedikleri dilde 'implement' edebilirler. Özgür bir lisansla lisansladım gitti :-) Benim awk öğrenmemi beklemek zorunda değiller. Belki de en uygunu groff için yeni bir macro yazmak olacaktır.

misafir
20 yıl önce

Benim de aklıma bu geldi söylediklerinizden.

misafir
20 yıl önce

Programı awk dili ile yeniden yazdım. Böylece haberde sözedilen hata da giderildi. Şöyle:


#!/usr/bin/awk -f

BEGIN{  print ".AM";

        print ".acc*over-def breve \\\\(ab";

        print ".acc*over-def dot \\\\(a.";

        print ".char \\\\(yg g\\\\*[breve]";

        print ".char \\\\(yG G\\\\*[breve]";

        print ".char \\\\(s, s\\\\*,";

        print ".char \\\\(S, S\\\\*,";

        print ".char \\\\(I. I\\\\*[dot]";

        print ".LP";}

{       gsub(/cx/,"\\\\(,c");

        gsub(/Cx/,"\\\\(,C");

        gsub(/gx/,"\\\\(yg");

        gsub(/Gx/,"\\\\(yG");

        gsub(/ix/,"\\\\(.i");

        gsub(/Ix/,"\\\\(I.");

        gsub(/ox/,"\\\\(:o");

        gsub(/Ox/,"\\\\(:O");

        gsub(/sx/,"\\\\(s,");

        gsub(/Sx/,"\\\\(S,");

        gsub(/ux/,"\\\\(:u");

        gsub(/Ux/,"\\\\(:U");

        gsub(/kx/,"x");

        gsub(/Kx/,"X");

        print;}

Görüş belirtmek için giriş yapın...

İlgili Yazılar

Linmodem sürücüleri para ile satılıyor!

sundance
6 Kasım 2003, 1 dakika okuma süresi

Zamanında çok umut verdiğini belirttiğimiz Linuxant firması, son nesil HSF ve HCF Linux modem sürücülerini para ile satmaya başladı

Şirketten yapılan açıklamaya göre sözkonusu argenin ciddi zaman ve kaynak ayırma gerektirmesi üzerine bu yola gidilmiş. Sözkonusu sürücülerin full sürümleri $14.95´e satılırken 14.400kbps ile limitlenmiş halleri bedavaya (fakat kapalı kodlu olarak, dağıtılmakta.

Ödül Avcısı Aranıyor!

cbc
24 Kasım 2003, 1 dakika okuma süresi

Slashdot´ı gezerken bir Gnome haberi gözüme çarptı. Çeşitli uygulamalara yeni özelllikler ekleyecek, para ile çalışan programcılar, bir nevi ödül avcıları arıyorlarmış. Para vaad edilen işlerden bazıları ise şöyle:

Gnome - Mozilla arası sürükle - bırak: 300 $
Paneldeki saat ile takvim uyumu: 1.000 $
Gaim listesi - adres defteri bağlantısı: 2.500 $

Penguence 2. sayı PDF olarak yayınlandı

resilence
19 Nisan 2005, 1 dakika okuma süresi

Penguence Sayı 2 PDF formatında çıktı.

Penguence Dergisi, Linux Kullanıcıları Derneği bünyesinde sürekli bir yayın çıkartmak amaciyla oluşturulmuş bir topluluk projesidir. Şubat 2005 tarihinde ilk sayısı çıkan dergi 2. sayısı ile okuyucuların karşısında. PDF formatında hazırlanan dergiyi http://penguence.linux.org.tr sitesinden indirebilirsiniz.

2.sayıda yer alan konulardan bazıları:

Ruhuna Gentoo Bulaşan Adam

conan
30 Ağustos 2002, 2 dakika okuma süresi

Gentooyu ilk fazlamesaide duyduğumu söylemekle yazıya başlamak istiyorum. Ama ilk defa tanışmam yine bir FM katılımcısı olan petkutin arkadaşımızın kubikindeki matrix screensaverli Linuxunu yenilemeye karar verdiğinde oldu. O andan itibaren ne kadar mantıklı bir şey olduğunu farkederek ben de denemeye karar verdim. Sağolsun petkutinin yarattığı isoyu alarak ilk denememe ofisteki makinamda başladım. İsterseniz önce burada bir duralım ve Gentoonun ne olduğuna bir göz atalım.

GNU/Linux 2.6 Çekirdeğinde Yüksek Performanslı Etkileşim

FZ
8 Mart 2003, 1 dakika okuma süresi

Linux çekirdek geliştirme ekibi gene yaptı yapacağını! Linux yaratıcısı Linus Torvalds son sunduğu "patch" ile etkileşimli proseslerin performansını artırdığını böylece X masaüstü ortamlarının çok daha iyi çalışacağını belirtti. Tabii buna müzik ve sinema uygulamaları da dahil.ost, greatly benefiting the X desktop, as well as music and movie players. O(1) karmaşıklığındaki zamanlayıcıyı geliştiren Ingo Molnar, Linus'un patch'ini kendi etkileşim çabaları ile bütünleştirince ortaya çıkacak sonucun yani 2.6 çekirdek sürümünün masaüstü kullanıcısının rüyasının gerçekleşmesi gibi bir şey olacağı tahmin ediliyor.