Osmanlıca Karakter Seti

0
butch
Pardus geliştiricileri, bir karakter seti olmadığı için bilgisayar ortamında varlığını sürdüremeyen Osmanlıca için harekete geçmiş.

Osmanlıcanın bir karakter setine sahip olacağını duymak güzel, ama en önemli konu Ali Işıngör'ün yazısında bahsettiği gibi bugüne kadar 700 yıllık tarihimize ait belgelerin bilgisayar ortamına aktarılması konusunda bir çözüm bulunmamış olması.

Görüşler

0
bm
Ben tam anlamadim yapilacak olan sey nedir diye. Anladigimdan cikarttigimi yazayim. Surada 94. satirda gozuken " جام ييه بلورم بڭا ضررى طوقونمز" da cikmayan harfler de cikar hale mi gelecek mesela? Yoksa simdi hic yazilamayani yazilabilir hale mi getirecek bu yeni katki? Yani unicode code point denen seyler Osmanlica icin var fakat gosterecek font ve basma/girme teknolojisi mi eksiktir, yoksa Osmanlica'da kullanilan harfler icin unicode code point yok mudur? Yoksa bunlar tamamen yanlis sorular midir? Webde bu konuda pek birsey bulamadim. Karakter seti denince ikincisini anliyorum galiba, ama tam bilemiyorum. Konulara hakim birisi problemi anlatabilir mi?
0
skilic
Konuya çok hakim değilim benim anladığım bu proje yeni bir karakter set yaratmıyor. Dediğiniz gibi unicode sanırım tek bir harf hariç tüm osmanlıca harfleri içeriyor. Fakat problem osmanlıca için yapılmış bir klavye layoutunun bulunmaması. Yani siz osmanlıca yazacaksanız arapça ve farsça klavyeleri aynı anda kullanmak zorunda kalıyorsunuz. Şimdilik yapılacak olan sadece bir osmanlıca klavye layout sanırım.
OCR falan çok sonraki aşamalar bence. Zaten OCR'lada el yazmalarını ve hatları eloktronik ortama taşımak nerdeyse imkansız.
0
FZ
0
robertosmix
Nihayet Pardus, "özgün" birşeyler yapmaya başlıyor. Umarım bu tür şeyleri sık sık görürüm ve beni utandırırlar. Zararın neresinden dönülürse kardır.
0
FZ
Bu konuda vakti zamanında kendisinden birkaç Osmanlı tarihi dersi almış olduğum Dr. Christoph Neumann'ın görüşlerini merak ettim ve beni bilgilendirmesini rica ettim. Şöyle bir yanıt aldım:

Burada galiba iki konuyu karıştırmak kolaydır. Birincisi, bilgisayarda (standart programların anlayabildiği bir biçimde) Osmanlıcayı yazabilmek. Bu, çoktan halledilmiş bir problem, çünkü Osmanlıca istimal edilen bütün karakterler Farsçada ve dolayısıyla Unicode’da mevcuttur. Farsça klavyesine alışmak istemeyenler için çoğu işletim sistemleri için klavye uygulamaları da mevcuttur. Burada sözü edilen “karakter seti” herhalde başka bir şey değildir. İkincisi ise daha çetrefil: Hakikaten Osmanlıca belgeleri arşivlemek isterseniz çok karmaşık (ve maalesef Farsça veya Arapçada yaygın kullanımda olan yazı stillerinden epey farklı) rık’a veya divanî gibi yazılar için OCR programları geliştirmek gerekmektedir. Onlar yoksa ya belge "scan"i istiflemekle kalacaksınız veya hepsini tek tek bilgisayara bir daha istinsah ederek geçireceksiniz (iyi eğlenceler!). Bildiğim kadarıyla böyle bir program yok. Olmayan başka bir şey: Osmanlıcayı okuyup okuduklarını ya modern Türkçe imlaya ya da akademik bir transliterasyona aktarabilen bir program. Anlamlı mı? Elbette! Bilgisayara geçirilen bilgilerin nispeten kısa bir müddetten sonra yok olacağını varsayarsak bile (1830’lardan önce yazılan veya basılan bir cilt kitap, zor tahrip edilebilen, kimyası dengede olan ve teknik değişim dolayısıyla okunamaz hale gelmeyen bir nesnedir; elektronik veriler böyle değil, yüz sene dayanmamaları çok muhtemeldir), ancak, sadece elektronik ortamda var olanların yeniden bilgi üretiminde yaygın bir şekilde kullanılacağı aşikârdır. Google’un kütüphane "scan"leri İngilizce basılan kitaplarıyla mahdut olması, dünyanın Anglosaksonlaşmasında büyük rol oynayacaktır (Avrupa’da diğer dillerde basılanlarını "scan" etmek projeleri çok başarılı olmazsa). Bu bakımdan Osmanlı mirası diye bir şey varsa ve bunun dünya mirasına dahil edilmesi istenirse bu kabil girişimler çok yararlı olabilir. Ancak kolay kolay başarıya ulaşmazlar (bir örnek için http://courses.washington.edu/otap/ adresine bakılabilir).
0
bm
Bu hocanin yazisi benim kafa karisikligimi yapilanin ne olamayacagini aciklayarak bir nebze azaltti. Tesekkur ederim. Yapilanin ne oldugunu hala anlamis degilim ama. Anlayan var mi?
0
roktas
Benim basitçe bu işten anladığım şu, yanıldığım yerler varsa lütfen düzeltin. Bir araştırmacı Osmanlıca metinlerin mevcut Türkçe klavyelerle de girilebilmesine imkan sağlayan bir transliteration veya daha da özelleştirirsek romanization standartı geliştirmiş (TSE tarafından kabul gören[1]) ve bu standarta uygun bilgiişlem ortamının hazırlanması gerekiyor; meselâ bir XKB klavye eşlemi, klavye giriş yöntemi ("input method"), translitere alfabeyle yapılacak sıralamalarda kullanılacak LC_COLLATE'i de içeren bir yerel (locale) tanımı: ot_TR gibi ... Bunun dışında bahsedilenlerin, misâl Osmanlıca metinlerin OCR ile taranarak bu standart uyarınca latin harflerine translitere edilmesi gibi irikıyım projeleri ayırıyorum, bence onlar çok daha kendi başına işler. Eğer durum buysa konuya "Osmanlıca karakter seti desteği" yerine yukarıda saydığım unsurları da toparlayan biraz daha şümullu bir isim vermek daha uygun olabilirdi. Doğru mu anlıyorum?

[1] Bu belgeye şu an erişemiyorum, abonelik işlemini bir türlü yapamadım.

0
FZ


Konu ile ilgili bir gelişme: Pardus'a Osmanlıca Karakter Desteği.

Görüş belirtmek için giriş yapın...

İlgili Yazılar

MERNİS Projesinde Hayalkırıklığı

FZ

Herkese bir TC kimlik numarası verilmesini hedefleyen Merkezi Nüfus İdaresi Sistemi'nde (MERNİS) kargaşa yaşandı. İçişleri Bakanlığı'nca verilen TC kimlik numarası ile Maliye Bakanlığı'nca verilen vergi kimlik numarası arasında yüzde 100 uyuşma sağlanması gerekirken, verilerin sadece yüzde 12'sinde uyuşma sağlanabildi.

Tek numara sisteminin, dünyanın en mükemmeli olacağını ifade eden İçişleri Bakanlığı Nüfus ve Vatandaşlık İşleri Genel Müdürü Aydoğdu, tam olarak uygulamaya geçildiğinde vatandaşların vergi, sosyal güvenlik, bankacılık işlemlerine tek numarayla ulaşılabileceğini söyledi. MERNİS projesi 1972'de gündeme geldi. Veri tabanı ise Kasım 2002'de oluşturulmaya başlanan proje için bugüne dek 50.000.000 $ harcandı.

Kaynak: Radikal

TT Net sayesinde Sourceforge'a girememekteyiz!

sundance

Çağ atlamaktan bitap düşmüş, bizi bir şekilde aya ulaştıracağına inancımızın tam olduğu TT Net, bu sefer kullanıcılarını bilgilendirmeden kullandığı proxy sunucusu yüzünden Sourceforge tarafından bloke edildi !

Bir program indirmek için (kablonetten) Sourceforge'a girmeye çalıştığımda "The IP address you are coming from: 195.175.37.39 ... has been blocked by SourceForge.net due to heavy volume." uyarısı ile karşılaştım.
Kontrol ettiğimde gördüm ki sözkonusu IP'nin benle hiçbir ilgisi yok, kendileri muhtemelen TTNet'in proxysi oluyorlar (bu arada ters çözümleme de yapmayan bir IP) ve dolayısıyla bütün TTNet trafiği tek bir IP'den geliyormuş gibi yapınca ve bunların içinde de SF'u ziyaret edenlerin sayısı fazla olunca SF'da bizi bloklamış. Blok birkaç saat içinde kalkacak fakat aynı davranış devam ederse bu sefer e-mail atılmadığı sürece kaldırılmayacak.

Ben söyliyim, bu gidişle ay bize gelmezse, bizim aya gideceğimiz yok haberiniz olsun.

Yükselen Değerler Medyası...

conan

Yükselen değerleri daima takip eden ve kendisine uygulayan güzide medyamızın bir ilke daha imza atmış olmasını gururla burada haber yapıyorum! Çok değil belki bir sene öncesine kadar içeriğini kimseyle paylaşmak istemeyen, ya da para ile satan medyamız bir anda ne hikmetse RSS feedleri ya da içerik paylaşımları yapmaya girişti.

İşte bazı gazetelerimizin birden ortaya çıkan RSS linkleri.

Türkiye'de Tehlikeli Bir Salgın: 400.000 kişi hasta

FZ

Dünya Sağlık Teşkilatı'nın salgın hastalıkları izleme odasında bilgisayarlara bağlı duran alarm kesik kesik ötmeye başladı. Nöbetçi iki uzman hemen özel ekranın başına koştular. Ne oluyordu? Çin'de yeni SARS vakaları mı görülmüştü? Yoksa beklenen 'kuş gribi' bir yerde çirkin yüzünü mü göstermişti? Ya da Afrika'daki AIDS faciasında yeni bir sıçrama mı gerçekleşmişti?

Ekrandaki verileri izleyen uzman: "Kötü haber Türkiye'den" dedi. Tuşlara birkaç kez dokunup bir süre araştırma yaptı. "Bir çeşit üst solunum yolları enfeksiyonu olarak başlıyor ama başka biçimlerde de kendisini gösterebiliyor. Özellikle gençleri vuruyor. Kız-erkek ayrımı yapmıyor."

Türk Telekom: Quo Vadis?

FZ

turk.internet.com'a göre: Türk Telekom'dan en son hareket, UMTH'cilere (Uzun Mesafe Telefon Hizmeti) hat vermemek şeklinde geldi. Yaklaşık 1 haftadır ISS'lere bir taahhütname imzalatarak kiralık hat verilirken, UMTH firmalarına ise hiç verilmiyor. Firmalar da Türk Telekom'un hakim durumunu kötüye kullandığı iddiası ile TK'ya başvurdular.

Telekom ve internet sektöründe büyük tepki ile karşılanan uygulamanın Türk Telekom’un şirket içinde yayınlanmış olan 10.11.2004 tarih ve 5385 sayılı genelgesi uyarınca başlatıldığı bilgisi alınıyor.

Alınan bilgiye göre bu genelgenin içeriğinde “Karasal hatlar üzerinden veri iletimi yetkilendirilmesi sadece data hizmetini içerdiğinden ses hariç data amaçlı tüm başvurular, UMTH işletmecileri ile irtibatlandırılmadığı sürece karşılanacaktır.” ifadesi bulunuyor. Bu ise Türk Telekom'un gerek Telekomünikasyon Kurumu tarafından verilen lisansları gerekse 406 sayılı kanun çerçevesinde Türk Telekom'un kalkmış olan tekel durumu uzantısında 1 ocak 2004 tarihinde başlamış olan serbestliği ihlal eden bir yaklaşım olarak bildiriliyor.

Kaynak: http://turk.internet.com/haber/yazigoster.php3?yaziid=11666