Osmanlıca Karakter Seti

0
butch
Pardus geliştiricileri, bir karakter seti olmadığı için bilgisayar ortamında varlığını sürdüremeyen Osmanlıca için harekete geçmiş.

Osmanlıcanın bir karakter setine sahip olacağını duymak güzel, ama en önemli konu Ali Işıngör'ün yazısında bahsettiği gibi bugüne kadar 700 yıllık tarihimize ait belgelerin bilgisayar ortamına aktarılması konusunda bir çözüm bulunmamış olması.

Görüşler

0
bm
Ben tam anlamadim yapilacak olan sey nedir diye. Anladigimdan cikarttigimi yazayim. Surada 94. satirda gozuken " جام ييه بلورم بڭا ضررى طوقونمز" da cikmayan harfler de cikar hale mi gelecek mesela? Yoksa simdi hic yazilamayani yazilabilir hale mi getirecek bu yeni katki? Yani unicode code point denen seyler Osmanlica icin var fakat gosterecek font ve basma/girme teknolojisi mi eksiktir, yoksa Osmanlica'da kullanilan harfler icin unicode code point yok mudur? Yoksa bunlar tamamen yanlis sorular midir? Webde bu konuda pek birsey bulamadim. Karakter seti denince ikincisini anliyorum galiba, ama tam bilemiyorum. Konulara hakim birisi problemi anlatabilir mi?
0
skilic
Konuya çok hakim değilim benim anladığım bu proje yeni bir karakter set yaratmıyor. Dediğiniz gibi unicode sanırım tek bir harf hariç tüm osmanlıca harfleri içeriyor. Fakat problem osmanlıca için yapılmış bir klavye layoutunun bulunmaması. Yani siz osmanlıca yazacaksanız arapça ve farsça klavyeleri aynı anda kullanmak zorunda kalıyorsunuz. Şimdilik yapılacak olan sadece bir osmanlıca klavye layout sanırım.
OCR falan çok sonraki aşamalar bence. Zaten OCR'lada el yazmalarını ve hatları eloktronik ortama taşımak nerdeyse imkansız.
0
FZ
0
robertosmix
Nihayet Pardus, "özgün" birşeyler yapmaya başlıyor. Umarım bu tür şeyleri sık sık görürüm ve beni utandırırlar. Zararın neresinden dönülürse kardır.
0
FZ
Bu konuda vakti zamanında kendisinden birkaç Osmanlı tarihi dersi almış olduğum Dr. Christoph Neumann'ın görüşlerini merak ettim ve beni bilgilendirmesini rica ettim. Şöyle bir yanıt aldım:

Burada galiba iki konuyu karıştırmak kolaydır. Birincisi, bilgisayarda (standart programların anlayabildiği bir biçimde) Osmanlıcayı yazabilmek. Bu, çoktan halledilmiş bir problem, çünkü Osmanlıca istimal edilen bütün karakterler Farsçada ve dolayısıyla Unicode’da mevcuttur. Farsça klavyesine alışmak istemeyenler için çoğu işletim sistemleri için klavye uygulamaları da mevcuttur. Burada sözü edilen “karakter seti” herhalde başka bir şey değildir. İkincisi ise daha çetrefil: Hakikaten Osmanlıca belgeleri arşivlemek isterseniz çok karmaşık (ve maalesef Farsça veya Arapçada yaygın kullanımda olan yazı stillerinden epey farklı) rık’a veya divanî gibi yazılar için OCR programları geliştirmek gerekmektedir. Onlar yoksa ya belge "scan"i istiflemekle kalacaksınız veya hepsini tek tek bilgisayara bir daha istinsah ederek geçireceksiniz (iyi eğlenceler!). Bildiğim kadarıyla böyle bir program yok. Olmayan başka bir şey: Osmanlıcayı okuyup okuduklarını ya modern Türkçe imlaya ya da akademik bir transliterasyona aktarabilen bir program. Anlamlı mı? Elbette! Bilgisayara geçirilen bilgilerin nispeten kısa bir müddetten sonra yok olacağını varsayarsak bile (1830’lardan önce yazılan veya basılan bir cilt kitap, zor tahrip edilebilen, kimyası dengede olan ve teknik değişim dolayısıyla okunamaz hale gelmeyen bir nesnedir; elektronik veriler böyle değil, yüz sene dayanmamaları çok muhtemeldir), ancak, sadece elektronik ortamda var olanların yeniden bilgi üretiminde yaygın bir şekilde kullanılacağı aşikârdır. Google’un kütüphane "scan"leri İngilizce basılan kitaplarıyla mahdut olması, dünyanın Anglosaksonlaşmasında büyük rol oynayacaktır (Avrupa’da diğer dillerde basılanlarını "scan" etmek projeleri çok başarılı olmazsa). Bu bakımdan Osmanlı mirası diye bir şey varsa ve bunun dünya mirasına dahil edilmesi istenirse bu kabil girişimler çok yararlı olabilir. Ancak kolay kolay başarıya ulaşmazlar (bir örnek için http://courses.washington.edu/otap/ adresine bakılabilir).
0
bm
Bu hocanin yazisi benim kafa karisikligimi yapilanin ne olamayacagini aciklayarak bir nebze azaltti. Tesekkur ederim. Yapilanin ne oldugunu hala anlamis degilim ama. Anlayan var mi?
0
roktas
Benim basitçe bu işten anladığım şu, yanıldığım yerler varsa lütfen düzeltin. Bir araştırmacı Osmanlıca metinlerin mevcut Türkçe klavyelerle de girilebilmesine imkan sağlayan bir transliteration veya daha da özelleştirirsek romanization standartı geliştirmiş (TSE tarafından kabul gören[1]) ve bu standarta uygun bilgiişlem ortamının hazırlanması gerekiyor; meselâ bir XKB klavye eşlemi, klavye giriş yöntemi ("input method"), translitere alfabeyle yapılacak sıralamalarda kullanılacak LC_COLLATE'i de içeren bir yerel (locale) tanımı: ot_TR gibi ... Bunun dışında bahsedilenlerin, misâl Osmanlıca metinlerin OCR ile taranarak bu standart uyarınca latin harflerine translitere edilmesi gibi irikıyım projeleri ayırıyorum, bence onlar çok daha kendi başına işler. Eğer durum buysa konuya "Osmanlıca karakter seti desteği" yerine yukarıda saydığım unsurları da toparlayan biraz daha şümullu bir isim vermek daha uygun olabilirdi. Doğru mu anlıyorum?

[1] Bu belgeye şu an erişemiyorum, abonelik işlemini bir türlü yapamadım.

0
FZ


Konu ile ilgili bir gelişme: Pardus'a Osmanlıca Karakter Desteği.

Görüş belirtmek için giriş yapın...

İlgili Yazılar

Gerçekten de yok mu Türk geliştirici?

FZ

Google'ın Summer of Code sonuçlarını açıklamasından sonra enteresan bir tartışma başladı.

En son Bahadır Kandemir'in blog ortamında gördüğüm Çok güldüm çok ve Neden enderunix'e ait seyler hep negatif bir psikoloji ile degerlendiriliyor? girdileri beni Barış Şimşek'in Neden Türk Geliştirici Yok? yazısına yönlendirdi.

Şimşek'in yazısı dikkat çekici, iddialı ve karamsar genellemeler ile dolu. Yazıdan birkaç örnek veriyor ve soruyoruz, Türkiye'deki durum gerçekten böyle mi?

22 Yıllık En Büyük E-Devlet Projesi Çöktü mü?

FZ

Türkiye’nin en büyük e-devlet projesi olan 22 yılın emeği MERNİS (Merkezi Nüfus İşletim Sistemi) adeta çöktü. 130 milyon kaydın yer aldığı ve yaklaşık 30 milyon dolara mal olan sistemde bulunan kayıtların yüzde 25’ten fazlası hata veriyor.

Skandal, Mersin’de meydana gelen sahtekarlık olayı ile ortaya çıktı. Emniyet Genel Müdürlüğü kayıtlarına da giren skandala konu olan ilde nüfus müdürlüğünde görevli bir personelin, hazırladığı nüfus kağıdına rahatlıkla TC Kimlik Numarası girebildiği ve bunu resmileştirebildiği fark edildi.

Siber Çete Çökertildi

FZ

İzmir'de son aylarda yüzlerce kişi banka internet hesaplarının kullanılarak dolandırıldıklarını belirterek savcılıklara suç duyurusunda bulundu. Polisin sürdürdüğü takip internetteki vurgunu ortaya çıkardı. Yaklaşık iki ay telefon dinleme, işlem yapılan bilgisayarların IP numaralarının takibi ve paraların aktarıldığı kişilerin kimliklerinin araştırılmasıyla şebekenin işleyişi ortaya çıkarıldı. Şebeke elemanlarının bağlantı kurduğu kişilerin tek tek belirlenmesinin ardından, önceki gün 'Papağan' adı verilen operasyon için düğmeye basıldı.

Bilimsel Toplantıların Duyuru Siteleri: Erişilebilirlik Üstüne

FZ

İki farklı bilimsel toplantı. İki farklı duyuru web sitesi.

Bu sitelerin amacı nedir, bağlanan kişiye en kestirme yoldan o bilimsel toplantı ile ilgili detayları sunmaktır öyle değil mi, yani toplantı yeri, tarihi, katılım şartları, vs.

Amaç bilgi vermekse bunun için standartların kullanılması, web sitesinin olabildiğince hedefe yönelik, kolay erişilebilir ve her türlü platformdan ulaşılabilir olması gerekmez mi? Böyle bir iş için grafik etkilerin yoğun olduğu, tamamen FLASH tabanlı bir siteyi mi tercih edersiniz yoksa w3c standartlarına uygun metin tabanlı web tarayıcılarla dahi görüntülenebilecek bir siteyi mi? Tüm içeriği, tüm bilgileri bol grafik efektli bir FLASH dosyasının içine gömerek mi sunmayı tercih edersiniz yoksa metin tabanlı HTML ya da XHTML olarak sunmayı mı? Amaca uygun iş yapmayı mı yoksa sırf teknoloji olsun diye teknoloji kullanmayı mı?

Yorumu size bırakıyorum, buyrun kıyaslayın (kendiniz de benzer örnekler bulabilirsiniz):

1- http://www.dilkongre2004.anadolu.edu.tr/

2- http://cs.bilgi.edu.tr/pages/turing_days/

Not: İkinci web sitesi ile ilgili tek eleştiri Türkçe halinin olmaması olabilir ki söz konusu etkinlik İngilizce gerçekleştirileceği için belki bu mazur görülebilir (yine de Türkçesinin olması kötü olmazdı).

Köylülerin internet çilesi!

anonim

internethaber.com'dan: Tarım ve Köyişleri Bakanlığı`nın çiftçiyi desteklemek için dönüm başına verdiği parayı almak isteyen köylüler, formlarda istenen kimlik numaralarını öğrenebilmek için internet cafelerin önünde uzun kuyruklar oluşturdu.
Tarım ve Köyişleri Bakanlığı`nın Çiftçilere Doğrudan Gelir Desteği projesi kapsamında arazilerinin dekar başına ödediği 10 milyon lirayı almak isteyen Bolulu çiftçiler, doldurdukları formlarda Türkiye Cumhuriyeti kimlik numarasını öğrenmek için sabahın erken saatlerinden itibaren internet cafelere hücum etti. İnternet cafelerin geç açıldığını öğrenen köylüler, `Ama bütün işyerleri açılırken internet cafelerin geç açılmasına anlam veremiyoruz. İşimizi son güne bıraktığımız için sıkıntı yaşıyoruz. Kimlik numarası almak için çektiğimiz çileye bakın` dediler.