Bilgisayarlar Yabancı Dil Öğrenebilecek Mi?

0
vst
İnsan zekasının gizli saklı ve en karmaşık işlem sürecine sahip olduğu bilinen dil öğrenme konusunda gelişmeler var. /.ta yer alan habere göre Amerikalı ve İsrailli bilim adamlarının çalışması şöyle: Bilgisayar İngilizce ve Çince olarak verilen iki metini okuyor ve altında yatan dil bilgisi kurallarını çıkartıyor. Bu kurallar daha sonra anlamlı cümleler kurmak için kullanılabiliyor. Aynı yöntem müziğe ve protein dizilerine özgü yapılarının çıkartılmasında da kullanılabiliyor.

50 dilde yayın yapan bir Fazlamesai.net olsaydı ne iyi olurdu... (Birkaç sene sonra bu yazıyı Almanca okurmuşuz :)

Görüşler

0
FZ
Bu tür haberlere karşı çok dikkatli ve şüpheci olmakta fayda var.

Genellikle Slashdot ve ScienceBlog gibi siteler çalışmanın detayını ve makalenin tamamını görmeden bu tür şeyleri yayınlıyorlar ve sonra yorumlarda alçaktan uçuşa geçiyorlar (popüler bilim haberciliği zor zanaat!).

Kast edilen makale şu: Unsupervised learning of natural languages. Makalenin tam metnine ise ilgili siteden erişemedim, PCI Full Text ve EBSCO veritabanları da bir sonuç döndürmedi (bu konuda yardımcı olabilecek birileri çıkarsa sevinirim).

Eldeki verilere bakıp söz konusu çalışmada kullanılan sistemin neyi "öğrendiğini" söylemek güç. Yorumlarda sanki "çeviri yapıyormuş" gibi yazılmış ama makale özetinde böyle bir şeyden bahsetmiyor. Gramer kurallarını öğreniyor derken kast edilen bu kuralların ne olduğunu belirtiyor mu açık olarak yoksa sadece yeni gramatik cümle üretiminde kullabiliyor şeklinde mi? Semantik yani anlambilimsel açıdan bir şey yapıyor mu? Dilin kurallarını bilmek demek o dilin kurallarına uygun şekilde sorulan soruları cevaplayabilmek de demektir. Böyle bir şey yapabiliyor mu? İki dilin kuralları arasında ilişki kurabiliyor mu (bahsedilen çeviri mevzusu). Maalesef makalenin tamamına şu anda erişemediğim için daha detaylı ve keskin yorum yapamıyorum (ve önemsiz olduğunu da iddia etmiyorum elbette, sadece tam olarak yapılmış olan şeyin ne olduğunu anlama ve yapılmamış şeyler üzerine yapılmışlar gibi hayal kurmayı engelleme çabası, hepsi bu).
0
sefalet
http://scholar.google.com/url?sa=U&q=http://arxiv.org/pdf/cs/0302015

http://scholar.google.com/url?sa=U&q=http://neuron.tau.ac.il/~horn/publications/newcastle.pdf

Özellikle ikinci adres aynı yazarların çalışması ama belirttiğiniz makale değil sanırım.Konuya ilgisi olanların işine yarayabilir.
0
FZ
Adresler için teşekkür ederim. Her iki makale de konuyla ilgili görünüyor, özellikle ikincisini yazan ekip gündemdeki makaleninki ile aynı. Ne var ki, bu ikinci makale geçen senenin makalesi ve pek bir detay yok. Bir önceki yorumda yazdığım görüşlerimi hala koruyorum (daha çok bilgi edinirsem bazı değişiklikler olabilir elbet).
0
vst
Ben ilk makaleye baktım. Semantik bilgiden bahsetmişler. Amaç olarak söz dizimini ve semantik bilgiyi beraber yorumlamak bahsediyor. Ancak makalenin geri kalanında, örneklerde mesela, bu mevzudan bir daha bahsetmemiş. Sanırım haklısınız...
0
sefalet
Şu internette beni kızdıran bir şey varsa o da bilginin gösterilip verilmemesi.Dağa çıkma nedeni olur haberleri yok.

http://www.eurekalert.org/pub_releases/2005-08/cuns-naf083105.php

Hafiften biraz bilgi veriyor.Algoritma, söylendiği gibi verilen metin içindeki söz dizimlerini ve diğer bulduğu dil bilgisi kalıplarını saptayıp yeni cümleler kurabiliyor.Fakat anlam yönünden ele alınmamış daha çok verdiğim adresteki makalede değinildiği gibi çocukların ana dillerini öğrenirken geçirdikleri ilk evreler model alınmış.

Patent alacak kadar özgün bir yöntem olduğu belirtilmiş.Ayrıca bilgisayarların dil öğrenmesi için önemli bir gelişme olduğu söyleniyor.Yani algoritma yöntemi bakımından yeni bir yaklaşım ama daha ortada dil öğrenen bir bilgisayar yok rahat olabiliriz.(öğrenirlerse birde forumlarda robotlar ile tartışmak var, hatta belki silah haline gelir USA yüzbin iyi konuşan google bilgi gücünde robotu Türk forumlarına sokar her tür hizipliği çıkarabilir, tabi bu arada hepsi birbirini tanımamış gibi davranıcak ama tartışmalarda birbirilerini tutacaklar, insan muhakemesi sosyal çevresinin fikirlerinden etkilenir unutmayalım, biri şunu roman yapsa ne güzel olur "Geveze Savaşları" ya da "Hayalet Casuslar" belki de daha şaşalı bir şey koymak gerekir "I.Dünya Ağız Dalaşı" artık daha ne yapayım romancılar oturup yazayım mı )

Benim ya da başkasının özgün makaleyi bulup burada paylaşması dileğiyle.

0
FZ
Maalesef verdiğiniz adreste de ScienceBlog'da yazdığından çok daha fazlası mevcut değil. Evet, haklısınız, üniversitelerin basın duyurularından yola çıkıp "olleyy, bakın neler yapmışlar, hadi şimdi geyik yapın bunun üstüne" demek yaygın bir tarz, yapan açısından işe de yarıyor, haber hit alıyor, millet geyiğin dibine vuruyor, yazılanların %90'ı posa ama olsun sonuçta "rating" var mı var (FM ile kıyaslamak gerekirse, Slashdot'a yazanlar arasında en azından birkaç dilbilimci var, ilaç için). Geyik kolay, anlamak zor.

Burada asıl vurgulanması gereken nokta, algoritmanın sonuçlarının yeni olmadığı, yeni olan, özette de belirtildiği gibi süreç yani yaptığı şeyi yapma yöntemi. Yoksa ne örüntü keşfetmek, ne gramere uygun cümleler kurmak yapılmayan bir iş değil, daha birkaç ay önce bir konferansa gönderilen makalenin tamamen bilgisayar otomatik ürettirildiği haberini geçmiştik burada ama işte o program önceden tasarlanmış kurallara göre çalışıyordu, bu son makalede ele alınan yapı ise (yapı her ne ise, o belli değil) unsupervised yani sen git şunu yap, bunu yap denmiyor (öğrenirken), özel olarak bir şey araması söylenmiyor, önüne konan bir veri yığını içinde "örüntü" ara deniyor (tabii burada bile bir tür önbilgi vardır diye iddia edebiliriz ama bu ayrı bir konu).

Özeti okurken söz konusu çalışmanın dayandığı birtakım örtülü varsayımları da gözden kaçırmamalıyız, misal "dil öğrenme tamamen bir istatistiksel veri işleme problemidir" gibi. Öyle midir? Bebekler gerçekten böyle mi öğreniyor? Bebekler birçok hata yapıyor, aşırı genelleme yapıyor, sonra bazı şeyleri yeniden keşfediyorlar vs. eğer algoritma insanın dil edinimini modellediğini iddia ediyorsa benzer hataları yaptığını gözlemlememiz gerekir. Ayrıca defalarca belirttiğim gibi, şu örüntü şu bağlamda geçiyor, vs. iyi güzel tamam ama o bağlamla ve örüntüyü oluşturan parçalarla ilgili yığınla "anlam" yüklüyoruz. Bu, çok önemli! Bir başka örnek olarak "deyimler", "atasözleri" vs. verilebilir. Ya da algoritmanın cümleler arası ilişkileri keşfedip keşfetmediğine bakılabilir. Ya da basit bir problem gibi görünen ama bazen anadilini konuşan insanları bile afallattan "zamir çözümleme" problemi ile ilgili bir şeyler yapıp yapmadığına bakılabilir.
0
FZ
Hakkında konuşup da kendisini bir türlü göremediğimiz makale Yahoo'daki cogslist'e yollanmış, ben de alıp Files kısmına koydum, şu adresten erişilebilir:

http://groups.yahoo.com/group/cogslist/files/

pnas.pdf

Henüz okuma fırsatım olmadı, en kısa sürede tartışmaya devam etmek ümidiyle...
0
sefalet

Güzel bir haber özellikle o kadar arama taramadan sonra iyi geldi.Fakat üye olmayanlar nasıl indirebilir?
0
FZ
Ah! Çok özür dilerim, e-postalar kamuya açık olunca, "Files" kısmı da açık sandım, yanılmışım.

Bu durumda birkaç seçenek:

1- Bilişsel bilimle ilgileniyorsanız Türk araştırmacıların ve heveslilerin bulunduğu, 2002'de kurulmuş olan cogslist'e üye olur ve böylece "Files" kısmına erişebilirsiniz:

http://groups.yahoo.com/group/cogslist/

2- Bir sebepten ötürü üye olmak istemiyorsanız bana bir e-posta yazarsınız, ben size dosyayı yollamaya çalışırım, adres olarak:

emres at bilgi nokta edu nokta tr
0
FZ
e-posta ile yolladım size, elinize geçmez ise lütfen haber verin.
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Yüzyılın Fizik Deneyi

FZ

Merkezi İsviçre'de bulunan Avrupa Nükleer Araştırma Örgütü (CERN) 36 ülke ve 2 binden fazla fizikçinin katılımıyla tarihin en büyük fizik deneyini gerçekleştirmeye hazırlanıyor. Yerin 100 metre altında gerçekleştirilecek olan zamanın en büyük fizik deneyinde Türkiye de üç ayrı ekiple yer alıyor. Bilim dünyasının 10 yıldan fazla bir süredir hazırlandığı ve yarım milyar İsviçre Frangı'na (580 milyon YTL) mal olan deneyin temel amacı maddeyi oluşturan parçacıkları inceleyerek, evrenin işleyişi hakkında daha fazla bilgiye sahip olmak. Türk bilim insanları Compact Muon Solenoid (CMS) isimli projenin, doğanın şifresini deşifre edeceği yorumunu yapıyor. İnsanlık adına, evrenin oluşumu, işleyişi ve geleceği adına büyük keşifler yapacak olan deneye Türkiye'den Çukurova Üniversitesi, ODTÜ ve Boğaziçi Üniversitesi fizik bölümlerinden öğretim görevlileri ve doktora öğrencileri katılıyor.

Androidlere Bir Adım Daha: Silikon Retina ile Yapay Göz

FZ

Zaghloul ve Boahen'in Journal of Neural Engineering dergisinin Aralık 2006 sayısında yayınlanacak A silicon retina that reproduces signals in the optic nerve [PDF - Tam Metin] makalesine göre doğrudan göze yerleştirilip beynin görsel bilgi işleme korteksine gerekli sinyalleri gönderebilecek bir silikon yonga tasarlanmış durumda.

Gelecek Radyo Dalgalarında mı?

sefalet

GNU Radyo daha önce fazlamesai.net haberlerinde duyurulmuştu. USRP (Universal Software Radio Peripheral) ise GNU Radyo ile çalışarak, radyo yazılımı kurmanızı ve geliştirmenizi sağlıyor.Amaç en az donanımla sizi radyo sinyallerinin heyecan verici dünyasına sokmak. GNU Radyo ile analog radyo sinyalleri sayısal ortama aktarılmakta ve böylece sayısal ortamda radyo dalgalarının işlenmesi daha esnek hale gelmekteydi. USRP yazılımı ve kartları ile USB 2 portu olan her makinada radyo hayatınıza başlamanız mümkün. Tüm USRP tasarımı açık kaynak olarak lisanslanmış durumda.

Bilişsel Bilimler Kılavuzu - III

FZ

Daha önce Ulaş Başar Gezgin'den alıntıladığımız bilişsel bilimler kılavuzunun 3. bölümü karşınızda (1. bölüm ve 2. bölümü de okuyabilirsiniz):

3. Bölüm

Şaşkın Beşer ve 25 Şeker: Düşler, Avukatlar, Çekik Gözlüler, "Ben demiştim zaten"ciler ve Diğerleri

Bu bölüme aşağıdaki sorulara yanıt vererek başlayalım. Kısa sürede yanıt bekleniyor:

1) Türkçe’de birinci harfi 'k' olan sözcüklerin sayısı mı daha fazladır yoksa üçüncü harfi 'k' olan sözcüklerin sayısı mı?

2) 8x7x6x5x4x3x2x1 çarpımının sonucu aşağı-yukarı kaçtır? (Unutmayalım: Hemen yanıt verilmesi bekleniyordu ve burada zeka ölçülmüyor. Rahat olun, çabuk yanıt verin.)

Profesörün Son Dersi

vst

Arkasında hüzün verici bir hikaye, ama o kadar etkileyici ki...

Uzatmadan; Atlatamadığı kanser hastalığının son aşamasına giren Carnegie Mellon Üniversitesi Bilgisayar Bilimleri Bölümü profesörlerinden sanal gerçeklik uzmanı Randy Pausch'un son dersi Çocukluk Rüyalarına Gerçekten Ulaşmak...

Neşeli, çarpıcı, düşündürücü olduğu kadar, uzun bir video olsa da insan "Hiç bitmese!" diyor. Herkesin izlemesi için ne yapsak?

Slashdot haberi: http://slashdot.org/articles/07/09/21/1448229.shtml