Bilgisayarlar Yabancı Dil Öğrenebilecek Mi?

0
vst
İnsan zekasının gizli saklı ve en karmaşık işlem sürecine sahip olduğu bilinen dil öğrenme konusunda gelişmeler var. /.ta yer alan habere göre Amerikalı ve İsrailli bilim adamlarının çalışması şöyle: Bilgisayar İngilizce ve Çince olarak verilen iki metini okuyor ve altında yatan dil bilgisi kurallarını çıkartıyor. Bu kurallar daha sonra anlamlı cümleler kurmak için kullanılabiliyor. Aynı yöntem müziğe ve protein dizilerine özgü yapılarının çıkartılmasında da kullanılabiliyor.

50 dilde yayın yapan bir Fazlamesai.net olsaydı ne iyi olurdu... (Birkaç sene sonra bu yazıyı Almanca okurmuşuz :)

Görüşler

0
FZ
Bu tür haberlere karşı çok dikkatli ve şüpheci olmakta fayda var.

Genellikle Slashdot ve ScienceBlog gibi siteler çalışmanın detayını ve makalenin tamamını görmeden bu tür şeyleri yayınlıyorlar ve sonra yorumlarda alçaktan uçuşa geçiyorlar (popüler bilim haberciliği zor zanaat!).

Kast edilen makale şu: Unsupervised learning of natural languages. Makalenin tam metnine ise ilgili siteden erişemedim, PCI Full Text ve EBSCO veritabanları da bir sonuç döndürmedi (bu konuda yardımcı olabilecek birileri çıkarsa sevinirim).

Eldeki verilere bakıp söz konusu çalışmada kullanılan sistemin neyi "öğrendiğini" söylemek güç. Yorumlarda sanki "çeviri yapıyormuş" gibi yazılmış ama makale özetinde böyle bir şeyden bahsetmiyor. Gramer kurallarını öğreniyor derken kast edilen bu kuralların ne olduğunu belirtiyor mu açık olarak yoksa sadece yeni gramatik cümle üretiminde kullabiliyor şeklinde mi? Semantik yani anlambilimsel açıdan bir şey yapıyor mu? Dilin kurallarını bilmek demek o dilin kurallarına uygun şekilde sorulan soruları cevaplayabilmek de demektir. Böyle bir şey yapabiliyor mu? İki dilin kuralları arasında ilişki kurabiliyor mu (bahsedilen çeviri mevzusu). Maalesef makalenin tamamına şu anda erişemediğim için daha detaylı ve keskin yorum yapamıyorum (ve önemsiz olduğunu da iddia etmiyorum elbette, sadece tam olarak yapılmış olan şeyin ne olduğunu anlama ve yapılmamış şeyler üzerine yapılmışlar gibi hayal kurmayı engelleme çabası, hepsi bu).
0
sefalet
http://scholar.google.com/url?sa=U&q=http://arxiv.org/pdf/cs/0302015

http://scholar.google.com/url?sa=U&q=http://neuron.tau.ac.il/~horn/publications/newcastle.pdf

Özellikle ikinci adres aynı yazarların çalışması ama belirttiğiniz makale değil sanırım.Konuya ilgisi olanların işine yarayabilir.
0
FZ
Adresler için teşekkür ederim. Her iki makale de konuyla ilgili görünüyor, özellikle ikincisini yazan ekip gündemdeki makaleninki ile aynı. Ne var ki, bu ikinci makale geçen senenin makalesi ve pek bir detay yok. Bir önceki yorumda yazdığım görüşlerimi hala koruyorum (daha çok bilgi edinirsem bazı değişiklikler olabilir elbet).
0
vst
Ben ilk makaleye baktım. Semantik bilgiden bahsetmişler. Amaç olarak söz dizimini ve semantik bilgiyi beraber yorumlamak bahsediyor. Ancak makalenin geri kalanında, örneklerde mesela, bu mevzudan bir daha bahsetmemiş. Sanırım haklısınız...
0
sefalet
Şu internette beni kızdıran bir şey varsa o da bilginin gösterilip verilmemesi.Dağa çıkma nedeni olur haberleri yok.

http://www.eurekalert.org/pub_releases/2005-08/cuns-naf083105.php

Hafiften biraz bilgi veriyor.Algoritma, söylendiği gibi verilen metin içindeki söz dizimlerini ve diğer bulduğu dil bilgisi kalıplarını saptayıp yeni cümleler kurabiliyor.Fakat anlam yönünden ele alınmamış daha çok verdiğim adresteki makalede değinildiği gibi çocukların ana dillerini öğrenirken geçirdikleri ilk evreler model alınmış.

Patent alacak kadar özgün bir yöntem olduğu belirtilmiş.Ayrıca bilgisayarların dil öğrenmesi için önemli bir gelişme olduğu söyleniyor.Yani algoritma yöntemi bakımından yeni bir yaklaşım ama daha ortada dil öğrenen bir bilgisayar yok rahat olabiliriz.(öğrenirlerse birde forumlarda robotlar ile tartışmak var, hatta belki silah haline gelir USA yüzbin iyi konuşan google bilgi gücünde robotu Türk forumlarına sokar her tür hizipliği çıkarabilir, tabi bu arada hepsi birbirini tanımamış gibi davranıcak ama tartışmalarda birbirilerini tutacaklar, insan muhakemesi sosyal çevresinin fikirlerinden etkilenir unutmayalım, biri şunu roman yapsa ne güzel olur "Geveze Savaşları" ya da "Hayalet Casuslar" belki de daha şaşalı bir şey koymak gerekir "I.Dünya Ağız Dalaşı" artık daha ne yapayım romancılar oturup yazayım mı )

Benim ya da başkasının özgün makaleyi bulup burada paylaşması dileğiyle.

0
FZ
Maalesef verdiğiniz adreste de ScienceBlog'da yazdığından çok daha fazlası mevcut değil. Evet, haklısınız, üniversitelerin basın duyurularından yola çıkıp "olleyy, bakın neler yapmışlar, hadi şimdi geyik yapın bunun üstüne" demek yaygın bir tarz, yapan açısından işe de yarıyor, haber hit alıyor, millet geyiğin dibine vuruyor, yazılanların %90'ı posa ama olsun sonuçta "rating" var mı var (FM ile kıyaslamak gerekirse, Slashdot'a yazanlar arasında en azından birkaç dilbilimci var, ilaç için). Geyik kolay, anlamak zor.

Burada asıl vurgulanması gereken nokta, algoritmanın sonuçlarının yeni olmadığı, yeni olan, özette de belirtildiği gibi süreç yani yaptığı şeyi yapma yöntemi. Yoksa ne örüntü keşfetmek, ne gramere uygun cümleler kurmak yapılmayan bir iş değil, daha birkaç ay önce bir konferansa gönderilen makalenin tamamen bilgisayar otomatik ürettirildiği haberini geçmiştik burada ama işte o program önceden tasarlanmış kurallara göre çalışıyordu, bu son makalede ele alınan yapı ise (yapı her ne ise, o belli değil) unsupervised yani sen git şunu yap, bunu yap denmiyor (öğrenirken), özel olarak bir şey araması söylenmiyor, önüne konan bir veri yığını içinde "örüntü" ara deniyor (tabii burada bile bir tür önbilgi vardır diye iddia edebiliriz ama bu ayrı bir konu).

Özeti okurken söz konusu çalışmanın dayandığı birtakım örtülü varsayımları da gözden kaçırmamalıyız, misal "dil öğrenme tamamen bir istatistiksel veri işleme problemidir" gibi. Öyle midir? Bebekler gerçekten böyle mi öğreniyor? Bebekler birçok hata yapıyor, aşırı genelleme yapıyor, sonra bazı şeyleri yeniden keşfediyorlar vs. eğer algoritma insanın dil edinimini modellediğini iddia ediyorsa benzer hataları yaptığını gözlemlememiz gerekir. Ayrıca defalarca belirttiğim gibi, şu örüntü şu bağlamda geçiyor, vs. iyi güzel tamam ama o bağlamla ve örüntüyü oluşturan parçalarla ilgili yığınla "anlam" yüklüyoruz. Bu, çok önemli! Bir başka örnek olarak "deyimler", "atasözleri" vs. verilebilir. Ya da algoritmanın cümleler arası ilişkileri keşfedip keşfetmediğine bakılabilir. Ya da basit bir problem gibi görünen ama bazen anadilini konuşan insanları bile afallattan "zamir çözümleme" problemi ile ilgili bir şeyler yapıp yapmadığına bakılabilir.
0
FZ
Hakkında konuşup da kendisini bir türlü göremediğimiz makale Yahoo'daki cogslist'e yollanmış, ben de alıp Files kısmına koydum, şu adresten erişilebilir:

http://groups.yahoo.com/group/cogslist/files/

pnas.pdf

Henüz okuma fırsatım olmadı, en kısa sürede tartışmaya devam etmek ümidiyle...
0
sefalet

Güzel bir haber özellikle o kadar arama taramadan sonra iyi geldi.Fakat üye olmayanlar nasıl indirebilir?
0
FZ
Ah! Çok özür dilerim, e-postalar kamuya açık olunca, "Files" kısmı da açık sandım, yanılmışım.

Bu durumda birkaç seçenek:

1- Bilişsel bilimle ilgileniyorsanız Türk araştırmacıların ve heveslilerin bulunduğu, 2002'de kurulmuş olan cogslist'e üye olur ve böylece "Files" kısmına erişebilirsiniz:

http://groups.yahoo.com/group/cogslist/

2- Bir sebepten ötürü üye olmak istemiyorsanız bana bir e-posta yazarsınız, ben size dosyayı yollamaya çalışırım, adres olarak:

emres at bilgi nokta edu nokta tr
0
FZ
e-posta ile yolladım size, elinize geçmez ise lütfen haber verin.
Görüş belirtmek için giriş yapın...

İlgili Yazılar

İTÜ Vakfı Bilim Ödülü 2007

anonim

İTÜ Vakfı'nın 1995'ten beri her yıl verdiği bilim ödülü başvuruları başladı. 2007 yılı ödülü Temel Bilimler ve Mühendislik Bilimleri alanında seçilecek bir yapıta verilecek. Son başvuru tarihi 15 Şubat 2008. Ayrıntılı bilgi: http://www.ituvakif.org.tr

Ödülün değeri 10.000 YTL olup yalnızca bir kişiye verilmektedir. Ödülün duyurusunun yapıldığı afişe ise buradan ulaşabilirsiniz.

Profesörün Son Dersi

vst

Arkasında hüzün verici bir hikaye, ama o kadar etkileyici ki...

Uzatmadan; Atlatamadığı kanser hastalığının son aşamasına giren Carnegie Mellon Üniversitesi Bilgisayar Bilimleri Bölümü profesörlerinden sanal gerçeklik uzmanı Randy Pausch'un son dersi Çocukluk Rüyalarına Gerçekten Ulaşmak...

Neşeli, çarpıcı, düşündürücü olduğu kadar, uzun bir video olsa da insan "Hiç bitmese!" diyor. Herkesin izlemesi için ne yapsak?

Slashdot haberi: http://slashdot.org/articles/07/09/21/1448229.shtml

XEROX'tan Tekrar Tekrar Yazılabilen Kağıt

yellowelephant

Xerox, kağıt üzerine basılı görüntü ve bilgilerin 16-24 saat içinde kaybolmasına ve aynı kağıdın tekrar tekrar kullanılmasına imkan veren bir teknoloji keşfettiğini ve patent başvurusunda bulunduğunu duyurdu.

Bilim ve Teknik'in 39 yılı bir DVD'de

larweda

Bildirgeç'teki bir habere göre, bilim ve teknik dergisi, 39. yılı şerefine, Ekim 1967 ila Aralık 2005 tarihleri arasında yayınladığı 457 sayının tamamını kapsayan dvd'yi, haziran 2006 sayısı ile ücretsiz olarak okurlarına hediye edecekmiş. Sitede bir de bunu anlatan insert'in fotoğrafının link'i var. Gerçekten kaçırılmaması lazım.

Sözcükleri Koklamak ya da Kokulara İsim Vermek...

FZ

Güle gül demesek yine de güzel kokmaz mıydı o çiçek? *

İngiliz nörologların son çalışmalarından birine göre bir kokunun isimlendirilmesi onun algılanışını etkiliyor.

Örneğin deneklere aynı koku önce "kaşar peyniri" olarak etiketlenip sonra "vücut kokusu" olarak etkiletlenip sunulunca, "kaşar peyniri" olarak sunulan kokunun "vücut kokusu" olarak sunulana kıyasla daha iyi koktuğunu söylemişler.

Oxford Üniversitesi'nde gerçekleştirilen araştırmaya göre kokunun ismi belli bir beyin bölgesini harekete geçirebiliyor. fMRI (functionaol Magnetic Resonance Imaging) yöntemi ile görüntülenen beyinlere bakıldığında ilginç şeyler göze çarpmış.