Bilgisayarlar Yabancı Dil Öğrenebilecek Mi?

0
vst
İnsan zekasının gizli saklı ve en karmaşık işlem sürecine sahip olduğu bilinen dil öğrenme konusunda gelişmeler var. /.ta yer alan habere göre Amerikalı ve İsrailli bilim adamlarının çalışması şöyle: Bilgisayar İngilizce ve Çince olarak verilen iki metini okuyor ve altında yatan dil bilgisi kurallarını çıkartıyor. Bu kurallar daha sonra anlamlı cümleler kurmak için kullanılabiliyor. Aynı yöntem müziğe ve protein dizilerine özgü yapılarının çıkartılmasında da kullanılabiliyor.

50 dilde yayın yapan bir Fazlamesai.net olsaydı ne iyi olurdu... (Birkaç sene sonra bu yazıyı Almanca okurmuşuz :)

Görüşler

0
FZ
Bu tür haberlere karşı çok dikkatli ve şüpheci olmakta fayda var.

Genellikle Slashdot ve ScienceBlog gibi siteler çalışmanın detayını ve makalenin tamamını görmeden bu tür şeyleri yayınlıyorlar ve sonra yorumlarda alçaktan uçuşa geçiyorlar (popüler bilim haberciliği zor zanaat!).

Kast edilen makale şu: Unsupervised learning of natural languages. Makalenin tam metnine ise ilgili siteden erişemedim, PCI Full Text ve EBSCO veritabanları da bir sonuç döndürmedi (bu konuda yardımcı olabilecek birileri çıkarsa sevinirim).

Eldeki verilere bakıp söz konusu çalışmada kullanılan sistemin neyi "öğrendiğini" söylemek güç. Yorumlarda sanki "çeviri yapıyormuş" gibi yazılmış ama makale özetinde böyle bir şeyden bahsetmiyor. Gramer kurallarını öğreniyor derken kast edilen bu kuralların ne olduğunu belirtiyor mu açık olarak yoksa sadece yeni gramatik cümle üretiminde kullabiliyor şeklinde mi? Semantik yani anlambilimsel açıdan bir şey yapıyor mu? Dilin kurallarını bilmek demek o dilin kurallarına uygun şekilde sorulan soruları cevaplayabilmek de demektir. Böyle bir şey yapabiliyor mu? İki dilin kuralları arasında ilişki kurabiliyor mu (bahsedilen çeviri mevzusu). Maalesef makalenin tamamına şu anda erişemediğim için daha detaylı ve keskin yorum yapamıyorum (ve önemsiz olduğunu da iddia etmiyorum elbette, sadece tam olarak yapılmış olan şeyin ne olduğunu anlama ve yapılmamış şeyler üzerine yapılmışlar gibi hayal kurmayı engelleme çabası, hepsi bu).
0
sefalet
http://scholar.google.com/url?sa=U&q=http://arxiv.org/pdf/cs/0302015

http://scholar.google.com/url?sa=U&q=http://neuron.tau.ac.il/~horn/publications/newcastle.pdf

Özellikle ikinci adres aynı yazarların çalışması ama belirttiğiniz makale değil sanırım.Konuya ilgisi olanların işine yarayabilir.
0
FZ
Adresler için teşekkür ederim. Her iki makale de konuyla ilgili görünüyor, özellikle ikincisini yazan ekip gündemdeki makaleninki ile aynı. Ne var ki, bu ikinci makale geçen senenin makalesi ve pek bir detay yok. Bir önceki yorumda yazdığım görüşlerimi hala koruyorum (daha çok bilgi edinirsem bazı değişiklikler olabilir elbet).
0
vst
Ben ilk makaleye baktım. Semantik bilgiden bahsetmişler. Amaç olarak söz dizimini ve semantik bilgiyi beraber yorumlamak bahsediyor. Ancak makalenin geri kalanında, örneklerde mesela, bu mevzudan bir daha bahsetmemiş. Sanırım haklısınız...
0
sefalet
Şu internette beni kızdıran bir şey varsa o da bilginin gösterilip verilmemesi.Dağa çıkma nedeni olur haberleri yok.

http://www.eurekalert.org/pub_releases/2005-08/cuns-naf083105.php

Hafiften biraz bilgi veriyor.Algoritma, söylendiği gibi verilen metin içindeki söz dizimlerini ve diğer bulduğu dil bilgisi kalıplarını saptayıp yeni cümleler kurabiliyor.Fakat anlam yönünden ele alınmamış daha çok verdiğim adresteki makalede değinildiği gibi çocukların ana dillerini öğrenirken geçirdikleri ilk evreler model alınmış.

Patent alacak kadar özgün bir yöntem olduğu belirtilmiş.Ayrıca bilgisayarların dil öğrenmesi için önemli bir gelişme olduğu söyleniyor.Yani algoritma yöntemi bakımından yeni bir yaklaşım ama daha ortada dil öğrenen bir bilgisayar yok rahat olabiliriz.(öğrenirlerse birde forumlarda robotlar ile tartışmak var, hatta belki silah haline gelir USA yüzbin iyi konuşan google bilgi gücünde robotu Türk forumlarına sokar her tür hizipliği çıkarabilir, tabi bu arada hepsi birbirini tanımamış gibi davranıcak ama tartışmalarda birbirilerini tutacaklar, insan muhakemesi sosyal çevresinin fikirlerinden etkilenir unutmayalım, biri şunu roman yapsa ne güzel olur "Geveze Savaşları" ya da "Hayalet Casuslar" belki de daha şaşalı bir şey koymak gerekir "I.Dünya Ağız Dalaşı" artık daha ne yapayım romancılar oturup yazayım mı )

Benim ya da başkasının özgün makaleyi bulup burada paylaşması dileğiyle.

0
FZ
Maalesef verdiğiniz adreste de ScienceBlog'da yazdığından çok daha fazlası mevcut değil. Evet, haklısınız, üniversitelerin basın duyurularından yola çıkıp "olleyy, bakın neler yapmışlar, hadi şimdi geyik yapın bunun üstüne" demek yaygın bir tarz, yapan açısından işe de yarıyor, haber hit alıyor, millet geyiğin dibine vuruyor, yazılanların %90'ı posa ama olsun sonuçta "rating" var mı var (FM ile kıyaslamak gerekirse, Slashdot'a yazanlar arasında en azından birkaç dilbilimci var, ilaç için). Geyik kolay, anlamak zor.

Burada asıl vurgulanması gereken nokta, algoritmanın sonuçlarının yeni olmadığı, yeni olan, özette de belirtildiği gibi süreç yani yaptığı şeyi yapma yöntemi. Yoksa ne örüntü keşfetmek, ne gramere uygun cümleler kurmak yapılmayan bir iş değil, daha birkaç ay önce bir konferansa gönderilen makalenin tamamen bilgisayar otomatik ürettirildiği haberini geçmiştik burada ama işte o program önceden tasarlanmış kurallara göre çalışıyordu, bu son makalede ele alınan yapı ise (yapı her ne ise, o belli değil) unsupervised yani sen git şunu yap, bunu yap denmiyor (öğrenirken), özel olarak bir şey araması söylenmiyor, önüne konan bir veri yığını içinde "örüntü" ara deniyor (tabii burada bile bir tür önbilgi vardır diye iddia edebiliriz ama bu ayrı bir konu).

Özeti okurken söz konusu çalışmanın dayandığı birtakım örtülü varsayımları da gözden kaçırmamalıyız, misal "dil öğrenme tamamen bir istatistiksel veri işleme problemidir" gibi. Öyle midir? Bebekler gerçekten böyle mi öğreniyor? Bebekler birçok hata yapıyor, aşırı genelleme yapıyor, sonra bazı şeyleri yeniden keşfediyorlar vs. eğer algoritma insanın dil edinimini modellediğini iddia ediyorsa benzer hataları yaptığını gözlemlememiz gerekir. Ayrıca defalarca belirttiğim gibi, şu örüntü şu bağlamda geçiyor, vs. iyi güzel tamam ama o bağlamla ve örüntüyü oluşturan parçalarla ilgili yığınla "anlam" yüklüyoruz. Bu, çok önemli! Bir başka örnek olarak "deyimler", "atasözleri" vs. verilebilir. Ya da algoritmanın cümleler arası ilişkileri keşfedip keşfetmediğine bakılabilir. Ya da basit bir problem gibi görünen ama bazen anadilini konuşan insanları bile afallattan "zamir çözümleme" problemi ile ilgili bir şeyler yapıp yapmadığına bakılabilir.
0
FZ
Hakkında konuşup da kendisini bir türlü göremediğimiz makale Yahoo'daki cogslist'e yollanmış, ben de alıp Files kısmına koydum, şu adresten erişilebilir:

http://groups.yahoo.com/group/cogslist/files/

pnas.pdf

Henüz okuma fırsatım olmadı, en kısa sürede tartışmaya devam etmek ümidiyle...
0
sefalet

Güzel bir haber özellikle o kadar arama taramadan sonra iyi geldi.Fakat üye olmayanlar nasıl indirebilir?
0
FZ
Ah! Çok özür dilerim, e-postalar kamuya açık olunca, "Files" kısmı da açık sandım, yanılmışım.

Bu durumda birkaç seçenek:

1- Bilişsel bilimle ilgileniyorsanız Türk araştırmacıların ve heveslilerin bulunduğu, 2002'de kurulmuş olan cogslist'e üye olur ve böylece "Files" kısmına erişebilirsiniz:

http://groups.yahoo.com/group/cogslist/

2- Bir sebepten ötürü üye olmak istemiyorsanız bana bir e-posta yazarsınız, ben size dosyayı yollamaya çalışırım, adres olarak:

emres at bilgi nokta edu nokta tr
0
FZ
e-posta ile yolladım size, elinize geçmez ise lütfen haber verin.
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Yeryüzünün en 'kara' siyahı üretildi

ersin2k

Amerikalı biliminsanları Salı günü dünyanın en kara maddesini geliştirdiklerini açıkladılar. Işığın % 99.9 unu emen bu materyal Amerikan Ulusal Standartlar ve Teknoloji Enstitüsü testlerinde kullanılan örnekten neredeyse 30 kat daha kara.

3-Boyutlu Güneş!

RoR

NASA'nın STEREO uydusunun dün gönderdiği 3-boyutlu güneş görüntülerini, özel gözlük kullanarak izleyebilirsiniz...

3-Boyutlu gözlük

http://inosci.blogspot.com/

Türkiye'den Avrupa'ya Lazer Teknolojisi

FZ

Türkiyeli bilim adamlarının geliştirdiği nanoteknoloji ürünü hassas fiber lazer, Avrupa’nın en yüksek bütçeli projelerinden birisi olan "X Işını Kaynağı Projesi"nde kullanılacak.

Bilginin Eskisi Makbul

anonim

ABD'de çalışan Türk Prof. Olgaç, eski bilgiyle daha doğru karar alınacağını matematiksel olarak kanıtladı. Buluş pek çok alanda bir devrim niteliğinde.
ABD'nin Connecticut Üniversitesi Makine Mühendisliği Bölümü öğretim üyelerinden Prof. Dr. Nejat Olgaç'ın, doktora öğrencisi Rıfat Sipahi'yle çalışmaları sonucu yaptığı 'Gecikmeli sistemlerin stabilizasyonu' adlı buluşun, başta bilgisayar olmak üzere, savunma ve üretim makineleri teknolojilerinde büyük yeniliklere yol açacağı ortaya çıktı.
Yüksek hızlı veri şebekesinin internetin ruhunu teşkil ettiğine değinen Olgaç, "Buluşun bu alana aktarılmasına çalışıyoruz. İnternet teknolojisine aktarılırsa, veri akış hızı bugünküyle ölçülemeyecek kadar hızlanacak" dedi.
Ayrıntılı bilgi Radikal gazetesinde.

Farenin Beyni İnsanın Şifası Olacak

FZ

Radikal'deki habere göre, fare beyninin gen haritası tamamlandı.

ABD'deki Allen Beyin Enstitüsü uzmanlarının tam olarak çıkardığı 'genom', milyonlarca insanın mustarip olduğu nörolojik hastalıkların esrar perdesinin kaldırılmasını sağlayabilecek.

Microsoft'un kurucularından Paul Allen'ın sahibi olduğu enstitü tarafından yapılan açıklamaya göre, fare beyninin üç boyutlu haritasında 21 binden fazla gen ayrıntılı olarak gösteriliyor. Harita, bilim adamlarına hiç bilmedikleri ayrıntılar sunuyor.