Bilgisayarlar Yabancı Dil Öğrenebilecek Mi?

0
vst
İnsan zekasının gizli saklı ve en karmaşık işlem sürecine sahip olduğu bilinen dil öğrenme konusunda gelişmeler var. /.ta yer alan habere göre Amerikalı ve İsrailli bilim adamlarının çalışması şöyle: Bilgisayar İngilizce ve Çince olarak verilen iki metini okuyor ve altında yatan dil bilgisi kurallarını çıkartıyor. Bu kurallar daha sonra anlamlı cümleler kurmak için kullanılabiliyor. Aynı yöntem müziğe ve protein dizilerine özgü yapılarının çıkartılmasında da kullanılabiliyor.

50 dilde yayın yapan bir Fazlamesai.net olsaydı ne iyi olurdu... (Birkaç sene sonra bu yazıyı Almanca okurmuşuz :)

Görüşler

0
FZ
Bu tür haberlere karşı çok dikkatli ve şüpheci olmakta fayda var.

Genellikle Slashdot ve ScienceBlog gibi siteler çalışmanın detayını ve makalenin tamamını görmeden bu tür şeyleri yayınlıyorlar ve sonra yorumlarda alçaktan uçuşa geçiyorlar (popüler bilim haberciliği zor zanaat!).

Kast edilen makale şu: Unsupervised learning of natural languages. Makalenin tam metnine ise ilgili siteden erişemedim, PCI Full Text ve EBSCO veritabanları da bir sonuç döndürmedi (bu konuda yardımcı olabilecek birileri çıkarsa sevinirim).

Eldeki verilere bakıp söz konusu çalışmada kullanılan sistemin neyi "öğrendiğini" söylemek güç. Yorumlarda sanki "çeviri yapıyormuş" gibi yazılmış ama makale özetinde böyle bir şeyden bahsetmiyor. Gramer kurallarını öğreniyor derken kast edilen bu kuralların ne olduğunu belirtiyor mu açık olarak yoksa sadece yeni gramatik cümle üretiminde kullabiliyor şeklinde mi? Semantik yani anlambilimsel açıdan bir şey yapıyor mu? Dilin kurallarını bilmek demek o dilin kurallarına uygun şekilde sorulan soruları cevaplayabilmek de demektir. Böyle bir şey yapabiliyor mu? İki dilin kuralları arasında ilişki kurabiliyor mu (bahsedilen çeviri mevzusu). Maalesef makalenin tamamına şu anda erişemediğim için daha detaylı ve keskin yorum yapamıyorum (ve önemsiz olduğunu da iddia etmiyorum elbette, sadece tam olarak yapılmış olan şeyin ne olduğunu anlama ve yapılmamış şeyler üzerine yapılmışlar gibi hayal kurmayı engelleme çabası, hepsi bu).
0
sefalet
http://scholar.google.com/url?sa=U&q=http://arxiv.org/pdf/cs/0302015

http://scholar.google.com/url?sa=U&q=http://neuron.tau.ac.il/~horn/publications/newcastle.pdf

Özellikle ikinci adres aynı yazarların çalışması ama belirttiğiniz makale değil sanırım.Konuya ilgisi olanların işine yarayabilir.
0
FZ
Adresler için teşekkür ederim. Her iki makale de konuyla ilgili görünüyor, özellikle ikincisini yazan ekip gündemdeki makaleninki ile aynı. Ne var ki, bu ikinci makale geçen senenin makalesi ve pek bir detay yok. Bir önceki yorumda yazdığım görüşlerimi hala koruyorum (daha çok bilgi edinirsem bazı değişiklikler olabilir elbet).
0
vst
Ben ilk makaleye baktım. Semantik bilgiden bahsetmişler. Amaç olarak söz dizimini ve semantik bilgiyi beraber yorumlamak bahsediyor. Ancak makalenin geri kalanında, örneklerde mesela, bu mevzudan bir daha bahsetmemiş. Sanırım haklısınız...
0
sefalet
Şu internette beni kızdıran bir şey varsa o da bilginin gösterilip verilmemesi.Dağa çıkma nedeni olur haberleri yok.

http://www.eurekalert.org/pub_releases/2005-08/cuns-naf083105.php

Hafiften biraz bilgi veriyor.Algoritma, söylendiği gibi verilen metin içindeki söz dizimlerini ve diğer bulduğu dil bilgisi kalıplarını saptayıp yeni cümleler kurabiliyor.Fakat anlam yönünden ele alınmamış daha çok verdiğim adresteki makalede değinildiği gibi çocukların ana dillerini öğrenirken geçirdikleri ilk evreler model alınmış.

Patent alacak kadar özgün bir yöntem olduğu belirtilmiş.Ayrıca bilgisayarların dil öğrenmesi için önemli bir gelişme olduğu söyleniyor.Yani algoritma yöntemi bakımından yeni bir yaklaşım ama daha ortada dil öğrenen bir bilgisayar yok rahat olabiliriz.(öğrenirlerse birde forumlarda robotlar ile tartışmak var, hatta belki silah haline gelir USA yüzbin iyi konuşan google bilgi gücünde robotu Türk forumlarına sokar her tür hizipliği çıkarabilir, tabi bu arada hepsi birbirini tanımamış gibi davranıcak ama tartışmalarda birbirilerini tutacaklar, insan muhakemesi sosyal çevresinin fikirlerinden etkilenir unutmayalım, biri şunu roman yapsa ne güzel olur "Geveze Savaşları" ya da "Hayalet Casuslar" belki de daha şaşalı bir şey koymak gerekir "I.Dünya Ağız Dalaşı" artık daha ne yapayım romancılar oturup yazayım mı )

Benim ya da başkasının özgün makaleyi bulup burada paylaşması dileğiyle.

0
FZ
Maalesef verdiğiniz adreste de ScienceBlog'da yazdığından çok daha fazlası mevcut değil. Evet, haklısınız, üniversitelerin basın duyurularından yola çıkıp "olleyy, bakın neler yapmışlar, hadi şimdi geyik yapın bunun üstüne" demek yaygın bir tarz, yapan açısından işe de yarıyor, haber hit alıyor, millet geyiğin dibine vuruyor, yazılanların %90'ı posa ama olsun sonuçta "rating" var mı var (FM ile kıyaslamak gerekirse, Slashdot'a yazanlar arasında en azından birkaç dilbilimci var, ilaç için). Geyik kolay, anlamak zor.

Burada asıl vurgulanması gereken nokta, algoritmanın sonuçlarının yeni olmadığı, yeni olan, özette de belirtildiği gibi süreç yani yaptığı şeyi yapma yöntemi. Yoksa ne örüntü keşfetmek, ne gramere uygun cümleler kurmak yapılmayan bir iş değil, daha birkaç ay önce bir konferansa gönderilen makalenin tamamen bilgisayar otomatik ürettirildiği haberini geçmiştik burada ama işte o program önceden tasarlanmış kurallara göre çalışıyordu, bu son makalede ele alınan yapı ise (yapı her ne ise, o belli değil) unsupervised yani sen git şunu yap, bunu yap denmiyor (öğrenirken), özel olarak bir şey araması söylenmiyor, önüne konan bir veri yığını içinde "örüntü" ara deniyor (tabii burada bile bir tür önbilgi vardır diye iddia edebiliriz ama bu ayrı bir konu).

Özeti okurken söz konusu çalışmanın dayandığı birtakım örtülü varsayımları da gözden kaçırmamalıyız, misal "dil öğrenme tamamen bir istatistiksel veri işleme problemidir" gibi. Öyle midir? Bebekler gerçekten böyle mi öğreniyor? Bebekler birçok hata yapıyor, aşırı genelleme yapıyor, sonra bazı şeyleri yeniden keşfediyorlar vs. eğer algoritma insanın dil edinimini modellediğini iddia ediyorsa benzer hataları yaptığını gözlemlememiz gerekir. Ayrıca defalarca belirttiğim gibi, şu örüntü şu bağlamda geçiyor, vs. iyi güzel tamam ama o bağlamla ve örüntüyü oluşturan parçalarla ilgili yığınla "anlam" yüklüyoruz. Bu, çok önemli! Bir başka örnek olarak "deyimler", "atasözleri" vs. verilebilir. Ya da algoritmanın cümleler arası ilişkileri keşfedip keşfetmediğine bakılabilir. Ya da basit bir problem gibi görünen ama bazen anadilini konuşan insanları bile afallattan "zamir çözümleme" problemi ile ilgili bir şeyler yapıp yapmadığına bakılabilir.
0
FZ
Hakkında konuşup da kendisini bir türlü göremediğimiz makale Yahoo'daki cogslist'e yollanmış, ben de alıp Files kısmına koydum, şu adresten erişilebilir:

http://groups.yahoo.com/group/cogslist/files/

pnas.pdf

Henüz okuma fırsatım olmadı, en kısa sürede tartışmaya devam etmek ümidiyle...
0
sefalet

Güzel bir haber özellikle o kadar arama taramadan sonra iyi geldi.Fakat üye olmayanlar nasıl indirebilir?
0
FZ
Ah! Çok özür dilerim, e-postalar kamuya açık olunca, "Files" kısmı da açık sandım, yanılmışım.

Bu durumda birkaç seçenek:

1- Bilişsel bilimle ilgileniyorsanız Türk araştırmacıların ve heveslilerin bulunduğu, 2002'de kurulmuş olan cogslist'e üye olur ve böylece "Files" kısmına erişebilirsiniz:

http://groups.yahoo.com/group/cogslist/

2- Bir sebepten ötürü üye olmak istemiyorsanız bana bir e-posta yazarsınız, ben size dosyayı yollamaya çalışırım, adres olarak:

emres at bilgi nokta edu nokta tr
0
FZ
e-posta ile yolladım size, elinize geçmez ise lütfen haber verin.
Görüş belirtmek için giriş yapın...

İlgili Yazılar

GRID Projesi: Büyük Hesap Makinesi!

RoR

Kasım ayında devreye alınacak büyük hadron çarpıştırıcısının (LHC)'nin verilerini işleyecek GRID projesi nedir?

Avrupa GRID projesine ülkemiz de dahil ancak gündeme pek yansımamakta.

Aşağıda 2. Ulusal GRID Çalıştayında Prof. Dr. Gülsen Önengüt'ün (Çukurova Üniversitesi) sunduğu LHC ve GRID ilişkisini anlatan sunuma ve 'grid' bilgi işlem hakkındaki kısa videoya erişebilirsiniz

Keskinliğini kaybeden sınırlar...

darkhunter

CG/Render teknolojisi nereye doğru gidiyor bilinmez, ama bir önceki jenerasyonun hayalleri yavaş yavaş gerçekleşiyor...

Tamamen CG (Computer Graphics) teknolojisinin ürünü olan bu çalışma, CG teknolojisinin, şu anki sınırlarını çizmesi açısından ilginç bir örnek.

Özgün haber ve yorumlar için tıklayın.

Bilim Teknik´den haberler -2- Karanlıkta Aydınlık Klavye

parsifal

Bilgisayar başında otururken ışık en fazla klavye için gereklidir. IBM laptoplarında bunu ekranın üstüne bir ışık kaynağı koyarak çözmeye çalışmıştır.
Masaüstü bilgisayarlar içinde pek çok çözüm sunulmakta...
Sundance'de bu çözümlere kendi alternatifini oluşturmak için devamlı çalışıyor.
Kensington bu soruna karşı bir ürün geliştirdi. Flylight adı verilen ördek boyunlu led lamba, bilgisayarın USB girişine bağlandığı anda klavyenin üzerine yeterli miktarda ışık düşürüyor.
Fiyatı mı? Sadece 20 USD.
Bu durumda Sundance'ye desteğimiz sonuna kadar devam ediyor...

Güney Kore’de Bilim Skandalı

Zebani

Kopyalama yoluyla insana ait kök hücre elde ettiğini açıklayan G. Koreli bilim adamı Hwang Woo-suk'un çalışmasının sahtekarlık içerdiği anlaşıldı.

Bir bilimcinin hırsı nelere yol açabiliyor. Bir bilimci böyle büyük bir yalanın farkedilmeyeceğini nasıl düşünür?

Bu yalanın farkedilmemesi çok daha ilginç olurdu herhalde. (Tabii biz bu ilginçliğin farkında olamazdık.)

Düşünsenize Newton yapsaydı aynı sahtekarlığı... :)

I. Ulusal Kriptoloji Sempozyumu

FZ

1. Ulusal Kriptoloji Sempozyumu, ODTÜ Uygulamalı Matematik Enstitüsü tarafından 18-20 Kasım 2005 tarihleri arasında düzenleniyor.

Etkinliğin davetli konuşmacıları arasında yer alan Subhamoy Maitra'nın, "Cryptographically Significant Boolean Functions" ve "Cryptanalysis of Digital Watermarking" konularında birer konuşma yapacağı da aktarılan bilgiler arasında. konularında, 50'şer dakika süreli ve İngilizce iki konuşma yapacaktır.