Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

UNIX Ağ Programlama Kılavuzu

FZ

Brian "Beej" Hall'un UNIX Ağ Programlama Kılavuzu'nun Türkçe tercümesi ileriseviye.org sitesine eklendi. C dili ile UNIX, GNU/Linux vb. işletim sistemleri üzerinde düşük seviyeli ağ ve Internet programlama yapmak isteyenler bu kaynaktan faydalanıp başlangıç aşamasından orta aşamaya kadar gelebilirler.

Internet´teki Komşular - Gerçek Dünyadaki Komşular

FZ

Sitenize komşu siteleri öğrenmek istemez misiniz? Hayır hayır bilgisayar ağlarından ve ping sürelerinden bahsetmiyorum. Fiziksel olarak size yakın sitelerden bahsediyorum. Hayır, web sayfalarınızın hangi web sunucuda durduğunun bir önemi yok. Önemli olan o sayfaları hazırlayan kişi ya da kurum olarak sizin bulunduğunuz yer.

GeoURL işte tam da bu konuda bizlere yardımcı olmak için geliştirilmiş bir veritabanı. Siteyi ziyaret edip inceledikten sonra kendi sitenizi ve bulunduğunuz yeri sisteme nasıl dahil edeceğinizi buradan öğrendikten sonra kendi sitenizi bu sayfa aracılığı ile (ya da küçük bir betik ile) sisteme ekleyebiliyorsunuz.

Sistemin asıl özelliği sitenize komşu olan siteleri göstermesi. Nasıl bir şeye benzediğini merak ediyorsanız ileriseviye.org'daki alttaki GeoURL düğmesine basın ;-)

Yeni Hesap Makinamız: Google

FZ

Google bir garipliğe, bir hoşluğa daha imza attı. Artık sitenin arama kısmına çok karmaşık hesapları girip sonuçları anında alabilirsiniz. Her türlü sabit, birim dönüşümü, doğal dildeki hesaplamaları anlama, vs.

Google'ın hesap makinasının yapabildiklerine birkaç örnek:

Dosyalar, kaynak kodları yetmez... İşlem gücümüzüde paylaşalım

tongucyumruk

Bu fikir daha önce başkasının aklına geldi mi veya uygulanıyormu bilmiyorum ama dün aklımda belirdi ve bana oldukça çekici geldi doğrusu. Tabii az sonra anlatacaklarımı yapmaya benim teknik bilgim yetmeyeceğinden FM ile de paylaşmak istedim.

İnternetin ortaya çıkışından beri insanlar sürekli birşeyleri paylaşma eğilimi içindeydiler. Önceleri bu sadece düz metinden oluşan bilgiydi (kaynak kodu, şarkı sözü, bilimsel araştırma sonuçları vs). Daha sonra sıkıştırma algoritmaları gelişip bant genişlikleri arttıkça insanlar önce resimleri daha sonraları ise önce müziği ve videolarını paylaşmaya başladılar. Ve bence şimdi bunu sadece veri paylaşımının ötesine geçirmenin vakti geldi...

Çalıntı laptoplara sınır (ya da biri bizi gözetliyor)

mentat

ÇALINTI ve kayıt dışı cep telefonlarını kullanıma kapatarak, hırsızlıkların önüne geçen hükümet, şimdi de son dönemde yaygınlaşan dizüstü bilgisayar (laptop) çalınmasına karşı yeni bir uygulamayı devreye sokmaya hazırlanıyor. Cep telefonlarını denetime alan yasanın mimarı olan AKP Milletvekili Seyfi Terzibaşıoğlu'nun hazırladığı yasa tasarısında çalıntı ve kayıt dışı dizüstü bilgisayarlar kara listeye alınacak, MAC numarasından takip edilecek ve internet kullanımına kapatılacak. İnternet servisi sağlayan firmalar, yeni yasa ile bunları takiple yükümlendirilecek. Haberin devamı hurriyet.com.tr'de.

Yorum: Haberi okur okumaz tüylerim diken diken oldu. 1984'e dönüyoruz yavaş yavaş..