Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Semantik Web ile Türkiye - ABD Kıyaslaması: Ursula K. LeGuin ve Oğuz Atay

FZ

Basit bir soru: X ülkesinin vatandaşı olan yazarları ve her birisinin kitaplarının listesini getir.

Süre: 2 dakika.

Yukarıdaki işi bir programcı olarak nasıl yapardınız? Mesela X = Türkiye.

Çok basit bir soru gibi görünüyor.

Acaba gerçekten öyle mi? İsterseniz bir deneyin. ;-)

İsterseniz süreyi 20 dakikaya çıkaralım. Yahut 2 saate. Kaç yazarın kaç kitabını getirebilirsiniz? Ne kadarlık bir bilgisayar kodu yazmanız gerekir, o kod hangi kaynaklara bağımlı olur, ne kadar sürede çalışır?

Şimdi siz bunu düşünedurun, dbpedia.org'a SPARQL sorgulama dili ile birkaç soru soralım ve sonuçlarına bakalım:

Devamı: burada...

Internet trafiğinin sadece %25i www....

sundance

Bigblueball.com´da yeralan bir habere göre Internet trafiğinin %75´i browser dışı bağlantılardan oluşuyor.

Herne kadar Windows Media Player, AOL Messenger, MSN ve Yahoo Mesenger´ın en çok kullanılan yazılımlar arasında olduğu belirtilen araştırmada [bence] p2p yazılımalarına gereken değer verilmese de sonuçlar düşündürücü.

Wap uzerinden web´de gezmek

tongucyumruk

Yakın zamana kadar FazlaMesai'yi wap üzerinden okumak için FazlaMesai'ye wap desteği gelmesi veya TurkCell'in SurfCell adlı garabetiyle boğuşmak zorunda olduğumu düşünüyordum... Yanılmışım... Çok sevgili arama motorumuz google beni bir kez daha şaşırttı.
Alıyorsunuz wap destekli telefonu, giriyorsunuz http://wap.google.com'a ve webin tamamında arama yapabiliyorsunuz. İşin güzel yanı arama sonuçları web siteleri olsa bile google bunları sizin için wml formatına çeviriyor güzel güzel browse ediyorsunuz dahası arama ile ulaştığınız siteden başka sitelere link varsa o linkleri de google sizin için wml formatına çeviriyor.
Ne diyelim... İlahi google sen herşeyi düşünürsün...

JavaScript: Quo Vadis?

FZ

jQuery'nin yaratıcısı ve aynı zamanda Mozilla 'hacker'larından John Resig'in Ars Technica'daki 'Extreme JavaScript Performance' başlıklı yazısını gördükten sonra "JavaScript, nereye?" diye sormamak mümkün değil. Buna bir de Mozilla'nın CTO'su ve JavaScript'in yaratıcısı Brendan Eich'ın "JavaScript Gets Faster" röportajı eklenince sorunun vurgusu daha da güçleniyor. Peki ama neden?

Web 2.0 Tasarım Eğitim Dökümanları

DemensMagnet

Web 3.0 konseptleri tartışılmaya başlayadursun tüm internet halen Web 2.0'a ayak uydurabilmiş değil. Özellikle de ülkemiz. Halen Web 2.0 nedir? diye soran arkadaşlarımız buradaki makaleyi inceleyebilirler.