Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Cep telefonuyla Telnet, ICQ ve diğerleri !!!

sundance

Trancell.com isimli şirket web sitesi üstünden ICQ mesajı, e-mail atabilmeyi, Internet'de surf yapabilmeyi ve dahası telnet ile bir yerlere girip işlem yapabilmeyi sağlıyor.

İnanması zor, denemesi kolay. Şahsen ben Larweda gelsin de onun telefonundan deneyelim diye akşamı bekliyorum ;)

Ben Size Altın Örümcek Alamazsınız Demedim!

parsifal

İstanbul Büyük Şehir Belediyesi Altın Örümcek 2005 Kamu Kurumu ödülünü kazanmış.

Heralde sonradan bir rehavet çökmüş ki, Kültür kısmında bulunan "CRR Konser Salonu" linki bizi önce http://www.crrks.org adresine, ordan da buraya yönlendiriyor.

Ve CRR Hakkında kısmına girince ağzımız bir karış açık kalıyor.

Burda tartışmamız gereken konu örümceğin hangi şartlarda verildiği mi yoksa bu büyüklükteki bir belediyenin web sayfasının içler acısı hale nasıl geldiği mi?

AOL Bir Şeyler Yapıyor Ama ...

sundance

ICQ`u aldığından beri çok bir hareket görmediğimiz AOL, ICQ lisansını bir şekilde kullanıma açıyor. Ama tam olarak ne yapıyor, nasıl yapıyor biz anlayamadık, anlayan beri gelsin.

Lisansın içinde `10,000 kopyadan fazla dağıtılmaması, 13 yaşından küçüklere verilmemesi` gibi ibareler var
Hayra alamet mi desek, yoksa büyük ölçekte firmaların ne yaptığının farkında olmadan yaptığı bir başka gariplik mi desek bilemiyoruz...

Güzel Siteler - 4: Lost Library

larweda

Son yıllarda ülkemizde de son da olsa popüler olmaya başlayan bilim kurgu ve fantazi edebiyatı, yayınevlerinin de desteğiyle yavaş yavaş hakettiği yerine gelmeye başlıyor. J.R.R. Tolkien`in Lord of the Rings`i (Yüzüklerin Efendisi), Frank Herbert`in Dune`u, Ursula K.Leguin`in Earthsea`si (Yerdeniz üçlemesi), Anne McCaffrey`in Dragonriders of Pern`i (Pern'in Ejderadamları), Terry Pratchett`in Discworld`ü (Diskdünya :-) David Eddings`in Elenium/Tamuli ve Belgariad serileri, Arthur C. Clarke`ın Space Odyssey ve Rama serileri, Dragonlance (Ejderha mızrağı), Philip Dick, Terry Brooks, Wolfgang Hohlbein ve Doris Lessing`in kitapları son 2-3 yılda türkçeye çevrilen fantasy/BK klasiklerinden bazıları.

İşte LostLibrary de bu hikayeler, konular ve kitaplar hakkında kaliteli türkçe içerik sağlayan çok az siteden biri. Siteyi hazırlayan insanların da yaşam tarzlarında BK ve Fantasy edebiyatının büyük yer kapladığı açıkça belli oluyor. Tatmin edici bir içeriğin yanında göz bozmayan bir tasarım da sunan LostLibrary, şiddetle tavsiye olunur.

Internet'in sahipleri

auselen

Başlık sansasyonel fakat "Asia Green IT System Bilgisayar San. ve Tic. Ltd. Sti." da kim?

http://www.iana.org/domains/root/db adresine denk gelince merak ettim, biraz sed ile güreşip aşağıdaki listeyi oluşturdum.

$ curl -s http://www.iana.org/domains/root/db | xmllint --html --xpath "//table/tbody/tr/td[1]/span/a|//table/tbody/tr/td[2]|//table/tbody/tr/td[3]" - 2>/dev/null...