Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

YouTube Videoları Artık Cepte

melitical

Verizon Wireless firmasıyla youtube arasında yapılan anlaşmaya göre artık Verizon Wireless kullanıcıları youtube videolarını cep telefonlarından izleyebilecekler.

Güzel Siteler - 4: Lost Library

larweda

Son yıllarda ülkemizde de son da olsa popüler olmaya başlayan bilim kurgu ve fantazi edebiyatı, yayınevlerinin de desteğiyle yavaş yavaş hakettiği yerine gelmeye başlıyor. J.R.R. Tolkien`in Lord of the Rings`i (Yüzüklerin Efendisi), Frank Herbert`in Dune`u, Ursula K.Leguin`in Earthsea`si (Yerdeniz üçlemesi), Anne McCaffrey`in Dragonriders of Pern`i (Pern'in Ejderadamları), Terry Pratchett`in Discworld`ü (Diskdünya :-) David Eddings`in Elenium/Tamuli ve Belgariad serileri, Arthur C. Clarke`ın Space Odyssey ve Rama serileri, Dragonlance (Ejderha mızrağı), Philip Dick, Terry Brooks, Wolfgang Hohlbein ve Doris Lessing`in kitapları son 2-3 yılda türkçeye çevrilen fantasy/BK klasiklerinden bazıları.

İşte LostLibrary de bu hikayeler, konular ve kitaplar hakkında kaliteli türkçe içerik sağlayan çok az siteden biri. Siteyi hazırlayan insanların da yaşam tarzlarında BK ve Fantasy edebiyatının büyük yer kapladığı açıkça belli oluyor. Tatmin edici bir içeriğin yanında göz bozmayan bir tasarım da sunan LostLibrary, şiddetle tavsiye olunur.

Pandora: Size Uyum Sağlayan Radyo

wizzyfx

Pandora ilginç bir Internet radyosu. Yine aynı şirketin yürüttüğü Genome isimli proje ile paralel olarak çalışıyor.

Virüste 2001´in Top 10´u...

esse

www.sophos.com; 2001 yılının en popüler virüsünün Nimda olduğunu açıklamış. Bu adresde yeralan bilgiye göre, Sophos'un ''destek masalarına'' en çok Nimda virüsü ile ilgili şikayet gelmiş. Tüm şikayetlerin yüzde 27'si Nimda'ya ait olurken, Sircam virüsü yüzde 20 oranında şikayet almış. Söz konusu sitede, Sophos'un teknoloji danışmanı Graham Cluley'in, ''Eylül ayında ortaya çıkan Nimda hala destek masamızı en fazla meşgul eden virüslerin başını çekmekte. Nimda'nın bu kadar etkili olmasının nedeni, bilgisayarları birçok yoldan enfekte edebilmesi. Gelecek günlerde de ortaya çıkacak virüslerin Nimda gibi birçok alternatifi kullanabilecek kapasitede olacağına inanıyoruz.'' sözlerine de yer verilmiş.

Internet'te bir şeyler oluyor!

sundance

ZDNet'te yeralan bu habere göre, Internet'de kaynağı çok belirlenemeyen garip bir trafik var.

Mayıs ortasından beri Internet'te dolaşan bu kaynağı belirsiz ağ aktivitesinin sebebi olarak ISS firması bir hacker programı gösterdi. Fakat diğer güvenlik firmaları bunun başka bir şeyler daha olduğundan şüpheleniyorlar.

Meydana gelen gariplikler arasında TCP/IP Windows size 55,808 byte olmasi (normali 1024 ve civarıdır) ve kaynak adresi olarak IANA tarafından rezerve edilmiş (dolayısıyla, hiçbir standart routerdan geçmemesi gereken) adresler kullanması gösteriliyor. Is there a GHOST in THE SHELL ?