Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Telefon ve Adsl tarifelerine indirim

anonim

Türk Telekom Genel Müdürü Paul Doany ses iletimine gelecek indirimin Pazartesi günü onaylanarak uygulamaya gireceğini, Adsl ile ilgili indirimin ise yakın zamanda açıklanacağını söylemiş.
Kaynak: Ntvmsnbc

Bir kaç ilginç rakam

conan

Internet üzerine ordan burdan topladığım birkaç istatistiksel veri:

- Google'da şu an ki indexlenmiş web sayfası sayısı: 2,073,418,204
- 2000 yılında tahmin edilen Internet'teki reklam pazarı payı 5 Milyar $
- Fortune 500 listesindeki şirketlerin sadece %30'unun web sayfası var.

Last.fm Kullanıcı bilgilerini CBS, RIAA'ya mı gönderdi?

fsniper

Tech Crunch, last.fm'in kullanıcı bilgilerini RIAA e ulaştırdığına dair bir haberin arkasını araştırmış. Özetle, kısa bir süre önce ismi gizli bir last.fm çalışanı, saklanmakta olan kullanıcı bilgilerin (kullanıcı adı, ip adresi, dinleme tercihleri gibi) RIAA'e aktarıldığı yönünde bir haber sızdırmıştı. Daha sonra last.fm bu konuda, "kendilerinin böyle bir bilgi aktarımı yapmadığını" söyleyerek haberi yalanlamıştı.

Ancak TechCrunch işin peşini bırakmayarak konunun last.fm in ebeveyn şirketi olan CBS tarafından yapıldığını haber yaptı. Habere bu bağlantıdan ulaşabilirsiniz.

©2004 Google - 8.058.044.651 web sayfası aranıyor...

mos

Slashdot 'da (*) yer alan bu habere göre, Google indeksini ikiye katlamış.

Daha önce 4 milyar civarında sayfayı indeksleyen arama motoru , bu sayıyı 8 milyarın üstüne çıkarmış görünüyor.

Haberle ilgili Google blog'unu okumak için tıklayın.

Jenerik isim kabusuna son

anonim

Haksız rekabet yaratmamak amacıyla “.tr” Alan Adı Yönetimi tarafından hiçbir kişi ya da kuruluşa verilmeyen, belgeye dayalı alt alanlarda bir sektör ve kavramı temsil eden alan adları, artık alınabilecek. Yeni düzenlemeyle başvurular internet üzerinden kredi kartıyla da yapılabilecek. Ancak “Turkiye”, “Ataturk” ve “Turk” alan adları yalnızca T.C. Devleti’nin yetkilendirdiği devlet kuruluşlarına verilecek.
Devamı ntvmsnbc'de