Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Jenerik isim kabusuna son

anonim

Haksız rekabet yaratmamak amacıyla “.tr” Alan Adı Yönetimi tarafından hiçbir kişi ya da kuruluşa verilmeyen, belgeye dayalı alt alanlarda bir sektör ve kavramı temsil eden alan adları, artık alınabilecek. Yeni düzenlemeyle başvurular internet üzerinden kredi kartıyla da yapılabilecek. Ancak “Turkiye”, “Ataturk” ve “Turk” alan adları yalnızca T.C. Devleti’nin yetkilendirdiği devlet kuruluşlarına verilecek.
Devamı ntvmsnbc'de

Free Software Magazine

yuxel

Free Software Magazine, yazarları arasında Richard Stallman'ın da bulunduğu yeni bir e-dergi. Dergi html ve pdf formatlarında okunabiliyor.

O’Reilly Web 2.0 lafını tescillemiş!

meddah

Web 2.0 hakkında konuşma düzenleyen bir şirkete O'Reilly'nin New York'daki avukatları tarafından bir tehdit mektubu gönderildi. Amaçları kendi izinleri olmadan Web 2.0 ismi altında hiçbir organizasyon yapılmamasi. Organizasyon da çok büyük değil! Katılım en fazla 100 kişi oluyor. Yani uluslararası bir organizasyondan bahsetmiyoruz.

Gönderilen mektubu bu adresten görebilirsiniz

Opera´nın MSN´den İntikamı

FZ

Meşhur ve çevik Internet tarayıcısı Opera hem 7.01 numaralı sürümünü çıkardı hem de daha önce kendisini kullanan Internet kullanıcılarını taciz eden MSN portalinden intikamını aldı.

Hapishaneden canlı webcam yayını!

larweda

Amerika Arizona`da bir hapishane, Crime.com`un desteğiyle hapishane içine tutukluların yaşadığı bölgelere webcam koymuş ve buradan insanlara seyrettiriyor. Bir nevi reality show yani. Bence önemli olan soru ise, her zamanki Internet`in ne kadar özgür olduğu tartışması. Acaba bu hapishanede yatan mahkumlar webcam konulmasından hoşlanıyorlar mı,ya da onaylıyorlar mı? Onaylıyor gibi görünseler de bu gerçekten kendi istekleri mi yoksa suçlu oldukları için onlar adına karar verilebiliyor mu? Bu konu tahminen Amerika`da da tartışmalar çıkaracaktır, biz de gelişmeleri takip ederek buradan aktarmaya devam ederiz.
Webcam'leri görebilmek için bir form doldurup email adresi vermek gerekiyor, sonucunda da birsürü spam e-mail alıyorsunuz, ben bu sorunu da halletmek için mailexpire`ı kullandım, ki bu da bir sonraki yazının konusu.