Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Sizi Rahatsız Eden Kavramları Google İle Değiştirin!

FZ

Savaş karşıtı slogan tespit edildi, hedefi saptırıldı ve Google ile temizlenip pırıl pırıl yapıldı.

Bu yıl, meşhur "1984" romanının yazarı George Orwell'in 100. doğum yıldönümü. Orwell, dilin gücünün politika bağlamında ne kadar etkili olabileceği üzerine bir hayli düşünmüş ve yazmıştı. Yazar, Internet aracılığı ile kavramların nasıl kısa sürede ve güçlü şekilde çarpıtıldığını görse idi herhalde küçük dilini yutardı!

Zoho çözümü Microsoft Office karşı başarılı olacak mı?

anonim

Zoho yeni Web 2.0 furyasına eklenen isimlerden birisi. Şimdilik çok başarılı gidiyor. Microsoft Office alternatiflerinin arttığı günümüzde Zoho en iyi online çözümlerden birisi olma yolunda. Google Office'e göre bir sürü artısı olmasına karşın aradığı parasal gücü de yakalaması lazım. Zoho sizce tutacak mı?

Internet trafiğinin sadece %25i www....

sundance

Bigblueball.com´da yeralan bir habere göre Internet trafiğinin %75´i browser dışı bağlantılardan oluşuyor.

Herne kadar Windows Media Player, AOL Messenger, MSN ve Yahoo Mesenger´ın en çok kullanılan yazılımlar arasında olduğu belirtilen araştırmada [bence] p2p yazılımalarına gereken değer verilmese de sonuçlar düşündürücü.

Radikal Internet Sitesine Ne Oldu?

FZ

Radikal'in web sitesinde önceki gün bazı sorunlar yaşandı. Gün boyunca haberlere ulaşmak isteyenler dakikalarca beklemek zorunda kaldı. Öğleden sonra ise özellikle MGK Genel Sekreterliği'nin yetkilerini konu eden 'İşte en gizli yönetmelik' başlıklı manşet haber ve İsmet Berkan'ın ilgili yazısı görüntülenemedi. Olayın teknik açıklaması şöyle:

Digg'sizin hakkından 180° gelir!

sundance

"Web 2.0 herşeyi değiştiriyor" derken, 2005 yılının en önde gelen 2005'in önde gelen Web 2.0 uygulamalarından Digg'e sonunda sağlam bir rakip çıktı!

Slashdot'ı, hızı ve dinamizmi ile geri plana iten Digg'e rakip olan 180° News RSS feedlerden otomatik olarak topladığı haberlerin Digg'deki gibi önemli-önemli değil diye sınıflandırılmasını sağlıyor.

Ne diyelim, We are of BORG. All your bases belong to us!