Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

SPAMcilerle mücadele

anonim

Spam'ciler artık iyice gemi azıya aldı! Hergün neredeyse yüz tane saçma sapan mesaj alıyoruz. Bu sayıyı kullanıcı sayısıyla çarpınca gerek band genişliğimiz gerekse disk sığamızın ne denli boşa harcandığını görüp dehşete kapılmamak elde değil. Çimento karıştırma makinası satanından tutun tercüme yapanına kadar herkes teknolojiye ayak uyduruyor(!).
Yaklaşık bir yıldır spam gönderenlerin kullandıkları ISP'lerle görüşmeye çalışıyorum. Yaklaşık yarısı yanıt verme nezaketini gösterdi bugüne kadar. Yanıt verenlerinde çoğu "O mesajlar spam değilmişki, duyuru yapıyorlarmış" dedi!
Yok efendim istersem "unsubs" diyip listeden çıkabilirmişim falan...

Web Standartları ve Tarayıcılar

yuxel

Acid2 : tarayıcıların web standartlarına uyumunu test etmek için Web Standartları Projesi tarafından desteklenen küçük bir test sayfası.
Test tarayıcıların, HTML4, CSS1, PNG ve pek kullanılmayan Data URL desteğini deniyor .

Google´den email servisi

sametc

‘Gmail’ adını taşıyacak olan yeni email hizmetinin içinde, gönderilen ve gelen email metinlerini tarayacak bir arama motoru bulunacak. Gmail kullanıcılara 1 gigabyte ücretsiz alan sağlayacak. Bu rakam yaklaşık 500 bin email sayfasını tutabiliyor.
Google, Gmail servisinin finansmanını alışılmadık bir şekilde sağlayacak. Google arama motoru, email metinlerinde geçen konulara ilişkin reklem linklerini emaillere iliştirecek. Örneğin, iletişim kuran iki kullanıcının gitmeyi planladıkları bir konserin bilet satışına dair internet linki email ile beraber gelecek. Google ilk etapta imtiyazlı kullanıcılara açılacak olan deneme servisinin ardından, Gmail’i bir kaç hafta içerisinde internete taşıyacak.
devamı: www.ntvmsnbc.com

Mashup

esrefatak

Müzik ve eğlence dünyasından ilham alan Web sektörü, baş döndürücü bir kullanıcı deneyimine hazırlanıyor: Mashup Web Applications

Yeni P2P - IRIS

cazz

Amerika'da, devlet tarafindan gorevlendirilmis bir ekip, var olan P2P teknolojisindeki sorunlari cozme amacli yeni bir P2P agi kuruyormus : IRIS (Infrastructure for Resilient Internet Systems)...

Projeden (ve MIT'den) Hari Balakrishnan soyle demis :

"Sunuculara karsi Denial of Service saldirilarini sona erdirecek!"

Balakrishnan ve arkadaslari , IRIS icin yeni bir arama algoritmasi da gelistireceklermis...

Bakiniz efenim...