Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Google´dan çıkmak istiyorum ;)

sundance

Google´ın spider programcıkları Internet´i aralıksız tarayarak yeni sayfaları, eski sayfalardaki en son değişiklikleri Google´ın devasa depolama alanlarına atıyorlar. Bu sayede Internet´ten kalkan bir içerik, geçici bile olsa uzun süre Google´dan erişilebilir kalıyor.

Hal böyleyken Yok kardeşim benim sitemi Google indexlemesin ya da Sağolsun şimdiye kadar indexlediniz ama bundan sonra istemiyorum, beni cache dışına alabilir misiniz ? gibi ihtiyaçlar hasıl olduğunda ;) başvurulabilecek güzel bir makale

Savaş Hazırlıkları ve İnternet

anonim

ABD son hızla asker yığına devam ederken içerideki paranoya da büyüyor. Ülke içinde her türlü önlemi alıyorlar. Bunun son örneği Savunma bakanı Donad Rumsfeld´in .mil uzantılı web siteleri için yayınladığı mesaj.

Mesajın tamamı www.fas.org/sgp/news/2003/01/dodweb.html adresinde. Ama benim özellikle dikkatimi çeken bir kısmı internetin gücünün en büyük ispatlarından biri olarak gördüğüm için buraya almak istiyorum.

Metinde şöyle diyor:
AN AL QAEDA TRAINING MANUAL RECOVERED IN AFGHANISTAN STATES: "USING PUBLIC SOURCES OPENLY AND WITHOUT RESORTING TO ILLEGAL MEANS, IT IS POSSIBLE TO GATHER AT LEAST 80% OF INFORMATION ABOUT THE ENEMY."

Açık Ağlar, Kapalı Rejimler

murat09

E - postanızı açtığınızda, haftanın her günü, size birşeyler satmaya çalışan onlarca mesaj buluyorsunuz. Genellikle bu bir ürün oluyor, fakat bazen internet üzerinde ürünler yerine fikirler de sahibini arıyor. Ekranınızda savaş karşıtı bir söylem, yeni hayat tarzı dersleri veren bir gurudan rahatlatıcı sözler, ya da açık açık siyasi propoganda görebiliyorsunuz.

www.2ka.org

lazarus

Zamanında hepimizin kurcaladığı Exploit Generator'un yaratıcısı Korhan Kaya çalışmalarını www.2ka.org altında beğenimize sunmuş.

Internet`in 20. doğum günü geliyor

anonim

1 Ocak 2003 Internet'in 20. doğum günü... 1 Ocak 1983'de ARPANET ağı NCP'den TCP/IP'ye resmen geçirilmişti. Bu tarih birçok kişi ve kuruluş tarafından Internet'in doğduğu gün olarak kabul edilmektedir. Bundan 6 ay sonra da ARPANET, ARPANET ve MILNET olarak ikiye ayrılmış ve ilk TCP/IP yönlendirici ile birbirlerine bağlanmıştı.