Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Küçük casuslar artık büyük tehdit

mos

haberde göreceğiniz üzere; bir zamanların -can sıkmaktan öteye gitmeyen- casus yazılımları, hiç küçümsenemeyecek bir pazarın doğmasına sebep olmuşlar.

Kablosuz antenlerimizi güçlendirelim...

sundance

Eminim kablosuz erişimle uğraşan herkes Cantenna ya da Pringles kutusundan yapılan antenleri görmüştür.

Fena değil bir çekim sağlasalar da bu antenlerin en büyük dezavantajı pigtail denen arabirime ihtiyaç duymaları.

Diyelim ki derdiniz bu değil, mevcut bir AP'iniz var ve bunun daha uzun mesafede veya her yöne doğru değil de sadece evinizin ekseninde çalışmasını istiyorsunuz. O zaman sizin için çok daha kolay, şık bir çözüm burada . Ben denedim, kesinlikle işe yarıyor.

Google: Bir kez daha...

sundance

Google bir kez daha yapacağını yaptı. Yaklaşık 700 milyon mesajdan oluşan, 20 yıllık Usenet Arşivini kullanıma açtı

1981`den bu güne gelen bu dev arşiv bugüne kadar eşi benzeri görülmemiş bir dev tarih belgesi. Bizi izlemeye devam edin, sanırım önümüzdeki haftalarda bu arşivden eşelenmiş onlarca önemli olayın haberiyle karşınızda olacağız ;)

Internet ve Hırsızlık (Çalan Çalana...)

FZ

İnternette milyonlarca site, milyarlarca sayfa var. Ancak her sitenin birbirinden farklı olduğunu sanmayın. Birçok site bir diğerinin yazı ve resimlerini olduğu gibi alıp kendininmiş gibi kullanıyor. Kimi siteler daha da ileriye giderek sitelerin tasarımlarını da olduğu gibi kopyalıyor. Pirated Sites sitesinde yüzlerce kişilik korsan avlama ekibi, internetin altını üstüne getirerek bu siteleri bulup arşivliyor. Resimleriyle inceleyebileceğiniz kopya siteler neredeyse aynen, renkleriyle bile oynanmadan başka isimler ve başka adreslere bürünmüş.

Haber kaynağı: Radikal

Internet'te Filtreleme ya da Sansür: Opennet.net

sundance

Son zamanlarda özellikle YouTube'un mahkeme kararı ile bloklanmasının ardından oldukça yoğun olarak tartışılan konulardan biri de Internet'te sansür.

Bu konuda herşeyden önce iyi bilgilenmemiz gerekiyor. Bu iş neden var? Sadece Türkiye'de mi var? Dünya'da bu konuda trendler ne vs. ki sağlıklı bir şekilde tartışalım ve daha da önemlisi, belki de klasik basından bile önemli olan bu ortamda, sağlıklı haberleşmenin sağlanması için sesimizi duyurabilelim.