Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Amerika'yı yeniden keşfetmek

sundance

Türkiye’de iş dünyasına atılan, birazcık idealizme sahip herkes, kısa bir süre içinde yeni bir şeyler icat etmek, farklı bir şeyler çıkarmak için harekete geçer. Bazen okuldan yeni çıkmış olmanın naifliğidir itici güç, bazen de yıllar boyunca maruz kalacakları köhneliğin farkına varmanın refleksif tepkisidir bunu yaptıran.

Ama “icat çıkarma” lafının çöreklendiği bu coğrafyada “salyangoz satmak”...

Özgür Ağ Projesi (The Free Network Project)

anonim

"Henüz Internet'e girebilmesi için çok küçük olsa da, kızım ve Internet için sürekli bir endişe içindeyim. Endişemin sebebi ise şu: Bundan 10-15 yıl sonra, kızım bana gelecek ve şunu söyleyecek : 'Babacığım, Internet'te basının özgürlüğü elinden alındığında sen nerelerdeydin? '

Freenet Project sitesinin giriş sloganı
-- Mike Godwin, Electronic Frontier Foundation

Türk Uzmandan ``Casus´´ Matematiksel Model

anonim

ABD´de yaşayan Türk profesör Bülent Yener, IRC sohbet odalarında geçen konuşmaları tespit edecek matematiksel bir modelleme üzerinde çalışıyor. ABD hükümeti Yener´in çalışmasını terörizmle mücadelede kullanacak.

Sohbet odaları internetin en çok ziyaret edilen alanlarından. Kullanıcıların diledikleri konuları konuştukları sohbet odaları, aynı zamanda kötü niyetli ``hacker´´ların şifre ve kredi kartı numaraları çaldıkları bir alan. Ancak, bu kez hedefte terörist örgütlerin şifreli haberleşmesi var. Ayrıntılı bilgi için ntvmsnbc.com.

Yeni Hesap Makinamız: Google

FZ

Google bir garipliğe, bir hoşluğa daha imza attı. Artık sitenin arama kısmına çok karmaşık hesapları girip sonuçları anında alabilirsiniz. Her türlü sabit, birim dönüşümü, doğal dildeki hesaplamaları anlama, vs.

Google'ın hesap makinasının yapabildiklerine birkaç örnek:

Web 2.0 Tasarım Eğitim Dökümanları

DemensMagnet

Web 3.0 konseptleri tartışılmaya başlayadursun tüm internet halen Web 2.0'a ayak uydurabilmiş değil. Özellikle de ülkemiz. Halen Web 2.0 nedir? diye soran arkadaşlarımız buradaki makaleyi inceleyebilirler.