Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Daha Ucuz ve Hızlı Internet İçin Harekete Geçin!

anonim

Türk Telekom'u, uyguladığı tavan fiyat politikası nedeni ile Türkiye'deki internet ve teknoloji ağının genişlemesini engellemekle suçluyoruz. Türk Telekom'un bu tutumu toplumumuzu aydınlık bir gelecekten uzaklaştırmaktadır. Siz de bizimle aynı fikirdeyseniz http://www.organizehareket.com a katılarak destek verin.

Dünyanın Baskıcı Rejimleriyle İşbirliği Yapan Şirketler

darkhunter

Çin'de yaşanan internet sansürleme projesine çanak tutan şirketlere Microsoft'da eklendi... Habere göre Shanghai Alliance Investment Ltd (SAIL) ile Microsoft'un ortaklığında kurulan yeni MSN portalında 13.06.2005 itibariyle "demokrasi, özgürlük, insan hakları, Tayvan'ın bağımsızlığı veya gösteri" ile ilgili sonuçlar görüntülenmeyecek... Bu durum ilk değil Google ve Yahoo bu kepazeliğe çoktandır çanak tutuyorlar!

MIT OCW - MIT derslerini Web`e açıyor!

larweda

MIT (Massachusets Institute of Technology) Üniversitesi, dünyada şanı yürümüş, Amerikanın önde gelen üniversitelerinden biri. "Paylaşılmayan bilgi çürür" ibaresinin farkında olan MIT yetkilileri, bir güzellik yaparak birçok bölümde/konudaki yazılı materyalleri (eğitmen notları, ders notları, kaynak listeleri, seminer notları ödevler vs.) internet üzerinden herkesin ücretsiz kullanımına açmaya karar verdi, bu sayede MIT bünyesinde verilen 16 akademik programın lisans ve yüksek lisans derslerini her isteyen istediği yerden takip edebilecek. MIT'nin gayet saygı duyulan ve Birleşik Devletlerin en pahalı üniversitelerinden birisi olduğu düşünülürse, bu gayet heyecan verici bir gelişme kesinlikle.

Wikipedia'nın CD sürümü çıkıyor

dkoksal

Özgür ansiklopedi internetten CD'lere geçerek arşivlik bilgi saklamak isteyenler için üretiliyor.

Yeni Hesap Makinamız: Google

FZ

Google bir garipliğe, bir hoşluğa daha imza attı. Artık sitenin arama kısmına çok karmaşık hesapları girip sonuçları anında alabilirsiniz. Her türlü sabit, birim dönüşümü, doğal dildeki hesaplamaları anlama, vs.

Google'ın hesap makinasının yapabildiklerine birkaç örnek: