Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Internet ve Hırsızlık (Çalan Çalana...)

FZ

İnternette milyonlarca site, milyarlarca sayfa var. Ancak her sitenin birbirinden farklı olduğunu sanmayın. Birçok site bir diğerinin yazı ve resimlerini olduğu gibi alıp kendininmiş gibi kullanıyor. Kimi siteler daha da ileriye giderek sitelerin tasarımlarını da olduğu gibi kopyalıyor. Pirated Sites sitesinde yüzlerce kişilik korsan avlama ekibi, internetin altını üstüne getirerek bu siteleri bulup arşivliyor. Resimleriyle inceleyebileceğiniz kopya siteler neredeyse aynen, renkleriyle bile oynanmadan başka isimler ve başka adreslere bürünmüş.

Haber kaynağı: Radikal

Yeni Hesap Makinamız: Google

FZ

Google bir garipliğe, bir hoşluğa daha imza attı. Artık sitenin arama kısmına çok karmaşık hesapları girip sonuçları anında alabilirsiniz. Her türlü sabit, birim dönüşümü, doğal dildeki hesaplamaları anlama, vs.

Google'ın hesap makinasının yapabildiklerine birkaç örnek:

.tr Paylaşılamıyor

mrtksn

15 yıldır ODTÜ'den dağıtılan .tr uzantılı alan adlarının tescil hakkını Telekomünikasyon Kurumu devralmak istiyormuş.

Gerekçe olarak ise internet servis sağlayıcılarıyla ilgili yetkilendirmeler, denetlemeler ve numara tahsisiyle ilgili işlemlerin Kurum tarafından yapıldığını, internet alan adları konusunun da kıt kaynaklardan bir tanesi olduğunu, dolayısıyla bu konudaki yetkilendirmenin Telekomünikasyon Kurumu tarafından yapılması gerektiği gösterilmiş. Ancak asıl mesele 1 milyon doları geçen yıllık kar gibi görünüyor.

Haberin tamamını buradan okuyabilirsiniz.

TürkTelekom Suyunu Çıkardı

sundance

Bayramdan önce Türk Telekom tariflerine gelen %25`lik zamla fiyatların 280,000 TL.den 350,000 TL.e çıktığını hemen herkez biliyor.

Peki bayram ertesinde bu ücretin %20`lik bir artışla 415,000TL`e çıktığını biliyor musunuz ?
Tabi ki hemen protesto sitesi açıldı. İster protesto edin, ister etmeyin, ama bilgilenin...

Zimbra Yahoo'ya Değer Katıyor

anonim

Zimbra isimli açık kaynak kodlu e-posta ve işbirliği çalışma ortamı şu anda en popüler ortamlan birisi olarak Lotus Notes ve Microsoft Exchange'in tahtını sallıyor. İlginç olan asıl nokta ise şu. Bu şirket Yahoo tarafından satın alındı. Acaba Microsoft'un Yahoo'yu ısrarla almak istemesinin ardında yatan asıl sebeplerden biriside bu mu? Startup'ların önemi bir kere daha ortaya çıktı. Türkiye'de de risk sermayesi ortaklıklarının bu modeli uygulaması gerektiğini düşünüyorum. Doğru vizyonu olan küçücük bir firma milyar dolarlık bir yatırıma dönüşebilir.