Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Clixpy ile kullanıcıların neler yaptığını gerçekten görün

wizzyfx

Geçtiğimiz hafta yayına giren Clixpy ile, web sayfanıza küçük bir javascript kodu ekleyerek kullanıcıların sitenizdeki tüm hareketlerini kayıt altına alabilirsiniz.

Google´den email servisi

sametc

‘Gmail’ adını taşıyacak olan yeni email hizmetinin içinde, gönderilen ve gelen email metinlerini tarayacak bir arama motoru bulunacak. Gmail kullanıcılara 1 gigabyte ücretsiz alan sağlayacak. Bu rakam yaklaşık 500 bin email sayfasını tutabiliyor.
Google, Gmail servisinin finansmanını alışılmadık bir şekilde sağlayacak. Google arama motoru, email metinlerinde geçen konulara ilişkin reklem linklerini emaillere iliştirecek. Örneğin, iletişim kuran iki kullanıcının gitmeyi planladıkları bir konserin bilet satışına dair internet linki email ile beraber gelecek. Google ilk etapta imtiyazlı kullanıcılara açılacak olan deneme servisinin ardından, Gmail’i bir kaç hafta içerisinde internete taşıyacak.
devamı: www.ntvmsnbc.com

Semantik Web ile Türkiye - ABD Kıyaslaması: Ursula K. LeGuin ve Oğuz Atay

FZ

Basit bir soru: X ülkesinin vatandaşı olan yazarları ve her birisinin kitaplarının listesini getir.

Süre: 2 dakika.

Yukarıdaki işi bir programcı olarak nasıl yapardınız? Mesela X = Türkiye.

Çok basit bir soru gibi görünüyor.

Acaba gerçekten öyle mi? İsterseniz bir deneyin. ;-)

İsterseniz süreyi 20 dakikaya çıkaralım. Yahut 2 saate. Kaç yazarın kaç kitabını getirebilirsiniz? Ne kadarlık bir bilgisayar kodu yazmanız gerekir, o kod hangi kaynaklara bağımlı olur, ne kadar sürede çalışır?

Şimdi siz bunu düşünedurun, dbpedia.org'a SPARQL sorgulama dili ile birkaç soru soralım ve sonuçlarına bakalım:

Devamı: burada...

Internet´teki Komşular - Gerçek Dünyadaki Komşular

FZ

Sitenize komşu siteleri öğrenmek istemez misiniz? Hayır hayır bilgisayar ağlarından ve ping sürelerinden bahsetmiyorum. Fiziksel olarak size yakın sitelerden bahsediyorum. Hayır, web sayfalarınızın hangi web sunucuda durduğunun bir önemi yok. Önemli olan o sayfaları hazırlayan kişi ya da kurum olarak sizin bulunduğunuz yer.

GeoURL işte tam da bu konuda bizlere yardımcı olmak için geliştirilmiş bir veritabanı. Siteyi ziyaret edip inceledikten sonra kendi sitenizi ve bulunduğunuz yeri sisteme nasıl dahil edeceğinizi buradan öğrendikten sonra kendi sitenizi bu sayfa aracılığı ile (ya da küçük bir betik ile) sisteme ekleyebiliyorsunuz.

Sistemin asıl özelliği sitenize komşu olan siteleri göstermesi. Nasıl bir şeye benzediğini merak ediyorsanız ileriseviye.org'daki alttaki GeoURL düğmesine basın ;-)

RÜTÜK unveils the Domin@tion v.1.0

Evil_Empire

Hiç RÜTÜK yasasının arkasında bir komplo teorisi olabileceğini düşündünüz mü? Büyük medya kuruluşlarının hükümetler üzerinde ne gibi yaptırımlar uygulayabileceğini tahmin edebiliriz. BÜYÜKLER, bulundukları yere, büyük yatırımlar yaparak ulaşmışlardır. Genelde bu büyük yatırımları yaparken, uzun vadeli krediler, hükümette söz hakkı, kamu gücü vb. çıkarlarını gözetmişlerdir.

Hükümetler, reklamların ürünüyse ve reklamı medya yaparsa. Halk medyanın tek bir haberiyle gaza gelip, tek haberiyle sakinleşebiliyorsa. Medya kartelinin, alternatif ortamlara bakışı ne kadar ılımlı olabilir? RÜTÜK tüm medyadan sorumlu, sorumsuz değil midir? Meclistekilerin hepsinin bir gazeteci dostu olduğunu varsayarsak, RÜTÜK üzerinde medyanın gücünü tahmin edebilir miyiz?

Ne dersiniz BÜYÜK balık her zaman küçüğünü yutar mı?

Not:yukarıdakı yazının gerçekle ilgisi yoktur ve kişi ya da kuruluş isimleri uydurmadır(!)