Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Microsoft IIS pazar payını %5 arttırdı bu ay!!!

sundance

Evet yanlış duymadınız, yıllardır Internet web sunucuları üzerine aylık araştırmalarını yayınlayan www.netcraft.com bu ayki araştırmasında 31,299,592 web sunucusunu inceledi.
Sonuçlar, Microsoft IIS ile sunulan web sitelerinde bir önceki aya göre %5`lik bir artış olduğu. İşin ilginç yanı bu %5`lik kayıp daha önce Solaris üstünde hizmet veren NameZero`nun Windows 2000`e geçmesi ve Network Solutions`ın Solaris ağırlıklı Digex`den Windows ağırlıklı Interland`e geçmesi sonucu oldu.

Neyse merak edenler için dakika ve skor ;)
Apache %58.73 - Microsoft %27.88

Internet mimarisinin temeli: Uçdan uca prensibi

arikan

MIT Media Lab Virüssel İletişim Grubu (Viral Communications Group)'ndan David Reed geçtiğimiz günlerde "IP3 Kamu Yararı ödülü" aldı. Reed bu odülü Internet mimarisinin temelini oluşturan dijital ağlarda "end-to-end prensibi"ni (uçdan uca prensibi) geliştirmesiyle kazandı.

TTNET ADSL fiyatlarını yeniden düzenledi.

larweda

Şu anda güzide memleketimizin tek ADSL üzerinden servis sağlayıcısı olan TTNET, yaklaşık 2-3 yıldır değiştirmediği ADSL tarifelerini yeniden düzenledi.
Yeni düzenlemeye göre, daha önce aylık 49 milyon TL. olan 128/32 Kbps bağlantı ücreti aylık 60 milyon TL.'ye çıkarıldı. Bu durumda ADSL - Kablonet arasındaki ücret farkı çok azalmış oldu.
Öte yandan, 256 ve daha üzeri downlink veren tarifeler de ulaşılabilir düzeylere çekilerek daha mantıklı rakamlara indirildi. Bu fiyat politikası, yakında ADSL pazarına girecek özel ISP'lerin belini kırmak olarak da nitelendirilebilir.

Vikipedi: Özgür Ansiklopedi

FZ

Ansiklopedi yazarı olmaya ne dersiniz? Uzmanlık alanınıza giren bilgileri madde madde yazarak ileride araştırma yapacak olan insanlara yardımcı olmak ister misiniz? Daha önce yazdığınız makalelerden faydalanarak ortak bilgi hazinesini genişletmek ister misiniz? Başkalarının yazdığı ansiklopedi maddelerine katkıda bulunmak için vaktiniz ve enerjiniz var mı? Ciddi ve detaylı bilgi aktarımı konusunda kendinize güveniyor musunuz?

O halde Vikipedi, Özgür Ansiklopedi yazarlarından biri olup katkıda bulunmaya başlayabilirsiniz. İngilizce halinde 280.000 civarında madde barındıran bu Internet tabanlı özgür ansiklopedinin Türkçesinde henüz sadece 330 civarı ansiklopedi maddesi var. En son eklenen maddeleri ve değişiklikleri burada görebilirsiniz.

Google da dahil pek çok sitenin kullandığı Vikipedi internet ansiklopedisine katkıda bulunarak Türkçe bilgi kaynaklarının gelişmesine katkıda bulunmuş olacaksınız. Sistemin Wiki tabanlı olması işleri kolaylaştırıyor ancak böyle bir sistemle ilk kez karşılaşıyor olsanız dahi mevcut yardım ve yönlendirme sayfaları gayet açıklayıcı, deneme yanılmalarınızı gerçekleştireceğiniz bir "sandbox" bile var.

Warner Bros ile amatör Harry Potter hayranları arasındaki telif savaşı

larweda

Harry Potter, J. K. Rowling'in çok satan fantazi serisi romanlarının baş kahramanı. Bir süre önce filmini çekmek üzere Harry Potter isminin ve kitaplarının telif haklarını satın alan Warner Bros, adresinde Harry Potter geçen amatör hayran sitelerini zorla ele geçirmeye çalıştı ancak geri adım atmak zorunda kaldı.