Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Google´dan çıkmak istiyorum ;)

sundance

Google´ın spider programcıkları Internet´i aralıksız tarayarak yeni sayfaları, eski sayfalardaki en son değişiklikleri Google´ın devasa depolama alanlarına atıyorlar. Bu sayede Internet´ten kalkan bir içerik, geçici bile olsa uzun süre Google´dan erişilebilir kalıyor.

Hal böyleyken Yok kardeşim benim sitemi Google indexlemesin ya da Sağolsun şimdiye kadar indexlediniz ama bundan sonra istemiyorum, beni cache dışına alabilir misiniz ? gibi ihtiyaçlar hasıl olduğunda ;) başvurulabilecek güzel bir makale

Web'iniz ne kadar estetik?

FZ

Garanti Galeri (GG) sanal dünyadaki tasarımlara odaklanan 'Tasarım Ağı/Ağ Tasarımı' sergisine ev sahipliği yapıyor. Sergi, gelişen ağ tasarımları ile bireylerin sanal dünyayla olan etkileşimleri düşünülerek hazırlanmış. Gerçek dünyadan sanal dünyaya giderek büyüyen ağlar, ağ tasarımları ve ağ tasarımcılarının sorgulandığı 'Tasarım Ağı/Ağ Tasarımı' sergisinin küratörlüğünü grafik tasarımcı Tom Klinkowstein yapıyor. Sergide, Klinkowstein'ın başkanı olduğu 'Media A' grubu ile 'Urban Probe', 'D-Fuze', 'Core77', 'ESP Trendlab', 'Doors of Perception' adlı ünlü ağ tasarımcılarının ürettikleri web tasarımları yer alıyor. New York'lu tasarımcı Tom Klinkowstein'ın küratörlüğünü ve tasarımını üstlendiği sergide, 1990-2090 yılları arasında ağ tasarımı ve tasarım ağının gelişimine ilişkin öngörüleri anlatan 'Ağ Bağlantılı Tasarımcının Hayati Yolu' başlıklı bir çalışma da yer alıyor.

Haberin devamı: http://www.radikal.com.tr/veriler/2004/08/12/haber_124745.php

Güzel Siteler - 4: Lost Library

larweda

Son yıllarda ülkemizde de son da olsa popüler olmaya başlayan bilim kurgu ve fantazi edebiyatı, yayınevlerinin de desteğiyle yavaş yavaş hakettiği yerine gelmeye başlıyor. J.R.R. Tolkien`in Lord of the Rings`i (Yüzüklerin Efendisi), Frank Herbert`in Dune`u, Ursula K.Leguin`in Earthsea`si (Yerdeniz üçlemesi), Anne McCaffrey`in Dragonriders of Pern`i (Pern'in Ejderadamları), Terry Pratchett`in Discworld`ü (Diskdünya :-) David Eddings`in Elenium/Tamuli ve Belgariad serileri, Arthur C. Clarke`ın Space Odyssey ve Rama serileri, Dragonlance (Ejderha mızrağı), Philip Dick, Terry Brooks, Wolfgang Hohlbein ve Doris Lessing`in kitapları son 2-3 yılda türkçeye çevrilen fantasy/BK klasiklerinden bazıları.

İşte LostLibrary de bu hikayeler, konular ve kitaplar hakkında kaliteli türkçe içerik sağlayan çok az siteden biri. Siteyi hazırlayan insanların da yaşam tarzlarında BK ve Fantasy edebiyatının büyük yer kapladığı açıkça belli oluyor. Tatmin edici bir içeriğin yanında göz bozmayan bir tasarım da sunan LostLibrary, şiddetle tavsiye olunur.

Last.fm Kullanıcı bilgilerini CBS, RIAA'ya mı gönderdi?

fsniper

Tech Crunch, last.fm'in kullanıcı bilgilerini RIAA e ulaştırdığına dair bir haberin arkasını araştırmış. Özetle, kısa bir süre önce ismi gizli bir last.fm çalışanı, saklanmakta olan kullanıcı bilgilerin (kullanıcı adı, ip adresi, dinleme tercihleri gibi) RIAA'e aktarıldığı yönünde bir haber sızdırmıştı. Daha sonra last.fm bu konuda, "kendilerinin böyle bir bilgi aktarımı yapmadığını" söyleyerek haberi yalanlamıştı.

Ancak TechCrunch işin peşini bırakmayarak konunun last.fm in ebeveyn şirketi olan CBS tarafından yapıldığını haber yaptı. Habere bu bağlantıdan ulaşabilirsiniz.

MIT OCW - MIT derslerini Web`e açıyor!

larweda

MIT (Massachusets Institute of Technology) Üniversitesi, dünyada şanı yürümüş, Amerikanın önde gelen üniversitelerinden biri. "Paylaşılmayan bilgi çürür" ibaresinin farkında olan MIT yetkilileri, bir güzellik yaparak birçok bölümde/konudaki yazılı materyalleri (eğitmen notları, ders notları, kaynak listeleri, seminer notları ödevler vs.) internet üzerinden herkesin ücretsiz kullanımına açmaya karar verdi, bu sayede MIT bünyesinde verilen 16 akademik programın lisans ve yüksek lisans derslerini her isteyen istediği yerden takip edebilecek. MIT'nin gayet saygı duyulan ve Birleşik Devletlerin en pahalı üniversitelerinden birisi olduğu düşünülürse, bu gayet heyecan verici bir gelişme kesinlikle.