Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

©2004 Google - 8.058.044.651 web sayfası aranıyor...

mos

Slashdot 'da (*) yer alan bu habere göre, Google indeksini ikiye katlamış.

Daha önce 4 milyar civarında sayfayı indeksleyen arama motoru , bu sayıyı 8 milyarın üstüne çıkarmış görünüyor.

Haberle ilgili Google blog'unu okumak için tıklayın.

$1.99'a kadar domain isimleri ama haber bu değil :)

sundance

Godaddy.com bir başka ürünle birlikte alındığı takdirde domain isimlerini $1.99'a kadar düşürmekte.

Fakat asıl haber bunun reklamını Super Bowl'da yapmak için tekrar tekrar başvurup sansür komitesi tarafından reddedilmelerinde. Reddedilen 14 reklamın bir kısmı daha çekilmeden, konsept aşamasında reddedilerek bambaşka bir rekora da imza atmış.. Saldırgan reklamcılık diye buna diyorlar herhalde.

Menü Kafası

arikan

Zamanındaki teknolojik limitlere göre önemli icatlar olan liste menüler, çoktan seçmeli düğmeler, yazılabilir metin alanları, kaydırma çubuğu gibi öğeler HTML ile web sitelerinde yaygın olarak kullanılarak tüm dünyada hakim bilgi erişim arayüzü oldu. Ancak erişilmek istenen bilgi miktarı giderek arttı ve karmaşıklaştı, ve bugün bir listedeki kırkdokuz öğeden birini seçmek oldukça zorlaştı. Bilgisayarlı ortama hakim bu menü kafası üslubu alışkanlık haline geldiğinden degişmekte zorlanıyor, ve bir tipoloji olarak her türlü tasarım eylemine yerleşiyor. Dünyada giderek büyüyen ve karmaşıklaşan dijital bilgi birikimini hazmetmek için yeni icatlara ihtiyaç var.

Aktivistler için Google benzeri bir Arama Motoru

revolte

Resist! (Diren!) Kollektifi aktivistler için yeni bir arama aracını duyurur:

Resist - Belli başlı aktivist web sitelerinin çoğunu, ve başka ilerici kaynakları tek yerden arayın!

Bu eşsiz proje aktivizm ve radikal politikaya odaklı hızlı ve kapsamlı bir araştırma aracı sağlıyor. Sonunda alternatif haberler, analizler, ilişkiler, olaylar ve başka bilgileri bulmanızı sağlayan bir arama motoru var - hepsi de "aktivist web" bağlamında.

Dünyanın Baskıcı Rejimleriyle İşbirliği Yapan Şirketler

darkhunter

Çin'de yaşanan internet sansürleme projesine çanak tutan şirketlere Microsoft'da eklendi... Habere göre Shanghai Alliance Investment Ltd (SAIL) ile Microsoft'un ortaklığında kurulan yeni MSN portalında 13.06.2005 itibariyle "demokrasi, özgürlük, insan hakları, Tayvan'ın bağımsızlığı veya gösteri" ile ilgili sonuçlar görüntülenmeyecek... Bu durum ilk değil Google ve Yahoo bu kepazeliğe çoktandır çanak tutuyorlar!