Irchiver - Araştırma Amaçlı Bilgi Toplayıcı

0
bahadirkandemir
irc.freenode.net'te #fazlamesai'de sohbet ederken, network admini lilo tarafından gönderilen bir global mesaj dikkatimi çekti.

Helsinki Bilgi Teknolojileri Enstitüsü'nde Kompleks Sistem Hesaplamaları Grubu'ndan bir araştırmacı, Ville H. Tuulos, Freenode networkünü bir araştırma için kullanmak istediğini belirtmiş. İlgilenenlerin #searchengine kanalına gelmeleri istendi. Kanala girenlerin sayısı çok fazlaydı, girişler yavaşladığında proje yöneticisi Ville H. Tuulos sunuma başladı...
Google benzeri, IRC için bir arama motoru hayal edin. Google benzeri bir yaklaşımın problemi, web üzerindeki link bilgisine ağırca bağlı olması (PageRank). Ve tabii ki bu sorun IRC'de yok. Bundan başka, IRC webe göre çok daha dinamiktir, tartışma konuları her zaman değişir, vs. Böylece, kelime aramaları yeterli olmaz.

Yaptığımız şey şu, elimizde doğal dildeki konuları yakalayan çeşitli istatistiksel modeller var. Bu konularla ilgiliyseniz, MPCA ve ICA kelimeleri size birşeyler anlatmalıdır. Her istatistiksel çalışmalarda olduğu gibi, büyük miktarda veriye ihtiyaç duyar, ve biz *gerçekten* büyük miktardan bahsediyoruz, 100MB gibi değil.

Şu anda başlangıç için 1.5 terabyte'lık bir disk alanına sahip bir SAN sistemi sipariş ettik. İşte miktar bu kadar. Küçük bir etki alanındaki yapay verilerle çalışamayız. Gerçek yaşam verileriyle çalışmak zorundayız, ve bu yeterli veriye ulaşmamızın tek yolu.

İkinci konu ise, tahmin ettiğiniz gibi, modellerimiz değersiz bilgilerle başarısızlığa uğrayabilir. Birçok network ve kanaldaki tartışmalar gürültüden ibarettir. Freenode bu yönde mükemmel. Yeterli insan var ve tartışmalar gürültü değil.

Şöyle bir sisteme sahip olmak istiyoruz:
a) Bir sorgu yazacaksınız, örneğin linux ile ilgili bir soru ve sistem bu tür tartışmanın nerede yapıldığını söyleyecek.
b) Sistem tartışmaların gerçek zamanlı evrimini gösterecek
c) Birden fazla networkte çalışırken, konuların dünyanın her tarafına nasıl yayıldığını göreceksiniz.
d) İddia ediyorum, bu tartışmaları arttıracak: kişilere göre konuları göreceksiniz. Mesela bir kimsenin uzmanlık alanları nedir, vs.

Eminim olayı anladınız ve gerisini hayal edersiniz.

Yaptığımız herşey açık kaynaklı olacak. GPL'li olacak.


Sunum sonrası lilo soruları sormaya başladı:

lilo: Tüm kanallar loglanacak mı?
tuulos: Burada böyle bir sisteme sahip olmak isteyip istemeyeceğimiz size kalmış. Ama kısa cevap: hayır. Tabii ki her zaman gizlilik hakkınızı koruyabileceksiniz. Bir kamu hizmetinden bahsediyoruz, casusluk aracından değil.
lilo: Kanallar sisteme dahil olup ayrılabilecek mi?
tuulos: Sistem her zaman gizliliğe saygılı olmalı.
lilo: Teknik olarak kullanıcıların sistemden ayrılması uygun mu? Bu veri toplamada sorun yaratmaz mı?
tuulos: Evet, tabii ki. IRC trafiğini düşünün. grep -v tuulos diyebilirsiniz.
lilo: Hostlar tutulacak mı? Yoksa sadece nickler mi tutulacak?
tuulos: Bireysel olarak kullanıcılarla ilgilenmiyoruz. Kişisel şeyleri kayıt etmeyeceğiz, nickler dışında.
lilo: SPAM'ciler sistemi yanıltmanın bir yolunu bulabilir, bunu nasıl engelleyeceksiniz?
tuulos: Bu bir silahlanma yarışı. Sorun şu ki, sistem ne kadar büyükse kandırmak o kadar zordur. Örneğin PageRank'i yanıltmak önemsizdir.
lilo: Başından sonuna kadar sistemin üzerinde çalışacak mısınız?
tuulos: Zorundayız. Başka türlü sistemi kullanılabilir kılamayız.
lilo: Gizlilik bildirgesi olacak mı?
tuulos: Hayır, burada bunu tartışmak için bulunuyoruz (:

Ayrıntlı bilgi için http://cosco.hiit.fi/irchiver/ adresini ziyaret edebilirsiniz.

İlgili Yazılar

GUIdebook: Kullanıcı Arayüzü Sergisi

Soulblighter

Genişlemekte olan içeriğiyle, bu site, bir çok işletim sisteminin, eski sürümleri dahil, ekran görüntülerinden tutun da, uygulamaların açılış ekranlarına ve görüntülerine kadar bir çok grafik arayüz resmini barındırıyor.

Piksellerimi boya abi! Limit sıfıra gider...

anonim

Alın size bir "pazarlama dahisi" daha. Bence kendinden önceki uygulamalara göre daha akılcı ve estetik bir düşünceye dayanıyor. Tüm dünyadan binlerce insan bir araya gelerek ve küçük renkli kutucuklar kullanarak bir resim ortaya çıkarabilir mi fikri ya da sorusu üzerinden yola çıkan bir uygulama.Sayfadaki her renkli piksel "şimdilik" bir dolara satılmakta. Eğer rağbet görürse, piksel üzerindeki renklerin gelişimine göre çok karmaşık ve türlü ilginçliklere gebe bir uygulama olacak.

SansureHayir!org yayına başladı

fsniper

Türkiye'de son dönemde ciddi bir artış ile uygulanan site yasaklama ve gizli sansür uygulamalarını konu edinen, yapılması gereken ve yapılanlar hakkında internet kullanıcısı görüşlerine yer veren SansüreHayır!org yayın hayatına başladı. Site üzerinden sansüre karşı düşüncelerinizi sözlük tadında herkese duyurabiliyor, başkalarının neler düşündüğünü okuyabiliyorsunuz. Ayrıca görünüşe göre SansüreHayır!org sloganlı yapışkanlı etiketler de yolda ;)

MailandNews.com da gitti !!

eki

Arada sırada çökse de üç yıldır free pop3 e-mail ihtiyacımızı paşa paşa karşılayan www.mailandnews.com, 28 şubatta yayınına (dolayısıyla yayınımıza ) son veriyor. Bu hızla giderse 2002 sonuna kadar free hiçbirşey kalmayacak galiba nette..
Asıl ilginç olanı da mailandnews.com'un olayı haber veriş biçimi. Sanki bir kaç saatlik bir sistem bakımını haber veriyorlar .. :(

**** ....We at MailandNews.com are sorry to announce that we will be discontinuing this service on February 28, 2002 at 12:00pm EST. Until then, our servers will remain in operation, enabling you migrate to another mail service. ****

Internet`in sonu veya Internet V2

sundance

Herşey önde gelen danışmanlık şirketlerinden birinin e-ticaret'i sorgulamasıyla başladı. "İyi güzel de ne zaman para kazanmaya başlayacağız ?" denildiğinin haftası Nasdaq hisselerinde %10 düşüş yaşandı.
Şimdi ise ICQ'da online insan bulamıyoruz ???

Internet'in sonu böyle mi geliyor acaba ?