Google bu kadar mı taciz edilir! :(

0
FZ
Geçen hafta bir dostumun ağabeyinin yüksek lisans tezini Internet´e yerleştirmiş ve burada haberini geçmiştim (http://www.fazlamesai.net/modules.php?name=News&file=article&sid=2349). Sonra da arkadaşımın sorması üzerine ona açıklama yapmıştım Google anında yakalar bu yeni belgeyi, PDF´nin de içini açar okur, indeksler filan. Birkaç gün önce Google´a baktığımda ve "veri zarflama" anahtar sözcüklerini arattığımda gerçekten de ilk sayfada ilgili tezin ve bağlantılı linklerin geldiğini gördüm. Arkadaşıma da söyledim, sevindi filan. Ancak bugün baktığımda beni dumura uğratan bir durumla karşılaştım!
13 Eylül 2004 tarihi itibari ile Google´da "veri zarflama" aratınca (http://www.google.com/search?q=veri+zarflama) evet, ilgili tez de geliyor ilk sayfada ama Google´ın ilk döndürdüğü sonuç şöyle bir şey: http://veri-zarflama-analizi.ki.espero-site.com/ Gidip bakmanıza gerek yok, ne olduğunu ben söyleyeyim bir prn0 sitesi! Alan adında veri-zarflama geçen bir prn0 sitesi. Var mı böyle bir şey arkadaş dedim, bir yaşıma daha girdim. Bir arama motoru bu kadar mı taciz edilebilir, bir algoritma bu kadar mı suistimal edilir dedim. (Ofisteki programcı arkadaşlardan birine söylemiştim, tabii o esnada haberim yoktu, aç bir Google´a falancaya bak demiştim, arkadaşım, "vaaay, bu veri zarflama analizi çok güzel bir konuymuş ben de ilgilenmek istiyorum" deyince kıllandım tabii! Sonra da duruma uyandık ;-)

Son söz: Bunun önüne geçmenin bir yolu var mıdır?

Görüşler

0
pirx
Nasıl engellenir onu bilemiyorum ama, işin ilginç yanı adamların alan adında "veri-zarflama" kelimesi yok. Tamamen başka bir kelime. Nasıl oluyorda aranan kelimeden dönen sonuca kendi alan adını ekleyip yönlendiriyor hayret doğrusu. İlk defa karşılaştım bu tip bir durumla.
0
pirx
Bu arada espero-site diye aradım ve bu garip yönlendirmeden nasibini almış pek çok kelimeyle karşılaştım. "bebekler" veya "kısa-mj" gibi.

Bu nasıl bir hinliktir yarabbi. Benim anlamadığım, bu malum içerikli sitelerin hiti artsa ne olacak? Hitine göre reklam alamazlar ya? Veya millet şans eseri siteye girip paralı üyelik sistemine mi kayıt olacaktır diye umuyorlar acaba?
0
abakana
Aaaa... Google' da bişiler ararken ek anahtar kelimeleriniz hazır!

(-xxx) -sex -cum

http://flcd.org/wordpress/index.php?p=53
0
FZ
Oktay biraderimiz çözmüş mevzuyu ;-)
0
murat09
Google nin arama algoritması çok da sağlıklı değil. Misal, siz leylekler üzerine içinde leylek kelimesi geçen ve kolay indexlenebilen (html uzantılı ve hızlı yüklenen mesela) bir site yapsanız, Google'da bunu indeksleyip arşivine alsa bile, eğer site isminizde (subdomainizde de olabilir bu) "leylek" kelimesi geçmiyorsa, içinde leylekler değil de kazlar olan bir siteyi sırf ismi leylekler.leylek.kazlar.com olduğu için arama sıralanmasında sizin o nadide ve güzel sitenizden daha üstlerde görüntüleyecektir.
Aynı örnek en son 23 Nisan Çocuk Bayramı'nda rezilötesi sitelerle karşılaşan ve bilgisayarına yüzlerce malware-spyware bulaşan Türk kullanıcıları içinde verilebilir.
Google her methedildiğinde maalesef kendi içindeki bu aptal arama algoritmasını düzelteceğine, Nasdaq'ta daha da yükselmeye uğraşıyor. http://www.fazlamesai.net/modules.php?name=News&file=article&sid=2365&mode=&order=0&thold=0 'ta "Editörün Notu: Google sessiz ve derinden evrensel bilgi işlem platformu olma yolunda ilerliyor. Amazon da benzer yolda. " demişsiniz. Google ve Amazon neticede birer TICARI firmadır. Bizim gözümüze Google nerdeyse her sitede reklam sokuyorsa, kendisine güvenen kullanıcıların ve bizimde beklediklerimizi vermek zorundadır. (Şahsi kanaatim Google'nin Büyük Biraderin ta kendisi olduğu yönündedir o ayrı mesele) Bu ne mi olabilir, arama algoritmasını anlayıp anlık sub-domain ler yaratan porno/spam sitelerinin bu beklentilerini boşa çıkaracak mantıklı bir arama algoritması kullanmak gibi.
Google algoritması düzelene kadar "Veri zarflama" için doğru arama sonuçları isterseniz şimdilik şu adresi verebilirim:
http://search.msn.com/results.aspx?FORM=MSNH&q=%22veri%20zarflama%22%20
0
malkocoglu_2
||sırf ismi leylekler.leylek.kazlar.com olduğu için
||arama sıralanmasında sizin o nadide ve güzel
||sitenizden daha üstlerde görüntüleyecektir.

Bu da yazilim algoritmasi acisindan mantikli degil mi?

||Google her methedildiğinde maalesef kendi
||içindeki bu aptal arama algoritmasını
||düzelteceğine,
||Nasdaq'ta daha da yükselmeye uğraşıyor.

Google'in arama algoritmasi oteki sirketlerden olan farkinin belkemigini olusturur. 80'lerdeki Hesapsal Ogrenim Teorisinden cikan Support for Vector Machines adli algoritmayi kullaniyorlar, ve bu algoritmayi iyilestirdiler... SVM, yapay ogrenimde en populer algoritmalardan biridir. Google'in da bilahere populer olmasinin sebebi teknolojileridir derim. "Aradigimizi daha rahat buluyoruz" diye insanlar google'i seciyorlar.

En son bahsedilen durumu yakindan incelemedim, fakat Internet'in yapisal eksiklerinden dogan bir durumun bu olayi yarattigi gibi bir ilk intibam var.

||Google ve Amazon neticede birer TICARI firmadır

.. ve bunun sonucu olarak serbest piyasa kurallari isleyecek, bu tip yakinmalar yeteri derecede karliliklarini etkilerse, teknik bir cozum bulunacaktir.

||Bizim gözümüze Google nerdeyse her sitede
||reklam sokuyorsa

Google'in kendi sitesindeki reklamlardan mi bahsediyor sunuz? Bu reklamlarin sayisi hala cok az. Ve bence hala siteyi gayet yalin bir sekilde tutmayi basariyorlar.

0
murat09
1- leylekler.leylek.kazlar.com un içinde leyleklerle ilgili bilgi olmadığı halde daha üstte görüntülenmesi güzel değil, FELAKET bir sonuçtur. Buna ister yazılım algoritması felaketi deyin, isterseniz saçmalık, sonuçta felaket derecede saçma sonuçlar doğurur.
2- '"Aradigimizi daha rahat buluyoruz" diye insanlar google'i seciyorlar' diyorsanız sizde Googlenin hatalarını başka hataları eleştirdiğiniz kadar objektifçe eleştirmelisiniz. Google SVM sinin hata vermesine yol açıyor diye kimsenin Internet'in ana yapısını değiştirmeye kalkmak için yola çıkacağını sanmıyorum.
3- Bilakis rekabet koşullarının rekabet edenlerin teknik donanımını geliştirmesine sebep verdiğini bildiğim için, serbest rekabet ve ticarete destek veririm.
4- Google reklamlarından bahsediyorum, Google'daki reklamlardan değil. Yani pek çok sitede üstte veya yanda küçük yazılarla sponsorlarına tıklattıran Google Ad-Sense'den.

Son olarak;
Google nin güzel dediğiniz ama olmayan domainleri listeleyen bozuk ve saçma algoritması yenilenmedikçe, BT sektöründe son kullanıcılara Google'yi internete çıkış noktası gösterme anlayışı artık değişmeli. Farkında mısınız bilmiyorum, browser adres çubuğuna 'www.leylekler.leylek.com' yazmak yerine Google arama kutusuna artık insanlar adres yazmaya başladı. E-Dönüşümde bu hiçte olumlu bir adım değil. Google Kıble değildir, lütfen -şahsi algılamayınız- hepimiz objektif davranalım.
0
malkocoglu_2
||leylekler.leylek.kazlar.com un içinde leyleklerle
||ilgili bilgi olmadığı halde daha üstte
||görüntülenmesi güzel
||değil, FELAKET bir sonuçtur

Eldeki teknolojinin sInIrlarini bilirseniz, daha gercekci seyler isteyebilirsiniz (bugun icin). Eger indeksleme islemini tamamiyle otomize etmek istiyorsaniz, gunumuzun yapay zeka teknoloji sInIrlari bunlardir. Tabii ki gelisme devam edecektir, ileride de daha iyisi olacaktir.

0
malkocoglu_2
Bir de::

Arama motorlari piyasasi, rekabetin oldukca iyi isledigi piyasalardan biri. Yeni baslayan sirketlere acik, yani piyasaya giris yapabilme (market penetration) diger yazilim sektorlere gore daha cabuk. Mesela isletim sistemi piyasasina giris zordur. Az sayida oyuncu vardir, ve o piyasaya yirtinsaniz bir centik zor atarsiniz; Cunku insanlarin masasinin, dizinin, vs ustunde duran bir seyi degistirmek pesindesiniz. Isiniz, bedavaya satmiyorsaniz, cok zor.

Fakat arama motorlari boyle degil. Kendine guvenen her babayigit makineleri kurar, matematigini, YZ, YO algoritmalarini carklarini kurar ve baslar indekslemeye... Iste BU PIYASA icinde begenilmeyen bir durum icin tek sirketi suclama tonlariyla yermek biraz acaiptir. Kaldi ki bahsettiginiz degisiklik bir acidan basit bir akilli tahmin (heuristic) eklemesi bile olabilir. Ama bahsettiginiz seklin dogru olup olmadigi (bence yanlis) niye yapilmadigi gibi konular, hele bahsettiginiz seviyede bu sekildeki bir piyasanin zirt diye duzeltebilecegi bir sey oldugu icin, niye yapilmamistir sorusunda "merak seviyesi kuskudan daha fazla" bir sekilde yaklasmak (bence) daha iyi olacaktir.


0
sundance
Tabi ki objektif davranalım.

92 yılından beri Internet'e giriyorum. O zamanların gopher bazlı search engineleri dahil olmak üzere Google'ın yaklaşımlarından herhangi birinde (usenet search, text ads, image browsing vs.) yarısı kadar başarılı olmuş bir başka arama motoru dahi göremedim.

Dahası bu yapılan işleri, düz piyasa mantığında (banner boyutları ile oynayarak, daha güzel görseller koyarak vs.) değil, gerçekten surf yapmayı minimum ölçüde etkileyecek (gerek bant genişliği, gerek ekranda yerleşim, gerekse hedef kitle yönelimi) şekilde "akıllı" yapmaları, benim Google'a saygı duymamın sebepleri. İsterseniz bunları tartışalım.

Hal böyleyken, search bar yerine google'ın içine url yazanlar varsa bu bence öncelikle onların salaklığı, sonra Google'ın başarısıdır.

Not: "Algoritmasını düzeltmektense Nasdaq'da değerini arttırmaya çalışıyor" Google'ın NASDAQ'da ne kadar süredir varolduğu ve böyle bir algoritmanın geliştirilmesi/düzeltilmesi gibi şeylerin ne kadar devasa işler olduğu gözönüne alınırsa objektiflikten uzak bir ifade. Bende hafifçe "ulan herkes bir Google da google tutturmuş" tepkisi içeriyor gibi geliyor.
0
FZ
Az önce arama sayfasının dibindeki `` Dissatisfied? Help us improve´´ bağına tıklayıp karşıma gelen forma şikayetimi yazdım. 24/48 saat içinde düzelirse takdir edeceğim adamları ;-)
0
bm
Wildcard DNS kayitlariyla yapiyorlar bunu. Malesef DNS protokolunde 'bu wildcard kayittan geliyor' diye haber vermnin yolu yok. Hatirlarsaniz ayni halti *.com icin Verisign da yemisti. Bir suru sacma sapan ismi deneyerek belki kaydin wildcard olduguna kanaat getirmek mumkun ama o da bu sefer normal kullanimdakilerin de zarar gormesi mevzu bahis oluyor.

Hangi kelime komabinasyonlarinin anahtar olarak google'da veya baska yerde arandigini bir sekilde ogreniyor olmali bu insanlar. Cunku o siteyi bir sekilde googlebot'a buldurmalari lazim. Acaba spyware mi kullaniyorlar yoksa proxy loglarini mi satin aliyorlar? (belki ikisi de). Belki arama motoru sirketleriyle baglantilari var?

0
bio
Muhtemelen spyware.

Sacma subdomain'ler deneyerek wildcard testi yapabilirler, ama kisa vadeli bir cozum olur. Bu durumda spammer'lar wildcard kullanmak yerine gercekten her subdomain'i DNS'e register etme yoluna giderler.

Belki Google'in sadece ikinci seviye alan adlarini indexleyip, subdomain'leri ve directory/dosya adlarini dikkate almamasi dusunulebilir.

Hatta ben Google'in yerinde olsam 20 kisilik bir ekip kurup 7/24 bu tur aramalar yaptirir, spam amacli wildcard domain'leri kara listeye alirim. Sonucta yapay zeka'nin limiti buysa, yapay olmayan zeka da var.

Görüş belirtmek için giriş yapın...

İlgili Yazılar

FreeWiFi - Özgür Network

anonim

Uzun zamandır niyetim vardı ve stallman.org'da yapılan çağrıyı da görmem üzerine freewifi.sometwo.net 'i açtım. Kısa sürenin çalışması olduğu için yanlışları olabilir (olacaktır). Desteğinizi ve mevcut hatalar için düzeltmelerinizi bekliyor.

Audiogalaxy sizlere ömür...

interhaber

Merhabalar, Geçtiğimiz 19 Haziran Çarşamba günü Audiogalaxy`nin o meşhur mavi renkli sitesine girenler, arattırdıkları parçaların hepsinin yanında "kısıtlıdır" işaretini görünce büyük bir şok yaşadılar. Gelen ilk haberler, müzik dünyasının BSA'sı olan RIAA tarafından Audiogalaxy`nin işinin bitirildiği yönünde. Geçen sene Napster`in ipini çekenler,bu sefer de Audiogalaxy`i harcadılar. Gerçekten de süper bir müzik ve MP3 servisi daha devre dışı kaldı ve böylece -mââlesef- dialerci arkadaşlara da meydan boş bırakılmış oldu! Ayrıca, kendi elindekileri paylaşıma açmak isteyenlerin önü de tıkandı. Merak ediyorum: "Acaba sıradaki Morpheus mu?" diye. Bütün müziksever internetçi arkadaşlara geçmiş olsun. Selâmlar...

Onbeş satırda P2P uygulaması

sundance

Ed Felten, p2p'nin önüne geçilmesinin ne kadar zor olduğunu anlatmak için Python ile 15 (yazı ile onbeş) satırlık bir p2p uygulaması yazmış.

(Perl okunaklı değil, Python okunaklı diyenler özellikle okusun sınavda soracağız ne anladıklarını ;)

Yaratıcı beyinlerden yaratıcı çözümler.
İlgilenenler için 5K Javascript ile Wolfenstein ya da yine 5K'da Pron Sitesi

Telekomda Serbestleşme Hakkında

anonim

Telekomda Serbestleşme Hakkında İnternet Kurulu Üyeleri ve Bilişim Sivil Toplum Kuruluşları Platformu Ortak Bildirgesi - 1 Ocak 2004

Türkiye Kamuoyuna,

Türkiye İnterneti bu yıl 10 yaşını doldurdu. 1 Ocak 2004'te Türk Telekom'un tekeli kalkmaktadır.

Bizler, İnternet Kurulu Üyeleri ve Sivil Toplum Kuruluşları olarak bu vesile ile kamuoyuna aşağıdaki açıklamayı yapıyoruz:

SPAMcilerle mücadele

anonim

Spam'ciler artık iyice gemi azıya aldı! Hergün neredeyse yüz tane saçma sapan mesaj alıyoruz. Bu sayıyı kullanıcı sayısıyla çarpınca gerek band genişliğimiz gerekse disk sığamızın ne denli boşa harcandığını görüp dehşete kapılmamak elde değil. Çimento karıştırma makinası satanından tutun tercüme yapanına kadar herkes teknolojiye ayak uyduruyor(!).
Yaklaşık bir yıldır spam gönderenlerin kullandıkları ISP'lerle görüşmeye çalışıyorum. Yaklaşık yarısı yanıt verme nezaketini gösterdi bugüne kadar. Yanıt verenlerinde çoğu "O mesajlar spam değilmişki, duyuru yapıyorlarmış" dedi!
Yok efendim istersem "unsubs" diyip listeden çıkabilirmişim falan...