Google bu kadar mı taciz edilir! :(

0
FZ
Geçen hafta bir dostumun ağabeyinin yüksek lisans tezini Internet´e yerleştirmiş ve burada haberini geçmiştim (http://www.fazlamesai.net/modules.php?name=News&file=article&sid=2349). Sonra da arkadaşımın sorması üzerine ona açıklama yapmıştım Google anında yakalar bu yeni belgeyi, PDF´nin de içini açar okur, indeksler filan. Birkaç gün önce Google´a baktığımda ve "veri zarflama" anahtar sözcüklerini arattığımda gerçekten de ilk sayfada ilgili tezin ve bağlantılı linklerin geldiğini gördüm. Arkadaşıma da söyledim, sevindi filan. Ancak bugün baktığımda beni dumura uğratan bir durumla karşılaştım!
13 Eylül 2004 tarihi itibari ile Google´da "veri zarflama" aratınca (http://www.google.com/search?q=veri+zarflama) evet, ilgili tez de geliyor ilk sayfada ama Google´ın ilk döndürdüğü sonuç şöyle bir şey: http://veri-zarflama-analizi.ki.espero-site.com/ Gidip bakmanıza gerek yok, ne olduğunu ben söyleyeyim bir prn0 sitesi! Alan adında veri-zarflama geçen bir prn0 sitesi. Var mı böyle bir şey arkadaş dedim, bir yaşıma daha girdim. Bir arama motoru bu kadar mı taciz edilebilir, bir algoritma bu kadar mı suistimal edilir dedim. (Ofisteki programcı arkadaşlardan birine söylemiştim, tabii o esnada haberim yoktu, aç bir Google´a falancaya bak demiştim, arkadaşım, "vaaay, bu veri zarflama analizi çok güzel bir konuymuş ben de ilgilenmek istiyorum" deyince kıllandım tabii! Sonra da duruma uyandık ;-)

Son söz: Bunun önüne geçmenin bir yolu var mıdır?

Görüşler

0
pirx
Nasıl engellenir onu bilemiyorum ama, işin ilginç yanı adamların alan adında "veri-zarflama" kelimesi yok. Tamamen başka bir kelime. Nasıl oluyorda aranan kelimeden dönen sonuca kendi alan adını ekleyip yönlendiriyor hayret doğrusu. İlk defa karşılaştım bu tip bir durumla.
0
pirx
Bu arada espero-site diye aradım ve bu garip yönlendirmeden nasibini almış pek çok kelimeyle karşılaştım. "bebekler" veya "kısa-mj" gibi.

Bu nasıl bir hinliktir yarabbi. Benim anlamadığım, bu malum içerikli sitelerin hiti artsa ne olacak? Hitine göre reklam alamazlar ya? Veya millet şans eseri siteye girip paralı üyelik sistemine mi kayıt olacaktır diye umuyorlar acaba?
0
abakana
Aaaa... Google' da bişiler ararken ek anahtar kelimeleriniz hazır!

(-xxx) -sex -cum

http://flcd.org/wordpress/index.php?p=53
0
FZ
Oktay biraderimiz çözmüş mevzuyu ;-)
0
murat09
Google nin arama algoritması çok da sağlıklı değil. Misal, siz leylekler üzerine içinde leylek kelimesi geçen ve kolay indexlenebilen (html uzantılı ve hızlı yüklenen mesela) bir site yapsanız, Google'da bunu indeksleyip arşivine alsa bile, eğer site isminizde (subdomainizde de olabilir bu) "leylek" kelimesi geçmiyorsa, içinde leylekler değil de kazlar olan bir siteyi sırf ismi leylekler.leylek.kazlar.com olduğu için arama sıralanmasında sizin o nadide ve güzel sitenizden daha üstlerde görüntüleyecektir.
Aynı örnek en son 23 Nisan Çocuk Bayramı'nda rezilötesi sitelerle karşılaşan ve bilgisayarına yüzlerce malware-spyware bulaşan Türk kullanıcıları içinde verilebilir.
Google her methedildiğinde maalesef kendi içindeki bu aptal arama algoritmasını düzelteceğine, Nasdaq'ta daha da yükselmeye uğraşıyor. http://www.fazlamesai.net/modules.php?name=News&file=article&sid=2365&mode=&order=0&thold=0 'ta "Editörün Notu: Google sessiz ve derinden evrensel bilgi işlem platformu olma yolunda ilerliyor. Amazon da benzer yolda. " demişsiniz. Google ve Amazon neticede birer TICARI firmadır. Bizim gözümüze Google nerdeyse her sitede reklam sokuyorsa, kendisine güvenen kullanıcıların ve bizimde beklediklerimizi vermek zorundadır. (Şahsi kanaatim Google'nin Büyük Biraderin ta kendisi olduğu yönündedir o ayrı mesele) Bu ne mi olabilir, arama algoritmasını anlayıp anlık sub-domain ler yaratan porno/spam sitelerinin bu beklentilerini boşa çıkaracak mantıklı bir arama algoritması kullanmak gibi.
Google algoritması düzelene kadar "Veri zarflama" için doğru arama sonuçları isterseniz şimdilik şu adresi verebilirim:
http://search.msn.com/results.aspx?FORM=MSNH&q=%22veri%20zarflama%22%20
0
malkocoglu_2
||sırf ismi leylekler.leylek.kazlar.com olduğu için
||arama sıralanmasında sizin o nadide ve güzel
||sitenizden daha üstlerde görüntüleyecektir.

Bu da yazilim algoritmasi acisindan mantikli degil mi?

||Google her methedildiğinde maalesef kendi
||içindeki bu aptal arama algoritmasını
||düzelteceğine,
||Nasdaq'ta daha da yükselmeye uğraşıyor.

Google'in arama algoritmasi oteki sirketlerden olan farkinin belkemigini olusturur. 80'lerdeki Hesapsal Ogrenim Teorisinden cikan Support for Vector Machines adli algoritmayi kullaniyorlar, ve bu algoritmayi iyilestirdiler... SVM, yapay ogrenimde en populer algoritmalardan biridir. Google'in da bilahere populer olmasinin sebebi teknolojileridir derim. "Aradigimizi daha rahat buluyoruz" diye insanlar google'i seciyorlar.

En son bahsedilen durumu yakindan incelemedim, fakat Internet'in yapisal eksiklerinden dogan bir durumun bu olayi yarattigi gibi bir ilk intibam var.

||Google ve Amazon neticede birer TICARI firmadır

.. ve bunun sonucu olarak serbest piyasa kurallari isleyecek, bu tip yakinmalar yeteri derecede karliliklarini etkilerse, teknik bir cozum bulunacaktir.

||Bizim gözümüze Google nerdeyse her sitede
||reklam sokuyorsa

Google'in kendi sitesindeki reklamlardan mi bahsediyor sunuz? Bu reklamlarin sayisi hala cok az. Ve bence hala siteyi gayet yalin bir sekilde tutmayi basariyorlar.

0
murat09
1- leylekler.leylek.kazlar.com un içinde leyleklerle ilgili bilgi olmadığı halde daha üstte görüntülenmesi güzel değil, FELAKET bir sonuçtur. Buna ister yazılım algoritması felaketi deyin, isterseniz saçmalık, sonuçta felaket derecede saçma sonuçlar doğurur.
2- '"Aradigimizi daha rahat buluyoruz" diye insanlar google'i seciyorlar' diyorsanız sizde Googlenin hatalarını başka hataları eleştirdiğiniz kadar objektifçe eleştirmelisiniz. Google SVM sinin hata vermesine yol açıyor diye kimsenin Internet'in ana yapısını değiştirmeye kalkmak için yola çıkacağını sanmıyorum.
3- Bilakis rekabet koşullarının rekabet edenlerin teknik donanımını geliştirmesine sebep verdiğini bildiğim için, serbest rekabet ve ticarete destek veririm.
4- Google reklamlarından bahsediyorum, Google'daki reklamlardan değil. Yani pek çok sitede üstte veya yanda küçük yazılarla sponsorlarına tıklattıran Google Ad-Sense'den.

Son olarak;
Google nin güzel dediğiniz ama olmayan domainleri listeleyen bozuk ve saçma algoritması yenilenmedikçe, BT sektöründe son kullanıcılara Google'yi internete çıkış noktası gösterme anlayışı artık değişmeli. Farkında mısınız bilmiyorum, browser adres çubuğuna 'www.leylekler.leylek.com' yazmak yerine Google arama kutusuna artık insanlar adres yazmaya başladı. E-Dönüşümde bu hiçte olumlu bir adım değil. Google Kıble değildir, lütfen -şahsi algılamayınız- hepimiz objektif davranalım.
0
malkocoglu_2
||leylekler.leylek.kazlar.com un içinde leyleklerle
||ilgili bilgi olmadığı halde daha üstte
||görüntülenmesi güzel
||değil, FELAKET bir sonuçtur

Eldeki teknolojinin sInIrlarini bilirseniz, daha gercekci seyler isteyebilirsiniz (bugun icin). Eger indeksleme islemini tamamiyle otomize etmek istiyorsaniz, gunumuzun yapay zeka teknoloji sInIrlari bunlardir. Tabii ki gelisme devam edecektir, ileride de daha iyisi olacaktir.

0
malkocoglu_2
Bir de::

Arama motorlari piyasasi, rekabetin oldukca iyi isledigi piyasalardan biri. Yeni baslayan sirketlere acik, yani piyasaya giris yapabilme (market penetration) diger yazilim sektorlere gore daha cabuk. Mesela isletim sistemi piyasasina giris zordur. Az sayida oyuncu vardir, ve o piyasaya yirtinsaniz bir centik zor atarsiniz; Cunku insanlarin masasinin, dizinin, vs ustunde duran bir seyi degistirmek pesindesiniz. Isiniz, bedavaya satmiyorsaniz, cok zor.

Fakat arama motorlari boyle degil. Kendine guvenen her babayigit makineleri kurar, matematigini, YZ, YO algoritmalarini carklarini kurar ve baslar indekslemeye... Iste BU PIYASA icinde begenilmeyen bir durum icin tek sirketi suclama tonlariyla yermek biraz acaiptir. Kaldi ki bahsettiginiz degisiklik bir acidan basit bir akilli tahmin (heuristic) eklemesi bile olabilir. Ama bahsettiginiz seklin dogru olup olmadigi (bence yanlis) niye yapilmadigi gibi konular, hele bahsettiginiz seviyede bu sekildeki bir piyasanin zirt diye duzeltebilecegi bir sey oldugu icin, niye yapilmamistir sorusunda "merak seviyesi kuskudan daha fazla" bir sekilde yaklasmak (bence) daha iyi olacaktir.


0
sundance
Tabi ki objektif davranalım.

92 yılından beri Internet'e giriyorum. O zamanların gopher bazlı search engineleri dahil olmak üzere Google'ın yaklaşımlarından herhangi birinde (usenet search, text ads, image browsing vs.) yarısı kadar başarılı olmuş bir başka arama motoru dahi göremedim.

Dahası bu yapılan işleri, düz piyasa mantığında (banner boyutları ile oynayarak, daha güzel görseller koyarak vs.) değil, gerçekten surf yapmayı minimum ölçüde etkileyecek (gerek bant genişliği, gerek ekranda yerleşim, gerekse hedef kitle yönelimi) şekilde "akıllı" yapmaları, benim Google'a saygı duymamın sebepleri. İsterseniz bunları tartışalım.

Hal böyleyken, search bar yerine google'ın içine url yazanlar varsa bu bence öncelikle onların salaklığı, sonra Google'ın başarısıdır.

Not: "Algoritmasını düzeltmektense Nasdaq'da değerini arttırmaya çalışıyor" Google'ın NASDAQ'da ne kadar süredir varolduğu ve böyle bir algoritmanın geliştirilmesi/düzeltilmesi gibi şeylerin ne kadar devasa işler olduğu gözönüne alınırsa objektiflikten uzak bir ifade. Bende hafifçe "ulan herkes bir Google da google tutturmuş" tepkisi içeriyor gibi geliyor.
0
FZ
Az önce arama sayfasının dibindeki `` Dissatisfied? Help us improve´´ bağına tıklayıp karşıma gelen forma şikayetimi yazdım. 24/48 saat içinde düzelirse takdir edeceğim adamları ;-)
0
bm
Wildcard DNS kayitlariyla yapiyorlar bunu. Malesef DNS protokolunde 'bu wildcard kayittan geliyor' diye haber vermnin yolu yok. Hatirlarsaniz ayni halti *.com icin Verisign da yemisti. Bir suru sacma sapan ismi deneyerek belki kaydin wildcard olduguna kanaat getirmek mumkun ama o da bu sefer normal kullanimdakilerin de zarar gormesi mevzu bahis oluyor.

Hangi kelime komabinasyonlarinin anahtar olarak google'da veya baska yerde arandigini bir sekilde ogreniyor olmali bu insanlar. Cunku o siteyi bir sekilde googlebot'a buldurmalari lazim. Acaba spyware mi kullaniyorlar yoksa proxy loglarini mi satin aliyorlar? (belki ikisi de). Belki arama motoru sirketleriyle baglantilari var?

0
bio
Muhtemelen spyware.

Sacma subdomain'ler deneyerek wildcard testi yapabilirler, ama kisa vadeli bir cozum olur. Bu durumda spammer'lar wildcard kullanmak yerine gercekten her subdomain'i DNS'e register etme yoluna giderler.

Belki Google'in sadece ikinci seviye alan adlarini indexleyip, subdomain'leri ve directory/dosya adlarini dikkate almamasi dusunulebilir.

Hatta ben Google'in yerinde olsam 20 kisilik bir ekip kurup 7/24 bu tur aramalar yaptirir, spam amacli wildcard domain'leri kara listeye alirim. Sonucta yapay zeka'nin limiti buysa, yapay olmayan zeka da var.

Görüş belirtmek için giriş yapın...

İlgili Yazılar

Internet ve Hırsızlık (Çalan Çalana...)

FZ

İnternette milyonlarca site, milyarlarca sayfa var. Ancak her sitenin birbirinden farklı olduğunu sanmayın. Birçok site bir diğerinin yazı ve resimlerini olduğu gibi alıp kendininmiş gibi kullanıyor. Kimi siteler daha da ileriye giderek sitelerin tasarımlarını da olduğu gibi kopyalıyor. Pirated Sites sitesinde yüzlerce kişilik korsan avlama ekibi, internetin altını üstüne getirerek bu siteleri bulup arşivliyor. Resimleriyle inceleyebileceğiniz kopya siteler neredeyse aynen, renkleriyle bile oynanmadan başka isimler ve başka adreslere bürünmüş.

Haber kaynağı: Radikal

Milyonluk web sayfasının son numarası!

sundance

Daha önce haber yaptığımız MillionDollarHomepage.com'da finale yaklaşıldıkça heyecan artıyor.

26 Ekimden bu yana $504,000'lık satış yapan MillionDollarHomepage.com son bin pixeli de ebay üzerinden $1 fiyatla satışa çıkartmış. 151 kişi teklif vermiş durumda ve şu anki fiyat $38,200. Bir sonraki aşama da bence domain ismini satmak olur herhalde :)

GreaseMonkey: Maymunun Gözü Açıldı

FZ

Bugüne kadar pek çok Firefox eklentisi ile, "plug-in"i ile karşılaşmıştım ancak hiçbiri beni GreaseMonkey kadar heyecanlandırmamıştı. Hiçbirini bu kadar güçlü bir araç olarak görmemiştim. Hiçbiri benim gibi bir programcıya çok fazla hitap etmemişti. Hiçbirinin bu kadar fark yaratacağını düşünmemiştim.

Türkiye´deki Internet Uygulamaları

FZ

11 Mart Pazartesi günü saat 18:30'da İstanbul Bilgi Üniversitesi Kuştepe Kampusu Akademik Kurul Odasında, Alcatel e-Ticaret Genel Müdürü Tayfun Türkalp'in konuşmacı olarak katılacağı "Türkiye'deki İnternet Uygulamaları" başlıklı bir konferans düzenlenecektir.

Yahoo`da sarsıldı

sundance

Yahoo bu senenin ilk çeyreği için hedeflediği $230M`lık gelirin %27 kadar gerisinde kaldı.
ZDNET`in haberine göre 11 Nisan`da açıklanacak bilançoya göre Yahoo ilk 3 aylık dönem içinde $170-$180`lık bir ciro yapmış olacak.

Bu arada Yahoo`nun yöneticilerinden Tim Koogle`ın artık kenara çekiliyor olması peki bir tesadüf mü ? Yoksa .bomb furyasına yeni bir aday daha mı var ?