Google bu kadar mı taciz edilir! :(

0
FZ
Geçen hafta bir dostumun ağabeyinin yüksek lisans tezini Internet´e yerleştirmiş ve burada haberini geçmiştim (http://www.fazlamesai.net/modules.php?name=News&file=article&sid=2349). Sonra da arkadaşımın sorması üzerine ona açıklama yapmıştım Google anında yakalar bu yeni belgeyi, PDF´nin de içini açar okur, indeksler filan. Birkaç gün önce Google´a baktığımda ve "veri zarflama" anahtar sözcüklerini arattığımda gerçekten de ilk sayfada ilgili tezin ve bağlantılı linklerin geldiğini gördüm. Arkadaşıma da söyledim, sevindi filan. Ancak bugün baktığımda beni dumura uğratan bir durumla karşılaştım!
13 Eylül 2004 tarihi itibari ile Google´da "veri zarflama" aratınca (http://www.google.com/search?q=veri+zarflama) evet, ilgili tez de geliyor ilk sayfada ama Google´ın ilk döndürdüğü sonuç şöyle bir şey: http://veri-zarflama-analizi.ki.espero-site.com/ Gidip bakmanıza gerek yok, ne olduğunu ben söyleyeyim bir prn0 sitesi! Alan adında veri-zarflama geçen bir prn0 sitesi. Var mı böyle bir şey arkadaş dedim, bir yaşıma daha girdim. Bir arama motoru bu kadar mı taciz edilebilir, bir algoritma bu kadar mı suistimal edilir dedim. (Ofisteki programcı arkadaşlardan birine söylemiştim, tabii o esnada haberim yoktu, aç bir Google´a falancaya bak demiştim, arkadaşım, "vaaay, bu veri zarflama analizi çok güzel bir konuymuş ben de ilgilenmek istiyorum" deyince kıllandım tabii! Sonra da duruma uyandık ;-)

Son söz: Bunun önüne geçmenin bir yolu var mıdır?

Görüşler

0
pirx
Nasıl engellenir onu bilemiyorum ama, işin ilginç yanı adamların alan adında "veri-zarflama" kelimesi yok. Tamamen başka bir kelime. Nasıl oluyorda aranan kelimeden dönen sonuca kendi alan adını ekleyip yönlendiriyor hayret doğrusu. İlk defa karşılaştım bu tip bir durumla.
0
pirx
Bu arada espero-site diye aradım ve bu garip yönlendirmeden nasibini almış pek çok kelimeyle karşılaştım. "bebekler" veya "kısa-mj" gibi.

Bu nasıl bir hinliktir yarabbi. Benim anlamadığım, bu malum içerikli sitelerin hiti artsa ne olacak? Hitine göre reklam alamazlar ya? Veya millet şans eseri siteye girip paralı üyelik sistemine mi kayıt olacaktır diye umuyorlar acaba?
0
abakana
Aaaa... Google' da bişiler ararken ek anahtar kelimeleriniz hazır!

(-xxx) -sex -cum

http://flcd.org/wordpress/index.php?p=53
0
FZ
Oktay biraderimiz çözmüş mevzuyu ;-)
0
murat09
Google nin arama algoritması çok da sağlıklı değil. Misal, siz leylekler üzerine içinde leylek kelimesi geçen ve kolay indexlenebilen (html uzantılı ve hızlı yüklenen mesela) bir site yapsanız, Google'da bunu indeksleyip arşivine alsa bile, eğer site isminizde (subdomainizde de olabilir bu) "leylek" kelimesi geçmiyorsa, içinde leylekler değil de kazlar olan bir siteyi sırf ismi leylekler.leylek.kazlar.com olduğu için arama sıralanmasında sizin o nadide ve güzel sitenizden daha üstlerde görüntüleyecektir.
Aynı örnek en son 23 Nisan Çocuk Bayramı'nda rezilötesi sitelerle karşılaşan ve bilgisayarına yüzlerce malware-spyware bulaşan Türk kullanıcıları içinde verilebilir.
Google her methedildiğinde maalesef kendi içindeki bu aptal arama algoritmasını düzelteceğine, Nasdaq'ta daha da yükselmeye uğraşıyor. http://www.fazlamesai.net/modules.php?name=News&file=article&sid=2365&mode=&order=0&thold=0 'ta "Editörün Notu: Google sessiz ve derinden evrensel bilgi işlem platformu olma yolunda ilerliyor. Amazon da benzer yolda. " demişsiniz. Google ve Amazon neticede birer TICARI firmadır. Bizim gözümüze Google nerdeyse her sitede reklam sokuyorsa, kendisine güvenen kullanıcıların ve bizimde beklediklerimizi vermek zorundadır. (Şahsi kanaatim Google'nin Büyük Biraderin ta kendisi olduğu yönündedir o ayrı mesele) Bu ne mi olabilir, arama algoritmasını anlayıp anlık sub-domain ler yaratan porno/spam sitelerinin bu beklentilerini boşa çıkaracak mantıklı bir arama algoritması kullanmak gibi.
Google algoritması düzelene kadar "Veri zarflama" için doğru arama sonuçları isterseniz şimdilik şu adresi verebilirim:
http://search.msn.com/results.aspx?FORM=MSNH&q=%22veri%20zarflama%22%20
0
malkocoglu_2
||sırf ismi leylekler.leylek.kazlar.com olduğu için
||arama sıralanmasında sizin o nadide ve güzel
||sitenizden daha üstlerde görüntüleyecektir.

Bu da yazilim algoritmasi acisindan mantikli degil mi?

||Google her methedildiğinde maalesef kendi
||içindeki bu aptal arama algoritmasını
||düzelteceğine,
||Nasdaq'ta daha da yükselmeye uğraşıyor.

Google'in arama algoritmasi oteki sirketlerden olan farkinin belkemigini olusturur. 80'lerdeki Hesapsal Ogrenim Teorisinden cikan Support for Vector Machines adli algoritmayi kullaniyorlar, ve bu algoritmayi iyilestirdiler... SVM, yapay ogrenimde en populer algoritmalardan biridir. Google'in da bilahere populer olmasinin sebebi teknolojileridir derim. "Aradigimizi daha rahat buluyoruz" diye insanlar google'i seciyorlar.

En son bahsedilen durumu yakindan incelemedim, fakat Internet'in yapisal eksiklerinden dogan bir durumun bu olayi yarattigi gibi bir ilk intibam var.

||Google ve Amazon neticede birer TICARI firmadır

.. ve bunun sonucu olarak serbest piyasa kurallari isleyecek, bu tip yakinmalar yeteri derecede karliliklarini etkilerse, teknik bir cozum bulunacaktir.

||Bizim gözümüze Google nerdeyse her sitede
||reklam sokuyorsa

Google'in kendi sitesindeki reklamlardan mi bahsediyor sunuz? Bu reklamlarin sayisi hala cok az. Ve bence hala siteyi gayet yalin bir sekilde tutmayi basariyorlar.

0
murat09
1- leylekler.leylek.kazlar.com un içinde leyleklerle ilgili bilgi olmadığı halde daha üstte görüntülenmesi güzel değil, FELAKET bir sonuçtur. Buna ister yazılım algoritması felaketi deyin, isterseniz saçmalık, sonuçta felaket derecede saçma sonuçlar doğurur.
2- '"Aradigimizi daha rahat buluyoruz" diye insanlar google'i seciyorlar' diyorsanız sizde Googlenin hatalarını başka hataları eleştirdiğiniz kadar objektifçe eleştirmelisiniz. Google SVM sinin hata vermesine yol açıyor diye kimsenin Internet'in ana yapısını değiştirmeye kalkmak için yola çıkacağını sanmıyorum.
3- Bilakis rekabet koşullarının rekabet edenlerin teknik donanımını geliştirmesine sebep verdiğini bildiğim için, serbest rekabet ve ticarete destek veririm.
4- Google reklamlarından bahsediyorum, Google'daki reklamlardan değil. Yani pek çok sitede üstte veya yanda küçük yazılarla sponsorlarına tıklattıran Google Ad-Sense'den.

Son olarak;
Google nin güzel dediğiniz ama olmayan domainleri listeleyen bozuk ve saçma algoritması yenilenmedikçe, BT sektöründe son kullanıcılara Google'yi internete çıkış noktası gösterme anlayışı artık değişmeli. Farkında mısınız bilmiyorum, browser adres çubuğuna 'www.leylekler.leylek.com' yazmak yerine Google arama kutusuna artık insanlar adres yazmaya başladı. E-Dönüşümde bu hiçte olumlu bir adım değil. Google Kıble değildir, lütfen -şahsi algılamayınız- hepimiz objektif davranalım.
0
malkocoglu_2
||leylekler.leylek.kazlar.com un içinde leyleklerle
||ilgili bilgi olmadığı halde daha üstte
||görüntülenmesi güzel
||değil, FELAKET bir sonuçtur

Eldeki teknolojinin sInIrlarini bilirseniz, daha gercekci seyler isteyebilirsiniz (bugun icin). Eger indeksleme islemini tamamiyle otomize etmek istiyorsaniz, gunumuzun yapay zeka teknoloji sInIrlari bunlardir. Tabii ki gelisme devam edecektir, ileride de daha iyisi olacaktir.

0
malkocoglu_2
Bir de::

Arama motorlari piyasasi, rekabetin oldukca iyi isledigi piyasalardan biri. Yeni baslayan sirketlere acik, yani piyasaya giris yapabilme (market penetration) diger yazilim sektorlere gore daha cabuk. Mesela isletim sistemi piyasasina giris zordur. Az sayida oyuncu vardir, ve o piyasaya yirtinsaniz bir centik zor atarsiniz; Cunku insanlarin masasinin, dizinin, vs ustunde duran bir seyi degistirmek pesindesiniz. Isiniz, bedavaya satmiyorsaniz, cok zor.

Fakat arama motorlari boyle degil. Kendine guvenen her babayigit makineleri kurar, matematigini, YZ, YO algoritmalarini carklarini kurar ve baslar indekslemeye... Iste BU PIYASA icinde begenilmeyen bir durum icin tek sirketi suclama tonlariyla yermek biraz acaiptir. Kaldi ki bahsettiginiz degisiklik bir acidan basit bir akilli tahmin (heuristic) eklemesi bile olabilir. Ama bahsettiginiz seklin dogru olup olmadigi (bence yanlis) niye yapilmadigi gibi konular, hele bahsettiginiz seviyede bu sekildeki bir piyasanin zirt diye duzeltebilecegi bir sey oldugu icin, niye yapilmamistir sorusunda "merak seviyesi kuskudan daha fazla" bir sekilde yaklasmak (bence) daha iyi olacaktir.


0
sundance
Tabi ki objektif davranalım.

92 yılından beri Internet'e giriyorum. O zamanların gopher bazlı search engineleri dahil olmak üzere Google'ın yaklaşımlarından herhangi birinde (usenet search, text ads, image browsing vs.) yarısı kadar başarılı olmuş bir başka arama motoru dahi göremedim.

Dahası bu yapılan işleri, düz piyasa mantığında (banner boyutları ile oynayarak, daha güzel görseller koyarak vs.) değil, gerçekten surf yapmayı minimum ölçüde etkileyecek (gerek bant genişliği, gerek ekranda yerleşim, gerekse hedef kitle yönelimi) şekilde "akıllı" yapmaları, benim Google'a saygı duymamın sebepleri. İsterseniz bunları tartışalım.

Hal böyleyken, search bar yerine google'ın içine url yazanlar varsa bu bence öncelikle onların salaklığı, sonra Google'ın başarısıdır.

Not: "Algoritmasını düzeltmektense Nasdaq'da değerini arttırmaya çalışıyor" Google'ın NASDAQ'da ne kadar süredir varolduğu ve böyle bir algoritmanın geliştirilmesi/düzeltilmesi gibi şeylerin ne kadar devasa işler olduğu gözönüne alınırsa objektiflikten uzak bir ifade. Bende hafifçe "ulan herkes bir Google da google tutturmuş" tepkisi içeriyor gibi geliyor.
0
FZ
Az önce arama sayfasının dibindeki `` Dissatisfied? Help us improve´´ bağına tıklayıp karşıma gelen forma şikayetimi yazdım. 24/48 saat içinde düzelirse takdir edeceğim adamları ;-)
0
bm
Wildcard DNS kayitlariyla yapiyorlar bunu. Malesef DNS protokolunde 'bu wildcard kayittan geliyor' diye haber vermnin yolu yok. Hatirlarsaniz ayni halti *.com icin Verisign da yemisti. Bir suru sacma sapan ismi deneyerek belki kaydin wildcard olduguna kanaat getirmek mumkun ama o da bu sefer normal kullanimdakilerin de zarar gormesi mevzu bahis oluyor.

Hangi kelime komabinasyonlarinin anahtar olarak google'da veya baska yerde arandigini bir sekilde ogreniyor olmali bu insanlar. Cunku o siteyi bir sekilde googlebot'a buldurmalari lazim. Acaba spyware mi kullaniyorlar yoksa proxy loglarini mi satin aliyorlar? (belki ikisi de). Belki arama motoru sirketleriyle baglantilari var?

0
bio
Muhtemelen spyware.

Sacma subdomain'ler deneyerek wildcard testi yapabilirler, ama kisa vadeli bir cozum olur. Bu durumda spammer'lar wildcard kullanmak yerine gercekten her subdomain'i DNS'e register etme yoluna giderler.

Belki Google'in sadece ikinci seviye alan adlarini indexleyip, subdomain'leri ve directory/dosya adlarini dikkate almamasi dusunulebilir.

Hatta ben Google'in yerinde olsam 20 kisilik bir ekip kurup 7/24 bu tur aramalar yaptirir, spam amacli wildcard domain'leri kara listeye alirim. Sonucta yapay zeka'nin limiti buysa, yapay olmayan zeka da var.

Görüş belirtmek için giriş yapın...

İlgili Yazılar

@superonline.com ttnet`e @telekom.gov.tr de superonline`a kapalı

wish666

Artık bu kadar olamaz yani. Superonline üzerinden bağlıysanız telekom`un sayfası www.telekom.gov.tr cannot be resolved hatası alıyorsunuz yani dns'i bulamiyorsunuz ve giremiyosunuz.
(Editörün notu: Bu haber`in sözlük anlamı, (ki şu anda doğruluğunu test edemiyorum, TTNET`in ADSL bağlantısından da telekom`un sayfası açılamıyor, sayfa down olabilir)sözlükte sansür olarak geçiyor. Zamanında Ihlas-Net`in islami koşullara uygun olmayan siteleri engellediğini duymuştum (ki onu da hiç deneme şansım olmadı) ama superonline böyle bir engelleme yapıyorsa bu içerik bazlı değil, tam anlamıyla çıkar bazlı bir sansür oluyor. TTNET fiyatları ucuzlattı, internet konusunda tekel olmaya çalışıyor tartışmasında bir taraf değilim ama Internet, kesinlikle sansüre maruz kalmaması gereken bir dünya)

Belgelerle Konuşabilmek İçin

FZ

Konu teknoloji olunca belgelere ulaşmak çok zor değil belki ama sosyal meselelere gelince merkezi bir yerden belgelerle desteklenmiş bilgilere ulaşmanın o kadar kolay olduğunu kimse söyleyemez. Hele de yakın tarih olsun gündemdeki politik gelişmeler olsun, ortalıkta, gazetecilerin ağzında binbir söz döner de filanca anlaşmada tam ne diyor, falanca sözleşmede tam olarak ne yazıyor, hangi olayda kimin hakkında ne karar verilmiş, vs., kimse tam bilmez, merak edenlerin büyük bir kısmı da ya araştırmaya üşenir ya da araştırsa bile ulaşmakta güçlük çeker.

Deneyimli gazeteci Levent Pirler tarafından http://www.belgenet.com işte tam da bu boşluğu doldurmaya yönelik değerli Internet kaynaklarından biri. Türkiye'nin yakın geçmişine ve gündemdeki önemli konulara dair hemen her türlü belgeyi burada bulmanız, adı geçen isimlere dair bilgileri edinmeniz mümkün. Son eklenen belgelere dair birkaç örnek vermek gerekirse:AB Kıbrıs Tüzüğü, Lozan Antlaşması: İnönü'nün TBMM Konuşması, KKTC Cumhurbaşkanı Denktaş'ın TBMM konuşması, TBMM Kıbrıs Deklarasyonu, Farklı Dil ve Lehçelerde Yayın Yönetmeliği.

Türk Telekom Kablosuz Internet tarifelerini belirledi

talat

Türk Telekom'un 42 ilde 400 noktada sunduğu kablosuz internet erişim ücretleri belirlendi. Yarım saat kablosuz internet TTWinet hizmeti 3.11 YTL olacak.

Türk usulü CAPTCHA!!!

sundance

Web sitelerine bilgisayar marifetiyle otomatik giriş yapılmasını engellemek amacıyla geliştirilmiş (insan olduğunuzu ispat için, ekranda gösterilen deforme edilmiş harf ve sayıları tanımlayıp tanımlayamadığınızı test eden) CAPTCHA teknolojisini biliyorsunuz.

Başka bir konuyla ilgili dolaşırken rastladığım, Serkan Feyvi'nin blogunda, tesadüfi olarak o anda üretilen imajlara dayalı teknolojinin, Türk usulü uygulamasının haberini Bu nasıl CAPTCHA? başlığı ile okuduğumda gülmekten sandalyemden yuvarlanıyordum...

Türkiye`de toplam 2000 ADSL portu varken...

sundance

Evet yanlış duymadınız, Türkiye`de toplam 2000 DSL portu var. Hem de Belçika`nın işletimden kaldırdığı santraller üzerinden çalışan 2000 port varken Avrupa SHDSL Symetrical High Density Subscriber Line, teknolojisine geçmeye hazırlanıyor. Telefon hatları üzerinden her iki yönlü 4.6Mbit iletişim sağlayacak olan SHDSL, şu anki SDSL başta olmak üzere bütün DSL teknolojisini etkileyeceğe benziyor.

Not: Bu arada farkında mısınız bilmiyorum ama geçen aydan itibaren ev telefonları %23`lük lüks tüketim malları kdv dilimine girdi :) Gülümseyin, ihtiyacımız var