Folosind Google Data Mine

Anonim

Ați făcut-o astăzi? Ați ajuns pe această pagină prin "googling"?

Dacă da, ați văzut viitorul și sunteți parte a acestuia, chiar dacă nu vă dați seama încă de asta. De fapt, Google are mult mai mult decât să caute. Voi vorbi despre ce face Google, știe - precum și ce ar trebui să faceți și știți pentru a profita la maximum de aceasta.

$config[code] not found

Destul de sigur, Google este cel mai bine cunoscut pentru motorul său de căutare puternic, care se bazează pe o bază de date masivă de pagini web, clipuri video, imagini, cotații de stoc, numere de telefon, adrese și alte bucăți de materiale și date pentru a furniza informații relevante - timpul necesar pentru a lovi o cheie.

Numele celui mai mare motor de căutare din lume a devenit sinonim cu căutarea pe Internet. A devenit chiar un verb în limba noastră de zi cu zi (chiar dacă Google nu ne place să-l folosim în acest fel): noi "google" recenzii de masă, adresa curentă a prietenului nostru din copilărie și, în zboruri de fantezie și grandoare, noi înșine.

Este ușor să uiți că nu suntem singuri când căutăm. Tot ceea ce facem în mediul Google (și unele lucruri pe care le facem în afara acestuia) sunt înregistrate, stocate și analizate. Odată ce știți că o companie are atât de multe date disponibile, nu durează mult să înțelegeți că toate aceste informații ar putea fi folosite pentru mult mai mult decât o experiență de căutare plăcută.

Pentru a înțelege pe deplin puterea potențială a Google, stați-vă puțin timp și gândiți-vă cum funcționează Google într-un mod mai detaliat. Cum funcționează Google

Căutătorului ocazional, nu este imediat evident modul în care Google caută pe Internet atât de rapid și cu rezultate atât de bune. Secretul este că atunci când tastați o interogare, ei nu caută deloc Internetul; Google caută în schimb o bază de date care crește și se actualizează în permanență, 24 de ore pe zi, 7 zile pe săptămână.

Toate acestea se întâmplă fără intervenție umană. Programele mici denumite "păianjeni" sau "crawlere" urmează în mod independent legăturile de la o pagină la alta, modul în care un păianjen urmează firele web. Pe măsură ce păianjenii se târasc în paginile web, aceștia colectează informații despre fiecare propoziție, imagine, număr de telefon și orice altceva pe care îl pot întâlni. Ei scanează fiecare pagină pe care o accesează, indexează cuvintele cheie și notează linkurile către și de pe pagină. Apoi, această informație este stocată într-o bază de date masivă. Aceleași linkuri și pagini sunt accesate cu crawlere din nou și din nou, asigurându-se că informațiile Google rămân actuale.

Google clasifică paginile folosind informațiile colectate de păianjeni. Sunt incluse în acest proces de clasificare următoarele:

  • frecvența și locația cuvintelor cheie (mai multe cuvinte cheie în locații mai proeminente sunt mai bune);
  • vârsta paginii (cu cât pagina este mai bine stabilită, cu atât mai bine);
  • numărul de pagini care leagă o pagină (cu cât mai multe legături sunt cu atât mai bine).

Există alți factori pe care Google le consideră și ei, dar aceștia sunt păstrați în secret pentru a împiedica pe cei care ar încerca să joc sistemul și să obțină ranguri înalte, fără a furniza, de fapt, informații utile. În plus, dacă exagerați și pur și simplu completați pagina cu informații redundante, cu liste de cuvinte cheie și cu legături nedorite, Google vă va penaliza sau chiar vă poate lăsa site-ul din baza de date. În mod evident, trebuie echilibrat un echilibru minunat. Acest echilibru de factori pe pagină este la fel de mult ca arta ca și știința.

Cu cât scorul de pagină este mai bun în funcție de aceste criterii, cu atât mai mare se clasifică în rezultatele căutării. Paginile cu cel mai mare rang apar pe prima pagină a unei căutări Google; deoarece majoritatea utilizatorilor Google nu se aventurează niciodată de această primă pagină, acele pagini de înaltă clasă obțin o cantitate disproporționată de trafic pe Internet.

Toate acestea pentru a spune că, atunci când executați o căutare pe Google, aceasta poate răspunde atât de repede, deoarece nu încearcă să caute întregul Internet în acel moment; consultă baza de date extrem de organizată și prioritizată. Dar, chiar mai important decât crearea unor căutări rapide, acest lucru înseamnă că Google are un vast depozit de date despre ceea ce este pe Internet și, mai important, cine folosește ce, când și în ce scop.

Ce știe Google?

Google "știe" foarte mult, de fapt. Google ține evidența căutărilor și chiar păstrează un fișier pentru căutările dvs. specifice pe baza adresei dvs. IP sau a datelor de conectare Google. Asta le dă o mică fereastră în mintea ta, dezvăluind ceea ce te interesează, te îngrijorează, te excită și te înspăimântă. Numai aceasta este o informație puternică de marketing.

Dacă ați putea accesa această bază de date, ați putea construi profiluri detaliate despre persoane - interesele lor, obiceiurile de cumpărare, problemele de sănătate, problemele de familie și multe altele. Puteți descoperi semne care sugerează dacă o companie reușește sau nu, dacă are în vedere o fuziune sau o achiziție și la ce linii de produse se extinde. Puteți urmări tendințele istorice în alegeri, economie, îngrijire medicală și orice alte domenii care au o valoare socială, financiară și politică semnificativă.

Mai mult, dacă, în cunoștință de cauză sau în necunoștință de cauză, utilizați alte servicii Google, furnizați mai multe informații. Ei scanează Gmail, obținând aceleași informații din corespondența dvs. ca și căutările dvs., precum și pe care sunt prietenii și colaboratorii dvs. Dacă partajați documente prin intermediul documentelor Google, ei știu cu cine lucrați și pe ce proiecte. Google Checkout adaugă date despre modelele dvs. de achiziție, obiceiurile dvs. de cheltuieli și bugetul dvs.

Există, de asemenea, informații pe care le transmiteți la Google, fără să fiți conștienți de faptul că faceți acest lucru. Google colectează, la fel ca și alte servicii Internet, adresa IP și, eventual, adresa MAC. Adresa dvs. IP le spune aproximativ în cazul în care vă aflați în lume din punct de vedere geografic, iar adresa dvs. MAC este o semnătură unică pentru aparatul dvs.; acest lucru le permite să urmăriți dacă utilizați întotdeauna aceeași mașină, câte mașini folosiți și așa mai departe. Astfel, Google nu numai că știe ce căutați și cu cine comunicați, compania știe de asemenea unde vă aflați și ce mașină sau mașini pe care o utilizați.

Desigur, să facem un pas înapoi și să recunoaștem că aproape orice site Internet are acces la unele sau la toate aceste informații. De exemplu, adresele IP sunt colectate în mod regulat pentru a se apăra împotriva atacurilor hackerilor și a refuzurilor de serviciu. Informații despre locul în care mergeți pe site-ul cuiva, când sosiți și plecați, și de unde veniți și accesați, toate statisticile web standard sunt disponibile chiar și pentru cel mai mic site personal.

Ceea ce face Google diferită este dimensiunea ei și diversitatea serviciilor, permițându-i să colecteze o mai mare varietate de informații de la mai mulți oameni.

Când depozitul dvs. de informații merge de la sute de piese de date la miliarde, aveți o imagine că nimeni altcineva nu o face. Ceea ce face Google cu adevărat puternic este faptul că poate observa oamenii în mai multe contexte decât oricine altcineva. Google vă urmărește chiar și atunci când nu sunteți pe computerul dvs. Hărți Google oferă imagini de înaltă rezoluție din majoritatea Statelor Unite, precum și din alte zone ale lumii. Este posibil ca locuința dvs. să fie văzută pe Hărți Google și, dacă ați apucat să vă udați curtea când satelitul a trecut, puteți să vă vedeți și în cea mai rară pereche de pantaloni scurți!

Ce poate face Google

Există câteva utilizări destul de evidente pentru baza de date Google, AdWords fiind probabil cel mai popular și mai vizibil momentan.

De fiecare dată când efectuați o căutare pe Google, primele câteva înregistrări din partea de sus a paginii și listele din partea dreaptă sunt "link-uri sponsorizate", reclame plătite cumpărate de persoane care cred că căutătorii care efectuează o căutare ca a dvs. ar fi interesați de bunurile și serviciile lor. Această tehnică sa răspândit în alte pagini web, ceea ce explică indicația "Anunțuri Google" pe care o vedeți că difuzează anunțuri relevante pentru paginile altor site-uri web.

În mod evident, vânzarea acestui spațiu publicitar este o excelentă sursă de venit pentru Google. În 2007, AdWords a adus Google venituri de peste 16 miliarde de dolari, făcând astfel cea mai mare sursă de venit Google până acum. În comparație, magazinul de date Google este o mină de aur care abia a fost exploatată.

Până acum, caracteristicile Google pe care le-am văzut s-au concentrat în primul rând pe reacția la tendințele actuale ale pieței. Oamenii devin interesați de ceva - noua versiune a X-Boxului, găsirea unui electrician online, memorabilia Super Bowl etc. - și Google este poziționată pentru a ajuta oamenii să se conecteze cu potențialii clienți.

Cu toate acestea, cu suficiente informații, o companie ca Google poate face mai mult decât reacționează pur și simplu la prezent cu viteza fulgerului. De asemenea, el poate vedea viitorul, sau chiar poate crea viitorul. Înainte să credeți că este vorba doar de o paranoică știință-ficțiune de vis, acordați o atenție deosebită problemei.

Să luăm un caz simplu. Să presupunem că ați configurat un program pentru a nota căutări care nu reușesc să arate pagini cu un loc foarte înalt - căutări nereușite care nu oferă informații utile căutătorului. Programul care urmărește aceste eșecuri notează ceea ce căuta căutătorul și pune aceste căutări nereușite în categorii.

Privind prin aceste concluzii, dacă Google constată că există un număr mare de căutări nereușite, care au legătură cu găsirea unui supermarket în Thermopolis, WY. Un pic mai mult în căutarea, și am o listă de locuri în cazul în care există multe căutări DIY căutare superstore locator. Această listă ar fi incredibil de valoroasă pentru o companie care oferă franciză magazine de bricolaj (fără a numi nume, dar gândiți-vă la acele depozite mari de portocale din fiecare suburbie: nu ar vrea să știe?).

Ei nu numai că ar ști că nu exista un magazin de bricolaj acolo, dar că un anumit număr de oameni căutau un astfel de magazin. Și ar putea avea probabil o idee despre ceea ce speră să cumpere acolo: aparate, materiale de construcție, grătare de gaz etc. Aceasta este o cercetare de piață fără durere, ordonată și analizată cu grijă de Google.

În același mod, această informație ar putea fi utilizată pentru a identifica potențialii cumpărători pentru un anumit produs, pentru a urmări criminalii implicați în pornografia infantilă și pentru a prinde potențialii hoți care acopera o casă sau un magazin. Acesta poate ajuta dezvoltatorii să aleagă site-uri pentru case noi și magazine, să vă avertizeze despre vremea severă din zona dvs., să localizeze alegătorii înregistrați și să învețe despre obiceiurile și interesele lor și să ajute IRS să găsească persoane care își trișează impozitele. S-ar putea să existe și greșeli de interpretare: o grămadă de căutări despre cancer dintr-un oraș mic ar putea însemna o mulțime de pacienți cu cancer, dar ar putea însemna că există o școală medicală acolo.

După cum puteți vedea, putem aplauda unele dintre utilizările acestor informații și le condamnăm pe alții. Dar toate acestea sunt posibile și toți folosesc aceleași tehnici de bază. Puteți găsi aproape orice doriți, trebuie doar să știți cum să îl căutați.

În următorul articol, vom arunca o privire asupra a ceea ce înseamnă toate aceste lucruri pentru dvs. ca un individ … și ca un antreprenor. Salt la: Google Data Mine și afacerea dvs.

* * * * *

Despre autor: Hamlet Batista este președintele NEMedia S.A, un furnizor de software de automatizare SEO care ajută antreprenorii și întreprinderile mici să crească calitatea traficului natural de căutare în timp ce se concentrează pe ceea ce fac cel mai bine. Hamlet blog, Hamlet Batista dot Com, explorează cele mai avansate de cercetare SEO, precum și strategii și tactici care vă pot oferi o margine importantă față de concurenții dumneavoastră.

17 Comentarii ▼