PDA

View Full Version : Getting what you want from Google (Updated)



Rex Mundi
12-04-05, 10:39 PM
Navegando me encontre esto en un foro:


Saludos


Tutorial: Getting what you want from Google (Updated)
There is so much information available on the web these days that it is becoming increasingly difficult to find what you want.
Thankfully, we have search engines like Google to sift through the dross and help us to find what we are looking for.
Unfortunately, there is still so much info that even with these search engines, it is often a painstakingly slow process to find exactly what you are after.

I currently use Google as my primary search engine mainly because it presently tops the charts as far as indexing is concerned.

Now, do you just plug in a keyword or two and hope for the best? That may be the quickest way to search, but with more than 3 billion pages in Google's index, it is still a struggle to pare results to a manageable number.

Here are a few tips that I have found on my travels whilst browsing the internet. http://www.c4p.cn/images/smilies/bs-biggrin.gif
There is not one person to thank here as these tips come from many sources.

Page translation
Just because someone speaks another language, it does not mean they do not have something useful or interesting to say.

I use the Google translation tools,
Code:
http://www.google.com/language_tools (http://www.c4p.cn/links.php?url=http://www.google.com/language_tools)
Which are similar to the ones found at:
Code:
http://babelfish.altavista.com (http://www.c4p.cn/links.php?url=http://babelfish.altavista.com)
And
Code:
http://world.altavista.com (http://www.c4p.cn/links.php?url=http://world.altavista.com)

When translating, be specific and creative because these tools are not really the most accurate things on the planet.

Useful Key words
These are some of the more popular keywords for you to use within your search string, just replace the x with your own text:

1. "xxxx" = will look for the exact phrase. For example, "George Bush" will avoid any reference to foliage. (Google is not case sensitive)
2. -x = will search for something excluding a certain term For example, if you were looking for a Hilton hotel and not the Paris Hilton, you'd type Hilton-Paris as your search criteria.
3. filetype:xxx = searches for a particular file extension (exe, mp3, etc)
4. -filetype:xxx = excludes a particular file extension
5. allinurl:x = term in the url
6. allintext:x = terms in the text of the page
7. allintitle:x = terms in the html title of that page
8. allinanchor:x = terms in the links
9. “OR” = Self-explanatory, one or the other... (i.e.: binder OR joiner)
10. ~X = Synonyms/similar terms (in case you can't think of any yourself)

Numbers in a range
Lets say you're looking for an mp3 player but only want to spend up to £150. Why swim through all the others? MP3 player £0..£150
The 2 periods will set a numeric range to search between and will also work with dates, weights, etc.

Calculations
For example, to find out how many times the number 8 goes into the number 720, just type 720/8 in the search box and press the Enter key to get the results. You can use the standard + and - keys to add or subtract. Use the / key to divide and the * to multiply.

Measurements
For example, type "100 meters in feet" (without the quotes) and press the
Enter key for the results.

Denied / common words & omitted results
Ever type in a search and see something like this:
"The following words are very common and were not included in your search:"
What if those common words were important to the search criteria?
You can force Google to search through even the common terms by putting a + in front of the denied word.

Or ever see this?
"In order to show you the most relevant results, we have omitted some entries very similar to the X already displayed. If you like, you can repeat the search with the omitted results included.” The answer is YES. yes yes yes. Did I mention yes? I meant to.

Preferences
It amazes me when I use other peoples PCs that they do not have their Google search preferences saved. When you use Google as much as I do, who can afford to not have preferences? They are located on the right of the search box, and have several options, though I only find three applicable for myself...
A. Open results in new browser.
B. Display 10-100 results per page.
C. Do not filter.

Wildcard searches. *
Great when applied to a previously mentioned method and handy if you only know part of a program name. I.e. *rar as in Winrar.

If you've read this far into this tutorial without saying, "Great, another guy that copied a few Google help pages and thinks its useful info" then I will show you why (besides accuracy, speed, and consistency finding info on anything) it’s nice to know how a search engine works. You combine it with your knowledge of other protocols.

Example:
Do you want free music, free games, free software or free movies? God bless FTP! Try this search:
Code:
intitle:"Index of music" "rolling stones" mp3

Now, what did that search turn up? Let us see if we can better it:
Now search for:
Code:
intitle:"Index of music" " rolling stones " *

Notice any difference? A bit better yes?
Now search for:
Code:
intitle:"index of *" " rolling stones " mp3

Bang on, a hell of a lot better.

Substitute rolling stones with your favourite band. No? Try the song name, or another file format. Play with it. Assuming someone made an FTP and uploaded it, you will find it. Play around with different search strings and try things like inurl:ftp. I find that * works better for me than trying to guess other peoples spellings mistakes.
The same method here applies for e-books, games, movies or anything that may be on an FTP site.

Intitle: at the beginning of a query word or phrase (intitle:"Three Blind Mice") restricts your search results to just the titles of Web pages.

Intext: does the opposite of intitle:, searching only the body text, ignoring titles, links, and so forth. Intext: is perfect when what you're searching for might commonly appear in URLs.

Try using site: (which restricts results to top-level domains) with intitle: to find certain types of pages. For example, get scholarly pages about Mark Twain by searching for intitle:"Mark Twain"site:edu. Experiment with mixing various elements; you'll develop several strategies for finding the stuff you want more effectively. The site: command is very helpful as an alternative to the mediocre search engines built into many sites.

Now what if you want a song, but cannot remember the name of the artist or for that matter, the song. Here is a foolproof way to find songs you do not know the name for, but you know some of the lyrics:
Code:
"Lyrics" XXXXXXXX (Replace XXX with lyrics you know for sure, make sure you punctuate it properly)
The first search return should be the name of the song; if it isn't, try other lyrics that you know, or keep refining the lyrics you have already entered.

Alternatively, if you know the artist or song you also use this string by pasting it into your browser replacing "XXX" with the artist/album/song name:
Code:
google.com/ie?q=parent-directory+%22XXX%22+mp3+OR+wma+OR+m3u+OR+ogg+OR+mp 3s+OR+mp3z&num=100

Now for something a bit different and something Teddy, Halo & Big-Al should find interesting.

Find Apache's (default) Index page by pasting this code into Google:
Code:
+("index of") +("/ebooks"|"/book") +(chm|pdf|zip|rar) +apache

Find a particular e-Book file by replacing XXX with the title or author.
Code:
allinurl: +(rar|chm|zip|pdf|tgz) XXX

Or the age old way:
Codes:
"parent directory " /appz/ -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
"parent directory " Gamez -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
"parent directory " DVDRip -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
"parent directory " Xvid -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
"parent directory " MP3 -xxx -html -htm -php -shtml -opendivx -md5 -md5sums

You only need change the word after the parent directory (in bold font)...

I hope you have enjoyed this tutorial and have gained some valuable information from it. http://www.c4p.cn/images/smilies/bs-biggrin.gif

TDR

Tannat
13-04-05, 01:31 AM
Excelente info !!

Gracias por compartirla RGutierrez.

Jarocho_Malo
13-04-05, 10:15 AM
Excelente, yo siempre me la había llevado con comillas + y –

Spiderman
13-04-05, 11:21 AM
Y cómo van las acciones, Tannat?

Tapirapi ¿0.0?
13-04-05, 11:41 AM
A lo mejor les conviene leer esto:

http://www.elhacker.net/trucos_google.htm#98

:aaa8:

Tannat
13-04-05, 11:45 AM
La última vez que me fijé se habían estabilizado alrededor de $ 200.

Y, por lo que acabo de fijarme (recién), anda más o menos por allí ($ 191)

http://chart.finance.yahoo.com/c/3m/g/goog.gif

Spiderman
13-04-05, 11:47 AM
Ya se estabilizó en esos niveles, no?

Salinger
15-04-05, 05:17 PM
Ese Google es un farsante consumado… O yo soy muy pendejo y no sé bien cómo funciona…

Cada vez que hago una búsqueda, Google me responde muy orondo que encontró chingomil trillones de resultados. ¡Pero nunca se ven todos!

Ejemplo: Si pongo la palabra “Godard”, el Google lleno de euforia me responde esto:

Resultados 1 - 10 de aproximadamente 1,020,000 de godard. (0.42 segundos)

A primera vista suena a toda madre, ¡más de un millón de páginas! Pero en realidad sólo se pueden ver los primeros 831 resultados. Y al final de éstos sale el fucking letrerucho de siempre:


“Para mostrarle los resultados más pertinentes, omitimos ciertas entradas muy similares a los 831 que ya hemos mostrado. Si lo prefiere, puede repetir la búsqueda e incluir los resultados omitidos.”


Ya sé que si pido ver los resultados “omitidos” vuelvo a ver los mismos (¡Hueva!) y algunos más. Pero… ¿quién le dijo a este cretino que sólo me enseñara 831 resultados?

¿Qué tal que el resultado 916 contenga lo que a mí me interesa saber?

¿O no sé buscar?

Saludos

Jarocho_Malo
15-04-05, 06:32 PM
Salinger; casi cualquier búsqueda de una palabra te arrojara pinche mil resultados ya que google no es un directorio ( como yahoo ) sino una maquina de búsqueda que indexa los documentos que sus robots encuentran en sus recorridos por Internet.

En otras palabras al buscar “Godard” te arroja todos los documentos que contengan esa palabra y los sortea comenzando con aquellos que la contienen mas veces la palabra buscada dentro del documento.

Para refinar tu búsqueda incluye mas términos de acuerdo a lo que buscas; por ejemplo:

Godard filmography:

http://www.google.com.mx/search?hl=es&q=Godard+filmography&spell=1

Godard biography

http://www.google.com.mx/search?hl=es&q=Godard+biography&spell=1

Suerte!

Salinger
16-04-05, 04:46 PM
¡Gracias, Jarocho!

Excelente respuesta como siempre. No sé cómo le haces para saber todas esas cosas pero ¡qué bueno que las sabes!


:aaa3: :aaa3: :aaa3:


De cualquier forma no deja de ser una tramposa fanfarronada que el Google diga que encontró un millón de páginas en medio segundo cuando en realidad sólo son 831. Se lo creeremos como un mero acto de fe cibernética, porque ese dato millonario no sólo es imposible comprobar sino que además no te sirve absolutamente para nada. Mera autopropaganda.

Es bueno saber también la manera tan caótica y anárquica en que Google encuentra sus resultados. Cualquier paginucha que contenga 1000 veces la palabra Godard aparecerá mucho más arriba que una probablemente excelente página en que sólo aparezca 14 veces.

La gran ventaja, sin embargo, es que su servicio continúa siendo absolutamente… ¡gratis! Y ahí sí ni quien se queje.

¡Saludos!

Tannat
16-04-05, 04:59 PM
Salinger:

En realidad Google es bastante eficiente (el más eficiente dicho sea de paso).

Al ubicarte y posicionarte las búsquedas usa un complejo mecanismo llamado "Page Rank" y en realidad tiene en cuenta MUCHOS DETALLES (no sólo que la palabra figure 1000 veces en una pinche paginita).

Se fija en:

a) El TITULO de la página (si tiene como título "Godard" figurará más arriba)

b) El NOMBRE de la página (una página llamada "godard.com" irá muy arriba)

c) Las veces que la palabra APARECE EN EL TEXTO Y FOTOS (una página que tenga una foto de Godard -con el ALT o rótulo que lo indica-) irá mucho más arriba que las otras.

d) Finalmente se fija en las páginas que tengan MAS REFERENCIAS. Una página de Godard a la que señalen CIENTOS de otras páginas, las tomará como más relevante.

Así que, como puedes ver, la suma de todos estos elementos hace que EN LA MAYORIA DE LAS BUSQUEDAS, los resultados que te provea sean bastante exactos y adecuados.

Además -y esto es verdaderamente soprendente y maravilloso- hasta se dan el lujo de tener en CACHE (grabado en sus discos), una copia de casi todas las páginas !!!

Más de una vez, la página que yo buscaba no existía MAS y en el "cache" de Google estaba la copia !!!

Discúlpame que te diga, pero Google es de las cosas más formidables que hemos sido capaces de crear los seres humanos en TODA NUESTRA HISTORIA.

No es perfecto, pero es lo más cercano a la "perfección" que hemos podido lograr en el manejo documentario universal.

Tannat
16-04-05, 05:01 PM
Spider:

Por lo que veo en el gráfico (se actualiza solo), parece que el "punto de equilibrio" de Google ronda los U$S 180 -veo que está bajando hacia ese valor-.

Así que, las "buenas noticias" lo subirán para los $ 210 (techo que ya alcanzó) y las malas o la mera normalidad, la tendrá en torno a los $ 180.

Eso, como tendencia actual... veremos qué nos dice el futuro.

Spiderman
16-04-05, 07:10 PM
Gracias, Tannat.

:015:

Salinger
17-04-05, 04:05 PM
Tannat:

Ante explicaciones tan apabullantes como la tuya, Tannat (y la del gran Jarocho) no queda más remedio que aceptar que después de todo el Google hace bien su aburridísimo trabajo.

Así que le perdonamos sus engañosas fanfarronadas de resultados multimillonarios en fracciones de segundo y continuaremos usándolo con cautelosa confianza.

Saludos y muchas gracias Tannat y Jarocho